Оптимизация матричных операций общего вида для процессора Pentium Pro
Грир Брюс С., Казаков С. В., Сиволгин С. В. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 3-10.
Описывается многоуровневая оптимизация матричных float-операций для процессора Pentium Pro на примере одной из программ из состава библиотеки BLAS. Верхние уровни оптимизации повышают эффективность использования кэш-памяти. Нижний уровень оптимизации учитывает архитектурные особенности микропроцессора. Приводятся графики производительности для различных алгоритмов (рис. 8, список лит. — 7 назв.)
|