Оптимизация вычислений векторных функций
Заварзин И. И., Курякин В. Ф., Лунев В. В., Обувалин Д. М., Рыжих В. Г. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 34-38.
На примере трех функций 1/x, lnx, ехр x показано, что для процессоров типа Pentium, Pentium Pro возможно повышение их производительности в 2-3 раза по сравнению с аппаратной реализацией, если набор значений аргументов заранее известен. Предложенные методы применимы к оптимизации этих и других функций от векторного аргумента на любом суперскалярном процессоре. Эти методы не приводят к уменьшению точности результата, более того, снижение требований к точности является дополнительным резервом повышения производительности подобных функций (табл. 3, список лит. — 6 назв.).
|
Распараллеливание библиотеки основных операций линейной алгебры (BLAS) на общей памяти
Лунев В. В., Обувалин Д. М., Орлов И. Н., Сиволгин С. В. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 60-68.
Представлены результаты работы по созданию высокоэффективной параллельной библиотеки BLAS для систем с разделяемой памятью в операционных средах Windows NT и UNIX. Описаны параллельные алгоритмы для программ этой библиотеки и оценена их эффективность для различного числа процессоров, предложена новая формула для оценки эффективности распараллеливания (рис. 11, список лит. — 6 назв.).
|