|
|
|
Издается с 1978 года в г. Сарове (Арзамас-16) Нижегородской области |
РОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ ЯДЕРНЫЙ ЦЕНТР -
ВСЕРОССИЙСКИЙ НИИ ЭКСПЕРИМЕНТАЛЬНОЙ ФИЗИКИ |
|
Русский | English
|
Выпуск No 4, 1997 | Оптимизация матричных операций общего вида для процессора Pentium Pro
Грир Брюс С., Казаков С. В., Сиволгин С. В. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 3-10.
Описывается многоуровневая оптимизация матричных float-операций для процессора Pentium Pro на примере одной из программ из состава библиотеки BLAS. Верхние уровни оптимизации повышают эффективность использования кэш-памяти. Нижний уровень оптимизации учитывает архитектурные особенности микропроцессора. Приводятся графики производительности для различных алгоритмов (рис. 8, список лит. — 7 назв.)
| Принципы использования технологии ММХ в графической библиотеке 3DR Воронов Г. И., Перепелкин С. П., Сапронов С. И. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 11-13.
Описываются принципы оптимизации библиотеки трехмерной графики 3DR, продукта фирмы Intel, на базе использования технологии ММХ микропроцессора Pentium. Работы проводились в период опытной эксплуатации новых микропроцессоров. Программирование выполнялось на языке С с использованием компилятора Proton. В результате был создан универсальный вариант графических библиотек, функционирующий на процессорах фирмы Intel как с традиционной системой команд, так и с использованием технологии ММХ (рис. 1, список лит. — 3 назв.).
| Использование библиотеки SMP-BLAS для решения ленточных систем Гвоздев Е. В., Орлов И. Н. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 14-17.
Показана возможность применения параллельной библиотеки SMP- BLAS, ориентированной на работу с плотными матрицами, для решения ленточной симметричной положительно-определенной системы А•х = b с использованием разложения Холецкого. Оценена эффективность такого подхода (рис. 3, табл. 5, список лит. — 4 назв.).
| Оптимизация программ быстрого преобразования Фурье для процессоров Pentium и Pentium Pro Воронов Г. И., Данилов Г. А., Дегтяренко Н. Н., Кибкало Александр А., Курякин В. Ф., Шамраев Б. П. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 18-27.
Описывается реализация семейства функций БПФ в библиотеках SPL и RPL. Даны оценки сложности наиболее известных алгоритмов вычисления БПФ, учитывающие особенности реализации для процессоров Pentium и Pentium Pro. Рассмотрены общие принципы организации семейства функций БПФ, реализация различных алгоритмов БПФ и вспомогательных операций, а также направления оптимизации для конкретных процессоров, включая процессоры с MMX-технологией (табл. 12, список лит. — 11 назв.).
| Организация тестовой системы библиотеки SPL Александрова И. В., Курякин В. Ф., Смирнов И. Е., Федорова Ю. Г. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 28-33.
Дано описание тестовой системы библиотеки SPL функций цифровой обработки сигналов. Показано, что она предоставляет мощные и гибкие средства для разработки тестов и управления тестированием. Инструментарий тестовой системы и ее идеология используются для разработки и сопровождения не только SPL, но и библиотек RPL функций примитивов распознавания и IPL функций обработки изображений (рис. 1, список лит. — 4 назв.).
| Оптимизация вычислений векторных функций Заварзин И. И., Курякин В. Ф., Лунев В. В., Обувалин Д. М., Рыжих В. Г. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 34-38.
На примере трех функций 1/x, lnx, ехр x показано, что для процессоров типа Pentium, Pentium Pro возможно повышение их производительности в 2-3 раза по сравнению с аппаратной реализацией, если набор значений аргументов заранее известен. Предложенные методы применимы к оптимизации этих и других функций от векторного аргумента на любом суперскалярном процессоре. Эти методы не приводят к уменьшению точности результата, более того, снижение требований к точности является дополнительным резервом повышения производительности подобных функций (табл. 3, список лит. — 6 назв.).
| Быстрые методы закраски в реалистической графике Плетенев Ф. А. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 39-50.
Предлагаются новые быстрые методы закраски, по качеству не уступающие методу закраски Фонга, а по быстродействию сравнимые с методом Гуро. Информация, используемая в предлагаемых методах, позволяет сделать учет шероховатостей поверхности без изменения геометрии поверхностных элементов. Существенное ускорение методов закраски позволяет использовать их в динамических пакетах реалистической графики. Формульная простота некоторых из них допускает аппаратную реализацию в разрабатываемых графических чипах-“ускорителях” (рис. 10, список лит. — 7 назв.).
| Алгоритм улучшения изображений на растре Змушко В. В. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 51-53.
Описан алгоритм для сглаживания дефектов, возникающих в изображении трехмерных объектов из-за дискретности растра. Алгоритм основан на приближенной оценке площади пересечения объекта с граничными пикселами и усреднении в соответствии с этим цвета объекта, а также на раздельной обработке каждой скан-линии для сложных объектов. Заметное улучшение качества изображения достигается при ми-нимальной потере производительности воспроизведения, составляющей 10-30%. Предложенный алгоритм был опробован на основе графической библиотеки 3DR (рис. 3, список лит. — 4 назв.).
| Об одном алгоритме построения изоповерхности в трехмерном декартовом пространстве Башуров В. В. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 54-59.
Представлен ускоренный способ построения изоповерхностей в трехмерном декартовом пространстве на регулярной сетке, который использует быстрый алгоритм 8-битной кодировки узлов исходной сетки. Благодаря предвычисленной структуре изоповерхности в каждой ячейке сетки процессорное время формирования изоповерхности сокращается по сравнению с существующими методами. Итоговая изоповерхность задается набором треугольников, вершины которых содержат собственные координаты и координаты вектора нормали к полученной поверхности (рис. 8, список лит. — 9 назв.).
| Распараллеливание библиотеки основных операций линейной алгебры (BLAS) на общей памяти Лунев В. В., Обувалин Д. М., Орлов И. Н., Сиволгин С. В. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 60-68.
Представлены результаты работы по созданию высокоэффективной параллельной библиотеки BLAS для систем с разделяемой памятью в операционных средах Windows NT и UNIX. Описаны параллельные алгоритмы для программ этой библиотеки и оценена их эффективность для различного числа процессоров, предложена новая формула для оценки эффективности распараллеливания (рис. 11, список лит. — 6 назв.).
| Проект библиотеки классов для построения виртуальных миров Субботин А. Н. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 69-74.
Предлагается подход к разработке инструментального средства для построения систем виртуальной реальности, основанный на современной объектно-ориентированной технологии анализа и проектирования. Рассматриваются следующие аспекты: простота использования и сопровождения, расширяемость, переносимость на различные операционные системы и аппаратные платформы (рис. 4, список лит. — 10 назв.).
| Дискретное преобразование Хартли и его приложение Сабанин Б. П. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 75-84.
Рассматривается дискретное преобразование Хартли и реализация его быстрого алгоритма. В качестве приложения преобразования Хартли разработана и обсуждается двумерная линейная свертка. Приводятся некоторые результаты тестирования и сравнения с альтернативной peaлизацией свертки на базе быстрого преобразования Фурье (табл. 3, список лит. — 10 назв.).
| О связи между определителем матрицы и ее минорами Кибкало Алексей А. Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 85-87.
Доказывается теорема о связи между определителем матрицы и ее минорами. Полученный результат может использоваться как в аналитических исследованиях, так и в практике вычислений (список лит. — 1 назв.).
| [ Возврат ] |
|
|
|
|
|
|
|