Издается с 1978 года
в г. Сарове (Арзамас-16) Нижегородской области

РОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ
ЯДЕРНЫЙ ЦЕНТР -
ВСЕРОССИЙСКИЙ НИИ
ЭКСПЕРИМЕНТАЛЬНОЙ ФИЗИКИ
 
 Русский |  English
О ЖУРНАЛЕ РЕДКОЛЛЕГИЯ ПУБЛИКАЦИОННАЯ ЭТИКА ПРАВИЛА ДЛЯ АВТОРОВ АВТОРЫ АРХИВ ПОСЛЕДНИЙ ВЫПУСК СЛЕДУЮЩИЙ ВЫПУСК СТАТЬЯ ГОДА



Выпуск No 4, 1997


Оптимизация матричных операций общего вида для процессора Pentium Pro

Грир Брюс С., Казаков С. В., Сиволгин С. В.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 3-10.

      Описывается многоуровневая оптимизация матричных float-операций для процессора Pentium Pro на примере одной из программ из состава библиотеки BLAS. Верхние уровни оптимизации повышают эффективность использования кэш-памяти. Нижний уровень оптимизации учитывает архитектурные особенности микропроцессора. Приводятся графики производительности для различных алгоритмов (рис. 8, список лит. — 7 назв.)



Принципы использования технологии ММХ в графической библиотеке 3DR

Воронов Г. И., Перепелкин С. П., Сапронов С. И.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 11-13.

      Описываются принципы оптимизации библиотеки трехмерной графики 3DR, продукта фирмы Intel, на базе использования технологии ММХ микропроцессора Pentium.
      Работы проводились в период опытной эксплуатации новых микропроцессоров. Программирование выполнялось на языке С с использованием компилятора Proton. В результате был создан универсальный вариант графических библиотек, функционирующий на процессорах фирмы Intel как с традиционной системой команд, так и с использованием технологии ММХ (рис. 1, список лит. — 3 назв.).



Использование библиотеки SMP-BLAS для решения ленточных систем

Гвоздев Е. В., Орлов И. Н.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 14-17.

      Показана возможность применения параллельной библиотеки SMP- BLAS, ориентированной на работу с плотными матрицами, для решения ленточной симметричной положительно-определенной системы А•х = b с использованием разложения Холецкого. Оценена эффективность такого подхода (рис. 3, табл. 5, список лит. — 4 назв.).



Оптимизация программ быстрого преобразования Фурье для процессоров Pentium и Pentium Pro

Воронов Г. И., Данилов Г. А., Дегтяренко Н. Н., Кибкало Александр А., Курякин В. Ф., Шамраев Б. П.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 18-27.

      Описывается реализация семейства функций БПФ в библиотеках SPL и RPL. Даны оценки сложности наиболее известных алгоритмов вычисления БПФ, учитывающие особенности реализации для процессоров Pentium и Pentium Pro. Рассмотрены общие принципы организации семейства функций БПФ, реализация различных алгоритмов БПФ и вспомогательных операций, а также направления оптимизации для конкретных процессоров, включая процессоры с MMX-технологией (табл. 12, список лит. — 11 назв.).



Организация тестовой системы библиотеки SPL

Александрова И. В., Курякин В. Ф., Смирнов И. Е., Федорова Ю. Г.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 28-33.

      Дано описание тестовой системы библиотеки SPL функций цифровой обработки сигналов. Показано, что она предоставляет мощные и гибкие средства для разработки тестов и управления тестированием. Инструментарий тестовой системы и ее идеология используются для разработки и сопровождения не только SPL, но и библиотек RPL функций примитивов распознавания и IPL функций обработки изображений (рис. 1, список лит. — 4 назв.).



Оптимизация вычислений векторных функций

Заварзин И. И., Курякин В. Ф., Лунев В. В., Обувалин Д. М., Рыжих В. Г.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 34-38.

      На примере трех функций 1/x, lnx, ехр x показано, что для процессоров типа Pentium, Pentium Pro возможно повышение их производительности в 2-3 раза по сравнению с аппаратной реализацией, если набор значений аргументов заранее известен. Предложенные методы применимы к оптимизации этих и других функций от векторного аргумента на любом суперскалярном процессоре. Эти методы не приводят к уменьшению точности результата, более того, снижение требований к точности является дополнительным резервом повышения производительности подобных функций (табл. 3, список лит. — 6 назв.).



Быстрые методы закраски в реалистической графике

Плетенев Ф. А.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 39-50.

      Предлагаются новые быстрые методы закраски, по качеству не уступающие методу закраски Фонга, а по быстродействию сравнимые с методом Гуро.
      Информация, используемая в предлагаемых методах, позволяет сделать учет шероховатостей поверхности без изменения геометрии поверхностных элементов. Существенное ускорение методов закраски позволяет использовать их в динамических пакетах реалистической графики. Формульная простота некоторых из них допускает аппаратную реализацию в разрабатываемых графических чипах-“ускорителях” (рис. 10, список лит. — 7 назв.).



Алгоритм улучшения изображений на растре

Змушко В. В.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 51-53.

      Описан алгоритм для сглаживания дефектов, возникающих в изображении трехмерных объектов из-за дискретности растра. Алгоритм основан на приближенной оценке площади пересечения объекта с граничными пикселами и усреднении в соответствии с этим цвета объекта, а также на раздельной обработке каждой скан-линии для сложных объектов. Заметное улучшение качества изображения достигается при ми-нимальной потере производительности воспроизведения, составляющей 10-30%. Предложенный алгоритм был опробован на основе графической библиотеки 3DR (рис. 3, список лит. — 4 назв.).



Об одном алгоритме построения изоповерхности в трехмерном декартовом пространстве

Башуров В. В.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 54-59.

      Представлен ускоренный способ построения изоповерхностей в трехмерном декартовом пространстве на регулярной сетке, который использует быстрый алгоритм 8-битной кодировки узлов исходной сетки. Благодаря предвычисленной структуре изоповерхности в каждой ячейке сетки процессорное время формирования изоповерхности сокращается по сравнению с существующими методами. Итоговая изоповерхность задается набором треугольников, вершины которых содержат собственные координаты и координаты вектора нормали к полученной поверхности (рис. 8, список лит. — 9 назв.).



Распараллеливание библиотеки основных операций линейной алгебры (BLAS) на общей памяти

Лунев В. В., Обувалин Д. М., Орлов И. Н., Сиволгин С. В.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 60-68.

      Представлены результаты работы по созданию высокоэффективной параллельной библиотеки BLAS для систем с разделяемой памятью в операционных средах Windows NT и UNIX. Описаны параллельные алгоритмы для программ этой библиотеки и оценена их эффективность для различного числа процессоров, предложена новая формула для оценки эффективности распараллеливания (рис. 11, список лит. — 6 назв.).



Проект библиотеки классов для построения виртуальных миров

Субботин А. Н.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 69-74.

      Предлагается подход к разработке инструментального средства для построения систем виртуальной реальности, основанный на современной объектно-ориентированной технологии анализа и проектирования.
      Рассматриваются следующие аспекты: простота использования и сопровождения, расширяемость, переносимость на различные операционные системы и аппаратные платформы (рис. 4, список лит. — 10 назв.).



Дискретное преобразование Хартли и его приложение

Сабанин Б. П.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 75-84.

      Рассматривается дискретное преобразование Хартли и реализация его быстрого алгоритма. В качестве приложения преобразования Хартли разработана и обсуждается двумерная линейная свертка. Приводятся некоторые результаты тестирования и сравнения с альтернативной peaлизацией свертки на базе быстрого преобразования Фурье (табл. 3, список лит. — 10 назв.).



О связи между определителем матрицы и ее минорами

Кибкало Алексей А.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 1997. Вып.4. С. 85-87.

      Доказывается теорема о связи между определителем матрицы и ее минорами. Полученный результат может использоваться как в аналитических исследованиях, так и в практике вычислений (список лит. — 1 назв.).



[ Возврат ]


 
 
 
© ФГУП "РФЯЦ-ВНИИЭФ", 2000-2021