Компьютерра PDA N119 (02.07.2011-08.07.2011) - страница 16

Шрифт

Интервал

Исторический момент фотографирования обратной стороны Луны станцией "Луна-3" можно пережить самостоятельно и от первого лица. Достаточно скачать и установить симулятор космических полетов "Orbiter 2010", распространяющийся по свободной лицензии, и загрузить в него миссию "Луна-3".

Графические ускорители NVIDIA серии GeForce 500

Автор: Олег Нечай

Опубликовано 05 июля 2011 года

В ноябре 2010 года компания NVIDIA представила обновлённую серию десктопных графических ускорителей на базе доработанной микроархитектуры Fermi. По сравнению с 400-й серией, появившейся на рынке осенью 2009 года, 500-е карты отличаются существенно меньшим энергопотреблением, повышенной производительностью и тихими системами охлаждения новой конструкции.

Особенности микроархитектуры Fermi

Прежде чем перейти к отличиям чипов на основе модифицированной микроархитектуры Fermi от микросхем первого поколения, напомним характерные особенности их конструкции.

Чипы на основе архитектуры Fermi относятся к классу MIMD (МКМД - вычислительная система со множественным потоком команд и множественным потоком данных). К ключевым особенностям Fermi относятся поддержка программного интерфейса DirectX 11 (включая шейдеры версии 5 и, самое главное, аппаратную тесселяцию), а также интерфейсов DirectCompute 11 и OpenCL 1.0, позволяющие использовать видеочип для общих (то есть, не графических) вычислений.

Для аппаратной поддержки тесселяции и алгоритма трассировки лучей в чипах используются параллельно работающие блоки растеризации и полиморфных движков, что позволило существенно поднять производительность рендеринга геометрии. Именно эту особенность можно считать главной, которая отличает ГП на основе микроархитектуры Fermi от микросхем предыдущего поколения.

Первые чипы с микроархитектурой Fermi получили индексы GF10x (GF расшифровывается как "Graphics Fermi"). "Полноформатный" графический процессор GF100 состоит из движка GigaThread, четырёх больших блоков Graphics Processing Clusters ("Кластеров графической обработки"), в каждый из которых входит по четыре мультипроцессора SM и выделенный движок растеризации. 16 мультипроцессоров, в свою очередь, объединяют 512 потоковых процессоров CUDA - по 32 в каждом SM, четыре текстурных модуля, полиморфный движок и 64 Кб кэш-памяти L1.

В мультипроцессоре установлены по два планировщика для группы CUDA (Warp Scheduler) и по два диспетчера инструкций. 48 блоков ROP сгруппированы в шесть модулей по восемь блоков, каждый из которых работает с одним из шести 64-разрядных контроллеров видеопамяти GDDR5 - общая ширина шины памяти составляет 384 бит. Объём кэш-памяти L2, подключённой к контроллерам кадрового буфера, - 768 Кб.

В чипах Fermi GF100 реализована система NVIDIA 3D Vision Surround, которую можно задействовать на двух видеокартах, работающих в режиме SLI. Благодаря этой технологии, можно выводить одновременно на три монитора трёхмерное изображение высокого разрешения 1920х1080 пикселей или двухмерную картинку с разрешением 2560х1600 точек. Для просмотра 3D, разумеется, потребуются затворные очки и стереодрайверы, способные "оживить" картинку в нескольких сотнях популярных видеоигр.

Несмотря на то, что в чипе GF100 изначально было заявлено 512 потоковых процессоров, такие микросхемы никогда не выпускались в рамках 400-й серии. Максимальным числом CUDA было 480 в кристаллах для видеокарт GeForce 480, хотя физически в чипе были реализованы все 512. Отключение 32 ядер было связано с недостаточной отработанностью 40-нм технологического процесса и слишком большим выходом некондиционных чипов с полным набором ядер. Сегодня эта проблема решена, а в конструкцию внесены изменения, позволяющие минимизировать возможность брака.

Новые ускорители серии 500 получили индекс GF11x и в топовых моделях (GF110) задействованы все 512 потоковых процессоров CUDA. Кроме того, в конструкцию транзисторов микросхемы внесены существенные изменения, что позволило минимизировать токи утечки и заметно снизить энергопотребление. К прочим ключевым конструктивным изменениям относятся доработанные блоки адресации и фильтрации текстур, обеспечивающие удвоенную скорость (за один такт, а не за два) обработки текселей в режимах вплоть до FP16, а также улучшенные алгоритмы обработки буфера глубины, в частности, отсечения перекрытых объектов (Z-culling), ускоряющие рендеринг картинки за счёт исключения невидимых (скрытых) объектов.