Видеокарта GeForce4 - следующий шаг Меньше года прошло с того времени, когда была анонсирована карта GeForce3. Это новое поколение видеокарт ввело в лексикон геймеров такие выражения как "вершинные и пиксельные шейдеры", и некоторыми из нас это воспринимается довольно абстрактно. Шейдерные эффекты, поддерживаемые в GeForce3 благодаря ее совместимости с DirectX 8, пока что реализованы в очень немногих играх. Но, совершенствуя линейку GeForce3, nVidia пошла по пути разработки графических чипов для Xbox, и уже некоторые игры для Xbox поддерживают эти новые функции. Разумеется, поддержка функций мощных видеокарт карт нового поколения в играх для PC стремительно набирает обороты.
Видеокарта GeForce4 - это новое слово в высокопроизводительной графике от nVidia, и очень веское. Из соображений удобств (или скорее из маркетинговых соображений) nVidia связывает разные чипы и архитектуры видеокарт с именем GeForce4. Время покажет, что в этом больше - путаницы или удобств для конечного пользователя. Дочитав этот обзор до конца, вы увидите, в чем эти различия проявляются. Для тестов мы отобрали две видеокарты линейки GeForce4 и вывели графики производительности, которые послужили нам базой для сравнения.
GeForce4 Ti пришла на смену видеокарте Geforce3. Вкратце поясним, что этот новый чип - по меньшей мере, реализованный в самых высокоскоростных конфигурациях - обладает более высокой графической мощностью, чем чип в Xbox (чем не повод воздать похвалу PC?). Самые быстрые GeForce4 Ti работают просто реактивно - nVidia удалось добиться тактовых частот до 300 MHz по ядру и 325(650 DDR) MHz по памяти. Не так много, как в свое время фигурировало в слухах, распространявшихся в Интернете, но достаточно, чтобы компьютер стал потреблять больше мощности, и потребовался более мощный теплоотвод для видеокарты. Именно обилие конденсаторов на поверхности этой немалой по размерам карты (длина - 22 см) и требует дополнительной потребляемой мощности. DDR-память объемом в 128 MB предполагает, что чипы памяти расположены по обеим сторонам видеокарты, как у недавно анонсированной Radeon 8500 128 MB. Линейка карт GeForce4 будет поставляться в трех вариантах, находящихся в ценовом диапазоне от $200 до $400.
GeForce4 Ti 4600. Обратите внимание на теплоотвод
Не каждый может себе такое позволить, да и не каждому нужна карта GeForce4 Ti. Данные продаж показывают, что подавляющее большинство встраиваемых видеокарт продаются по цене не более $200, причем нет резкого разрыва в ценах между картами ценового диапазона до $100 и картами ценового диапазона от $100 до $200. Поэтому неудивительно, если nVidia обновит успешно зарекомендовавшие себя линейки GeForce2, добавит в них производительности и сделает конкурентными картами нижнего ценового диапазона. Пример тому - видеокарта Geforce4 MX, сочетающая в себе более простое двухконвейерное ядро с быстрой DDR-памятью и повышенной тактовой частотой. Карта GeForce4 MX 460, по цене $179, самая быстрая в семействе MX, имеет тактовую частоту 300 MHz на чипе и 275 MHz в DDR-памяти. При такой высокой скорости этой видеокарте очень бы подошел такой же суперсовременный теплоотвод, как и у ее собратьев с приставкой Ti. Но, несмотря на свое имя, говорящее о превосходстве над Geforce3, у них полностью отсутствует аппаратная поддержка сложных эффектов вершинных и пиксельных шейдеров.
Видеокарта GeForce4 MX 460
В чипах GeForce4 много новшеств, и пора детально рассмотреть основные характеристики на примере карт разных моделей.
Спецификации
Скорости мало не бывает, и в этом наиболее заметна разница в новых картах по показателям частот ядра и пропускной способности памяти. Карта GeForce4 отличается более высокой скоростью чипа, который на 10% больше по размерам и изготовлен по техпроцессу 0.15 микрон (а не более тонкому), на который nVidia перешла в прошлом году. На вызов ATI, анонсировавшей карту Radeon 8500LE по цене $199, nVidia ответила выпуском карты GeForce4 Ti 4200. Это признак того, что в ближайшее время мы увидим и другие карты ценового диапазона до $200. Но факт недавнего анонсирования этой модели означает, что она не будет выпускаться одновременно с другими в линейке GeForce4 Ti. Первыми на рынке будут продвигаться карты GeForce4 MX, и они поступят в продажу уже в ближайшие неделю-две.
GeForce4 Ti 4200GeForce4 Ti 4400GeForce4 Ti 4600GeForce4 MX 460GeForce4 MX 440Цена$199$299$399$179$149Частота ядра225275300300270Частота памяти500550650550400Вершинных шейдеров DX8222нетнетСтандарт пиксельных шейдеров DX81.31.31.3HW T&LHW T&LКонвейеров 44422Модулей текстурирования22222Кол-во транзисторов63 млн.63 млн.63 млн.Техпроцесс0.15 мк0.15 мк0.15 мк0.15 мк0.15 мкДата поступления в продажуапрельмартмартфевральфевраль
Но повышенная графическая мощность - это не единственное новшество nVidia. Линейка GeForce3 была улучшена за счет более эффективного рендеринга и целого ряда новых функций, получивших название Lightspeed Memory Architecture. Все это присутствует и в GeForce4, но имеются дополнительные усовершенствования в производительности. Развитие линейки GeForce4 пошло по нетрадиционному пути - повышение производительности вершинных и пиксельных шейдеров, что сегодня именуется как nFiniteFX II. Из новых функций видео в карту Geforce4 встроена поддержка двух мониторов, присутствовавшая уже в GeForce2 MX под названием TwinView, а теперь переименованная в nView. Программный пакет nView теперь максимально облегчил использование дополнительного пространства рабочего стола экрана за счет использования нескольких мониторов. nVidia наконец добавила поддержку iDCT в GeForce4 MX для ускорения декодирования DVD. Поскольку в системах верхнего ценового класса не требуется ускоренной поддержки декодирования DVD-видео, то nVidia не включила эту функцию в GeForce4 Ti.
Новые функции
В плане производительности, карта Geforce4 Ti выгодно отличается от GeForce3 своей мощной обработкой шейдерных эффектов с помощью технологии nFiniteFX II. В ее новом чипе реализованы два программируемых вершинных конвейера, сопоставимых с единственным конвейером GeForce3. В этом она догоняет графический чип Xbox, у которого тоже два конвейера. Дополнительные конвейеры позволяют карте GeForce4 Ti получить трехкратное превосходство над GeForce3 по мощности обработки геометрии. Благодаря этому попиксельное отображение рельефа, например, выше по производительности на 50%. Это прямая выгода от более высоких тактовых частот. На примере одного из новейших демо-приложений можно видеть, как Geforce4 Ti высчитывает эффекты столкновений с элементами рельефа, и волны, наталкивающиеся на скалистый берег. В целом, усовершенствованная аппаратная поддержка вершинных и пиксельных шейдеров позволит разработчикам игр реализовать в своих творения более сложные эффекты и сцены.
Улучшенная производительность позволяет преобразовать чистую графическую мощность в полезную работу. У процессоров уже давно имеются специфические кэш-буферы памяти для более быстрой работы - нечто подобное реализовано и в GeForce4. В четырех разных частях чипа имеются специализированные кэши, в которых буферизуются часто используемые данные. Функция QuadCache карты GeForce4 хранит примитивы, данные вершин, текстур и пикселей так, как этого не позволяет GeForce3. Другой выигрыш в производительности достигнут за счет того, что новый чип активнее обрабатывает невидимые пиксели на стадии их подготовки для передачи в финальный фрейм, поскольку они затеняются объектом. Выбраковка преград (Occlusion culling), - процесс удаления скрытых поверхностей, получил широкое распространение в видеокартах от PowerVR, но у nVidia и ATi подход к разработке чипов совсем другой. Во всяком случае, Geforce4 на 25% лучше по отбраковке скрытых пикселей, чем Geforce3.
nVidia переименовала функцию антиалиасинга в Accuview AA, но главное отличие в дополнительном режиме качества изображения, который теперь доступен через панель управления Windows как режим 4XS, которому доступно больше текстурных выборок и который реализует более высокое качество. Поскольку метод мультисэмплингового алиасинга Quincunx от nVidia требует больше ресурсов чипа, то производительность снижается и близка той, что свойственна низкокачественному режиму 2X. Активация антиалиасинга - неплохой вариант улучшения качества изображения, особенно если в карте есть достаточный запас производительности. Но с другой стороны, антиалиасинг - это большие накладные расходы по производительности в таких ресурсоемких играх нового поколения, как Doom III - весь запас мощности видеокарты расходуется на обработку сложных зрелищных сцен.
Демо-приложения
nVidia - большой мастер создавать собственные демо-приложения. Начиная с демонстраций для первых Xbox'ов до новейших усложненных демо-заставок, сопровождающих выпуск каждого нового компьютерного чипа, разработчики компании всегда отличались особым талантом в создании великолепных графических образов, вкладывали в них новые функции и усовершенствованную аппаратную поддержку. Но зачастую эти демо-приложения не дают полного ощущения таких важных свойств игры, как физика объектов, искусственный интеллект, зрелищные фоновые пейзажи, а акцентируют внимание на каком-то одном аспекте с целью произвести впечатление. Не стали исключением и эти демо-приложения. Кто-то получит максимум удовольствия от убойной графики, а кому-то придется лишь ждать, когда эта крутая графика станет частью реальных компьютерных игр.
Вервольф
Модель этого вервольфа составлена из 100000 полигонов, 61 ребра скелетной анимации, 8 слоев шерсти. На примере этой демонстрации показывается, как с помощью шейдерных эффектов можно смоделировать волосяной покров. Концентрические оболочки полигонов привносят дополнительные слои текстур, плавно переходящих в фон благодаря альфа-блендингу, чем достигается невиданная ранее реалистичность передачи сцены. Попиксельное анизотропное освещение на текстурах волос максимально реалистично передает переливы света на каждой пряди волос. Благодаря новым возможностям скелетной анимации точно передаются изгибы кожи при движении модели.
Грация
В этой заставке с танцовщицей демонстрируется расчет физики частиц для моделирования изгибов ткани одежды. Физика движения платья и цепи на шее смоделированы в реальном времени так, что после остановки модели предметы одежды продолжают плавно двигаться по инерции.
CodeCreatures
CodeCreatures - демо-приложение от немецкой фирмы-разработчика CodeCult, показывающее невиданные возможности движка в обсчете полигонов. На прошлогодней выставке ECTS их движок показал скорость от 200000 до 300000 полигонов на фрейм. Вся сцена состоит из около 3 миллионов полигонов, а движок способен обсчитывать около 10 миллионов полигонов в секунду.
Поскольку видеокарта GeForce4 MX не поддерживает пиксельные шейдеры, многие графические возможности демо-приложений для Geforce4 Ti для нее будут недоступны (на MX приложение "Грация" запускается, но фоновые эффекты и пейзажи не передаются во всей полноте). Но nVidia не обделила вниманием карты нижнего ценового класса и разработала эффектные демо-приложения специально под них.
Жуки
В этой сцене показывается наступление полчищ жуков. Тест демонстрирует возможности чипа в обработке сложных сцен путем отбрасывания скрытых пикселей.
Смерч
На примере этой сцены, где смерч пожирает трейлеры и разрывает их на части, демонстрируются возможности обсчета физики частиц. Вся соль этой заставки - в показе поразительных возможностей видеокарты при обсчете концентрации частиц, на основе чего процессор выполняет физическое моделирование процесса разрушения злосчастного трейлерного парка.
Хамелеон
Это скриншот с демо-приложения "Chameleon", созданного специально для демонстрации поддержки шейдеров в Geforce3, проигранного под видеокартой Geforce4 MX, но с незначительными изменениями - отключены эффект преломления и пиксельные шейдеры, передающие морщины на коже.
Тесты производительности
Как бы ни были привлекательны эффекты, они немногого стоят, если сами игры недостаточно производительны, чтобы их передать. Мы протестировали образцы карт GeForce4 Ti 4600 по цене $399 и GeForce4 MX 460 по цене $179, и результаты были просто ошеломляющими. Во избежание искажений результатов производительности карты, возможных на менее быстродействующих компьютерах, мы установили эти видеокарты в самые мощные на сегодня системы в конфигурации - 1.6GHz Athlon XP 1900+, системная плата на чипсете KT266A, память 512MB PC2100, Windows XP. Следует иметь в виду, что самые производительные видеокарты раскрывают свои возможности по максимуму только при достаточно быстрых процессорах, а на медленных компьютерах результаты могут быть совсем другими.
Для тестов мы воспользовались MadOnion's 3DMark 2001, одним из первых приложений, в которых можно тестировать шейдерные эффекты, доступные в DirectX 8, и запустили несколько ярких сцен. Движок в нем тот же, что и в Max Payne, и сам тест дает очень наглядное представление о производительности видеокарт под Direct3D.
Очень достойно в этом тесте показала себя карта Radeon 8500, опередив GeForce3 Ti 500, а GeForce4 Ti 4600 на разрешении 1024х768 обошла остальные карты и набрала рейтинг почти в 10000 пунктов. Неудивительно, что в этом тесте GeForce4 MX 460 показала себя очень скромно, поскольку в ней нет поддержки пиксельных шейдеров. Однако она лучше, чем карты предыдущего поколения nVidia этого ценового класса. Это настоящий прорыв по сравнению с показателями карт GeForce2 MX 400 (2,890 пунктов) или GeForce2 GTS (4,271).
Сравнение результатов тестов на более высоких разрешениях с включенным антиалиасингом показывает, что GeForce4 Ti 4600 явно выигрывает за счет более высокой производительности и пропускной способности памяти 10.4GB/сек. Поскольку на более высоких разрешениях с антиалиасингом через шину памяти в память карты передается значительно больше данных, то из-за недостаточно высокой пропускной способности памяти производительность при таких настройках может сильно снижаться.
Тесты 3DMark 2001 (теория)
Скорость расчета полигонов при 1-м источнике освещения50 млн. тр./сек.29.9 млн. тр./сек.26.3 млн. тр./сек.36 млн. тр./сек.Скорость расчета полигонов при 8-ми источниках освещения12.6 млн. тр./сек.7.3 млн. тр./сек.6.2 млн. тр./сек.9.7 млн. тр./сек.Вершинный шейдер97 fps47.7 fps62.8 fps87.3 fpsПиксельный шейдер122.5 fpsнет89.6 fps101.4 fpsТочечные спрайты30.4 млн./сек.10.4 млн./сек.17.7 млн./сек.28.1 млн./сек.
Хотя эти тесты отражают показатели производительности лишь теоретически, тем не менее, это эффективная мера производительности вершинных и пиксельных шейдеров. Интересно отметить, что GeForce4 Ti 4600 за секунду выдает вдвое больше треугольников, чем GeForce3 Ti 500 в тесте при 1-ом источнике освещения. По мощности эта карта отстает от Ti 4600 в тесте с 8-мью источниками динамического освещения, и сцена начинает притормаживать.
Производительность в OpenGL
Очень много разработчиков игр используют движок от Quake III, поэтому вполне уместно будет включить в тесты и этой почтенный бенчмарк. Для тестов мы взяли последнюю версию 1.31 Quake III с демо-бенчмарком "four.dm_67", лежащим в одной директории с файлом pak6.pak3.
Без включенных дополнительной фильтрации и антиалиасинга скорость в fps в Quake III очень высокая. Приятно отметить, что и GeForce4 MX 460 демонстрирует высокую производительность рендеринга. Достаточно сравнить ее средние показатели в 150 fps при разрешении 1024х768 против 51 fps у карты GeForce2 MX или 85.1 fps у GeForce2 GTS. Как видим, сегодняшние карты ушли далеко вперед от карт предыдущего поколения. Весьма любопытно взглянуть на тесты карт верхнего ценового класса при всех включенных опциях и эффектах качественного изображения. GeForce4 Ti 4600 теряет около 30% своего достигнутого при разрешении 1024х768 рейтинга, а при включенных анизотропной фильтрации 8X, дающей максимум четкости текстурам пола и стен, и антиалиасинге 4X, этот рейтинг упал наполовину. Примечательно то, что Radeon 8500 теряет меньше в производительности после включения анизотропной фильтрации.
"Return to Castle Wolfenstein" - очень популярная игра на базе движка от Quake III: Team Arena. Это лишний повод напомнить, как много новых дополнительных возможностей смогут реализовать в своих творениях разработчики игр, когда им станет доступно более производительное "железо".
Игры становятся все более зрелищными, но скорость fps не превышает 100, что свойственно сегодняшним играм. В этом тесте мы использовали демо-бенчмарк "checkpoint.dm", доступный для скачивания с многих сайтов, посвященных игре Wolfenstein.
Что более всего впечатляет в этих результатах, это то, что при переходе на более высокое разрешение показатели у GeForce4 Ti 4600 падают очень несущественно. Эта карта очень производительна при высоком разрешении с включенным антиалиасингом Quincunx. В противоположность ей, самая быстрая из карт GeForce4 MX позволяет играть в эту игру на разрешении 1024х768 с включенным Quincunx, но для плавной и ровной передачи сложных сцен ей просто не хватало мощности.
Тестовый стенд: AMD Athlon 1900+, 256MB PC2100 DDR SDRAM, IBM Deskstar ATA-100, драйверы Nvidia версии 27.30, драйверы ATI версии 7.66, Creative Labs Sound Blaster Live!, Windows XP.
В Quake III (v1.31) и Return to Castle (v.1.1) уровни детализации текстур и обработки геометрии были заданы на максимум, при включенной трилинейной фильтрации. Настройки OpenGL и D3D Vsync отключены. Разрешение экрана 1024x768 при частоте обновления 75Hz.
Заключение
На радость тем, кто регулярно следит за выходом новых продуктов от nVidia и ждет официального анонса GeForce4, хотим сообщить, что это изделие превзошло наши лучшие ожидания. Теперь, когда мы знаем результаты тестирования, можно судить, насколько эти карты превосходят по производительности GeForce3 - разрыв по некоторым ресурсоемким тестам составляет около 50%. Но в целом, это не стало революционным переходом от одного поколения к другому, поэтому резкого скачка в скорости не произошло. Карта GeForce4 MX - это революционный переход от карт линейки GeForce2, на замену которым она приходит. Карты GeForce2 MX опустятся на ту же низкую ступень в иерархии, занимаемую до недавнего времени TNT2, так что очень скоро видеокарты TNT2 прекратят свое существование в новых компьютерах.
На пресс-конференции nVidia, посвященной выпуску этого нового изделия, заявленная цена $199 за GeForce4 Ti 4200 вызвала легкое недоумение. Она не будет выпускаться одновременно с другими картами, и партнеры nVidia, похоже, были не готовы к такой неожиданной смене планов. Но сама карта стоит этих ожиданий. Ценовой уровень $200 - это и есть то поле боя, на котором в ближайшие месяцы развернутся баталии между nVidia и ATI, поскольку обеим компании теперь есть что предложить - карты с поддержкой DirectX 8 для массового геймера. Для серьезных геймеров карта Ti 4200 это серьезный аргумент в пользу отказа от карт GeForce4 MX 460 по цене $179. Отсутствие поддержки шейдерных эффектов, которые появятся в будущих играх, говорит о том, что карту GeForce4 MX можно рассматривать лишь как временный апгрейд.
Мы затронули только верхний пласт возможностей, которыми обладает карта GeForce4. Поскольку карты GeForce4 MX начнут поступать в массовую продажу в конце февраля, а карты Ti - в марте, есть еще некоторое время, чтобы определиться с апгрейдом. Следите за финальными обзорами карты Geforce4 в ближайшие недели.