Amd radeon hd 6900 series технические характеристики. Выводы по синтетическим тестам

Amd radeon hd 6900 series технические характеристики. Выводы по синтетическим тестам

Ежегодное обновление графических архитектур AMD и NVIDIA в 2010 г. оказалось не совсем таким, как всегда: вместо радикального обновления видеокарт и привычного уже большого роста производительности обе компании решили уделить внимание уже существующим GPU, оптимизировав и доработав их с целью устранения основных недостатков и удешевления конечных видеокарт. В частности, о представленных ранее сложно сказать, что они задают новую планку производительности – они скорее приносят достигнутые прошлым поколением возможности в сегмент middle-end, являющийся наиболее массовым.

Тем не менее, интерес к продуктам высшего класса для энтузиастов продолжает сохраняться, и тут обоим вендорам пришлось серьезно постараться, чтобы удовлетворить эту требовательную категорию потребителей. Мы уже рассматривали и – новую инкарнацию топовых видеокарт компании на доработанной архитектуре Fermi, а теперь наконец пришло время для ответного хода AMD – акселераторов Radeon HD 6900 на базе чипов Cayman.

В свете незначительного усовершенствования ядер Barts (Radeon HD 6800) по сравнению с Cypress (Radeon HD 5800), вопрос о том, как же AMD планирует нарастить производительность будущих топовых GPU, стоял очень остро: особенных предпосылок к радикальному изменению архитектуры не наблюдалось. Однако компании все же удалось нас удивить: Cayman очень значительно отличаются от своих предшественников.

Новшества в AMD Cayman: от VLIW5 к VLIW4

Новые графические процессоры AMD переведены с архитектуры VLIW5 (Very Large Instruction Word) на VLIW4. Разъясним: уже несколько поколений GPU этого вендора строятся из процессоров (SIMD Engines), которые делятся на пять исполнительных блоков: четыре одинаковых ALU, осуществляющих вычисления с плавающей точкой с 32-битной точностью, и один дополнительный более «умный» T-блок, способный также исполнять трасцендентные инструкции (математические функции тангенса, арктангенса, косинуса, возведения в степень и вычитания и т.п.). У NVIDIA в архитектуре Fermi есть аналогичные устройства, называемые Special Function Unit. Нюанс такого решения состоит в том, что для оптимального исполнения кода этими блоками необходимо тщательно его отлаживать и специальным образом организовывать, иначе они просто будут простаивать, а исполнение будет полностью осуществляться обычными ALU. Принцип параллелизации исполнения кода в архитектурах AMD базируется на инструкциях (Instruction Level Parellelism): пять ALU в пределах одного SIMD-процессора могут одновременно исполнять пять одинаковых инструкций, что в рамках одного потока встречается не так уж часто.

SIMD-процессор с архитектурой VLIW4
Схема GPU Cayman
Оптимизированные механизмы работы с памятью

По данным AMD, в подавляющем большинстве случаев ALU действительно простаивали (средняя загруженность – 3,4 из 5), потому было принято решение избавиться от мало востребованных T-блоков, взамен нарастив число процессоров в целом. Таким образом, теперь GPU строится из SIMD-процессоров, которые состоят из четырех одинаковых обычных ALU, а в случае, если все же возникает необходимость исполнить сложную инструкцию, три из них виртуально объединяются и делают это за один такт. Освободившееся место разработчики просто использовали для наращивания количества процессоров: вместо 20 в Cypress их теперь 24.

У этого подхода есть и достоинства, и недостатки. Основной «плюс» перехода на VLIW4 – более эффективное управление загрузкой GPU: традиционный рендеринг отлично распараллеливается, и большее число одинаковых исполнительных блоков будут выгодней, нежели наличие иногда задействуемых «умных». Недостаток же состоит в том, что оптимизированные для использования расширенных ALU шейдеры, встречающиеся в некоторых играх, могут на Cayman исполняться медленнее, чем на Cypress. К тому же для целей GPGPU – еще одной ключевой сферы, на которую обращено пристальное внимание и AMD, и NVIDIA, – возможность быстрого исполнения сложных инструкций довольно важна. Однако для графического подразделения AMD игровые видеокарты – основной приоритет, потому было принято именно такое решение. К тому же вышеописанная возможность исполнения нескольких потоков одновременно и большее число SIMD-процессоров вполне могут сделать Cayman более выигрышным GPU для нужд GPGPU, нежели Cypress и Barts.

Возвращаясь к изменениям в GPU, отметим также, что в его составе появился усовершенствованный диспетчер потоков, способный теперь обслуживать несколько исполняемых «ядер» одновременно. У NVIDIA Fermi также есть такая возможность, однако есть и ограничения: хоть GPU и способен проводить вычисления нескольких ядер одновременно, все они должны генерироваться одним и тем же приложением в рамках одного и того же контекста (состояния) GPU. Если же на обработку запускаются два ядра от разных приложений (к примеру, GPGPU-рендеринг видео одновременно с Direct3D), видеокарте приходится постоянно переключаться между контекстами, уделяя внимание то одному ядру, то другому (а не одновременно), а это влечет огромные потери производительности. В AMD Cayman применен другой подход: драйвер осуществляет виртуализацию GPU для каждого исполняемого ядра, таким образом никакое из приложений, задействующих его, просто не знает о существовании других, работая будто бы с собственным процессором и собственной виртуальной памятью. Трансляцией очереди команд графическому процессору занимается драйвер, а расположенный в GPU асинхронный диспетчер потоков обрабатывает и реорганизует очередь инструкций таким образом, чтобы потери от исполнения разнородных потоков были минимальными. Единственное «но»: аппаратно-то в GPU такие возможности есть, но пока нет программного API с поддержкой этого нововведения (DirectCompute в нынешней ревизии ее не содержит, и AMD возлагает все надежды на OpenCL).

Также из усовершенствований вычислительной части GPU отметим оптимизации интерфейсов памяти: каждый SIMD-процессор содержит 8 КБ эксклюзивного кэша L1 и 32 КБ локального буфера, ядро оснащено четырьмя массивами кэша L2 по 128 КБ и 64-килобайтовым глобальным буфером. Выборка и запись данных из локального в глобальный буфер может осуществляться «на лету», не выходя из GPU в память видеокарты. Введение второго DMA-блока в контроллере памяти также ускоряет обмен данными с ней.

Значительно доработаны растеризаторы: теперь обработка 16-битных данных происходит вдвое быстрее, 32-битных – в 2-4 раза, в зависимости от типа данных.

Вдвое больше геометрии

Одним из слабых мест прошлых поколений GPU AMD была низкая производительность при обработке геометрии, в частности, радикально меньшее быстродействие при тесселяции, нежели у NVIDIA Fermi. AMD усиливает Cayman введением второго устройства Graphics Engine: теперь сборка вершин и геометрии, тесселяция и растеризация осуществляются в два потока. К тому же тесселятор 8-го поколения сам по себе работает в 2-3 раза быстрее, чем прошлая его инкарнация в Cypress. Итоговый чистый прирост производительности от увеличения скорости обработки геометрии составляет 30-70%, в зависимости от того, насколько сильно обрабатываемая сцена загружает тесселяторы.

Принцип работы EQAA

В Cayman AMD вводит поддержку нового для себя алгоритма сглаживания изображения: Enhanced Quality Anti-Aliasing (EQAA). Под этим названием скрывается не что иное как знакомый нам еще со времен NVIDIA G80 Coverage Sample Anti-Aliasing – алгоритм, использующий для повышения качества сглаживания не полноценные семплы цветности и глубины, а информацию о примитивах. Если пиксель находится на границе двух примитивов (перекрывается ими) – для него цвет усредняется не только по полноценным семплам RGB+Z, но и по выбранным дополнительно только цветовым. В идеальном случае качество сглаживания должно быть равно достигаемому при мультисемплинге более высокой ступени (4xEQAA = 8xMSAA) при очень незначительном снижении производительности, т.к. памяти на эти дополнительные семплы тратится намного меньше. Кроме того, Cayman поддерживают и Morphological Anti-Aliasing – простую технику сглаживания посредством выявления контрастных зон с помощью пост-процессингового фильтра, представленную с Radeon HD 6800.

PowerTune

Как и NVIDIA, AMD серьезно озаботилась проблемой энергопотребления своих видеокарт при высокой нагрузке, когда устройства зачастую значительно превышают заявленный для них TDP. Напомним, что в NVIDIA GeForce GTX 570/580 введены блоки мониторинга потребляемого видеокартами тока, которые при обнаружении повышенной нагрузки и выявлении драйвером запущенных приложений для стресс-тестирования (FurMark, OCCT) снижают частоты вдвое. AMD пошла дальше конкурента, внедрив технологию PowerTune. Встроенные в GPU блоки постоянно оценивают уровень потребляемой им энергии, и в случае превышения TDP драйвер «на лету» немного снижает тактовые частоты (не вдвое, как на GeForce GTX 580/570, а примерно на 10%). Фактически перед нами полный аналог Intel Turbo Boost, только работающий диаметрально противоположно. Соответственно, и параметр TDP, заявляемый AMD, стоит скорее считать не абсолютно максимальным, а максимально разрешенным. Решение это абсолютно логично: вместо того, чтобы устанавливать тактовые частоты видеокарт заведомо ниже потенциально достижимых данным GPU с целью гарантированного сбережения ее от перегрева и повреждения в случае максимально возможной нагрузки, AMD теперь может задать более высокую исходную частоту, т.к. все равно чаще всего GPU не загружен полностью и не потребляет максимальный ток. Если же вдруг такое все-таки случается – драйвер просто подстраивает частоту, удерживая видеокарту в рамках TDP.

PowerTune можно настраивать в панели Overdrive утилиты Catalyst Control Center, доступны значения от -20% до +20%. Как несложно понять, таким образом регулируется порог срабатывания алгоритма. Отметим, что в штатном режиме PowerTune срабатывает крайне редко и влияет на производительность в большинстве приложений очень слабо – в пределах 1-2 кадров/с. Полностью отключить эту систему нельзя, однако, очевидно, сторонние производители видеокарт смогут модифицировать порог ее активации для своих предразогнанных моделей, а вот как быть сторонникам экстремального разгона – пока неясно.

Знакомство с AMD Radeon HD 6900

Итак, рассмотрим представленные AMD видеокарты. В семейство Cayman входят две модели – Radeon HD 6970 и Radeon HD 6950 . Позиционируются они довольно интересно: топовая модификация располагается между NVIDIA GeForce GTX 580 и GTX 570, а младшая занимает собственную нишу между GeForce GTX 570 (сверху) и парой Radeon HD 6870 и GeForce GTX 470 (внизу). Рекомендованные цены установлены на уровне $369 и $299, соответственно. Топовой же моделью в линейке AMD продолжает оставаться Radeon HD 5970, появления его наследника HD 6990 на базе двух GPU Cayman стоит ожидать только в I квартале 2011 г.

Графический процессор Cayman XT в AMD Radeon HD 6970 содержит 1536 активных ALU, сгрупированных в 24 SIMD-массива по 16 SIMD-процессоров, 96 текстурных блоков и 32 растеризатора. Тактовая частота составляет 880 МГц. Видеокарта оснащается 2 ГБ памяти GDDR5 с тактовой частотой 1375 МГц (5500 МГц QDR), обращение к которой осуществляется по шине шириной 256 бит. Уровень TDP этого одночипового флагмана составляет 250 Вт – на 62 Вт выше, чем у Radeon HD 5870, и на 100 Вт выше заявленного для Radeon HD 6870.

Младшая модификация оснащается GPU Cayman Pro, в котором активны 22 SIMD-массива, что составляет 1408 ALU и 88 текстурных блоков, количество растеризаторов осталось прежним – 32. Процессор работает на частоте 800 МГц, 2 ГБ памяти GDDR5 – на 1250 МГц (5000 МГц QDR), ширина шины также сохранена на уровне 256 бит. TDP AMD Radeon HD 6950 установлен на уровне 200 Вт. В простое со сниженными частотами обе видеокарты потребляют 20 Вт.

Обе модификации используют одинаковый дизайн печатной платы и системы охлаждения, потому рассматривать их будем вместе. Длина плат составляет 10,5” (26,7 см) – для них потребуется просторный корпус. Пластиковый кожух прямоугольной формы полностью накрывает всю видеокарту, дизайнерских изысков вроде своеобразного оформления отверстий воздухозаборника, как на Radeon HD 5870, нет. Система охлаждения представляет собой полностью накрывающий GPU и чипы памяти массивный радиатор, подошва которого – ставшая так популярной среди разработчиков СО испарительная камера. Продувается радиатор традиционным центробежным вентилятором, весь горячий воздух выводится за пределы корпуса. Отметим, что, в отличие от NVIDIA, AMD все же не стала пытаться уместить все видеовыходы на одной стороне крепежной планки и отдавать вторую половину на вентиляционную решетку: тут она занимает всего четверть планки. Эффективность СО вполне достаточна: алгоритм управления оборотами настроен таким образом, чтобы удерживать температуру GPU на уровне 88-90 оС, а до того момента кулер остается практически неслышимым. В особенности это относится к Radeon HD 6950 : с охлаждением ее СО справляется вообще без проблем, а вот старшую модель при максимальной нагрузке в FurMark все же нельзя назвать тихой. Отдельно стоит отметить, что алгоритм явно не учитывает возможность увеличения порога срабатывания PowerTune: если в штатном режиме кулер Radeon HD 6970 работает громко, но постоянно, то при поднятии порога на 20% он начинает постоянно раскручиваться и замедляться, следуя колебаниям температуры и срабатываниям PowerTune. Звук при этом, соответственно, довольно неприятно пульсирует.

Питание видеокарт обеспечивается двумя разъемами, для Radeon HD 6970 это один 8-контактный и один 6-контактный, для младшей версии – два 6-контактных. VRM организован по схеме 6+2, о нехватке питания или неподключенном разъеме призван сигнализировать установленный на плате пьезодинамик.

Графические интерфейсы представлены двумя DVI, один из которых работает в режиме Dual-Link, второй – Single-Link, одним HDMI 1.4a и двумя mini-DisplayPort 1.2. Об особенностях этой ревизии DisplayPort мы .

Обе видеокарты поддерживают построение массивов CrossfireX вплоть до Quad Crossfire с четырьмя видеокартами. Возле разъемов для подключения мостиков CF можно увидеть неожиданный переключатель, имеющий два положения. Дело в том, что Radeon HD 6900 содержат два чипа BIOS, один из которых поддается перепрошивке пользователем, а второй заблокирован и позволяет в случае неполадок загрузиться с гарантированно стабильными настройками. Вполне возможно, в дальнейшем появится возможность регулировать (или совсем отключать) PowerTune именно редактированием BIOS – тогда наличие такой меры предосторожности более чем оправданно.

Из дополнительной функциональности Radeon HD 6900 ничего нового выделить мы не можем, набор технологий все тот же: поддерживаются панорамный вывод 3D-изображения Eyefinity, стереоскопическая технология HD3D, аппаратное воспроизведение и обработка MPEG-4/ASP, MPEG-4/AVC, MPEG-4/MVC, VC-1 и MPEG-2 посредством движка UVD3.

Перейдем к тестированию

Прежде всего обратим внимание на тест Unigine Heaven: тяжелая нагрузка на тесселяторы ранее делала это приложение настоящим козырем NVIDIA Fermi. Как видим, усовершенствования, проведенные AMD в новых GPU, позволяют им наконец потягаться с соперниками: Radeon HD 6970 идет практически вровень с GeForce GTX 570, у которой блоков тесселяции не 2, как в Cayman, а целых 15. Подчеркнем, что в данном случае нельзя говорить, что Cayman настолько быстрее Fermi в тесселяции: именно в данном тестовом приложении с используемыми им коэффициентами его двух блоков восьмого поколения достаточно для паритета с GeForce GTX 570/580. В целом же геометрическая мощь видеокарт NVIDIA намного выше. Что касается сравнения поколений архитектур ATI/AMD, то тут прогресс налицо: превосходство Radeon HD 6950 над Cypress в виде Radeon HD 5870 составляет 36%.

Переходя к комплексным и игровым тестам, мы сталкиваемся с несколько противоречивой ситуацией. Обе используемых нами версии 3DMark показывают, что Radeon HD 6970 «промахивается» мимо назначенной ей ниши между GeForce GTX 580 и GTX 570, располагаясь сразу под ними. В то же время Radeon HD 6950 работает именно так, как и обещалось, обеспечивая заметный отрыв от GeForce GTX 470 и Radeon HD 6870.

Игровые тесты показывают, что в большинстве случаев AMD Radeon HD 6970 все же оказывается медленнее своих прямых конкурентов, причем иногда очень заметно: обратите внимание на слабо объяснимый провал в Dirt 2. Мы склонны связывать такие результаты с недостаточной отлаженностью драйверов: значительное изменение архитектуры явно потребует оптимизации ПО для наиболее эффективной работы. Вероятнее всего, в списках изменений следующих версий Catalyst мы увидим много сообщений о повышении быстродействия Cayman в тех или иных играх.

Что касается Radeon HD 6950 , то эта модификация радует намного больше флагмана: при ее позиционировании и цене на сегодняшний день конкурентов ей попросту нет, а обеспечиваемый ей уровень производительности более чем достаточен для подавляющего большинства современных игр.

Выводы

В целом новые топовые видеокарты AMD, бесспорно, можно считать новым витком эволюции графической архитектуры компании. Если с технической точки зрения Radeon HD 6800 нас не смогли порадовать, будучи простой доработкой уже существующих GPU, то Radeon HD 6900 действительно содержат серьезно переработанные процессоры. Больший уклон на производительность в среднестатистических расчетах позволил AMD нарастить мощность ядер, тем самым ускорив видеокарты относительно прошлого поколения. К сожалению, острой борьбы с NVIDIA за пальму первенства все же не получилось (уж слишком быстра GeForce GTX 580), однако в рукаве AMD еще остается традиционный козырь – возможное снижение цен. Правда, в случае Radeon HD 6900 оно вряд ли будет таким агрессивным, как с видеокартами прошлого поколения: GPU Cayman заметно сложнее, себестоимость его выше, а следовательно, и «пространства для маневра» у AMD меньше.

Одним словом, революции не произошло, и, в отличие от 2009 года, на этот раз AMD вступает в новый год на позиции догоняющей. Что ж, нам, как конечным потребителям, такая конкуренция лишь на руку.

Установлены новые 40нм графические процессоры Cayman производства Taiwan Semiconductor Manufacturing Company (TSMC). Ожидается, что эти модели вскоре появятся в розничной продаже, ориентировочно по цене от $369 за Radeon HD 6970 и $299 за Radeon HD 6950.

Чипы серии Radeon 6900 первоначально были разработаны для 32нм технологического процесса, но из-за технических проблем компания TSMC решила пропустить 32нм техпроцесс и перейти сразу к 28нм. Поэтому разработчикам AMD пришлось срочно портировать эти конструкции на 40нм линии. Чип Cayman состоит из 2640 миллионов транзисторов, его площадь составляет 389мм². Одной из причин увеличения размера чипа стал новый тесселятор восьмого поколения, который улучшает производительность в , использующих DirectX 11.

Были добавлены новые функции Morphological Anti-Aliasing (MAA) и Enhanced Quality Anti-Aliasing (EQAA). Функция MAA использует технологию постпроцессинговой фильтрации, которая ускоряется с помощью DirectCompute. Она обеспечивает антиалиазинг всей сцены и не ограничивается краями полигонов или частично прозрачными поверхностями.

Принципиальным отличием серии HD 6900 от предыдущих стало то, что энергопотребление видеокарт может быть ограничено с помощью технологии AMD PowerTune, а не исключительно путём ограничения тактовой частоты, как это было ранее. Частоты GPU и памяти будут динамически меняться, чтобы соответствовать пределам TDP для каждой видеокарты. Для решений Radeon HD 6970 может быть установлено максимальное тепловыделение 250Вт, в то время как для HD 6950 оно ограничено 200Вт.

Энергопотребление в режиме ожидания для обоих решений оказывается относительно низким, по 20Вт. Для дополнительного питания Radeon HD 6950 требуется два 6-контактных разъёма, но Radeon HD 6970 потребуется один 8-контактный и один 6-контактный разъёмы. Кроме того, у новых моделей есть переключатель BIOS для сброса настроек BIOS видеокарты до значений по умолчанию, который может понадобиться в случае возникновения проблем с настройками.

До сих пор охлаждение с помощью паровых камер (Vapor Chamber Cooling) использовалось очень редко, гораздо популярнее кулеры для видеокарт на основе тепловых трубок. Но AMD решила использовать такую систему охлаждения в качестве референсной СО, что было принято большинством партнёров производителя. Считается, что паровая камера более эффективно охлаждает чип, чем традиционные тепловые трубки, кроме того, такие модели легче проектировать. Отметим, что в главном конкуренте от nVidia, также используется охлаждение с помощью паровой камеры.

Обе видеокарты имеют по 2 разъёма DVI, разъём HDMI 1.4а и 2 разъёма mini-DisplayPort. Видеокарта может поддерживать до четырёх , а при использовании хабов DisplayPort ─ до шести. Была добавлена поддержка DisplayPort 1.2, это позволяет достичь пропускной способности 21.6Гбит/с. Хабы DisplayPort могут использовать эти полосы пропускания, разделяя их на несколько мониторов с помощью технологии Multi Stream Transport (MST).

Новые видеокарты предназначены для замены моделей серии Radeon HD 5800, одной из самых успешных в истории компании. Видеокарты серии HD 5800 были первыми решениями с поддержкой DirectX 11, но в настоящее время они считается дорогостоящими, и их выпуск постепенно прекращается. Недавно представленная серия Radeon HD 6700 предлагает такую же производительность, как серия HD 5800, но по гораздо более низкой цене. Radeon HD 6970 в целом обеспечивает на 20% лучшую производительность, чем , будучи при этом всего на $20 дороже.

Выпуск Radeon HD 6990 под кодовым названием Antilles состоится в следующем месяце. Это будет модель с двумя графическими чипами Cayman и, вероятно, с 4Гб памяти GDDR5.

Число потоковых процессоров 512 1536 480 1408 1120 1600
Число TMU 64 96 60 88 56 80
Число ROP 48 32 40 32 32 32
Частота ядра 772 МГц 880 МГц 732 МГц 800 МГц 900 МГц 850 МГц
Частота памяти 1.0 ГГц (эффективная 4.0 ГГц) GDDR5 1.375 ГГц (эффективная 5.5 ГГц) GDDR5 950 МГц (эффективная 3.8 ГГц) GDDR5 1.25 ГГц (эффективная 5.0 ГГц) GDDR5 1.05 ГГц (эффективная 4.2 ГГц) GDDR5 1.2 ГГц (эффективная 4.8 ГГц) GDDR5
Ширина шины памяти 384-бит 256-бит 320-бит 256-бит 256-бит 256-бит
Буфер памяти 1.5 Гб 2 Гб 1.25 Гб 2 Гб 1 Гб 1 Гб
Число транзисторов 3 млрд 2.64 млрд 3 млрд 2.64 млрд 1.7 млрд 2.15 млрд
Площадь чипа 520 мм² 389 мм² 520 мм² 389 мм² 255 мм² 334 мм²
Разъёмы питания 1x 8-пин
1x 6-пин
1x 8-пин
1x 6-пин
2x 6-пин 2x 6-пин 2x 6-пин 2x 6-пин
Техпроцесс TSMC 40nm TSMC 40nm TSMC 40nm TSMC 40nm TSMC 40nm TSMC 40nm
Цена $499 $369 $349 $299 $239 $349

AMD Radeon HD 6950/6970:

описание видеокарт и результаты синтетических тестов

Есть смысл еще раз напомнить, что карты требуют дополнительного питания, причем 6950 — двумя 6-контактными разъемами. А 6970 — 8-контактным и 6-контактным. Надеемся, что партнеры AMD будут вкладывать в комплект соответствующие переходники-разветвители питания.

О системе охлаждения.

AMD Radeon HD 6950/6970 2048 МБ 256-битной GDDR5, PCI-E

Стоит заметить, что CO очень схожа по принципу с той, что мы видели на GTX 580/570, и она также базируется на испарительной камере, которая заключена в медном узком отсеке, соприкасающемся с GPU. Над этой камерой выстроена конструкция из ребер охлаждения, через которые проходит воздух, гонимый цилиндрическим вентилятором на конце всего устройства. Правда, в отличие от GTX 580, в данном случае вся конструкция выполнена из меди, включая ребра радиатора, поэтому СО получилась весьма тяжелой.

Мы уже писали, что такое решение — более эффективно, нежели традиционно использовавшееся ранее на тепловых трубках. Внутри испарительной камеры особая жидкость, которая моментально передает тепло от нижней пластины к верхней.

Особо стоит также отметить, что СО настроена на незначительные реагирования при нагреве, чтобы обеспечить почти бесшумную работу. Поэтому нагрев ядра может даже превышать то, что мы видели в случае с 5870.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6970 2048 МБ 256-битной GDDR5, PCI-E

AMD Radeon HD 6950 2048 МБ 256-битной GDDR5, PCI-E

Результаты исследования показали, что, несмотря на все вышесказанное, СО реально эффективна, и даже при частоте вращения 40% от максимума нагрев равен 92 градуса у 6970, а у 6950 — 84. Это после 6-часового постоянного тестирования под нагрузкой в 3D. Да, кому-то 92 градуса покажутся чрезмерно высокими, однако для акселераторов уровня Hi-End это приемлемо.

Максимальное энергопотребление карт под нагрузкой — 250—260 Вт для 6970 и чуть выше 205 Вт для 6950. Мы специально не приводим всяких графиков потребления, чтобы не усложнять прочтение материала. Читателей ведь всегда интересует — сколько оно потребляет в максимуме, чтобы подобрать нужный БП, а детали уже мало кому интересны.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектации, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе CPU Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.11; Nvidia версии 263.09 / 260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
  • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

За неимением собственных синтетических тестов DirectX 11 мы ещё раз воспользовались примерами из пакетов SDK Microsoft и AMD и демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли приложения обоих производителей: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11 (автор — Тимофей Чеблоков, очень известный специалист в 3D-графике).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6970 HD 6970 )
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950 )
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580 )
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570 )

Для сравнения результатов новых моделей видеокарт серии Radeon HD 6900 были выбраны эти модели, потому что Radeon HD 5870 — предыдущее одночиповое решение компании для топового ценового диапазона, сильнейшее до выхода новых моделей; Radeon HD 6870 — текущее решение компании AMD, стоящее на ступеньку ниже топовых и основанное на недавно вышедшем видеочипе Barts.

А именно эти решения Nvidia были взяты потому, что Geforce GTX 580 — быстрейшая одночиповая модель компании, основанная на свежем GPU. Хотя она не является конкурентом представленных видеокарт по цене, её результаты интересны как некая максимальная для решений Nvidia планка. Ну а GTX 570 взята как прямой конкурент для старшей модели новой серии — HD 6970.

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В данном тесте фильтрации 32-битных (8 бит на цвет) текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных. Вот и результаты нашей текстурной синтетики в случае видеоплат серии HD 6900 не дотягивают до пиковых значений. Далее мы рассмотрим скорость текстурирования ещё раз, в тесте из пакета 3DMark Vantage, где получаются более реалистичные цифры.

А тут получается, что HD 6970 выбирает лишь 67 текселей за один такт из 32-битных текстур при билинейной фильтрации, что почти на треть ниже теоретической цифры в 96 отфильтрованных текселей. Для HD 6950 эти цифры соответствуют 62 текселям из 88 теоретических, то есть эффективность младшей модели получилась чуть выше, и это связано с небольшой разницей по пропускной способности видеопамяти, также влияющей на результаты.

Неудивительно, что все карты AMD показывают такую высокую производительность и значительно опережают своих соперников из стана компании Nvidia. У них ведь и теоретические показатели скорости текстурирования весьма высоки. А вот даже топовая GTX 580 имеет лишь 64 TMU и сильно уступает моделям на Cayman, имеющим 88—96 TMU, да ещё и работающих на более высоких частотах.

Весьма любопытной получилась разница между HD 6950 и HD 5870 в разных условиях. Если в случаях с большим количеством текстур, где больше всего сказывается именно количество TMU и их частота, они идут наравне, то при меньшем количестве текстур на пиксель вперёд выходит модель HD 5870. Причём разницу нельзя списать только на ПСП, и вероятно тут сказываются и различные оптимизации в драйверах.

Рассмотрим эти же результаты в тесте филлрейта:

Эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за новыми топовыми решениями семейства Radeon HD 6900, имеющими просто огромное количество TMU и более эффективными в нашем синтетическом тесте. Удивительно, но в случаях с 0—4 накладываемыми текстурами младшая из рассматриваемых сегодня видеокарт почему-то сильно уступает предыдущему топовому решению AMD, хотя в сложных условиях практически не отстаёт от него.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты очень просты для современных GPU и сильно упираются в производительность текстурирования. Поэтому они показывают далеко не все возможности современных видеочипов, но всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями. В данном случае особых отличий между HD 5870 и HD 6950 нет, результаты этих моделей сопоставимы. Хотя один тест выделился — пиксельный шейдер освещения тремя источниками по Фонгу явно зависит от математической производительности GPU, и поэтому уровня HD 5870 в нём достигла только старшая модель — HD 6970.

Производительность в других тестах ограничена по большей части скоростью текстурных модулей и филлрейтом, но с учётом эффективности блоков и кэширования данных. Новые модели серии Radeon HD 6900 несколько быстрее предшествующих: HD 6970 быстрее HD 5870, а HD 6950 быстрее HD 6870 (из другого ценового диапазона). И почти все они опережают обе топовые модели Geforce — даже GTX 580 в этих тестах показывает результат лишь на уровне HD 6870, и в этом явно виноват недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

И в этот раз получилось примерно то же самое, снова GTX 580 конкурирует скорее с HD 6870, чем с реальными топовыми моделями AMD. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Именно поэтому данный тест лучше подходит для архитектуры AMD, чипы которой имеют большее количество математических блоков.

И тут нашлись два интересных момента. Во-первых, HD 5870 обгоняет даже HD 6970, что сложно объяснить одними лишь теоретическими характеристиками. Разница по пиковой математической производительности между этими моделями почти отсутствует, но есть и архитектурные отличия. Похоже, что именно разная эффективность исполнения этого шейдера на тех самых VLIW5- и VLIW4-процессорах и привела к такой разнице не в пользу нового чипа Cayman. Поэтому и HD 6950 в этом тесте выступила лишь на уровне HD 6870, а также GTX 580.

Во втором, сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU.

Вот в этом тесте у новых решений всё прекрасно, HD 6950 обеспечивает результат на уровне HD 5870, а HD 6970 лидирует с хорошим отрывом, почти соответствующим 25-процентной разнице в теоретической скорости текстурирования. Понятно, что видеокартам производства Nvidia здесь ловить нечего, и они показывают результат на уровне заметно более дешёвой модели конкурента.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа. Производительность новых видеокарт AMD в тесте «Frozen Glass» весьма хороша, HD 6970 снова оказалась заметно быстрее, чем HD 5870, а HD 6950 почти догнала её. Увы для Nvidia, но из-за слабого текстурирования решения компании AMD снова оказались заметно быстрее.

Вот во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя уже немногим лучше, и HD 6870 с HD 6950 близки к результатам карты GTX 580 из другого рыночного сегмента, стоящей дороже. Интересно, что HD 5870 снова оказалась быстрее, чем HD 6970. Это подтверждает нашу теорию о том, что скорость в тесте ограничена математической производительностью и что тест чуть хуже подходит новой архитектуре компании AMD.

Есть ещё одно вероятное объяснение — синтетические тесты зачастую очень сильно грузят GPU параллельными расчётами и энергопотребление новых моделей в синтетике вполне может выходить за рамки выставленного ограничения. Следовательно, может снижаться и тактовая частота, а вместе с ней и результаты оказываются ниже, чем ожидалось. Впрочем, это предположение нужно проверять. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для решений Nvidia ситуация стала заметно печальнее, так как со скоростью текстурирования у последних чипов AMD, в отличие от конкурентов, всё очень хорошо, поэтому они лишь наращивают своё и без того неоспоримое преимущество. Даже самый-самый GTX 580 уступает тому же HD 6870 в обоих тестах с упором на текстурирование. Ну а наши новые герои из семейства HD 6900 оказались быстрейшими, HD 6950 даже выиграл у HD 5870, пусть и сущие копейки. А HD 6970 снова стал лидером, что вполне объяснимо теоретически, если посмотреть на производительность блоков TMU.

Всё это были устаревшие задачи, в основном с упором в текстурирование, а реже в филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9-тестах видеокарты производства Nvidia всегда выступают сильнее решений AMD, в противоположность всем предыдущим испытаниям. Такое положение связано с тем, что эти тесты не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения кода пиксельных шейдеров.

В тестах сложных пиксельных шейдеров версии 3.0 новые топовые видеокарты AMD всё же не смогли догнать конкурентов, хотя и заметно приблизились к ним. Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем очень неплохо справляется новая архитектура Nvidia и… новая архитектура AMD. Пожалуй, это первый тест, где мы видим заметную положительную разницу между предыдущей и новейшей архитектурами компании AMD.

И последняя справляется с задачей явно лучше. Хотя даже HD 6970 с трудом конкурирует с GTX 570, но ведь о таком раньше мы вообще не помышляли. Решения Nvidia всегда были неоспоримыми лидерами в этой паре тестовых задач, и традиционно показывали результат намного сильнее. А видеокарты на новом графическом чипе Cayman смогли к ним приблизиться вплотную.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, но в разных условиях по-разному. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории. В D3D10-тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были заметно сильнее, но последние решения AMD к ним подтянулись, что мы видели уже и ранее.

В варианте без суперсэмплинга большее влияние на производительность оказывает эффективный филлрейт (производительность ROP) и пропускная способность памяти. Поэтому решения Nvidia оказались впереди, и только представленный сегодня топовый Radeon HD 6970 почти догоняет младшую GTX 570. Модель ниже уровнем под именем HD 6950 показывает результат на уровне HD 5870, но примерно того же результата добилась и HD 6870. Это и неудивительно, потому что филлрейт у неё даже больше, чем у старших решений серии HD 6900.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Как всегда, включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia заметно падают по сравнению с показателями видеокарт AMD. Теперь тройка моделей с близкими результатами (HD 6870, HD 5870 и HD 6950) опережает GTX 570, а старшее решение HD 6970 с успехом конкурирует с GTX 580. Разница между топовыми картами линеек HD 6000 и HD 5000 осталась примерно той же, новая модель выигрывает несколько процентов у предыдущей.

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую (без SSAA), только позиции Nvidia несколько ослабли. В обновленном D3D10-варианте теста без суперсэмплинга HD 6970 становится на один уровень с GTX 570, что нормально для прямых конкурентов, а лидером остаётся топовая GTX 580. Остальные три видеокарты производства AMD показывают схожие результаты и отстают. Посмотрим, что изменит включение суперсэмплинга, он может вызвать сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD немного улучшили свои показатели относительно решений Nvidia.

Теперь HD 6970 показывает результаты на уровне GTX 580, а примерно равные по скорости HD 6950 и HD 5870 становятся на одну ступеньку с GTX 570. И лишь более дешёвая HD 6870 немного отстаёт от этой видеокарты Nvidia. Сравнительные цифры в парах HD 6970 и HD 5870 снова повторились, разница в пользу более свежих моделей примерно такая же. По этим тестам можно сделать вывод — обе выпущенные сегодня карты семейства HD 6900 справились с «шейдерными» задачами очень хорошо, на уровне традиционно сильных в этих задачах конкурентов Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов привычно соответствуют разнице в частотах и количестве исполнительных блоков, но с влиянием их эффективности. Современная архитектура AMD в таких случаях имеет большое преимущество перед конкурирующими видеокартами Nvidia, и это объясняет результаты тестов, в которых решения AMD явно оказываются значительно более производительными, хотя и не настолько, насколько велико их теоретическое преимущество.

Теоретически, GTX 580 должен быть чуть ли не вдвое медленнее HD 5870 и HD 6970. На практике же разница не доходит и до полутора раз. Конечно, это мало что меняет, ведь даже HD 6870 значительно быстрее обеих карт Nvidia в таких тестах, не говоря уже про топовые модели. В остальном, решения расположились примерно соответственно теории, за некоторыми исключениями.

К примеру, результаты сравнения нового и старого топовых семейств видеокарт AMD получились любопытными. Во-первых, HD 6870 показала идентичный HD 6950 результат в этом тесте при разнице в теоретических цифрах в пользу модели на базе Cayman. Во-вторых, то же самое можно сказать и про связку HD 6970 и HD 5870 — при схожих теоретических цифрах, в реальности с небольшим перевесом побеждает более старая, с потоковыми процессорами на основе архитектуры VLIW5.

И здесь снова есть несколько возможных объяснений — или AMD ещё не полностью оптимизировала драйверы для новых GPU, или архитектура Cayman менее эффективна в этом тесте (при этом вполне возможно, что она будет более эффективной в менее прямолинейных тестах), или повлияла технология PowerTune, или в этом тесте начало сказываться и ограничение пропускной способностью видеопамяти.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В этот раз все GPU остались примерно на тех же позициях, кроме относительной производительности Cayman и Cypress/Barts. Теперь в этих парах уже всё в строгом соответствии с теоретическими цифрами пиковой производительности, а HD 6970 даже немного обгоняет HD 5870, то есть в этом случае новая архитектура сработала эффективнее. И в паре HD 6950 и HD 6870 теперь такая разница в пользу топового решения, какая и должна быть.

В остальном — ничего нового. Так как скорость рендеринга тут ограничена исключительно производительностью шейдерных блоков, то HD 6970 и HD 5870 являются лидерами, за ними следуют остальные видеокарты AMD, а обе Geforce уступают в том числе и младшей модели из другого ценового диапазона. Хотя преимущество решений AMD всё равно остаётся несколько ниже, чем при сравнении теоретических цифр — это говорит о том, что КПД суперскалярных процессоров VLIW5 и VLIW4 ниже 100%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти или филлрейтом в определённой мере (в рамках одного производителя).

Увы, хотя мы видели ранее рост геометрической производительности решений на Barts в этом тесте, в этот раз видеокарты нового семейства оказались примерно на том же уровне, что и Radeon HD 5870 предыдущего поколения. Возможно, виновато ограничение производительности ПСП видеопамяти, но ведь HD 6870 весьма силён в этом тесте и обогнал даже HD 6950. Так что скорее всего виноват эффективный филлрейт, то есть производительность ROP.

В любом случае, всем решениям AMD очень далеко до топовых видеокарт Nvidia, и хотя выполнение геометрических шейдеров может и стало более эффективным, но этого явно недостаточно. Основанные на GF110 видеокарты Nvidia справляются с работой почти вдвое быстрее всех видеокарт конкурента. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились ни для решений Nvidia, ни для AMD. Новые видеокарты семейства HD 6900 в данном тесте слабо реагируют на изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, как и остальные решения, но всё же показывают результаты чуть выше, чем на предыдущей диаграмме. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга должна быть ограничена геометрической производительностью, но обрабатываемых примитивов явно недостаточно, чтобы новая архитектура компании AMD показала значительно более высокий результат, хотя и есть небольшая разница, которая объясняется архитектурными изменениями в GPU.

Видеокарты Nvidia всё так же остаются лидерами теста, но тот же Radeon HD 6970 уже почти догнал младшую модель GTX 570. А HD 6950 обгоняет HD 5870, пусть и не слишком сильно. И эти неплохие результаты явственно говорят о наличии оптимизаций по обработке геометрических данных в новых чипах.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте разница между чипами AMD с традиционным графическим конвейером (в т. ч. и Cayman с его двумя растеризаторами) и чипами с архитектурой Fermi заметна сразу. Хотя мы знаем по предыдущим исследованиям, что младшие чипы Nvidia по скорости исполнения геометрических шейдеров отстают, показывая не такие впечатляющие результаты, так как их возможности по геометрической обработке урезаны. Зато результаты GTX 570 и GTX 580, имеющих в основе чип GF110, очень хороши и почти вдвое выше, чем у лучшего из решений компании AMD.

И это решение — новенький Radeon HD 6970. Возможности нового топового чипа по обработке геометрии и скорости исполнения геометрических шейдеров явно выросли по сравнению с другими видеокартами компании. И новые решения на Cayman показывают в этих тестах результаты выше, чем решения на базе Cypress и Barts, хотя и далеко не втрое, и даже не вдвое. Вероятно, инженерам AMD ещё предстоит решать задачу распараллеливания работы блоков установки треугольников (geometry setup), в которую могут упираться эти тесты.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Это хорошо видно по сравнительным результатам Radeon HD 5870 и HD 6950, да и прочих решений AMD. Похоже, что именно ПСП и ограничивает их производительность в тесте, поэтому и разница между всеми решениями не так уж велика.

Тем не менее, очень хорошие результаты показывает HD 6970 на новом GPU — он почти достаёт GTX 570, с которым и придётся конкурировать этой модели в реальном мире. Ну и лидером остаётся самая дорогая и производительная GTX 580. Обе карты семейства HD 6900 показали себя неплохо, младшая новая модель идёт почти наравне с предыдущей топовой. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме заметно изменилось, особенно в тяжёлом режиме. Хотя видеокарты Nvidia почему-то потеряли в производительности именно в наиболее лёгких условиях. Как раз при малом количестве полигонов скорость упирается в ПСП и в этом случае новые платы AMD почти догнали топовые решения конкурента.

А вот в тяжёлых режимах разница в пользу Nvidia выросла до полуторакратной, там GTX 580 и GTX 570 остаются недосягаемыми для соперников. Старшая видеокарта семейства HD 6900 обгоняет остальные решения AMD, хотя это снова слабо заметно при сравнении с HD 5870. Можно было бы сказать о влиянии ПСП, но ведь конкурента-то это не останавливает…

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Любопытно, что результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. В этом тесте все видеокарты AMD и Nvidia показывают очень близкие результаты, что также можно списать на ограничение пропускной способностью видеопамяти. Этот показатель у всех представленных видеокарт находится в районе 130—190 ГБ/с, и разброс невелик. Лучшей среди видеокарт AMD снова стала свежая модель Radeon HD 6970. Рассмотрим второй вариант этого же теста:

И снова произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia «просели» только в лёгком режиме, а AMD во всех трёх. И поэтому в режиме с малым количеством полигонов разница между решениями небольшая, а вот в среднем и тяжёлом GTX 580 и GTX 570 заметно опережают все модели Radeon, в том числе и из анонсированного сегодня семейства HD 6900. По сравнению с Cypress новый GPU показывает результат примерно на том же уровне, и мы делаем вывод, что в тестах вершинных выборок никаких заметных изменений при переходе от Cypress к Cayman нет.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Тесты Feature этого тестового пакета обладают поддержкой DirectX 10 и интересны уже тем, что отличаются от наших. При анализе результатов новых видеокарт в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. К сожалению, ещё более новый тестовый пакет компании — 3DMark11 — не содержит специализированных синтетических тестов и нам в данном случае совсем неинтересен.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя текстурный тест компании Futuremark также не показывает теоретически возможного уровня скорости текстурных выборок, но всё же эффективность новых видеокарт семейства Radeon HD 6900 в нём несколько выше, чем в нашем. Да и решения Nvidia также более эффективно используют имеющиеся текстурные блоки. Поэтому в данном текстурном тесте получается несколько иное соотношение результатов по сравнению с нашим.

Видеокарты нового семейства компании AMD показывают результаты, полностью соответствующие теоретическим параметрам. HD 6950 немного быстрее, чем HD 5870, а модель HD 6970 является явным лидером теста. Наглядно видно, что текстурная производительность Cayman заметно выросла по сравнению с Cypress. А вот HD 6870 на основе чипа Barts показывает худший результат, аналогичный цифрам топовой видеокарты Nvidia. Ну а GTX 570 проигрывает в текстурировании вообще всем, как и в нашем тесте.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Совсем иная ситуация в тесте производительности блоков ROP. Цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP, почти без влияния величины пропускной способности видеопамяти. Модель HD 6970 показывает отличный результат, почти догоняя топовую GTX 580 и опережая своего конкурента GTX 570.

В свою очередь, HD 6950 также оказывается не только впереди своего конкурента GTX 570, а обогнала ещё и предшественницу — HD 5870. Отмечаем несколько бо́льшую эффективность блоков ROP и более высокую скорость заполнения у новых моделей видеокарт компании AMD по сравнению со старыми чипами.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен баланс блоков GPU. Влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме весьма похожи на то, что мы видели в тесте текстурной производительности из 3DMark Vantage. А вот платы Nvidia в данном случае получили небольшое увеличение производительности, что говорит о том, что не только текстурная производительность влияет на результаты теста.

Новые модели AMD вновь серьёзно заявили о себе, обогнав свою предшественницу в лице HD 5870. А вот HD 6870 из другого ценового сектора показала заметно более слабый результат, став аутсайдером этого теста (что вполне сглаживается её низкой ценой). Что касается сравнения Cayman с конкурирующими решениями Nvidia, то обе новые видеокарты семейства HD 6900 опередили даже топовую модель линейки Geforce GTX 500.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит от многих параметров, но основными являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Логично, что видеокарты производства Nvidia чувствуют себя в этом приложении как рыба в воде, и значительно опережают конкурентов, в том числе и представленные сегодня топовые модели.

Это один из немногих тестов без тесселяции, в которых видно преимущество у представленных недавно видеокарт новой серии Radeon HD 6800 и сегодняшних героев HD 6900. Скорость рендеринга всех этих моделей в данном тесте выше, чем у топовой модели предыдущей линейки. Это объясняется тем, что и в Barts, и в Cayman увеличили скорость обработки геометрии и выполнения геометрических шейдеров. И хотя даже HD 6970 продолжает серьёзно отставать от GTX 570, новая модель всё же значительно улучшила позиции компании AMD в этом тесте.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, но в нём скорость обработки геометрии ещё важнее. Именно поэтому прошлое поколение в виде карты Radeon HD 5870 отстало как от обеих моделей Geforce, являющихся неоспоримыми лидерами сравнения, так и от всех новых моделей видеокарт AMD, семейств HD 6900 и HD 6800. А все платы, основанные на Cayman и Barts, показали более высокие результаты, чем единственное решение на Cypress, уступив только сильным конкурентам.

Похоже, что в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, снова нет значительного влияния распараллеленной обработки геометрии на Cayman, так как Barts показал близкий результат. Поэтому и оба решения линейки HD 6900 продолжают отставать от конкурирующих видеокарт соперника, имеющих отличную скорость обработки геометрии — до двух раз выше. От топового решения компании AMD, основанного на новой архитектуре с двумя блоками обработки геометрии, мы всё же ожидали несколько большего прогресса.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы увидели ещё более интересную картину, чем в аналогичных тестах из нашего тестового пакета. Показанная на диаграмме производительность решений лишь примерно соответствует тому, что должно получаться по теории и несколько расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Даже по теоретическим характеристикам новых моделей HD 6970 и HD 6950 было понятно, что они не усилили пиковую производительность математических вычислений по сравнению с HD 5870. Но всё же и явного отставания мы не ждали. Да, своих конкурентов из Nvidia обе платы обогнали с огромным запасом, но мы к этому привыкли, ведь видеокарты Geforce показывают не очень высокие результаты в таких случаях; простая и интенсивная математика выполняется на Radeon значительно быстрее.

Неожиданно то, что новая старшая модель проиграла 7% предыдущей топовой, хотя теоретически должна уступать не более 1%. Тут снова можно начинать гадать о том, что послужило причиной этого проигрыша своему же предшественнику. То ли в этом виноват недостаток оптимизации драйверов для новых решений, то ли меньшая эффективность архитектуры VLIW4 в таких тестах, то ли слишком умная система управления питанием на новых моделях, «зарезавшая» тактовую частоту и производительность решений при достижении установленного порога энергопотребления.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Возможно, пример для вычислительных шейдеров не самый удачный, но их пока вообще мало. Все видеокарты показывают близкие результаты в этом тесте, но побеждает всё-таки топовая модель Geforce GTX 580. Анонсированные сегодня платы на новом чипе Cayman уступают ей совсем немного, и только при использовании пиксельного шейдера. Прямой конкурент новых решений компании AMD — видеокарта GTX 570 — отстаёт от них в обоих режимах: и с использованием пиксельного, и с использованием вычислительного шейдеров.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот более интересные результаты, для решений AMD чем-то похожие на цифры из математического теста 3DMark Vantage. Несмотря на большое теоретическое превосходство в пиковых цифрах, быстрейшая видеокарта Radeon HD 5870 лишь немного опережает лучшее решение Nvidia. А обе новые модели семейства HD 6900 показывают результаты, близкие к показателям своего прямого конкурента — Geforce GTX 570.

Но нас сегодня больше интересует разница между результатами решений на Cayman и Cypress, и тут мы снова видим, как побеждает старая видеокарта, да с каким преимуществом! 17% между HD 5870 и HD 6970 в пользу первой — в очередной раз математические тесты обнажают разницу между красивой теорией и жестокой практикой. Ну где же те применения, в которых новый GPU сможет показать свою силу? Возможно, в тестах тесселяции всё встанет наконец на свои места.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но главным нововведением в Direct3D 11 всё же считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V и других. В некоторых из них тесселяция используется для моделей персонажей (все игры жанра FPS из перечисленных), в других — для имитации реалистичной водной поверхности (DiRT 2) или ландшафта (Civilization V).

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. Он показывает не только тесселяцию, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Рассмотрим сначала попиксельные техники. Parallax occlusion mapping (средние столбики на диаграмме) на видеокартах обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а умеренная тесселяция не даёт большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то тут самый важный вывод в том, что видеокарты AMD немного быстрее плат Nvidia в самом лёгком режиме, но медленнее в сложных попиксельных расчётах (вспоминаем тесты parallax mapping ранее). А до выхода плат на Cayman карты Geforce были чуть-чуть быстрее решений AMD и при включенной тесселяции.

Но теперь разница по скорости обработки геометрии между HD 6900 и HD 5870 хорошо видна — новые платы на базе Cayman в подтесте с тесселяцией оказались заметно быстрее Cypress. В этом тесте с небольшим коэффициентом разбиения треугольников HD 6970 даже обогнала своего конкурента GTX 570 с хорошим запасом.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

Лишь в этом примере мы впервые видим по-настоящему полное сравнение геометрической мощи решений AMD и Nvidia. Очень сильно выделяется как графическая архитектура Fermi, так и новый GPU производства AMD под именем Cayman. Отбросим в сторону то, что это чисто синтетический тест и такие экстремальные коэффициенты разбиения не будут использоваться в играх сегодняшнего дня, нам сейчас интересен потенциал. Синтетика ведь и нужна для того, чтобы оценить перспективность и отличия разных решений.

Сразу видно, что с видеокартами Nvidia Geforce на чипе GF110 конкурировать невозможно, в задачах экстремальной тесселяции они в разы быстрее даже обновленной архитектуры AMD. Но это архитектура, специально разработанная изначально с учётом возможностей нового API. А что же с Cayman? По сравнению с Cypress всё очень хорошо!

Новые модели компании AMD в режимах средней нагрузки показывают впечатляющий прирост в скорости, и разница по сравнению с HD 5870 достигает более чем двукратной. Однако такой прирост мы видим не всегда, а чаще всего он укладывается в полуторакратный. Обещанной трёхкратной разницы мы, по крайней мере, точно не увидели. То есть, Cayman хотя и сократил отставание от конкурента в задачах обработки геометрии, но до распараллеленной работы 16 блоков тесселяции в GF110 всё ещё очень далеко.

С другой стороны — наибольшая разница между решениями разных компаний достигается в условиях экстремальной тесселяции, которых нет и пока что не ожидается в реальных играх. Поэтому скорее всего Cayman заметно укрепит позиции компании AMD в существующих игровых бенчмарках с применением тесселяции. Особенно если коэффициент разбиения будет не слишком большим, как в тестах 3DMark11.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто замечательно, вот чего не хватает в нынешних играх:

Island не является чисто синтетическим тестом для измерения геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры, поэтому разница в производительности может быть меньше, чем в предыдущем случае, зато такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU.

Мы протестировали программу при четырёх разных коэффициентах тесселяции, эта настройка называется Dynamic Tessellation LOD. Если при самом низком коэффициенте разбиения впереди оказываются видеокарты компании AMD, то при усложнении работы платы на основе GF110 сразу вырываются далеко вперёд. При росте коэффициента разбиения и сложности сцены производительность всех Radeon падает очень сильно, в отличие от скорости конкурирующих решений.

Причём в этот раз HD 5870 почему-то даже опережает обе модели нового семейства. То есть налицо обратная теории разница в задаче со сложной геометрией. И объяснение этому может быть только одно — недостаток оптимизации драйверов для новой архитектуры, ведь в предыдущих тестах мы видели её явное преимущество над Radeon HD 5870, основанном на чипе Cypress. Ну а в этом тесте мы пока что вынуждены констатировать разгром Cayman — при максимальном коэффициенте LOD разница между скоростью Geforce и Radeon достигла 4—6 раз!

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов видеокарт из нового семейства Radeon HD 6900, основанных на графическом процессоре Cayman, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно сделать вывод о том, что новинки — неплохая замена линейке Radeon HD 5800, хотя и не слишком сильно отличающаяся от неё по производительности, по крайней мере в синтетических тестах.

Графический процессор Cayman выполнен на основе новой архитектуры и отличается от предыдущих чипов аппаратно, хотя количество некоторых исполнительных блоков в нём не выросло. Зато новый GPU отличается архитектурными улучшениями, направленными на увеличение эффективности вычислений на GPU (таких тестов у нас считайте что и нет) и, что ещё более важно, смягчение важного отставания от конкурента в виде производительности обработки геометрии. Многие из синтетических тестов показывают, что скорость тесселяции и выполнения геометрических шейдеров заметно выросла, пусть и не всегда в несколько раз, как нам было обещано.

Благодаря архитектурным изменениям и своим частотным характеристикам, результаты видеокарт новой серии во многих синтетических тестах являются конкурентоспособными для своего ценового сектора, особенно по сравнению с прямым конкурентом Geforce GTX 570. Ещё более хорошо это видно в вычислительных тестах из пакетов RightMark и Vantage. Да и в остальных приложениях решения семейства HD 6900 показали неплохую скорость, чаще всего уступающую только топовой видеокарте Nvidia.

К сожалению, не обошлось и без не очень приятных сюрпризов. Несмотря на бо́льшую сложность и площадь чипа по сравнению с Cypress, результаты моделей HD 6900 в некоторых математических тестах были ниже, чем у HD 5870, что довольно непросто объяснить, и мы пока не уверены в причинах такого отставания. Возможно, виноват недостаток оптимизации драйверов, а может быть эффективность новой архитектуры VLIW4 в наших тестах оказалась ниже. Вполне вероятно и то, что система управления питанием на новых моделях понижала тактовые частоты при достижении максимального энергопотребления в требовательных синтетических тестах, не позволяя им показать ожидаемую, исходя из числа блоков и их тактовой частоты, производительность.

Наверняка многие ожидали, что Radeon HD 6970 сможет на равных соперничать с GTX 580 во всех тестах, но этого не произошло, хотя результаты были показаны очень неплохие и вполне соответствующие рекомендованным ценам на анонсированные сегодня модели. Предполагаем, что результаты Radeon HD 6970 и HD 6950 в синтетических тестах будут подтверждены и соответствующими цифрами в «игровой» части нашего материала. В играх старшая HD 6970 должна будет выступить примерно на уровне GTX 570, в некоторых тестах чуть медленнее, а в других — быстрее, а HD 6950 хоть и окажется медленнее этой модели Nvidia, но ведь и цена на эту видеокарту установлена ниже. Так давайте же скорее перейдём к исследованию скорости в играх!

Сегодня, 15 декабря 2010 года, была официально представлена серия видеокарт AMD Radeon HD 6900. Как и было обещано, ее презентация состоялась менее чем через месяц после выхода серии AMD Radeon HD 6800. Новым одночиповым лидером AMD Radeon HD 6970 планирует потеснить недавно вышедший NVIDIA GeForce GTX 570, а в лице AMD Radeon HD 6950 представить оптимальное высокопроизводительное решение.

Итак, «расстановка сил» на четвертый квартал 2010 года с точки зрения компании AMD должна выглядеть следующим образом. Самой производительной видеокартой на сегодня так и останется двучиповая видеокарта ATI Radeon HD 5970 . Одночиповым же лидером должен остаться конкурирующее решение NVIDIA GeForce GTX 580 , имеющее максимальную стоимость и отличающееся наибольшим энергопотреблением. А вот в классе лучших по соотношению цена/возможности GPU, как раз и должен расположиться AMD Radeon HD 6970. Класс пониже имеет младшая модель этой же серии AMD Radeon HD 6950. На слайде не указана с кем именно суждено конкурировать ей, но судя по всему, по производительности она будет находиться между видеокартами NVIDIA GeForce GTX 480 и NVIDIA GeForce GTX 470. В среднем классе видеокарт все останется без изменений: видеоускорители AMD Radeon HD 6800 должны успешно конкурировать с NVIDIA GeForce GTX 465, а ATI Radeon HD 5700 - c NVIDIA GeForce GTS 450.

Графические ускорители Cayman, также как Cypress и Barts, выполнены по 40 нм техпроцессу. Поневоле задаешься вопросом: «За счет чего, новые видеоускорители могут стать лучше?». Ответ на этот вопрос можно дать быстро, а вот чтобы очертить основные моменты «оптимизации» графического ядра понадобится время.

Первым самым заметным изменением чипов Cayman стало внедрение преобразованной архитектуры ядра VLIW4, вместо VLIW5, которая была характерна для графических процессоров Cypress и Barts. Ее суть заключается в уменьшении количества блоков в суперскалярном потоковом процессоре с пяти до четырех. За ненадобностью был исключен пятый блок специальных функций, так называемый T-блок. Подобное нововведение в архитектуре позволяет надеяться на 10% увеличение производительности в расчете на мм² кристалла.

Также в графических ускорителях серии AMD Radeon HD 6900 был изменен вид блоков окончательного рендеринга изображения, а именно блоки ROP. Модули Z/Stencil ROP были объединены с блоками Color ROP, что должно ускорить операции записи данных.

Следующей немаловажной оптимизацией стало внедрение механизма асинхронного выполнения команд «Asynchronous dispatch», что позволяет более эффективно использовать возможности GPU, избегая «затора» команд. Другое улучшение - двойной DMA-движок должен позволить ускорить процесс чтения и записи данных в памяти.

Двойным стало и построение логики управления GPU, благодаря чему появилась возможность обработки двух примитивов за один такт.

Двойная структура блоков управления и использование нового тесселятора теоретически очень положительно должны отразится на быстродействии в играх с поддержкой DirectX 11. Судя по данным компании AMD, по сравнению с ATI Radeon HD 5870 новый AMD Radeon HD 6970 оказывается в среднем на 35% производительнее.

Вместе с новой архитектурой был представлен новый алгоритм сглаживания улучшенного качества - Enhanced Quality Anti-Aliasing (EQAA). Для нового режима сглаживания характерно до 16 оценочных выборки на пиксель. Причем число цветов и оценочных выборок можно регулировать независимо. Положительным фактом является и то, что этот механизм сглаживание EQAA совместим с адаптивными методами сглаживания Super-Sample AA и Morphological AA.

Побочным эффектом включения фактически любого вида сглаживание является падение производительности. Судя же по приведенным показателям, производительность после включения режима расширенного качества уменьшается незначительно, что должно позволить насладиться более качественной картинкой при той же «играбельности».

Также на презентации видеокарт серии AMD Radeon HD 6900 отмечалась поддержка режима сглаживания Morphological AA (MLAA), который относится к пост-фильтрации. Данный режим фильтрации быстрее, чем SSAA, обеспечивая заметное улучшение качества изображения, и является совместимым с играми DirectX 9, 10 и 11.

Одним из последних нововведений, реализованных в серии видеоускорителей AMD Radeon HD 6900, стала оптимизация энергопотребления - технология AMD PowerTune. Для очень мощных видеоускорителей вопрос питания, обычно, является одним из наиболее болезненных. Поэтому видеокарта имеет механизм ограничения энергопотребления в случае превышения граничных значений. За этим специально следят интегрированные процессоры контроля питания.

Управление технологией AMD PowerTune можно осуществлять с помощью AMD OverDrive в AMD Catalyst Control Center, увеличивая или уменьшая диапазон энергопотребления.

А теперь давайте перейдем к не менее интересным деталям спецификации:

AMD Radeon HD 6870

AMD Radeon HD 6850

ATI Radeon HD 5870

ATI Radeon HD 5850

Кодовое имя

Cayman XT

Число транзисторов

2 , 6 4

2 , 6 4

Количество потоковых процессоров

Производительность, TFLOPs

Текстурных блоков

Фильтрация текстур, GTexels/s

Цветовой ROPs

Фильтрация пикселей, GPixels/s

Z/Stencil, GSamples/s

Частота ядра, МГц

Частота памяти, ГГц

1,375 (5,5 эффект-я) GDDR5

1,25 (5,0 эффект-я) GDDR5

1,05 (4,2 эффект-я) GDDR5

1,0 (4,0 эффект-я) GDDR5

1,2 (4,8 эффект-я) GDDR5

1,0 (4,0 эффект-я) GDDR5

Разрядность шины памяти, бит

Пропускная способность памяти, ГБ/c

Кадровый буфер, ГБ

Техпроцесс

TSMC 40 нм

TSMC 40 нм

Максимальное / минимальное энергопотребление, Вт

Старшая модель новой серии имеет 96 текстурных блока и 24 суперскалярных процессора, которые вмещают 1536 блоков ALU. Предыдущий лидер ATI Radeon HD 5870 имел только 80 текстурных блоков, но число блоков ALU у него было больше - 1600. При этом нужно учитывать, что он построен по архитектуре VLIW5. По заявленному уровню производительности 2,7 TFLOPs графический ускоритель AMD Radeon HD 6970 практически равен ATI Radeon HD 5870, который имеет 2,72 TFLOPs.

Частота ядра графического процессора AMD Radeon HD 6970 составляет 880 МГц. Также в вышеприведенной спецификации производитель отмечает обработку двух примитивов за рабочий цикл и наличие 128 блоков Z/Stencil ROPs. Разрядность шины памяти видеоускорителей серии AMD Radeon HD 6900, также как AMD Radeon HD 6800 и ATI Radeon HD 5800, равна 256 бит. На «референсную» модель видеокарты предусматривается установка аж 2 ГБ видеопамяти GDDR5 с эффективной частотой 5500 МГц. Энергопотребление видеокарты, основанной на AMD Radeon HD 6970, должно составлять менее 300 Вт. Для подведения дополнительного питания к ней предусматривается наличие одного 8-контактного и одного 6-контактного разъемов PCIE.

Судя по результатам тестирования компании AMD, своего конкурента в лице NVIDIA GeForce GTX 480 новая видеокарта на AMD Radeon HD 6970 должна опережать во всех популярных 3D-играх в среднем на 15%.

Кроме того, отмечается, что производительности всего одной видеокарты на AMD Radeon HD 6970 должно быть достаточно для игры на трех мониторах по технологии AMD Eyefinity в разрешении 5760х1080.

Сравнения в одиночном режиме нового и предыдущего флагмана AMD в презентации не приводится, но зато отмечено, что в режиме AMD CrossFireX ускорители AMD Radeon HD 6970 будут быстрее, чем ATI Radeon HD 5870.

Вторая модель новой серии - теоретически на 17% должна быть менее производительна, чем старшие решения на AMD Radeon HD 6970. AMD Radeon HD 6950 имеет 22 SIMD процессора, что при архитектуре VLIW4 означает наличие 1408 блоков ALU. Частота графического ядра немного меньше 800 МГц. А вот разрядность шины и объем видеопамяти GDDR5 у «референсной» модели такие же. Но при этом эффективная частота памяти на видеоускорителе AMD Radeon HD 6950 меньше - 5000 МГц, против 5500 МГц.

Максимальное энергопотребление видеокарты AMD Radeon HD 6950 должно быть не более 225 Вт, что обуславливает наличие только двух 6-контактных разъемов питания PCIE.

Судя по результатам внутреннего тестирования производительности, AMD Radeon HD 6950 на 20% превосходит NVIDIA GeForce GTX 470.

Аппаратной инновацией серии видеокарт AMD Radeon HD 6900 можно назвать наличие переключателя между двумя микросхемами BIOS. Одну из микросхем BIOS можно переписывать и обновлять, в то время как вторая защищена от перезаписи и хранит фабричные настройка по умолчанию. Такое нововведение должно очень понравиться энтузиастам.

Серия видеокарт AMD Radeon HD 6900 имеет сразу пять портов для вывода изображения, что позволяет подключить к одной видеокарте сразу шесть мониторов. Причем порты, как и в случае с ускорителями серии Barts, соответствуют новым версиям спецификаций DisplayPort 1.2 и HDMI 1.4a.

На презентации новой серии видеокарт AMD Radeon HD 6900 было посвящено немало программной поддержке всех видеокарт AMD Radeon - пакету AMD Catalyst Software. Ведь неотъемлемой частью любого компьютерного продукта является его программная поддержка: драйверы, компоненты расширения возможностей, панель управления. В этом направлении компания AMD также усиленно работает, каждый месяц выпуская новые версии драйверов для видеокарт, оптимизируя их под современные 3D-игры.

На данный момент драйвера и утилита управления AMD Catalyst Control Center поддерживает четыре операционные системы: Windows 7, Windows Vista, Windows XP и Linux. Причем по статистике за 2010 год с официального сайта было скачано более чем 50 млн. комплектов драйверов AMD Catalist.

Наглядным примером эффективности оптимизации драйверов может служить производительность видеокарт серии ATI Radeon HD 5800 в ряде популярных игр при обновлении пакета AMD Catalyst с версии 9.10 на 10.10. Самый значительный прирост производительности наблюдался в игре Resident Evil 5, который составил 68%, в игре Metro 2033 прирост составил 48%, и в Dirt 2 - 43%. Еще в шести популярных играх наблюдались немного меньшие улучшения в среднем равные 15%. При этом в список оптимизируемых входит значительно больше число программ и игр, где тоже не лишними окажутся +5-10% быстродействия только благодаря обновлению ПО. Кроме того, новы версии исправляют ошибки - система работает стабильнее, а в играх исчезают «артефакты».

Стоит отметить, что компания AMD почти еженедельно создает AMD Catalyst Application Profiles (CAP), профиля специально для увеличения эффективности многовидеоускорительных конфигураций или оптимизации режимов сглаживания в новых приложениях.

Помимо этого компания AMD подчеркивает наличие в пакете AMD Catalyst комплекта кодеков DivX для медиакодирования на графических картах серий AMD Radeon HD 6800 и 6900, а также поддержку новой спецификации графического API - OpenGL 4.1.

Небольшим анонсом презентации стало то, что в 2011 году AMD Catalyst Control Center поменяет свой интерфейс на более понятный для пользователя. Новшества AMD Catalyst Control Center заключаются в двух разных видах для стандартного и расширенного режима управления, а также возможности динамического обновления драйверов для установленного оборудования AMD.

Но хватит теории - пора переходить к практике.

По своей конструкции видеокарты AMD Radeon HD 6970 и AMD Radeon HD 6950 очень похожи. И если бы не маркировка и надписи на системе охлаждения, то с первого взгляда их не отличить.

Видеокарта AMD Radeon HD 6970 эталонного дизайна

Длина видеокарт серии AMD Radeon HD 6900 от заглушки до «хвоста» составляет 275 мм. Конечно это не очень короткий видеоускоритель, но и не такой длинный как ATI Radeon HD 5870. Для своего класса видеокарт имеет вполне приемлемую длину.

На видеокарте установлен кулер турбинного типа, который занимает два слота расширения. С обратной сторона видеокарта прикрыта металлической панелью, которая увеличивает жесткость и обеспечивает более надежное крепление кулера.

Само оформление видеокарт AMD Radeon HD 6900 очень сильно напоминает исполнение видеоускорителей серии AMD Radeon HD 6800 с чередующимися красно черными полосками. Дополнительные разъемы питания, один 8-ктнтактный и один 6-контактный, выведены с верхней части перпендикулярно текстолиту, что более удобно при подключении, особенно в не самых просторных корпусах, чем положение разъемов в торце.

На интерфейсной панели видеокарт AMD Radeon HD 6900 имеется два порта DVI-D, два разъема DisplayPort 1.2 и один HDMI 1.4a.

Переключатель BIOS также присутствует на обеих моделях видеокарт этой серии в верхней части рядом с разъемами CrossFire, позволяющими собрать в одну систему до четырех подобных карт.

Сняв заднюю металлическую панель с корпуса видеокарты, можно выяснить, что она служит в большей степени для придания жесткости плате. Греющихся элементов от которых она могла бы отводить тепло, вроде микросхем памяти или элементов узла питания, на обратной стороне нет.

Система охлаждения видеокарт выполнена из меди на основе достаточно габаритной испарительной камеры, принцип которой также используется и на последних видеокартах NVIDIA.

Разводка печатной платы предполагает расположение всех наиболее горячих узлов на лицевой стороне, что обеспечивает возможность эффективного отвода тепла от них благодаря наличию производительного кулера.

Стабилизатор питания видеокарты AMD Radeon HD 6970 имеет 6+2-фазное исполнение и управляется ШИМ-контроллером VT1556MF от Volterra. В случае со старшей моделью серии посадочные места под элементы в этой части платы заняты почти все. На случай неверного подключения разъемов питания или вообще их отсутствия здесь же расположен встроенный спикер, громко оповещающий владельца о нештатной ситуации.

Сам графический процессор выполнен без теплораспределительной крышки, поэтому при монтаже системы охлаждения следует быть осторожным. Утилита GPU-Z пока не совсем знакома с новинкой, поэтому придется подкорректировать ее отчет. Графический процессор Radeon HD 6970 вмещает 1536 блоков ALU и 128 блоков Z/Stencil ROPs. Рабочая частота ядра составляет 880 МГц. Разрядность шины памяти равна 256 бит.

На эталонной карте установлено 2 ГБ видеопамяти GDDR5 восемью микросхемами Hynix H5GQ2H24MFR-R0C, которые работают с эффективной частотой 5500 МГц. Однако эти чипы имеют небольшой запас пропускной способности, т.к. при напряжении питания 1,6 В они, по спецификации, обеспечивают эффективную частоту 6,0 ГГц.

Мы постарались оценить, насколько хорошо справляется с охлаждением видеокарты AMD Radeon HD 6970 её система охлаждения на основе испарительной камеры. При автоматическом режиме управления скоростью вращения турбины, интенсивная нагрузка заставляет графический процессор разогреваться до впечатляющих 90°C. Но сам кулер в таком режиме работает на 40-45% своей эффективности, хотя это и составляет до 2500 об/мин, сопровождаясь небольшим, но четко различимым шумом.

Если же в ручном режиме установить максимальную скорость вращения турбины, то температура GPU быстро уменьшается почти на треть, но вращающийся со скоростью более 5600 об/мин кулер создает невыносимый шум. Таким образом, используемая система охлаждения способна охладить видеокарту, но тихой ее назвать очень тяжело - производителям альтернативных систем охлаждения такая ситуация должна быть на руку, а покупателю, желающему чтобы видеокарта работала быстро, но тихо при любой нагрузке, стоит подготовиться к дополнительным расходам.

В режиме же простоя энергопотребление видеокарты заметно уменьшается благодаря оптимизации рабочих частот и напряжения питания. В таком режиме карта остается тихой.

Разгон AMD Radeon HD 6970

Немного ускорить видеокарты на AMD Radeon HD 6970, наверняка, сможет каждый владелец, воспользовавшись стандартной вкладкой AMD Catalyst Control Center - ATI Overdrive. Причем в нашем случае, даже оставив управление кулером на логике карты и не прибегая к попытке оптимизации энергопотребления, мы сразу же «уперлись» в стандартный потолок, заложенный в этот компонент и обеспечивающий безопасность разгона. Поэтому для попытки оценить частотный потенциал GPU и видеопамяти мы воспользовались утилитой MSI Afterburner 2.1.0 Beta 5.

Попавший к нам официальный образец смог стабильно функционировать на частоте 964 МГц для графического процессора и 1541 МГц (эффективная 6164 МГц) для видеопамяти, что на 9,5% и 12% выше номинала соответственно, и обеспечит минимум 10% прирост быстродействия в играх, правда при увеличении вдвое шумности.

Видеокарта AMD Radeon HD 6950 эталонного дизайна

Как и было отмечено выше, эталонные видеокарты AMD Radeon HD 6950 внешне почти такая же, как и AMD Radeon HD 6970, и издалека их можно спутать.

И на AMD Radeon HD 6950 установлен кулер турбинного типа, который занимает два слота расширения. С обратной сторона видеокарта так же прикрыта металлической панелью, которая лишь увеличивает жесткость и обеспечивает более надежное крепление системы охлаждения.

Отличительными особенностями является только надпись на кожухе кулера и наличие двух 6-контактных разъемов дополнительного питания, вместо одного 6-контактоного и 8-контактного. Последнее обусловлено чуть меньшим энергопотреблением AMD Radeon HD 6950 - до 225 Вт, вместо до 300 Вт у старшей модели.

На интерфейсной панели также имеется два порта DVI-D, два разъема DisplayPort 1.2 и один HDMI 1.4a, к которым суммарно можно подключить до шести мониторов.

Для обоих эталонных ускорителей серии AMD Radeon HD 6900 характерны одинаковые системы охлаждения и совершенно идентичная разводка печатной платы, которая предполагает расположение всех наиболее горячих узлов на лицевой стороне.

Но у младшей модели, вследствие меньшего энергопотребления, стабилизатор питания имеет немного упрощенный вид, а для подачи дополнительного питания вместо одного из 8-контактных разъемов используется 6-контактный.

Однако упрощение не коснулось схемы работы - стабилизатор питания видеокарты AMD Radeon HD 6950 по-прежнему имеет 6+2-фазное исполнение и управляется ШИМ-контроллером Volterra VT1556MF.

Вполне ожидаемо, что и графический процессор Radeon HD 6950 имеет такой же внешний вид, как и старшее решение, т.е. выполнен без теплораспределительной крышки. И с AMD Radeon HD 6950 утилита GPU-Z еще не совсем знаком с новинкой, поэтому некоторые характеристики в её отчете не соответствуют заявленным.

Графический процессор Radeon HD 6950 вмещает 1408 блоков ALU, которые собраны в 22 SIMD-процессора. Рабочая частота ядра AMD Radeon HD 6950 составляет 800 МГц, а видеопамятью он общается по 256-битной шине.

На эталонной карте установлено 2 ГБ видеопамяти GDDR5, которые набраны восемью чуть менее скоростными микросхемами Hynix H5GQ2H24MFR-R2C, работающими с эффективной частотой 5000 МГц. Эти чипы работают уже в номинальном режиме при меньшем, по сравнению с микросхемами на Radeon HD 6970, напряжении питания - 1,5 В. Таким образом видеопамять на AMD Radeon HD 6950 имеет меньший разгонный потенциал.

И для Radeon HD 6950 была оценена эффективность работы стандартного кулера. При автоматическом режиме управления скоростью вращения турбины, интенсивная нагрузка заставляет графический процессор разогреваться только до 84°C. При этом кулер использовал только 37% своего потенциала и оставался не очень шумным. Как видим, использование данной системы на менее горячей карте более оправдано.

При ручной установке максимальной скорости вращения турбины, температура GPU уменьшается на 20°C, что создает более благоприятные условия для разгона, например. Но постоянно работать с вращающейся со скоростью более 5600 об/мин турбиной будет непросто. К тому же, в случае с AMD Radeon HD 6950 эталонная система охлаждения уже более эффективна и позволяет ускорителю не перегреваться без заметного шума. Поэтому замена её потребуется лишь для проведения экспериментов или при необходимости полностью обесшумить производительный компьютер.

В режиме же простоя энергопотребление видеокарты AMD Radeon HD 6950 уменьшается благодаря оптимизации рабочих частот и напряжения питания. В таком режиме карта остается практически бесшумной.

Разгон AMD Radeon HD 6950

Как и в случае с AMD Radeon HD 6970, видеокарту AMD Radeon HD 6950 с помощью AMD Catalyst Control Center удалось сходу разогнать до предела, который заложен на вкладке ATI Overdrive. Дальнейший разгон производился с помощью утилиты MSI Afterburner 2.1.0 Beta 5.

Нам удалось добиться стабильной работы ускорителя при частоте 873 МГц для графического процессора и 1456 МГц (эффективная 5824 МГц) для видеопамяти, что на 9,1% и, достаточно неожиданно, почти 16,5% выше номинала соответственно. Такое ускорение должно обеспечить минимум 10% прирост быстродействия в играх.

Тестирование

Для тестирования видеокарт AMD Radeon HD 6970 и AMD Radeon HD 6950 был собран следующий обновленный стенд:

Процессор

Intel Core i7-980X Extreme Edition (LGA 1366, 6 core, 3,33 ГГц, L3 12 МБ) @4,1 ГГц

Материнская плата

MSI Big Bang-XPower (LGA 1366, Intel X58 Express, DDR3, ATX)

Cooler Master V8 (LGA 1366, 69,69 CFM, 2,94 мм H 2 O, 17-21 дБ)

Оперативная память

3x 2GB Kingston DDR3-2250 (KHX2250C9D3T1FK3/6GX)

Жесткие диски

2x 128 GB Kingston SSDNow V+ (SNVP325-S2B/128GB)

Блок питания

Seasonic M12D-850 (850 Вт, 120 мм, 20 дБ)

Antec LanBoy Air Yellow (MidiTower, Transformer)

Несмотря на использование в процессе тестирования бета-драйвера, новые решения AMD - Radeon HD 6950 и Radeon HD 6970 - во многих тестах и играх будут вполне успешно конкурировать с ускорителями на графических процессорах NVIDIA. Надеемся, финальный драйвер обеспечит еще большую производительность и стабильность, а также поможет хоть как-то «прикрыть» наиболее слабое место ускорителей от AMD - приложения под OpenGL.

Напоследок давайте оценим энергоэффективность новинок.

На фоне достаточно горячего 3D-ускорителя на NVIDIA GeForce GTX 480, новинки вообще выглядят замечательно. Обеспечивая во многих приложениях такую же или даже большую производительность видеокарта AMD Radeon HD 6970 имеет заметно меньшее энергопотребление, как под нагрузкой, так и в простое.

Выводы

Честно сказать, от выпуска графического ядра Cayman и видеокарт на его основе - AMD Radeon HD 6950 и AMD Radeon HD 6970 - мы ожидали большего. Но, как показала теория и визуализируют официальные слайды, все это подтверждается практикой, качественного скачка производительности новые одночиповые флагманы не обеспечивают. Соответственно тем, кто готов платить любую цену за производительность, по-прежнему стоит искать редкие предложения на двухчиповом Radeon HD 5970 или выбирать более распространенные решения от конкурентов на NVIDIA GeForce GTX 580.

Но, если посмотреть на сегодняшние новинки с точки зрения цена/возможности, то благодаря более приятной рекомендованной стоимости, 369$ за карту на AMD Radeon HD 6970 и 299$ за ускоритель на AMD Radeon HD 6950, эти решения должны быть действительно конкурентоспособными, особенно на фоне пусть и более быстрых и даже обладающих рядом технологических преимуществ ускорителей на NVIDIA GeForce GTX 580 за 500$ рекомендованной стоимости и более 600$ реальной.

При этом не стоит забывать, что графические процессоры AMD Radeon HD 6950 и AMD Radeon HD 6970 имеют оптимизированную архитектуру, благодаря которой они имеют достаточный для фактически всех современных игр уровень производительности при оптимальном энергопотреблении. А учитывая все эти особенности, включая нагрев и шумность, ускорители на AMD Radeon HD 6950 с эталонным дизайном смотрятся предпочтительнее, хотя после некоторой оптимизации и замены кулера и AMD Radeon HD 6970 могут оказаться действительно интересным вариантом.

Выражаем благодарность украинскому представительству компании AMD за предоставленные для тестирования видеократы.

Выражаем благодарность компания Intel , MSI , Cooler Master , Kingston , Seasonic , Antec (дистрибьютор Eletek) и ASUS за предоставленное для тестового стенда оборудование.

Статья прочитана 11112 раз(а)

Подписаться на наши каналы
просмотров