Asus AMD Radeon HD7970 - "темный рыцарь" игрового мира. Тесселяция и обработка геометрии

Введение

Архитектура графических процессоров AMD (ATI) не подвергалась существенным изменениям со времен серии Radeon HD 2000: вплоть до HD 6000 в GPU использовался VLIW-дизайн. Что это такое? Сначала вспомним, как работает центральный процессор в наших персоналках. Современные CPU - суперскалярные, то есть их вычислительные блоки могут выполнять несколько инструкций из одного потока одновременно. Но инструкции при этом должны быть независимыми друг от друга, поэтому процессор непрерывно проверяет, когда можно выполнять параллельные операции, а когда нужно подождать разрешения очередной зависимости. Кроме того, CPU занимается предсказанием ветвлений и может делать часть работы заранее (out-of-order). Оптимизация этих функций - сложная техническая задача, а схемы, на которых они построены, занимают добрую часть кристалла CPU.

Но есть другой путь: задать порядок исполнения инструкций на этапе компиляции кода. Компилятор сам находит инструкции, которые можно выполнять одновременно, и формирует из них длинные составные конструкции. Отсюда и термин VLIW - very long instruction word. VLIW в общем случае показывает высокую эффективность, когда код содержит мало зависимостей, а ход программы предсказуем. Компилятор «знает» код от начала до конца и может задать исполнение определенных фрагментов с большим запасом по времени. Но планирование получается жестким, и в случае когда ход программы зависит от внешних данных, хитроумная компиляция уже мало помогает, исполнительные блоки простаивают и производительность идет вниз.

Но рендеринг 3D-графики - предсказуемая задача и отлично распараллеливается. Поэтому ставка на VLIW, которую сделала тогда еще независимая канадская компания, себя полностью оправдала. Переложив функции планировщика на компилятор, ATI могла делать относительно компактные чипы с бешеными сотнями исполнительных элементов внутри, и видеокарты в результате получились относительно недорогими. Звездный час VLIW в исполнении AMD пришелся на время Radeon HD пятитысячной серии, когда дебют архитектуры Fermi от NVIDIA (GeForce 400) немного забуксовал. И неудивительно, ведь «зеленым» приходится делать огромные чипы, вплоть до трех миллиардов транзисторов. И даже сейчас, когда в адаптерах GeForce 500 архитектура Fermi уже работает на полную мощность, а топовые ускорители NVIDIA побеждают в бенчмарках продукцию AMD, шеститысячные Radeon все еще обеспечивают отличную производительность в играх.

В таком случае, зачем AMD решилась на столь резкий поворот? Казалось бы, достаточно немного отполировать дизайн GPU, нарастить вычислительных блоков тут и там, внедрить более тонкий технологический процесс — и VLIW будет жить долго и счастливо. Зачем тратить время и деньги на разработку совершенно новой архитектуры? Но дело не только и не столько в играх. GPU медленно превращаются из устройств, предназначенных исключительно для 3D-рендеринга, в процессоры общего назначения (GPGPU - general purpose GPU), которые можно использовать для любых массированных параллельных вычислений. Однако на сегодняшний день вышло так, что если мы говорим GPGPU, то подразумеваем CUDA. Ни родной для «красных» API под названием ATI Stream, ни Open CL не имеют такой популярности, как CUDA от NVIDIA. Между тем AMD очень хочет откусить кусок от этого рынка, но чтобы это стало возможным, со старой доброй архитектурой VLIW придется расстаться. Для неграфических вычислений она не подходит, ибо они менее предсказуемы, чем 3D-рендеринг, и GPU просто не в состоянии работать в полную силу.

Архитектура Graphics Core Next

Возьмем последнего представителя VLIW-архитектуры от AMD, процессор Cayman, который лежит в основе адаптеров Radeon HD 6950/6970/6990. Основным компонентом шейдерного домена у него является SIMD Engine - блок из шестнадцати потоковых процессоров. Все они одновременно исполняют одну VLIW-инструкцию, но применительно к разным данным (потому и SIMD - single instruction, multiple data). В свою очередь, в одной VLIW-инструкции может быть упаковано вплоть до четырех скалярных операций, что соответствует четырем ALU внутри одного потокового процессора.

Строительный блок ядра Graphics Cores Next (GCN) называется Compute Unit, и он устроен совершенно по-другому. В нем тоже 64 ALU, но они разделены на четыре отдельных векторных SIMD-модуля по 16 штук плюс блок планировщика. Проще говоря, раньше параллелизм был реализован за счет нескольких операций в одной инструкции, а теперь за счет нескольких отдельных SIMD-блоков. И если производительность старой архитектуры зависит от того, сколько скалярных операций компилятор может закодировать в одной VLIW-инструкции, то Compute Unit в ядре GCN может динамически распределять нагрузку между SIMD-блоками.

Нагрузка для параллельного исполнения в SIMD-блок поступает в виде массива (wavefront) из 64 инструкций, который выполняется за четыре цикла. И хотя одновременно в работе могут быть только четыре массива, еще 28 находятся у Compute Unit в прямом доступе, за счет чего планировщик и получает пространство для маневра. В ситуации, когда зависимость в коде мешает комбинированному SIMD-блоку VLIW-процессора работать на полную мощность, отдельные SIMD-блоки чипа GCN просто переключатся на другие массивы из той же задачи либо вовсе на другие задачи.

Изюминка GCN - отдельный скалярный модуль в каждом Compute Unit. Он предназначен для разовых операций, не укладывающихся в wavefront (что избавит SIMD-модули от неэффективного использования), а еще - для контроля исполнения программы: условных ветвлений, переходов и прочих событий, которые Cayman переваривал с трудом. Скалярный модуль выполняет одну операцию за цикл.

Кеш-память

Новая конструкция исполнительных модулей требует более быстрой и объемной кеш-памяти по сравнению c VLIW-дизайном. У каждого CU есть отдельный кеш L1 объемом 16 Кбайт плюс хранилище для инструкций и данных на 16 и 32 Кбайт, общее для четырех CU, - буфер для разделения данных между массивами. Еще есть полностью когерентный кеш L2, поделенный на порции по 64 Кбайт между двухканальными контроллерами памяти. В нем хранятся копии вышеупомянутых буферов

Шины кешей L1 и L2 имеют разрядность 64 байт. AMD сообщает, что пропускная способность L1 достигает почти 2 Тбайт/с, а L2 - 700 Гбайт/с, и, судя по всему, здесь имеется в виду суммарное значение для процессора с 32 CU.

Для сравнения: у Cayman каждый SIMD-модуль имеет кеш L1 объемом 8 Кбайт с шиной 16 Байт.

Обработка геометрии, растеризация

О собственно графических компонентах чипа в презентациях AMD, сопровождающих релиз, сказано немного. Судя по блок-схеме, их внутреннее устройство не изменилась, только «Тесселятор» прокачался до девятой версии и обеспечивает гигантский прирост быстродействия в соответствующих задачах.

Между тем, если верить информации из посторонних источников и слайдам самой AMD с июньского Fusion Development Summit, то изнутри Geometry Engine и Tesselator выглядят совсем по-другому. Как и Cayman, ядро GCN содержит два Graphics Engine, но если раньше они состояли из отдельных блоков для растеризации, тесселяции и так далее, то теперь в каждом GE может быть произвольное количество конвейеров для обработки пикселей и геометрических примитивов.

Вероятно, такой дизайн поможет производителю легко наращивать графическую мощь либо выпускать бюджетные GPU, урезанные по этой части. Быстрая работа с геометрией придется в современных играх как нельзя кстати.

PCI-E 3.0

Заголовок говорит за себя: AMD внедрила шину PCI-E нового поколения со вдвое большей пропускной способностью. Непонятно, нужна ли она сегодня для 3D-рендеринга, но для неграфических расчетов наверняка пригодится. AMD внесла в архитектуру GCN массу нововведений с далеким прицелом на такое применение и специальную функцию графики, которая тоже отлично сочетается с новым интерфейсом.

Новые функции GCN

В GCN есть два дополнительных блока распределения команд под названием Asynchronous Compute Engine, которые работают совершенно независимо друг от друга и графического командного процессора. AMD планирует открыть доступ к ACE через Open CL, и тогда в распоряжении программистов окажутся три отдельных устройства, каждое со своей очередью команд. Кроме того, по информации из третьих рук, ACE обеспечивает внеочередное исполнение на уровне отдельных задач. Сами CU хоть и поумнели по сравнению с SIMD-модулями VLIW-архитектуры, но могут обрабатывать свои wavefront’ы строго в прямом порядке.

Ядро GCN и центральный процессор компьютера могут иметь общее адресное пространство. В таком случае все инструкции, которые попадают на исполнение в GPU, указывают на адреса в пространстве x86-64, а он уже самостоятельно перекодирует их в адреса локальной видеопамяти при помощи специального модуля. В результате GPU получает прямой доступ к системной памяти. Кроме того, ядро GCN наделили рядом функций для поддержки языков высокого уровня: виртуальными функциями, указателями, рекурсией и так далее. Это позволит программистам писать универсальный код, пригодный для исполнения на CPU или на GPU.

Новые GPU полностью совместимы с API OpenCL 1.2, DirectCompute 11.1 (и DirectX 11.1 как таковой) и C++ AMP. Появились специальные инструкции, полезные для производства мультимедийного контента. Кроме того, чипы на базе архитектуры GCN стали первыми GPU со встроенным кодировщиком видео стандарта H.264, который можно будет использовать, как только AMD выпустит необходимую библиотеку софта.

В свою очередь, декодер приобрел поддержку нескольких дополнительных форматов: MVC, MPEG-4/DivX и Dual Stream HD + HD. Вообще, видеокарты Radeon были сильны по части воспроизведения видео еще во времена ATI. У семитысячной серии есть масса «улучшайзеров» картинки, например алгоритм Steady Video, устраняющий дрожание камеры.

Partially Resident Textures - еще один трюк с виртуальной памятью, который предназначен уже для 3D-рендеринга: приложение или шейдер работают с адресным пространством, превышающим объем набортной памяти адаптера, а она сама выступает лишь в качестве быстрого кеша. Таким образом можно использовать текстуры объемом до 32 Тбайт, порции которых GPU будет динамически подкачивать поближе к себе. Поддержка со стороны ОС в этом не требуется.

Тормоза, которые неизбежно возникнут при загрузке текстур из системной памяти, AMD отчасти компенсирует использованием MIP mapping’a. Гигантская текстура наверняка будет храниться в нескольких вариантах с различным разрешением (mipmaps). Каждый из них разделен на фрагменты объемом 64 Кбайт. Когда адаптеру требуется определенный фрагмент, и он уже есть в локальной видеопамяти, то нет проблем. Если же фрагмента не оказалось, то программа может немедленно потянуть его из системной памяти, а может отложить чтение и взять для текущего кадра соответствующую копию фрагмента с низким разрешением (если он уже есть в видеопамяти).

Небольшое дополнение к вопросу о тесселяции. В GCN реализован алгоритм Ptex (Per-face texture mapping). В общем случае в 3D-моделировании текстура накладывается на модель целиком и вершины необходимо аккуратно совмещать с нужными участками двухмерного полотна. Нетрудно представить, как аппаратная тесселяция, плодящая дополнительные вершины, усложняет задачу дизайнера. При использовании Ptex на каждый полигон накладывается отдельная текстура, в результате - никаких видимых стыков. Кроме того, Ptex позволяет упаковывать в один файл текстуры с различным разрешением.

Наконец, AMD немного поработала над анизотропной фильтрацией с целью устранить едва заметное мерцание на текстурах высокого разрешения. Изменение алгоритма не должно сказаться на быстродействии.

Контроль энергопотребления

AMD отмечает, что производители GPU и видеокарт всегда перестраховываются на счет энергопотребления и устанавливают тактовые частоты с учетом пиковой нагрузки, которая возможна лишь в самых жадных приложениях или даже в стресс-тестах (FurMark. OCCT). А в обычных играх графический процессор мог бы работать на более высокой частоте. Для того чтобы всегда выжимать из GPU максимум, предназначена технология PowerTune - калькулятор, который в реальном времени с интервалами в единицы миллисекунд рассчитывает энергопотребление карты на основе анализа выполняемой задачи (без всяких аналоговых сенсоров). И если есть возможность, тактовая частота GPU увеличивается. Заметьте, это не сброс частоты относительно номинала при достижении порога мощности, а наоборот - точно выверенный динамический разгон.

А еще ядро GCN умеет полностью отключаться, когда на экране долго ничего нет, и останавливать кулер (технология ZeroCore). В конфигурации CrossFire процессоры на дополнительных картах (и на одной - тоже) и вовсе не работают без 3D-нагрузки.

Eyefinity 2.0

Вместе с Radeon HD 7000 дебютирует вторая версия технологии Eyefinity, которая принесла массу нововведений. Многие представленные «фичи» не нуждаются в комментариях, поэтому перечислим их кратко:

  • Официально поддерживаются конфигурации с пятью дисплеями в ряд в альбомной или портретной ориентации.
  • Центральный монитор в ряду теперь может быть больше остальных по вертикали.
  • Одновременная работа Eyefinity, AMD HD3D и CrossFire.
  • Максимальное разрешение комбинированного экрана - 15х15 тысяч пикселей.
  • Произвольные разрешения.
  • Перемещение панели задач Windows на любой экран.
  • Вывод отдельных аудиопотоков на несколько дисплеев.

Новые Radeon поддерживают DisplayPort 1.2, а значит - технологию Multi-Stream. С ее помощью можно подключать к одному выходу три дисплея по цепочке или через специальный хаб. Причем на выходе хаба может быть не только DisplayPort, но и интерфейсы HDMI, DVI и VGA. AMD обещает, что хабы появятся в продаже летом 2012 года.

HDMI-выход соответствует стандарту 1.4а, поэтому может передавать двойной сигнал на 3D-телевизор с частотой 24 кадра на каждый канал. А специально для игр есть поддержка 3 GHz HDMI с частотой 60 Гц на канал.

Кроме того, стандарты DisplayPort 1.2 HBR 2 и 3 GHz HDMI пригодятся для подключения грядущих дисплеев с разрешением 4096x2160.

Radeon HD 7970

Технические характеристики

HD 7970 - одночиповый флагман линейки, представляющий архитектуру GCN во всей мощи. Его GPU называется Tahiti и содержит 32 CU (Compute Units), устройство которых подробно описано выше. Если пересчитать это на количество отдельных ALU, как AMD делала до сих пор, то получится 2048 штук - в полтора раза больше, чем в ядре Cayman! И блоков TMU (texture mapping units) в Tahiti тоже 128 против 96. Шина памяти - 384-битная вместо 256-битной. Если учесть, сколько дополнительной логики добавили в архитектуру, то совершенно не удивительно, что Tahiti состоит из 4,31 миллиарда транзисторов. Просто для сравнения: в Cayman - 2,64 миллиарда, а в GF110 от NVIDIA - три. Работает все хозяйство на частоте 925 МГц. Внешний вид, конструкция

В оформлении семитысячной серии AMD отступила от брутальных форм Radeon HD 6000 и выбрала броский дизайн с плавными линиями и глянцевой поверхностью кожуха. Вернулся узнаваемый красный текстолит, в этот раз - с малиновым оттенком. По габаритам Radeon HD 7970 не отличается от предшествующих одночиповых флагманов AMD/ATI.

Продукция кирпичного завода AMD

Карта тяжелая. Берешь в руку - и чувствуется мощь. Все дело в системе охлаждения с крупной испарительной камерой, приделанной к толстой раме. Со времен Radeon HD 6970 конструкция не претерпела больших изменений, разве что вентилятор-турбинка стал шире.

Для лучшего охлаждения с заглушки убрали один порт DVI, чтобы целиком занять слот выхлопной решеткой.

С задней стороны, как и раньше, есть прижимная крестовина. От сплошной крышки решили отказаться.

На печатной плате, как и у HD 6970, есть переключатель между основным и резервным BIOS. А еще по задней поверхности разбросано несколько мелких сдвоенных переключателей неизвестного назначения, которые мы, от греха подальше, решили не трогать. Возможно, что перед нами лишь инженерный образец HD 7970 и на серийных платах этих странных элементов уже не будет.

В хвосте платы расположены семь катушек индуктивности и восьмифазный контроллер напряжения CHiL CHL8228G, чему, без сомнения, будут рады оверклокеры, ведь о н уже использовался на картах Radeon HD 6970, . Скорее всего, и схема питания карты организована по-старому: шесть фаз приходятся на GPU и одна отдана для питания внутренних цепей микросхем GDDR5. В противоположном углу платы находится двухфазный чип uP1509P от uP Semiconductor со своей катушкой, который, по аналогии с HD 6970, должен контролировать напряжение на буферах ввода-вывода видеопамяти.

Вот и пришла пора сменить с честью отработавший три года, Palit GeForce GTX 460. В качестве замены я выбрал флагман от Radeon - HD 7970 фирмы Asus. Найти карту на этом чипе оказалось очень сложно, в магазинах образовался большой дефицит, особенно у нас на Дальнем Востоке. Удалось приобрести ASUS Radeon HD 7970 DirectCU II только за 18 000 рублей, что на сегодня, к сожалению довольно таки много.

Главная надежда: что видеокарта оправдает свою цену, порадовав меня своей производительностью.

Спецификация видеокарты:

Упаковка и комплектация

Большая коробка с фирменным рыцарем сразу привлекает к себе внимание потенциального покупателя. Производитель хвастается фирменной системой охлаждения DirectCU II , уникальной функцией VGA HotWire , позволяющей подключить ее к материнке серии ROG . Так же мы видим важную информацию, которую нужно учесть при покупке: блок питания от 600 Вт. с током 42А по линии +12в.

В коробке видеокарта надежно упакована, и столь ценному содержимому не страшна неаккуратная транспортировка.

В комплекте имеется диск с драйверами и утилитами, среди которых есть GPU Tweak , которым я позже и воспользовался.

Подробная инструкция с цветными картинками. Гибкий мостик CrossFireX, переходник с DVI на HDMI, на самой плате данного выхода нет. Переходник на 8ми контактный разъем питания PCI-E, не все БП имеют два таких разъема. И есть еще радиатор, который можно приклеить на двухсторонний скотч к блоку стабилизации питания, если будете ставить жидкостное охлаждение.

Никаких бонусов в виде игр или ключей к играм не было.

Внешний вид

На вид карта большая и солидная, занимает три слота расширения. Но в мой новый корпус вместилась без проблем, и ей там вполне просторно.

Подключить к видеокарте можно до 6 мониторов, для этого имеется 4 порта Display, и два DVI. Но один Display порт работает при условии, если один DVI порт переключен в режим Single -Link специальным переключателем.

Фирменная система охлаждения делает видеокарты этого производителя «близнецами»: красные полоски по центру, два вентилятора, и бэкплейт, который предотвращает перегиб текстолита и принимает на себя вес массивной системы охлаждения.



Теперь понятно почему на коробке рыцарь: видеокарта вся закована в толстую, мощную броню.

Питание к плате подводится через два восьми контактных разъема, что должно обеспечить запас по мощности.
Карта оснащена 3 ГБ видеопамяти GDDR5, изначально работающей на частоте 5500 МГц. Между памятью и чипом Tahiti XT шина шириной 384-бит. Чип изготовлен по 28 нм техпроцессу и включает 2048 унифицированных конвейеров, а также 32 блока растеризации.

Система охлаждения состоит из верхнего блока с двумя 90 мм вентиляторами.



Вентиляторы работают над двумя алюминиевыми радиаторами которые отводят тепло от шести тепловых трубок. Эффективность такой системы уже давно зарекомендовала себя, и я проверю ее в работе при помощи MSI Afterburner.

Тестирование

Тестовый стенд:

Испробовал карту и в этом деле. Здесь при включении вентиляторов на 100 % шум явно слышен в виде мощного гудения. При разгоне ядра до 1100 и памяти до 1500 карта выдавала 615 МHash при «добыче» LTC. При нынешней сложности и курсе – это 100 долларов в месяц, что явно не рентабельно.

Выводы

Впечатления о работе карты очень положительные, я считаю, что нашел достойную замену своей старой видеокарте. Вентиляторы даже под нагрузкой не разгоняются на 100 %, поэтому в хорошем корпусе их почти не слышно. Температура не поднимается выше 70 градусов, да и нагрев карты не влияет на другие комплектующие. В играх на высоких настройках карта выдает очень даже играбельное количество кадров в секунду. Когда и этого будет мало, видеокарту можно будет разогнать, что повысит ее производительность процентов на двадцать.
Ну а перечисленные ниже недостатки - относительны. Для просторного корпуса размер видеокарты не имеет значения, зато можно эффективнее устроить систему охлаждения на три слота. Цена так же относительна; когда сегодня сходил с супругой в магазин за продуктами, то понял, что все нормально, ни какой переплаты:-({|=:

Преимущества:
Тихая
Производительная
Хороший разгонный потенциал, способный повысить производительность до 20 %
Эффективное охлаждение

Недостатки
Большие размеры, не в любой корпус вместится
Высокая цена

Radeon HD 7970: переход на 28-нм техпроцесс

В начале декабря мы не рассчитывали, что видеокарта нового поколения окажется у нас до наступления 2012 года. Даже в середине месяца, после того как мы получили официальное уведомление от AMD, мы планировали выпустить данный обзор в январе. Windows 8 и API DirectX 11.1, идущий в компании с новой ОС, не будут доступны в течении ближайших нескольких месяцев, а нынешние графические карты класса high-end отлично справляются с современными играми. Несмотря на то, что AMD, по слухам, ещё несколько месяцев назад прекратил выпуск флагманской модели Radeon HD 6990 , мы исходили из того, что трудности с переходом на техпроцесс 28 нм в компании TSMC, чьи производственные мощности использует AMD, оставляют мало шансов, что новые графические процессоры будут представлены в срок.

Однако AMD, в конце концов, назначила дату анонса на середину декабря, что нас удивило ещё более. Вот как прозвучала официальная версия AMD: "Собрав отзывы от наших партнёров и оценив нашу общую готовность… мы убеждены, что новая дата анонса позволит нам захватить сезон рождественских праздников и CES". Попытка захватить рождественский сезон, анонсировав карту за пару суток до католического Рождества - крайне оптимистичная стратегия, особенно если учесть, что первые официальные поставки начнутся после 9 января. Печальным результатом всего этого стало то, что многие сотрудничающие с AMD разработчики не успели подготовить соответствующие обновления ПО, нужные хотя бы для того, чтобы надлежащим образом протестировать HD 7970.

Встречаем Radeon HD 7970

Независимо от того, готова ли Radeon HD 7970 встретить мир и готов ли мир встретить её, она попала в лабораторию и прошла серию тестов. Данная карта является первым представителем нового поколения AMD и имеет серьёзные отличия от моделей нынешней 6000-й серии.

Компания AMD использует новую архитектуру Southern Islands и обеспечила поддержку новых функций и технологий, включая совместимость с DirectX 11.1. Флагманский GPU Tahiti (Таити) состоит из 4,31 миллиардов транзисторов и, таким образом, примерно на 160% по данному параметру превосходит своего предшественника на ядре Cayman.

Одновременно компания AMD осуществила переход на техпроцесс 28 нм, что позволило втиснуть такое количество транзисторов в кремниевую пластинку площадью 365 мм² - чип Cayman занимает даже большую площадь (389 мм 2).

Прежде чем углубиться в тонкости Southern Islands, давайте поближе взглянем на основные спецификации Radeon HD 7970 по сравнению с предшественниками и конкурентом.

Radeon HD 7970 Radeon HD 6970 Radeon HD 6990 GeForce GTX 580
Потоковых процессоров 2048 1536 3072 512
Блоков текстур 128 96 192 64
Блоков растеризации Color ROP 32 32 64 48
Частота шейдерных блоков 925 МГц 880 МГц 830 МГц 772 (1544) МГц
Скорость фильтрации текстур 118.4 ГТекс/с 84.5 ГТекс/с 159.4 ГТекс/с 49.4 ГТекс/с
Частота памяти 1375 МГц 1375 МГц 1250 МГц 1002 МГц
Шина памяти 384-битная 256-битная 2x256-битная 384-битная
Пропускная способность шины памяти 264 Гбит/с 160 Гбит/с 160 Гбит/с 192.4 Гбит/с
Графическая память 3 Гбайт GDDR5 2 Гбайт GDDR5 2 Гбайт GDDR5 1.5-3 Гбайт GDDR5
Площадь чипа 365 мм² 389 мм² 2x389 мм² 520 мм²
Число транзисторов (млрд) 4.31 2.64 5.28 3
Техпроцесс 28 нм 40 нм 40 нм 40 нм
Разъёмы питания 1x8-pin, 1x6-pin 1x8-pin, 1x6-pin 2x8-pin 1x8-pin, 1x6-pin
Максимальная мощность (TDP) 250 Вт 250 Вт 375 Вт 244 Вт
Цена Рекомендованная цена $549 Цена на сайте Newegg.com $340-$380 $700-$750 (средняя цена на момент окончания продаж) $500-$530 (версия 1,5 Гбайт)
$590-$730 (версия 3 Гбайт)

По сравнению с Radeon HD 6970, новинка имеет явные преимущества: на треть увеличилось количество потоковых процессоров и блоков обработки текстур, пропускная способность памяти возросла на 65% благодаря использованию 384-разрядной шины памяти. Лишь два ряда спецификаций моделей Radeon HD 7970 и HD 6970 совпадают: число блоков растеризации Color ROP и TDP 250 Вт.

Основываясь на этих спецификациях (и том факте, что новая карта будет стоить около $550), мы можем предположить, что Radeon HD 7970 превзойдёт 6970, немного опередит GeForce GTX 580 , но будет уступать двухпроцессорной карте Radeon HD 6990 . Несомненно, сугубо технические характеристики на практике менее важны, чем тесты игровой производительности. Но вначале более подробно остановимся на функциональных особенностях нового поколения видеокарт Radeon и архитектуре Graphics Core Next.

Вначале расскажем о том, что нам известно о серии Radeon HD 7000. Несмотря на слухи об обратном, все 28-нм GPU в линейке Radeon 7000, ранее носившие кодовое название Southern Islands, основаны на архитектуре Graphics Core Next. Она включает серию Radeon HD 7700 (ядро Cape Verde), 7800 (Pitcairn) и 7900 (Tahiti). Кроме того, AMD может включить в новую 7000-ю линейку некоторые продукты на 40-нм чипах, используя ребрендинг старых моделей, в которых используется нынешняя архитектура VLIW4/5.

Реализованные на основе новой архитектуры модели имеют одинаковую функциональность, что является хорошей новостью. На следующем рисунке представлено положение новых карт в линейке относительно серии Radeon HD 6000.

Как вы сможете убедиться по нашим тестам, серия Radeon HD 7900 позиционируется как производительная игровая однопроцессорная карта, приближающаяся по производительности к нынешнему двухпроцессорному флагману - HD 6990. В первом квартале 2012 года должна быть представлена и замена HD 6990 - флагманская модель 7000-й серии, основанная на двух GPU Tahiti, призванная занять верхнее положение в "пищевой цепочке" Radeon.

Теперь мы знаем, какое положение в линейке займут представители серии Radeon HD 7000 в соответствии с планами маркетингового отдела компании AMD. Далее мы подробно остановимся на уникальных особенностях новой линейки, однако начнём с основного вопроса - что представляет собой архитектура Southern Islands?

Graphics Core Next и архитектура Southern Islands

Radeon HD 7970 является первым коммерческим продуктом на архитектуре Graphics Core Next, но дизайн новых GPU сам по себе не является секретом. Чтобы дать разработчикам ПО возможность лучше изучить особенности будущего железа, компания AMD раскрыла особенности архитектуры Graphics Core Next на конференции AMD Fusion’11 Developer Summit, проходившей с 13 по 16 июня в американском городе Белвью.

По словам Эрика Демерса (Eric Demers), технического директора подразделения графических продуктов AMD, ныне существующая архитектура VLIW, берущая начало с линейки Radeon 2000, всё ещё имеет потенциал для построения мощных графических карт. Но она ограничена с точки зрения функциональности. Вместо того, чтобы поддерживать жизнь старой архитектуры, AMD выбрала другой путь - вложиться в разработку полностью новой архитектуры. На первом плане для карт класса hi-end находится поддержка новейших игр и качество изображения. Чтобы соответствовать этой установке, AMD отказалась от дальнейшей работы над архитектурой VLIW (Very Long Instruction Word - "очень длинная машинная команда") в пользу новой Graphics Core Next.

Преимущество в эффективности архитектуры Graphics Core Next

Архитектура VLIW весьма эффективна при обработке графических инструкций. Её компилятор оптимизирован для разметки скалярных математических преобразований, которые лежат в основе вычислений 3D-графики. Слабость VLIW проявляется тогда, когда GPU должен составлять очередь заданий со скалярными инструкциями в приложениях общего назначения.

Иногда происходит так, что набор инструкций, называющийся пакет инструкций (wavefront - "фронт инструкций"), не может выполняться до тех пор, пока производятся вычисления над другим аналогичным набором. Это называется "зависимостями". Проблема в том, что компилятор не может изменить порядок исполнения пакета инструкций после того, как определена очередь заданий. Поэтому драгоценный потенциал ALU часто растрачивается впустую, когда инструкции ожидают своей очереди и не выполнены зависимости, которые к ним относятся.

Перед вами - теоретический пример того, как движок SIMD в архитектуре VLIW4 карты Radeon HD 6970 и его 16 банков шейдерных процессоров (каждый такой процессор имеет по четыре ALU, что даёт в сумме 64 ALU на движок SIMD) обрабатывает пакет инструкций, который включает в себя зависимости.


Пока свободными остаются три ALU, следующий пакет простаивает в очереди. Как видим, налицо неэффективное использование вычислительных ресурсов, обусловленное излишне простой логикой обработки инструкций в устаревшей архитектуре.

Как оптимизировать множество скалярных операций, которые выполняются за такт? Нужно ввести блок вычислений - Copmute Unit или CU, который заменит традиционные для AMD движки SIMD.

Каждый CU имеет по четыре блока векторных операций (Vector Units или VU), которые, в свою очередь, включают по 16 ALU, что даёт в сумме 64 ALU на один блок вычислений. Таким образом, число ALU в блоке вычислений (CU) точно такое же, как в движке SIMD. Разница в том, что в отличие от шейдерных процессоров в движке SIMD, каждый из четырёх блоков векторных операций, входящих в Copmute Unit, может иметь независимую очередь задач. CU имеет собственный планировщик очереди, что позволяет свободным VU работать с новыми пакетами инструкций, исключая "бутылочное горлышко" при обработке зависимостей. Это ключевое отличие новой архитектуры, благодаря которому каждый VU может работать с новыми пакетами инструкций, даже если присутствует очередь зависимостей.

В нашем примере одна и та же очередь инструкций может исполняться за шесть тактов на архитектуре VLIW4, но за четыре такта на Graphics Core Next. AMD предполагает, что Radeon HD 7970 может достигнуть 7,5-кратного увеличения пиковой теоретической производительности относительно Radeon HD 6970 благодаря более эффективному использованию вычислительных ресурсов.

Разница в реальных приложениях зависит от эффективности компилятора программного кода. В некоторых вычислительных задачах Radeon HD 7970 будет лучше исключительно за счёт большего числа ALU и более высоких частот ядра и памяти. В ходе тестирования новинки мы видели много вариаций, их увидите и вы. Но, основываясь на результатах синтетических бенчмарков, можно с уверенностью утверждать, что вычислительный потенциал Graphics Core Next превосходит VLIW4.



СОДЕРЖАНИЕ

Первый графический адаптер с 28-нанометровым GPU. Комок высоких технологий, сплав запредельной производительности, образцовой функциональности и показательной экономичности. Или попросту говоря – самая быстрая в мире одночиповая видеокарта от AMD – Radeon HD 7970 .

Заждались мы уже от AMD чего-то неординарного, яркого и скоростного. Чуть больше года назад, когда была представлена линейка видеокарт Radeon HD 6900, у них не было шансов тягаться с GeForce GTX 580. Тогда компания осознанно отдала первенство в топ-сегменте, акцентируя внимание на том, что решения на чипах Cayman обладают лучшим, чем у конкурента, соотношением цена/производительность и более энергоэффективны. Но, как и любой серьезный игрок на рынке, компания может длительное время очень успешно предлагать достойные устройства по хорошей цене. Но где-то там, в глубине души… она, конечно же, хочет быть технологическим лидером в своем сегменте.

Radeon HD 7970 дает ей такую возможность. Новинка основана на чипе с принципиально новой архитектурой, который производится по наиболее прогрессивному 28-нанометровому техпроцессу. Гарантирует ли успех такое потенциально очень привлекательное сочетание?

Архитектура Graphics Core Next

Длительное время AMD для своих графических решений использовала архитектуру VLIW (Very Long Instruction Words), которая хорошо оптимизирована для работы с 3D, однако малоэффективна для универсальных вычислений. В подобных задачах довольно высокая теоретическая мощность GPU не давала ожидаемых результатов. Новая архитектура, получившая название Graphics Core Next, разрабатывалась в первую очередь для того, чтобы улучшить эффективность вычислений не связанных напрямую с 3D.

Строительными модулями GCN являются так называемые Compute Unit (CU), основу которых составляют векторные блоки, скалярный сопроцессор и независимый планировщик.

Такая модель организации более универсальна, легче поддается программированию, отладке и анализу. Но основным преимуществом GCN является хороший параллелизм вычислений в многозадачной среде и возможность динамического распределения нагрузки. По этой причине AMD делает акцент на том, что представленные решения с архитектурой GCN это нечто большее, чем просто мощные игровые видеокарты.

В максимальной конфигурации чип имеет 32 блока Compute Unit (суммарно 2048 потоковых процессора), шесть 64-битных контроллера памяти, и продвинутую систему двухуровневого кеширования. В новом ядре по-прежнему используется два блока обработки геометрии, которые были существенно модернизированы.

Функциональные нюансы

Помимо низкоуровневых архитектурных изменений, новинки AMD будут обладать целым набором различных нововведений, улучшающих их функциональность.

DirectX 11.1

Прежде всего, отметим поддержку DirectX 11.1, возможности которого будут реализованы в Windows 8. После выхода данной операционной системы от Microsoft, новая версия API сулит немало интересных возможностей. С предварительным перечнем функций DirectX 11.1 можно ознакомиться .

AMD ZeroCore Power

Функция PowerTune, появившаяся еще в адаптерах серии HD 6900, позволяет оптимальным образом задействовать ресурсы видеокарты, выжимая максимум производительности в рамках заданного теплового пакета. GPU с архитектурой GCN получили в свое распоряжение новый инструмент для оптимизации энергопотребления – AMD ZeroCore Power.

Данная функция, унаследованная от мобильной версии Radeon, позволяет переводить видеокарту в состояние глубокого сна, в котором ее энергопотребление не превышает 3 Вт, а вентилятор системы охлаждения останавливается. Это происходит в том случае, когда монитор переходит в режим stand-by (этот период изменяется в настройках ОС). Технология реализована на аппаратном уровне и не зависит от используемой операционной системы.

Подобный алгоритм работы акселератора настолько очевиден, что возникает лишь вопрос, почему же в железе он реализован только сейчас. Так или иначе, стремление AMD максимально улучшить экономичность своих решений можно только приветствовать.

Любопытно, что в режиме CrossFire все дополнительны адаптеры, не используемые в текущий момент, автоматически переводятся в состояние ZeroCore Power и не издают шума.

Video Codec Engine

Для декодирования видео используется блок, функционально идентичный UVD3, который реализован в чипах Cayman. Это наиболее функциональное решение на рынке, потому данный факт никаких нареканий не вызывает. В тоже время архитектура GCN предполагает наличие аппаратного блока Video Codec Engine, который предназначен для кодирования видео в формат H.264. Чтобы задействовать данную разработку, требуется соответствующее программное обеспечение, которое пока находится в процессе разработки.

В целом, возможность кодирования видео средствами GPU существует достаточно давно, однако ранее для этого задействовались потоковые процессоры. К тому же возможности по настройке, а также финальное качество картинки далеко не всегда устраивали требовательных пользователей. Ныне AMD обещает предоставить возможность гибкой настройки параметров, скорости, а также метода кодирования (возможен гибридный вариант с задействованием потоковых вычислителей).

Partially Resident Textures

Инновационная функция частично резидентных текстур (Partially Resident Textures) позволяет обрабатывать текстуры огромного размера (до 32 ТБ), используя локальную память адаптера, как своеобразный кеш-буфер. Блочный принцип работы с виртуальными текстурами и специальный алгоритм использования мип-уровней позволяет компенсировать задержки при подгрузке необходимых для рендеринга частей.

Данная функция может пригодиться в случаях, когда используется технология MegaTexture. Наглядный пример – игра Rage от id Software. В дальнейшем количество проектов, применяющих такой принцип визуализации, будет лишь увеличиваться.

Специально для перфекционистов улучшен алгоритм анизотропной фильтрации. Новый метод исключает случаи появления небольших артефактов в редких ситуациях, возникающих при обработке некоторых типов текстур. Функция активируется автоматически и не сказывается на общей производительности.

HDMI 1.4a (3ГГц)

Еще одним нововведением Radeon HD 7970 является скоростная версия HDMI 1.4a (3 ГГц) с поддержкой формата Frame Packing, позволяющая получить на подходящем экране стереокартинку не только для просмотра 3D-видео, но и игр в режиме 1080p с частотой обновления 60Гц для каждого глаза.

При этом максимальное разрешение при подключении по HDMI составляет 4096×3112. Таким образом, адаптер полностью готов к грядущей эре видео еще более высококачественных форматов Quad HD/4k.

Eyefinity 2.0

За последнее время несколько важных нововведений получила фирменная мультидисплейная технология Eyefinity. Вторая ревизия значительно увеличивает возможности создания конфигураций с несколькими мониторами. В частности теперь доступны режимы 5×1 с альбомной или портретной ориентациями экранов, а максимальное поддерживаемое разрешение увеличилось до 16384×16384.

Адаптеры с 28-нанометровыми чипами также получили технологию Discrete Digital Multi-Point Audio (DDMA), позволяющую выделить несколько независимых аудиопотоков для различных дисплеев, работающих в рамках Eyefinity.

С появлением Catalyst 11.12 стала возможной работа стереоскопической технологии HD3D на трех мониторах. В феврале ожидается выход драйверов 12.2, которые еще больше разнообразят возможности настройки конфигураций с несколькими дисплеями.

PCI Express 3.0

Видеокарты с GCN первыми получили поддержку PCI Express 3.0. Благодаря улучшенному алгоритму кодирования данных при передаче, пропускная способность шины нового поколения вдвое выше, чем у версии 2.0. В частность для режима х16 это 32 ГБ/c.

Напомним, что в случае с платформой Intel для полноценной работы данного скоростного интерфейса, соответствующую поддержку должны иметь центральный процессор, который собственно содержит контроллер PCI-E 3.0, материнская плата со специальными коммутирующими «вентилями», позволяющими получить необходимую скорость, и графический адаптер.

Что касается процессоров, то формально первыми CPU, которые получат поддержку PCI-E 3.0, должны стать предназначенные для платформы LGA1155 чипы Ivy Bridge, которые предположительно будут анонсированы в начале апреля. Однако в действительности, на рынке уже есть решения с контроллером шины нового стандарта. Речь о процессорах для LGA2011. Официально поддержка PCI-E 3.0 для них не заявлена, однако по факту, при наличии остальных требуемых компонентов экосистемы, шина работает именно в таком режиме.

Любопытно, что компания AMD в данном случае не торопится внедрять поддержку PCI Express 3.0 для своей настольной платформы. На текущий момент чипсеты для AM3+ и FM1 довольствуются шиной версии 2.0. Отчасти такой прагматичный подход оправдан. Возможностей текущей версии интерфейса вполне достаточно для нужд даже наиболее производительных видеокарт. Более того, в конфигурациях с несколькими адаптерами, когда слоты работают в режиме x8 (PCI-E 2.0) не наблюдается снижения производительности в игровых приложениях, соответственно пропускная способность шины не является узким местом платформы. С другой стороны, помимо сугубо маркетингового эффекта (и нужно признать, немалого) практическую пользу от PCI Express 3.0, возможно, удастся получить для GPGPU.

Серия процессоров Southern Islands

При формировании продуктовой линейки на основе решений с GCN, будут использоваться три типа графических чипов, принадлежащих семейству Southern Islands.

Tahiti – решение для максимально производительных адаптеров, которые должны будут удовлетворить запросы самых взыскательных энтузиастов. Для моделей линейки Radeon HD 7900 используется именно это ядро. Pitcairn – основа адаптеров, которые будут предлагаться для достаточно требовательных игроков. Данные GPU задействуются для видеокарт серии Radeon HD 7800. Cape Verde – чип для решений с хорошей энергоэффективностью и достаточной производительностью. Таковыми должны стать модели линейки Radeon HD 7700.

Приведем слайд, который поможет понять позиционирование будущих адаптеров серии Radeon HD 7000.

На начальном этапе 28-нанометровые чипы с архитектуру GCN будут использоваться лишь для видеокарт высокого и среднего уровней. В частности, для устройств серий Radeon HD 7900/7800/7700. Менее производительные видеокарты в линейке HD 7000 будут фактически идентичны тем, что сейчас включены в серии HD 6500/6600 и HD 6450/6350. Очевидно, что контрактный производитель кристаллов, компания TSMC, на текущий момент не в состоянии обеспечить AMD таким количеством чипов 28 нм, чтобы их можно было использовать и для бюджетных решений. В подобных условиях приоритет имеют более сложные, но и более прибыльные устройства.

Radeon HD 7970

Первой из семейства видеокарт с новой архитектурой была представлена Radeon HD 7970 . Давайте посмотрим на ее технические характеристики и сравним со старшей одночиповой моделью предыдущей линейки – Radeon HD 6970.

Графический адаптер основан на чипе Tahiti, который, как уже упоминалось, производится по 28-нанометровой технологии. Новый кристалл содержит 4,31 млрд. транзисторов, что на 63% больше, чем у предшественника, при этом его площадь даже несколько компактнее, чем у Cayman (365 vs. 389 мм2). Тактовая частота GPU увеличилась незначительно – до 925 МГц. АMD решила не форсировать события, преодолевая знаковую отметку в 1 ГГц. В случае с Radeon HD 7970 используется версия Tahiti со всем активными блоками, включая 2048 потоковых процессоров. Вычислительная производительность возросла на 40% и составляет 3,79 TFLOPS. Количество текстурных блоков возросло с 96 до 128, что, с учетом повышенной частоты ядра, позволило получить филрейт на уровне 118,4 ГТ/c. Число модулей ROPs не изменилось, потому пиксельная скорость заполнения практически на прежнем уровне.

Как и предшественник, Radeon HD 7970 использует память GDDR5, работающую на 1375 МГЦ (5500 МГц). Однако теперь передача данных производится по 384-битной шине, благодаря чему пропускная способность увеличена со 176 до 264 ГБ/c. При этом объем локальной ОЗУ для топового решения составляет 3 ГБ. Для традиционной одномониторной конфигурации такая емкость явно избыточна, даже если говорить о 27- или 30-дюймовой панели с разрешением 2560х1600. Однако в конфигурациях с несколькими дисплеями, кадровый буфер значительно увеличивается, потому подобный объем не окажется лишним.

Ознакомившись с техническими характеристиками можно смело говорить о том, что Radeon HD 7970 будет заметно производительнее предшественника с ядром Cayman. Новинка улучшена по всем параметрам, которые влияют на быстродействие GPU. При неизменном максимальном TDP в 250 Вт разработчикам удалось выжать максимум.

Референсная видеокарта

Внешне новинка лишь отчасти напоминает топовую модель предыдущей серии. Строгие прямоугольные формы внешнего кожуха системы охлаждения уступили место конструкции со скругленными углами, ярко-красными вставками и глянцевым покрытием элементов верхней защитной крышки.

Печатная плата имеет длину 270 мм, однако форма системы охлаждения увеличивает устройство до 280 мм. Корпусы Middle-tower даже средней ценовой категории, как правило, обеспечивают беспроблемную установку адаптеров подобных габаритов, в случае же с более дорогостоящими игровыми моделями проблем с размещением Radeon HD 7970 точно не возникнет.

В этот раз AMD не установила радиаторную пластину на тыльной стороне печатной платы. Греющиеся элементы, требующие дополнительного охлаждения, расположены на лицевой панели PCB, потому подобный элемент декора лишь ухудшил бы отвод тепла. Хотя, нужно признать, что анодированная пластина добавляет баллы за внешний дизайн, но в этот раз победила практичность.

На верхней кромке видеокарты расположена пара разъемов для подключения дополнительного питания: шести и восьмиконтактный. Соответствующие переходники с Molex-разъемов должны поставляться в комплекте с видеокартой.

Использование двух микросхем BIOS стало хорошей традицией для старших моделей адаптеров от AMD, и в данном случае компания не стала отказываться от функции Dual BIOS. Немалая часть владельцев таких решений – потенциальные экспериментаторы, которые захотят поиграться с частотами чипа/памяти, в том числе используя для этого и различные версии прошивок. Чтобы обезопасить пользователей от возможных проблем с этой стороны, AMD предлагает две версии BIOS, переключаться между которыми можно с помощью миниатюрного тумблера, расположенного на верхней кромке печатной платы.

По толщине Radeon HD 7970 занимает два слота расширения. На интерфейсной панели расположены четыре коннектора: пара Mini-DisplayPort, HDMI и DVI (Dual-Link). Примечательно, что все разъемы размещены в один ряд, тогда как большую часть крепежной пластины занимает решетка выхлопа системы охлаждения. Напомним, что Radeon HD 6900 имеют еще один порт DVI, расположенный на втором ярусе, что заметно уменьшает площадь решетки, тем самым замедляя вывод нагретого воздуха наружу.

Общая конструкция системы охлаждения во многом схожа с той, что используется для референсных видеокарт на чипах Cayman. К массивному алюминиевому основанию прикреплена крупная испарительная камера, на которую установлена кассета с набором алюминиевых пластин. Данный блок продувается 70-миллиметровым центробежным вентилятором. Чипы памяти, а также силовые элементы контактируют с радиаторной пластиной через теплопроводные прокладки, тогда как GPU сообщается непосредственно с теплосъемником испарительной камеры. Сверху кулер прикрыт защитным пластиковым кожухом. Подобная концепция СО уже доказала свою эффективность, потому вполне логично что AMD предпочла данный кулер для Radeon HD 7970. Важным преимуществом такой системы является то, что практически весь нагретый воздух выдувается за пределы системного блока. Это важный нюанс, особенно когда речь идет о производительных решениях с высоким TDP.

Теперь несколько слов о впечатлениях от работы видеокарты. В режиме покоя графический адаптер работает практически бесшумно, снижая частоту чипа до 300 МГц, а памяти до 600 МГц. Вентилятор вращается со скоростью 1000–1100 об/мин (20% от максимального значения). На открытом стенде этого оказывалось достаточно, чтобы температура GPU не поднималась выше 35 С.

Под нагрузкой вентилятор оживает, плавно увеличивая обороты. Алгоритм линейный, потому резких рывков или перепадов в процессе изменения не ощущается. После длительного прогрева температура чипа повысилась до 77 градусов, пропеллер вращался на 43% от максимума (~2300 об/мин). В таком режиме видеокарта, безусловно, слышна, но о серьезном дискомфорте речь не идет.

Мы также на практике убедились в работоспособности технологии AMD ZeroCore Power. Спустя 20–30 секунд после перехода монитора в режим ожидания, вентилятор кулера видеокарты действительно останавливается. Для охлаждения адаптера в таком состоянии достаточно работы СО в пассивном режиме.

В целом, штатная система охлаждения Radeon HD 7970 демонстрирует достойную эффективность при довольно умеренном звуковом сопровождении под нагрузкой. По этой причине нет сожаления о том, что на начальном этапе подавляющее большинство моделей от различных производителей видеокарт будут основаны на референсных печатных платах и кулерах, отличаясь между собой фактически только наклейками на верхней крышке.

Безусловно, компании работают над устройствами с альтернативными СО. В частности Gigabyte и XFX уже подготовили свои варианты.

Аналогичных шагов стоит ждать и от других весомых игроков на этом рынке. Другой вопрос, насколько эффективнее окажутся такие решения. Конструкции с габаритными тихоходными вентиляторами осевого типа выигрышно смотрятся на открытых стендах, но требуют заметно большего внимания к организации охлаждения внутри корпусов, так как горячий воздух в подобных случаях фактически не выводится за пределы системы.

Разгон

Тем, кто уже успел приобщить Radeon HD 797 0 к жидкому азоту, Tahiti раскрылся во всей красе, удивляя устойчивой работой на 1500–1600 МГц даже в CrossFire-конфигурациях. Оверклокеры, сумевшие обзавестись несколькими Radeon HD 7970, на зависть менее удачливым коллегам активно устанавливают новые мировые рекорды в классических приложениях от Futuremark.

К сожалению, на момент проведения тестирования, имеющиеся средства для разгона не позволяли нам изменять напряжения питания, а также увеличивать частоту GPU выше 1125 МГц – границы, установленной в драйвере. Достичь указанного значения не составило никаких проблем даже со штатным вольтажом. +200 МГц – уже очень неплохая прибавка, по сравнению с рекомендуемым значением, но наверняка это далеко не предел для нового чипа. Вопрос возможности разгона остается открытым, и мы к нему еще обязательно вернемся. Особенно любопытно будет оценить потенциал финальных Radeon HD 7970, которые попадут в розничную продажу. Все же в наших руках побывал инженерный образец видеокарты. Однако уже сейчас можно говорить, что 1 ГГц для Tahiti – это только начало. Учитывая легкость, с которой новому кристаллу даются такие частоты, производители видеокарт в последующем наверняка для своих турбированных модификаций будут изначально использовать более внушительные стартовые значения для графического ядра.

Что касается памяти, то для рассмотренной видеокарты используются 2-гигабитные чипы Hynix H5GQ2H24MFR-ROC с базовой частотой 6 ГГц. Так как штатным значением для Radeon HD 7970 является 5500 МГц, микросхемы изначально имеет определенный запас для разгона.

28-нанометровый техпроцесс творит чудеса. Несмотря на значительно возросшую сложность чипа, а также увеличившееся количество функциональных блоков и транзисторов, Tahiti работает на очень высоких тактовых частотах. В этом отношении их 40-нанометровые предки «сдувались» значительно раньше.

Конфигурация тестового стенда

Процессор: Intel Core i7-3930K

Материнская плата: MSI X79A-GD65 (8D)

Оперативная память: GeIL EVO TWO DDR3-2133 16 ГБ (GET316GB2133C11QC)

Накопитель: HDD WD WD1001FALS (1ТБ, 7200 об/мин)

Блок питания: be Quiet! Dark Power Pro 1000W

Результаты тестирования

Подбирать конкурентов для новинки AMD в данном случае было довольно легко. В первую очередь, это предыдущий флагман – Radeon HD 6970. Еще до начала практических тестов было очевидным, что Radeon HD 7970 окажется быстрее предшественника, вопрос был лишь в том, насколько значительной окажется разница в быстродействии этих решений в реальных условиях. А вот GeForce GTX 580 гораздо более интересный соперник для нового топового решения AMD. Уже более года данная видеокарта является обладателем чемпионского пояса в супертяжелом весе. И соперничество именно с этим адаптером вызывает наибольший интерес.

Первые результаты традиционной синтетики от Futuremark демонстрируют заявку на лидерство Radeon HD 7970. В 3DMark Vantage новинка имеет 20%-ное преимущество над GeForce GTX 580 в стандартном режиме Performance и почти вдвое больший перевес в Extreme – очень достойные показатели.

Схожую картину можно наблюдать и в более технологичном 3DMark 11 . С той лишь разницей, что преимущество в режиме с высоким разрешением и качеством графики составляет более скромные 28%.

Но, это еще не победа. Продукты от AMD всегда очень неплохо показывали себя в синтетических приложениях – вычислительная мощность позволяет, да и возможную программную оптимизацию под эталонные тесты не стоит сбрасывать со счетов. Тем не менее, полученные данные дают определенный повод для оптимизма.

В тесте Heaven Benchmark 2.5 использовался режим c максимальным уровнем тесселяции. Это очень некомфортные условия для чипов AMD предыдущего поколения. В подобных ситуациях серьезное преимущество имеют решения от NVIDIA. Собственно в этом можно убедиться, взглянув на соответствующую диаграмму. GeForce GTX 580 на 37% опережает до недавнего времени топовый Radeon HD 6970. Однако в случае с Radeon HD 7970 ситуация меняется на противоположную. Адаптер с Tahiti оказался проворнее и быстрее флагмана калифорнийцев, пересчитывая миллионы полигонов расторопнее предшественника на внушительные 67%. AMD сдержала слово в отношении скорости обработки тесселяции. Соответствующие блоки нового поколения действительно работают очень быстро. И хотя 4-кратного преимущества в данном случае получить не удалось, прирост в 1,7 раза оказался вполне реален.

Первая реальная игра и от тотального преимущества, исчисляемого десятками процентов, не остается и следа. Всего лишь 2% или 1 кадр/c отделяет Radeon HD 7970 и GeForce GTX 580 в режиме Full HD и порядка 9% при разрешении 2560х1600. Вряд ли шестиядерный Core i7-3930K здесь стал ограничителем.

Вместе с тем отметим, что движок Lost Planet 2 явно благоволит решениям от NVIDIA – уж очень велика разница между GeForce GTX 580 и Radeon HD 6970 (53%). Без хорошей оптимизации под конкретную архитектуру достичь подобного сложно. Тем не менее, играя даже на поле соперника, Radeon HD 7970 пусть и минимально, но все же смог его обойти.

В игре Мetro 2033 наблюдаем уверенное преимущество Radeon HD 7970 над основным оппонентом от NVIDIA. Разница в производительности составляет убедительные 21–26%. Обратим внимание на то, что Radeon HD 6970 здесь также выглядит очень неплохо, уступая более дорогостоящему GeForce GTX 580 всего 2–6%. Однако стоит учесть, что во время проведения теста в настройках игры отключалась опция PhysX. Ее активация добавляет визуальных эффектов, но ставит участников в неравные условия. В случае с решениями AMD расчет физики частиц ляжет на плечи CPU, тогда как с адаптером NVIDIA она будет просчитываться вычислительными блоками GPU посредством API CUDA.

Игра Far Cry 2 в режиме DirectX 10 также резвее бегает на Radeon HD 7970. Вряд ли кто-то способен на глаз ощутить разницу в скорости отрисовки между 153 и 142 кадрами/c, но 8%-ное преимущество все же факт неоспоримый. А с увеличением разрешения оно возрастает до более весомых 22%. В сравнении же с предшественником решение на Tahiti расторопнее на 35%.

Схожая расстановка сил наблюдается и в Colin McRae: DiRT 3 . GeForce GTX 580 на 13–22% отстает от Radeon HD 7970. И, что уже стало закономерностью, отрыв новичка AMD увеличивается с ростом разрешения. Ну, а самый скоростной Cayman в данном тесте довольствуется последним местом, отстав от лидера на 42–47%.

Оценивая производительность новинки, следует сказать и об ее скрытом потенциале, ведь Radeon HD 7970 имеет не просто улучшенную, а принципиально новую архитектуру. Как это часто бывает в подобных случаях, последующая программная оптимизация может принести очень хорошие результаты. Потому, вполне реально рассчитывать на дополнительную производительность решений с GCN по мере совершенствования драйверов. Разработчики наверняка сейчас сконцентрируют внимания на адаптерах линейки Radeon HD 7000. Потому очередные улучшения при обновлении ПО в первую очередь будут ощущать как раз владельцы видеокарт с новой графической архитектурой.

На этапе замера энергопотребления у нас осталось два участника. Дело в том, что в качестве тестовой Radeon HD 6970 использовалась MSI R6970 Lightning , которая, помимо используемого GPU, с референсной видеокартой не имеет ничего общего. Серьезно усиленная элементная база и оригинальная печатная плата не позволяют использовать полученные данные для прямого сравнения. А вот GeForce GTX 580 мы использовали адаптер ASUS ENGTX580/2DI/1536MD5 , который основан на эталонном дизайне и имеет рекомендуемые NVIDIA частотные и электрические характеристики.

Признаться, значения в 70 Вт на циферблате ваттметра весьма впечатляют. Особенно с учетом того, что тестовая система основана на отнюдь не самой экономичной платформе LGA2011 с шестиядерным процессором, четырьмя модулями памяти и двухдисковым HDD 7200 об/мин.

AMD хорошо поработала над тем, чтобы максимально снизить энергопотребление Radeon HD 7970. В режиме простоя система с такой видеокартой потребляет на 18 Вт меньше, чем ПК с GeForce GTX 580. Когда же речь идет о реальной игровой нагрузке, разница увеличивается еще больше – до 50–60 Вт. И это при том, что новинка на Tahiti обеспечивает большую скорость, а соответственно имеет лучшее соотношение производительности на ватт.

Итоги

В AMD, безусловно, уловила тренд гетерогенных вычислений. Более того, в сложившейся ситуации можно сказать, что компания всячески содействуют его развитию. По крайней мере, касаемо аппаратной части. Вполне вероятно, что в глобальном масштабе и недалекой перспективе Graphics Core Next поможет AMD более весомо заявить о себе, как о поставщике решений для самых разнообразных задач и применений: от ультимативных игровых систем, до HPC-вычислений.

Что же касается непосредственно Radeon HD 7970 , то видеокарта заслуживает похвалы. На текущий момент это самый производительный одночиповый графический адаптер. Без каких-либо скидок, оговорок и уточнений. Новинка имеет тотальное преимущество над флагманом предыдущего поколения, обеспечивая на 30–70% более высокие показатели, чем у Radeon HD 6970. Ей также удалось опередить и основного конкурента – GeForce GTX 580 – хотя разница здесь уже более скромная.

Тем не менее, для тех, кто готов потратить на видеокарту порядка $500, выбор не столь однозначен. Цена GeForce GTX 580 с референсной системой охлаждения и рекомендуемыми тактовыми частотами заметно снизилась за последние два-три месяца. Такую модель уже можно приобрести за $460-470. Тогда как розничная стоимость Radeon HD 7970 3GB в Украине ожидается на уровне $600. AMD не то, чтобы переоценила свое устройство, а скорее задала ту планку, с которой Radeon HD 7970 предлагает примерно схожее соотношение цена/производительность, что и у топового решения калифорнийцев. Последнее, хоть и оказывается медленнее, но настолько же и дешевле. Потому демпинга не получилось, хотя очень этого и хотелось. Впрочем, мы знаем, что AMD умеет оперативно реагировать на рыночную ситуацию, умело корректируя свою ценовую политику. К счастью для пользователей, в сегменте дискретной графики имеет место жесткая конкуренция, и нет явного лидера, что часто позволяет в ценовом вопросе расставить все точки над «i» сугубо рыночными методами.

Radeon HD 7970 – добротное решение с отличной производительностью, расширенной функциональностью, технологическими инновациями и хорошим потенциалом. За исключением цены, фактически, других слабых мест данный адаптер не имеет. Так или иначе, майка лидерства заслуженно переходит AMD. По крайней мере, на ближайшие пару месяцев, по прошествии которых NVIDIA также представит собственные разработки с 28-нанометровыми GPU и новой архитектурой Kepler. Так что очередная графическая партия также обещает быть весьма любопытной.

AMD решила начать новую битву за господство на рынке GPU. Но сегодня обоим производителям, AMD и Nvidia, приходится сталкиваться с новыми вызовами и работать в новых условиях. В частности, AMD приходится переходить на новую технологию производства 28 нм, да и полностью новую архитектуру GPU, как оказалось. NVIDIA тоже планирует перейти на 28 нм, но только через несколько месяцев, и с новой архитектурой. Но AMD оказалось первой, и в нашей статье мы поговорим о новом поколении GPU в виде AMD Radeon HD 7970.

AMD считает, что игры на ПК ждёт бурное развитие, причём в ближней перспективе - особенно с учётом того, что приставки обновляются довольно долго. А поскольку современные графические движки выигрывают от возможностей передовых видеокарт, то подобное развитие будет только усиливаться. В прошлом году оборот рынка игр для ПК составил 15 млрд. долларов, и к 2013 году ожидается рост до 20 млрд. долларов. И не забывайте о том, что геймеры сегодня предпочитают играть на всё более высоком разрешении. Разрешение 1080p уже стали де-факто стандартом, что подкрепляется и стремительно дешевеющими дисплеями с большой диагональю. Кроме того, AMD фокусируется на более высокой эффективности GPU и на вычислительные возможности GPU. Последняя сфера для AMD сегодня очень важна, поскольку компания желает обойти ограничения, выявленные у GPU архитектуры Cayman.


На данный момент AMD представила только Radeon HD 7970, как можно видеть на слайде, но в линейке Radeon HD 7900 должны вскоре появиться новые видеокарты.

NVIDIA GeForce GTX 570

NVIDIA GeForce GTX 580

AMD Radeon HD 6950 AMD Radeon HD 6970 AMD Radeon HD 7970
GPU GF110 GF110 Cayman PRO Cayman XT Tahiti XT
Техпроцесс 40 нм 40 нм 40 нм 40 нм 28 нм
Количество транзисторов 3 млрд. 3 млрд. 2,6 млрд. 2,6 млрд. 4,3 млрд.
Площадь кристалла 530 мм² 530 мм² 389 мм² 389 мм² 365 мм²
Тактовая частота GPU 732 МГц 772 МГц 800 МГц 880 МГц 925 МГц
Тактовая частота памяти 950 МГц 1000 МГц 1250 МГц 1375 МГц 1375 МГц
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Объём памяти 1280 Мбайт 1536 Мбайт 2048 Мбайт 2048 Мбайт 3072 Мбайт
Ширина шины памяти 320 бит 384 бит 256 бит 256 бит 384 бит
Пропускная способность памяти 152 Гбайт/с 192 Гбайт/с 160 Гбайт/с 176 Гбайт/с 264 Гбайт/с
Модель шейдеров 5.0 5.0 5.0 5.0 5.0
DirectX 11 11 11 11 11.1
Количество потоковых процессоров 480 (1D) 512 (1D) 1408 (352 4D) 1536 (384 4D) 2048 (1D)
Тактовая частота потоковых процессоров 1464 МГц 1544 МГц 800 МГц 880 МГц 925 МГц
Количество текстурных блоков 60 64 88 96 128
Количество ROP 40 48 32 32 32
Максимальное энергопотребление 219 Вт 244 Вт 200 Вт 250 Вт 250 Вт
Минимальное энергопотребление - 30-32 Вт 20 Вт 20 Вт 2,6 Вт
CrossFire/SLI SLI SLI CrossFireX CrossFireX CrossFireX

Видеокарта Radeon HD 7970 базируется на GPU "Tahiti XT", который производится по 28-нм техпроцессу. В общей сложности графический процессор насчитывает 4,3 млрд. транзисторов. Для сравнения, процессоры Intel Sandy Bridge-E (за исключением четырёхъядерных моделей) имеют 2,27 млрд. транзисторов. А предшественник из семейства Cayman Radeon HD 6900 работал с 2,6 млрд. транзисторов. Площадь кристалла составляет 365 мм². Как видим, площадь чуть меньше 389 мм² у GPU "Cayman", которые при этом производятся по 40-нм техпроцессу. GPU GF110 от NVIDIA содержит 3 млрд. транзисторов на площади 530 мм². Большая часть бюджета транзисторов GPU была потрачена на 2048 потоковых процессоров. GPU и потоковые процессоры работают на тактовой частоте 925 МГц. AMD решила сохранить ту же самую память, что и у Radeon HD 6970, то есть GDDR5 на 1375 МГц. Но интерфейс памяти был расширен с 256 бит до 384 бит, что обеспечило увеличение пропускной способности памяти до 264 Гбайт/с. Кроме того, и ёмкость возросла с 2048 Мбайт до 3072 Мбайт. У Radeon HD 7970 работают 128 текстурных блоков и 32 конвейера растровых операций (ROP) - мы получаем прирост текстурных блоков по сравнению с Radeon HD 6970, но количество ROP осталось прежним. AMD указала максимальное энергопотребление для Radeon HD 7970 на уровне 250 Вт, которое также является предельным значением для PowerTune. Типичное энергопотребление видеокарты составляет 210 Вт. У Radeon HD 6970, напомним, максимальное энергопотребление составляло 250 Вт, а типичное под нагрузкой - 190 Вт. Благодаря технологии ZeroCore Power (подробнее о ней чуть ниже) энергопотребление в режиме бездействия не превышает три ватта.

GPU-Z 0.5.7, как можно видеть на скриншоте, корректно отображает не все данные AMD Radeon HD 7970. На нашей тестовой системе Socket 1366 интерфейс был указан как PCI Express 3.0 x16, а тактовая частота - 500 МГц. Также приведены некорректные значения для пиксельной и текстурной пропускной способности. Правильные значения: 925 МГц для GPU, 29,6 Гпиксель/с и 118,4 Гтексель/с.

 
Статьи по теме:
Распространенные коды ошибок на принтерах HP
МФУ HP Laserjet M1132 MFP – это одна из лучших и популярнейших моделей принтеров HP. Профессиональный сервисный центр Комплэйс выполняет ремонт HP M1132 MFP за 1-2 дня. Гарантия на ремонт 2 месяца. Ошибка E8 HP M1132 Ошибка E8 – это ошибка сканера. Сканер
Apparat — Журнал о новом обществе
Последнее обновление: 27.12.2018 Искусственный интеллект, голосовое управление и виртуальная реальность – это тот год, когда научная фантастика постепенно становится реальностью. Слышал такой закон, что человеку свойственно переоценивать влияние технологи
Профессиональный проигрыватель JetAudio Jetaudio не устанавливается
Cообщить об ошибке Битая ссылка на скачивание Файл не соответствует описанию Прочее Отправить сообщение JetAudio – оригинальный программный комплекс, разработанный компанией Cowon, выступающий в качестве проигрывателя. Уникальность приложения закл
Какой лучший редактор HTML, PHP, CSS, JS кода?
Редактор кода - подручный инструмент каждого программиста. И каждый подбирает под себя: кто-то ценит функциональность, кто-то мобильность, для кого-то главное - дизайн и удобство. Кому-то даже нравится писать код в Notepad, но это всё равно, что пытаться