Видеокарта (видеоадаптер, графический адаптер) — устройство с графическим процессором (GPU), который занимается формированием графического образа и выполнением других задач, связанных с графикой. Видеокарты являются дискретными и интегрированными.
Обычно дискретная видеокарта является платой расширения и подсоединяется в слот расширения — универсальный (PCI-Express, PCI, ISA, VLB, EISA, MCA) или специализированный (AGP). Интегрированная видеокарта встраивается (интегрируется) в материнскую плату (как в виде отдельных элементов системной логики, так и в качестве составной части северного моста чипсета или CPU (например, технология AMD Fusion)). Интегрированные системы практически всегда работают медленнее дискретных видеокарт, но они дешевые и потребляют мало энергии. Интегрированная графика используется в основном в ноутбуках и офисных компьютерах, то есть там, где не требуется высокая производительность в 3D приложениях и играх.
В настоящее время на рынке видеокарт существует два лидера — NVIDIA и AMD Radeon.
NVIDIA и AMD Radeon — это производители графических процессоров для видеокарт. А производители готовых решений в виде видеокарт, это те компании, которые, непосредственно, собирают и комплектуют свои продукты чипами (процессорами) Radeon и GeForce.
Примеры основных производителей видеокарт:
- на видеочипах AMD Radeon: HIS, Asus, MSI, Sapphire, Gigabyte, XFX.
- на видеочипах NVIDIA GeForce: Asus, Gigabyte, Inno3D, MSI, Palit, Zotac.
Первые персональные компьютеры не содержали в своей архитектуре отдельного графического процессора в том виде, в котором он существует сегодня. Для вывода текста на экран монохромного монитора не требовалось сложных решений, поэтому возможностей простого видеоконтроллера вполне хватало. С появлением компьютерных игр и программ для обработки графики остро встал вопрос о специализированном устройстве для вывода изображения на цветной монитор с большей, чем 640х480 точек, разрешением. Сначала были разработаны системы для вывода пиксельной графики, а позже, по мере роста интереса к трехмерным играм и графические ускорители, которые обеспечивали 3D-функции. В наше время видеоконтроллер и ускоритель объединены в единое целое — устройство под названием видеокарта (графический адаптер).
Благодаря архитектуре, оптимизированной для работы с изображениями, графический процессор (GPU) имеет гораздо более высокую вычислительную скорость, чем центральный процессор компьютера (CPU), поскольку в нем реализован эффективный алгоритм распараллеливания задач. Графический процессор состоит из большого количества (в топовых моделях — более 1,5 тыс.) небольших блоков, способных работать отдельно друг от друга с огромной скоростью. Данная архитектура связана с особенностью расчетов в 3D-графике, значительная часть которых представляет собой перемножения больших матриц чисел. Такие расчеты эффективно разбиваются на блоки и обрабатываются параллельно.
Если говорить о параметрах, то они у графических процессоров достаточно схожи с центральными процессорами. Это такие параметры, как микроархитектура процессора, тактовая частота работы ядра, техпроцесс производства. Но у них есть и довольно специфические характеристики. Например, немаловажная характеристика графического процессора — это количество пиксельных конвейеров (Pixel Pipelines). Эта характеристика определяет количество обрабатываемых пикселей за такт работы GPU. Количество данных конвейеров может различаться, например, в графических чипах серии Radeon HD 6000, их количество может достигать 96. Пиксельный конвейер занимается тем, что просчитывает каждый следующий пиксель очередного изображения, с учетом своих возможностей. Для ускорения процесса просчета используется несколько параллельно работающих конвейеров, которые просчитывают различные пиксели того же изображения. Также, количество пиксельных конвейеров влияет на важный параметр — скорость заполнения памяти видеокарты. Скорость заполнения видеокарты можно рассчитать умножив частоту ядра на количество конвейеров.
Аппаратная часть видеокарты
Конструкция видеокарты. Основой любой видеокарты (например, дискретной видеокарты Sapphire Radeon RX 470) является графический процессор (GPU — Graphic Processor Unit).
Подобно центрального процессора (CPU), он выполняет обработку команд, но, в отличие от CPU — GPU работает со специальными графическими инструкциями, которые используются только в программировании 2D и 3D-изображений.
Современные видеокарты потребляют до 200 и более ватт электроэнергии, которая в основном превращается в тепло, которое необходимо эффективно отводить.
Поэтому важным элементом конструкции видеоадаптера является система охлаждения. К офисных и домашних ПК особых требований не предъявляется: можно подыскать систему с небольшим малошумным вентилятором или вообще найти карту с пассивным охлаждением. Игровым ПК нужен мощный вентилятор и радиатор из меди (или хотя бы с основой из меди). Обязательно должны быть дополнительные радиаторы на чипах памяти.
Внешние интерфейсы. На рынке ПК присутствует основной вид разъемов — PCI-Express. Причем существуют различные его версии, различающиеся по скоростям: 1х, 2х, 4х, 8х, 16х. Безусловно, последний интерфейс имеет значительное преимущество в пропускной способности.
Стандартным интерфейсом для подключения видеокарт в настоящее время являются шины PCI-Express 1.1 и PCI-Express 2.0. Как правило, в качестве видеоинтерфейсов используется вариант PCI-Express 16x, что обеспечивает пропускную способность 4 Гб/с (PCI-Express 1.1) и 8 Гб/с (PCI-Express 2.0) в каждом направлении, хотя изредка встречаются реализации PCI-Express 8x (в основном в урезанных SLI- или CrossFire-решениях). Шина PCI-Express 2.0 совместима с PCI-Express 1.1, то есть старые видеокарты будут нормально работать в новых системных платах. Кроме того, спецификация PCI-Express 2.0 расширяет возможности энергоснабжения до 300 Вт на видеокарту.
Для подключения внешних видеоустройств на видеокартах, могут использоваться аналоговые интерфейсы VGA, S-Video и цифровые — DVI и HDMI. Главная особенность HDMI — возможность передавать по одному кабелю на расстояние до 10 метров наряду с цифровым видеосигналом еще и аудио-сигнал без потери качества. Благодаря этому количество соединительных проводов существенно уменьшается.
Технологии, используемые в видеокартах
Самый простой способ увеличения производительности видеокарты, это использования большего количества графических процессоров. Данная идея далеко не нова — двухпроцессорный системы известны еще с 90-х годов прошлого века. Например, в 2000 году компания 3dfx выпустила видеокарту Voodoo 5500 с двумя процессорами, а у Voodoo 6000 было уже 4 графических процессора. На сегодня видеокарты также существуют в двухчиповом варианте. Например, NVIDIА GeForce GTX 295 и AMD (ATI) Radeon HD5970. Однако, такие решения достаточно дорогие, поскольку представляют собой пару топовых чипов и без того не дешевых. Более доступным решением является сочетание нескольких не самых дорогих видеокарт в одном компьютере.
Фирма NVIDIА разработала технологию SLI (Scalable Link Interface — масштабируемый объединенный интерфейс) — программно-аппаратная технология NVIDIА, что обеспечивает монтирование и совместную работу двух видеокарт в режиме Multi-GPU Rendering. Нагрузка между ними распределяется динамически, что позволяет значительно увеличить производительность видеосистемы и получить высокое качество отображения трехмерной графики.
Для нормальной работы видеокарт в SLI режиме, необходима материнская плата с двумя графическими слотами, допускающими установку видеокарт с интерфейсом PCI-Express (NVIDIА GeForce 6×00 и более новых, причем обе видеокарты должны быть построены на одинаковых GPU). Для обмена информацией между ними, чаще всего используется специальный SLI-коннектор, хотя в отдельных случаях возможна связь через интерфейс PCI-Express.
Во многих случаях использование SLI дает увеличение производительности 3D-приложений, хотя радикальное увеличение наблюдается в основном в играх, специально оптимизированных под эту технологию.
CrossFire является ответом компании AMD на инновацию NVIDIА SLI и также позволяет использовать две видеокарты для увеличения производительности видеосистемы.
NVIDIA 3D Vision Surround — это технология обеспечивает подключение трех FullHD-мониторов, для работы с 3D изображением. Но если говорить о аналог AMD в лице технологии Eyefinity , то она позволяет подключать около 6 мониторов на одну видеокарту, начиная с шеститысячной серии AMD (естественно, не без поддержки данной технологии). А сейчас появились специальные модифицированные системы, которые позволяют объединять до 24 мониторов в 1 стенд, именно с помощью технологии Eeyfinity.
NVIDIA CUDA — технология программно-аппаратной архитектуры, позволяет производить вычисления с использованием графического процессора, заметно повышает производительность системы, то есть графический процессор помогает центральному процессору в его вычислительной работе. Аналогом компании AMD, является технология FireStream. Но в силу некоторых обстоятельств больше известной и «технологической» является именно CUDA.
NVIDIA PhysX является кроссплатформенной технологией для симуляции физических явлений. Физический «двигатель» PhysX SDK состоит из трех компонентов обработки физики:
- обработка твердых тел;
- обработка тканей;
- обработка жидкостей;
Если у видеокарты отсутствует поддержка PhysX, то эти вычислительные задачи переносятся на центральный процессор. Хотя PhysX является открытым стандартом, но в силу факторов конкуренции NVIDIА CUDA и AMD FireStream, компания AMD начинает в 2009 году использование альтернативного двигателя ирландской компании, под названием Havok Physics.
Основные характеристики и параметры видеокарт
Технологический процесс — определяет размер элементов в ядре. Чем меньше размер элементов — тем меньше площадь ядра, стоимость и энергопотребление. Обычно (но не всегда) целые линейки видеокарт выпускают по одинаковому техпроцессу. Узнать, по каким нормам выпускается определенный чип, можно при помощи специальных утилит (например, Everest). На данный момент в сфере видеочипов стандартом является 14 нм техпроцесс (например, видеокарты Radeon RX 470 и Geforce GTX 1070).
Объем видеопамяти — определяет объем данных, которые ускоритель может загрузить в свою собственную память. Больший объем видеопамяти снизит частоту обращения к RAM, таким образом можно избавиться от лишних задержек в работе ПК. Наиболее оптимальным выбором для современных игр, сегодня считается 4096 Мбайт памяти, которой должно хватить всем современным приложениям. Многие производители предлагают видеокарты с вдвое большим объемом, но, как показывают тесты, прирост от использования 8192 Мбайт незначительный.
Тип видеопамяти конечно, большой объем видеопамяти необходим для нормальной работы ПК, но еще важно, на какой скорости работает эта память. GDDR (англ. Graphics Double Data Rate) — подвид энергозависимой динамической памяти с произвольным доступом (DRAM) и удвоенной скоростью передачи данных (DDR — Double-Dynamic Rate), предназначенный для использования в графических картах (видеокартах). На данный момент в видеокартах используют память GDDR, которая за один такт передает информацию сразу в две стороны, тем самым удваивая частоту шины памяти. Например, если чип памяти работает на частоте 500МГц, то в случае памяти DDR эффективная частота шины памяти будет 1000МГц.
На сегодня в видеокартах могут применяться следующие типы видеопамяти:
- GDDR- частота до 600МГц. Это такие видеокарты как Radeon 9600, GeForce 6600, GeForce FX5600. Эта память давно устарела и не используется в современных видеокартах.
- GDDR2 — частота от 600 до 1000МГц. Устарела.
- GDDR3 — частота от 900 до 2000МГц, используется в большинстве старых видеокарт.
- GDDR4 — частоты от 2 ГГц. На данный момент ее имеют отдельные версии Radeon HD2900xt, HD 3870 (x2).
- GDDR5 — частоты до 7 ГГц. Такая память установлена на топовые современные видеокарты.
Частота памяти. Она зависит от времени выборки — это интервал времени между началом обработки запроса к запоминающего устройства и получением от него запрошенных данных. Измеряется в наносекундах, например время выборки памяти 2,5 нс для типа памяти GDDR3.
Ширина шины памяти — определяет скорость и разгон графической памяти. Могут быть варианты с 32, 64, 128, 256, 512 битной шириной шины памяти. Большая ширина шины обеспечивает лучшую пропускную способность и эффективность разгона. Для бюджетных Low-End решений практически всегда используются урезанные до 64 или даже 32 бит шины, однако среди игровых видеокарт преобладает шина 256 или 512 бит.
Частота чипа или тактовая частота GPU — указывает сколько тактов в секунду может выполнять видеочип и определяет максимальный объем работы, который процессор может выполнить в единицу времени. Чем выше частота GPU тем больше производительность.
Шейдеры — это небольшие программы, которые выполняются процессором видеокарты и предназначены для определения конечного изображения трехмерной сцены. Шейдеры используются как в играх, так и в 3D моделировании. Чаще всего шейдеры используются в параллельных процессах обработки графики, благодаря чему снимается часть нагрузки с центрального процессора, а значит, увеличивается эффективность. Если видеокарта не содержит специальных процессоров для их обработки, их можно выполнять в режиме эмуляции за счет ресурсов центрального процессора. Шейдеры позволяют изображать сложные поверхности с помощью простых геометрических форм. Шейдеры как правило отвечают за какой-нибудь графический эффект, например с рассеяния света, эффект отражения, преломления. Различают шейдеры вершинные и пиксельные.
Число пиксельных и вершинных шейдерных блоков очень важно. Вершинные шейдерные блоки выполняют расчеты каркасов объектов, а пиксельные — заполняют их. Соответственно, чем больше шейдерных блоков, тем больше графики процессор сможет обработать за такт. Эти параметры вместе с тактовой частотой определяют производительность графического процессора.
Также используют унифицированные шейдерные блоки, которые одновременно могут обрабатывать пиксельные и вершинные шейдеры, в зависимости от того что нужно в данный момент. Такая технология впервые появилась в видеочипах 8 поколения nVidia (G80) и серии 2000 от AMD / ATI (R600).
Технология динамического освещения (High dynamic range (HDR), вывела реалистичность картинки в играх на новый уровень. Нововведения позволило по-новому отображать блики воды, свет, проходящий через полупрозрачные поверхности (витражи), и многое другое.
Фильтрация текстур — если в виртуальном мире посмотреть издалека на дорогу, то текстуры на ней будут смазаны. Фильтрация текстур позволяет устранить этот недостаток. Существует несколько видов фильтрации: билинейная, трилинейная и анизотропная. Самая качественная, но и самая сложная для ускорителя — анизотропная фильтрация. NVIDIA и ATI применяют собственные технологии для расчета фильтрации, поэтому результат получается разный.
Сглаживание (антиалиасинг (antialiasing)) — как известно, в играх при низком разрешении на краях объектов можно наблюдать «зубчатую» границу, по-научному такое явление называется алиасингом. Сглаживание — это технология, позволяющая сделать пределы кривых линий более гладкими. Если не вдаваться в подробности, то принцип сглаживания прост — увеличивается разрешение картинки, значение цвета предельных точек усредняется между цветом изображения и цветом фона. Таким образом, «зубчатая» граница размывается. Следует отметить, что антиалиасинг — очень ресурсоемкая технология.
Количество блоков текстурирования (TMU) — количество блоков, определяющих текстурную производительность (скорость выборки и наложения текстур), особенно при использовании трёхлинейной и анизотропной фильтрации. Наибольшее значение блоки TMU имеют в относительно старых играх дошейдерной эпохи, хотя и сейчас они не потеряли актуальности.
Количество блоков растеризации (ROP) , осуществляющих операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как и в случае с блоками TMU, актуальность блоков ROP в период господства шейдерной архитектуры несколько снизилась.
Время доступа памяти (измеряется в нс) — величина, обратно пропорциональной рабочей частоте видеопамяти. Чем меньше время доступа, тем больше максимальная рабочая частота памяти.
Пропускная способность памяти — объем информации, проходящей через память за одну секунду. Она равна эффективной частоте памяти, умноженной на разрядность памяти. Естественно, чем выше пропускная способность памяти тем лучше. Особенно высокие требования предъявляются при работе видеокарты в сложных режимах (высокое разрешение, сглаживание и фильтрация текстур).
DirectX (от англ. Direct — прямой, непосредственный) — это готовый набор функций (API), которые могут использовать разработчики приложений API, разработанных для решения задач, связанных с программированием под Microsoft Windows. DirectX наиболее широко используется при написании компьютерных игр.
Пакет средств разработки DirectX под Microsoft Windows бесплатно доступен на сайте Microsoft. Чаще всего обновленные версии DirectX поставляются вместе с игровыми приложениями, так как DirectX API обновляется достаточно часто, и версия, включенная в ОС Windows, конечно является далеко не самой новой.
В настоящее время наиболее новой является версия DirectX 12, рассчитанная под операционную систему Windows 10.
OpenGL (Open Graphics Library — открытая графическая библиотека, графическое API) — спецификация, определяющая независимый от языка программирования кросс-платформенный программный интерфейс для написания приложений, использующих двумерную и трехмерную компьютерную графику. Наиболее современная версия — OpenGL 4.3.
Поддержка кодеков. С выходом каждого нового поколения видеокарт в ядра добавляется аппаратная поддержка новых видеокодека. Она позволяет снять нагрузку с процессора при обработке видео.
Обзор и сравнение современных графических видеокарт
Индустрия видеокарт является одной из самых динамичных из всех сфер информационных технологий. Рассмотрим характеристики видеокарт по классам.
Дискретные видеокарты Hi-end класса. Для того чтобы играть в современные игры на максимальных или близких к максимальным настройках, следует обратить самое пристальное внимание на видеокарты этого класса. Такие видеокарты стоят дорого и потребляют очень много электроэнергии, так что ноутбук с такой графикой не будет долго работать от батареи. Это следует учитывать. Характеристики новейших видеокарт этого класса указаны в таблице ниже.
Дискретные видеокарты среднего уровня. Видеокарты этого класса стоят дешевле, чем видеокарты Hi-end класса и меньше нагружают аккумуляторную батарею. Однако они также дают возможность выполнять сложные задачи, связанные с графическими приложениями и играть в новейшие игры с высокими настройками детализации.
Бюджетные дискретные игровые видеокарты. Такие видеокарты также называют видеокартами нижнего сегмента среднего класса. Видеокарты такого уровня не позволяют играть в современные игры, требующие мощных видеокарт, на высоких настройках детализации. Однако, такая видеокарта потребляет значительно меньше энергии и ряд игр будут на них работать на невысоких настройках графики. Одним из преимуществ таких видеокарт является большее время работы ноутбука от аккумуляторной батареи, в сравнении с использующими мощную видеокарту. Ноутбуки на таких видеокартах имеют умеренную стоимость.
Кроме рассмотренных классов видеокарт существует также класс интегрированных видеокарт, которые не приспособлены для новейших игр. В качестве примера таких видеокарт — Intel Graphics Media Accelerator (GMA) 3650, Intel Graphics Media Accelerator (GMA) 3600, Intel Graphics Media Accelerator (GMA) 3150. Такие видеокарты работают на платах с поддержкой встроенного видеоядра процессора.
Характеристики игровых видеокарт Hi-end класса:
Модель | Архитек-тура | Шейдеры | Частота ядра, МГц | Частота шейдеров, МГц | Частота памяти, МГц | Разрядн. шины памяти | DirectX | 3DMark05 | 3DMark06 | 3DM Vant. P GPU | 3D Mark11 Vant. P GPU |
---|---|---|---|---|---|---|---|---|---|---|---|
NVIDIA GeForce GTX 680M SLI | Kepler | 2688 | 720 | 720 | 1800 | 256 | 11.1 | 32059 | 26530 | 35538 | 10983 |
AMD Radeon HD 7970M Crossfire | GCN | 2560 | 850 | 850 | 1200 | 256 | 11 | 36878 | 27647 | 35208.5 | 11119 |
NVIDIA GeForce GTX 680M | Kepler | 1344 | 720 | 720 | 1800 | 256 | 11.1 | 28025 | 23022.3 | 20723.5 | 5918 |
NVIDIA GeForce GTX 580M SLI | Fermi | 768 | 620 | 1240 | 1500 | 256 | 11 | 31017 | 23255 | 24335.3 | 5990 |
AMD Radeon HD 6990M Crossfire | Terascale2 | 2240 | 715 | 715 | 900 | 256 | 11 | 28941 | 23292 | 24558 | 6422 |
NVIDIA GeForce GTX 485M SLI | Fermi | 768 | 575 | 1150 | 1500 | 256 | 11 | 29690 | 23415 | 23092 | 5334 |
AMD Radeon HD 6970M Crossfire | Terascale2 | 1920 | 680 | 680 | 900 | 256 | 11 | 30784.5 | 22759 | 20547 | 5541.5 |
AMD Mobility Radeon HD 5870 Crossfire | Terascale2 | 1600 | 700 | 700 | 1000 | 128 | 11 | 19079 | 16596.3 | 14096 | — |
Характеристики игровых видеокарт среднего уровня:
Модель | Архитек-тура | Шейдеры | Частота ядра, МГц | Частота шейдеров, МГц | Частота памяти, МГц | Разрядн. шины памяти | DirectX | 3DMark05 | 3DMark06 | 3DM Vant.P GPU | 3D Mark11 Vant. P GPU |
---|---|---|---|---|---|---|---|---|---|---|---|
NVIDIA GeForce GT 640M | Kepler | 384 | 625 | 625 | 900 | 128 | 11 | 17710.7 | 10846,4 | 6406,6 | 1700,2 |
AMD Radeon HD 7730M | GCN | 512 | 575-675 | 575-675 | 900 | 128 | 11.1 | 16766 | 9615 | 5833 | 1478 |
ATI FirePro M7740 | Terascale1 | 640 | 650 | 650 | 1000 | 128 | 10.1 | 17192 | 12109,5 | 5896 | — |
AMD Radeon HD 6775G2 | Terascale2 | 880 | — | — | — | — | 11 | — | — | — | — |
AMD Radeon HD 7690M XT | Terascale2 | 480 | 725 | 725 | 900 | 128 | 11 | 17545 | 10919 | 5594 | 1346 |
AMD FirePro M5950 | Terascale2 | 480 | 725 | 725 | 900 | 128 | 11 | 19971 | 10592 | 5560 | 1350 |
AMD Radeon HD 6770M | Terascale2 | 480 | 675/725 | 675/725 | 800 | 128 | 11 | 15484,2 | 10126,7 | 5149,8 | 1327,8 |
NVIDIA GeForce GT 635M | Fermi | 144 | 675-753 | 1350-1505 | 785-900 | 128/192 | 11 | 10818 | 5348 | 1393 | |
NVIDIA GeForce GT 555M | Fermi | 144 | 525-753 | 1180-1505 | 785-900 | 128/192 | 11 | 18199,3 | 10453,2 | 4847,1 | 1178,9 |
ATI Mobility Radeon HD 5850 | Terascale2 | 800 | 625 | 625 | 2000 | 128 | 11 | 15364,8 | 9866,8 | 5365,6 | — |
Характеристики игровых бюджетных видеокарт:
Модель | Архитек-тура | Шейдеры | Частота ядра, МГц | Частота шейдеров, МГц | Частота памяти, МГц | Разрядн. шины памяти | DirectX | 3DMark05 | 3DMark06 | 3DM Vant.P GPU | 3D Mark11 Vant.P GPU |
---|---|---|---|---|---|---|---|---|---|---|---|
AMD Radeon HD 7630M | Terascale2 | 480 | 450 | 450 | 900 | 128 | 11 | — | — | — | — |
NVIDIA Quadro FX 1800M | GT2xx | 72 | 560 | 1125 | 1100 | 128 | 10.1 | 15249 | 7572.5 | 2800.5 | |
ATI Mobility Radeon HD 5650 | Terascale2 | 400 | 450-650 | 450-650 | 800 | 128 | 11 | 12418.1 | 6459.8 | 2710.6 | 855.5 |
AMD Radeon HD 7660G | Terascale3 | 384 | 497-686 | 497-686 | — | — | 11 | 11235 | 7316 | 4176 | 1056 |
AMD Radeon HD 6530M | Terascale2 | 400 | 500 | 500 | 800 | 128 | 11 | — | 6963 | — | — |
NVIDIA GeForce GT 620M | Fermi | 96 | 625-715 | 1250 | 900 | 64/128 | 11 | 14930 | 7462.5 | 3675.5 | 916 |
NVIDIA Quadro K 500M | Kepler | 192 | — | — | 900 | 64 | 11 | — | — | — | — |
NVIDIA GeForce GT 525M | Fermi | 96 | 600 | 1200 | 900 | 128 | 11 | 13307 | 6902.1 | 2927.4 | 742.9 |
AMD Radeon HD 7610M | Terascale2 | 400 | 450 | 450 | 800 | 128 | 11 | 12445.5 | 6669.5 | 3071 | 746.5 |
Технология встроенных видеокарт AMD Fusion
AMD Fusion (от англ. Fusion — слияние) — кодовое наименование микропроцессорной архитектуры, которая была разработана американской компанией AMD. Суть проекта «AMD Fusion» заключается в объединении центрального многозадачного универсального процессора с графическим параллельным многоядерным процессором в одном кристалле. Процессоры, создаваемые по такой микроархитектуре, называются APU — Accelerated Processing Unit, по аналогии с CPU. Энергопотребление процессоров Fusion достаточно неплохо оптимизировано, что обеспечивает десткопам на их основе бесшумность, а ноутбукам — длительное время автономной работы. APU — процессор, в котором скалярные и векторные вычисления выполняются в одной архитектуре. Цель проекта Fusиon — использовать гетерогенные вычисления для максимального увеличения эффективности. Например, наличие двух ядер позволит достичь высокого соотношения производительности к затраченной энергии. Правда, для этого необходимо, чтобы программы были написаны в соответствии со спецификой гетерогенной модели обработки информации.
В технологии AMD Fusиon исторически первой была разработана платформа на основе APU Llano с ядром K10 на базе 32-нм технологического процесса. Она была доступна в сериях APU A4, A6, A8 и E2. В качестве основы для APU Llano выступает так называемый FCH (Fusion Controller HUB), что на данный момент существует в двух модификациях — A75 FCH и A55 FCH. Платформа, состоящая из APU Llano и FCH A55 / A75, имеет имя Lynx. Она позиционируется на рынке в качестве mainstream — решений. На рисунке показана схематичная блок схема FCH A75. FCH A55 не поддерживает стандарта USB 3.0 в отличие от FCH A75. На кристалл этого процессора интегрированы следующие элементы:
- до четырех x86-совместимых вычислительных ядер поколения Stars (техпроцесс 32 нм) с 1 Мбайт кэша второго уровня для каждого ядра. Поддерживается технология AMD Turbo CORE;
- северный мост;
- графический SIMD-массив (количество ядер зависит от модели APU)
- набор цифровых интерфейсов ввода / вывода (DVI, HDMI, DisplayPort)
- контроллер PCI-Express, 24 линии. Шестнадцать из них используются для дискретной графики, четыре линии составляют интерфейс UMИ и четыре используются для других устройств;
- двухканальный контроллер памяти стандарта DDR-3.
При разработке APU Llano инженеры AMD в первую очередь ориентировались на графическую мощь при умеренной производительности x86-ядер, в то время как основной конкурент в лице Intel, наоборот, усилил классические ядра, уделив меньше внимания графической составляющей своих процессоров. С таким расположением приоритетов неудивительно, что графическая часть APU Llano серии A вышли значительно более продуктивной в сравнении с интегрированным графическим ядром процессоров Core i3 с микроархитектурой Sandy Bridge.
Также AMD представила обновленную серию A своих гибридных решений, ранее известную под кодовым именем Trinity, которая имеет улучшенные потребительские характеристики, по сравнению с Llano.
Новые чипы соединяют два или четыре процессорных ядра «Piledriver», а также видеоядро серии «Northern Islands» с 384 вычислительными ядрами архитектуры VLI4. Главное преимущество APU — это высокая производительность в 3D играх. Новая серия APU от компании AMD основана на чипе, состоящий из 1300000000 транзисторов, выполненном на базе 32 нм HKMG техпроцесса, имеет площадь 246 мм2. Новые чипы серии A имеют до четырех x86-ядер, до 128 КБ кэш-памяти первого уровня (64 КБ для инструкций, 64 КБ для данных) и до 4 МБ кэш-памяти второго уровня. Графическое ядро содержит до 384 вычислительных ядер и имеет поддержку Direct 11 API, в состав чипа входят аппаратные блоки кодирования и декодирования видеоданных: UVD 3 и VCE.