Fecha de lanzamiento | 2011 (original); 2017 (basado en el zen) |
---|---|
Nombre en clave | Fusión Desna Ontario Zacate Llano Hondo Trinity Weatherford Richland Kaveri Godavari Kabini Temash Carrizo Bristol Ridge Raven Ridge Picasso Renoir Cezanne Phoenix IGP Wrestler WinterPark BeaverCreek |
Arquitectura | AMD64 |
Modelos |
|
Núcleos | 1 a 8 |
Transistores |
|
Soporte API | |
DirectX | Direct3D 11 Direct3D 12 |
OpenCL | 1.2 |
OpenGL | 4.1+ |
Historia | |
Predecesor | Athlon II Sempron |
Sucesor | Athlon basado en Ryzen Zen |
La Unidad de procesamiento acelerado ( APU ) de AMD, anteriormente conocida como Fusion , es una serie de microprocesadores de 64 bits de Advanced Micro Devices (AMD), que combina una unidad central de procesamiento ( CPU ) AMD64 de propósito general y una unidad de procesamiento de gráficos integrados (IGPU) 3D en una sola matriz .
AMD anunció las APU de primera generación, Llano para dispositivos de alto rendimiento y Brazos para dispositivos de bajo consumo, en enero de 2011. La segunda generación Trinity para dispositivos de alto rendimiento y Brazos-2 para dispositivos de bajo consumo se anunciaron en junio de 2012. La tercera generación Kaveri para dispositivos de alto rendimiento se lanzó en enero de 2014, mientras que Kabini y Temash para dispositivos de bajo consumo se anunciaron en el verano de 2013. Desde el lanzamiento de la microarquitectura Zen , las APU Ryzen y Athlon se han lanzado al mercado global como Raven Ridge en la plataforma DDR4, después de Bristol Ridge un año antes.
AMD también ha suministrado APU semipersonalizadas para consolas a partir del lanzamiento de las consolas de videojuegos de octava generación Sony PlayStation 4 y Microsoft Xbox One .
El proyecto AMD Fusion comenzó en 2006 con el objetivo de desarrollar un sistema en un chip que combinara una CPU con una GPU en una sola matriz . Este esfuerzo se vio impulsado por la adquisición por parte de AMD del fabricante de chipsets gráficos ATI [1] en 2006. Según se informa, el proyecto requirió tres iteraciones internas del concepto Fusion para crear un producto que se considerara digno de lanzar. [1] Las razones que contribuyeron al retraso del proyecto incluyen las dificultades técnicas de combinar una CPU y una GPU en la misma matriz en un proceso de 45 nm y puntos de vista contradictorios sobre cuál debería ser el papel de la CPU y la GPU dentro del proyecto. [2]
La primera generación de APU para computadoras de escritorio y portátiles, con nombre en código Llano , se anunció el 4 de enero de 2011 en el Consumer Electronics Show de 2011 en Las Vegas y se lanzó poco después. [3] [4] Incluía núcleos de CPU K10 y una GPU de la serie Radeon HD 6000 en la misma matriz en el zócalo FM1 . Se anunció una APU para dispositivos de bajo consumo como la plataforma Brazos , basada en la microarquitectura Bobcat y una GPU de la serie Radeon HD 6000 en la misma matriz. [5]
En una conferencia en enero de 2012, el miembro corporativo Phil Rogers anunció que AMD cambiaría el nombre de la plataforma Fusion a Arquitectura de Sistema Heterogéneo (HSA), afirmando que "es apropiado que el nombre de esta arquitectura y plataforma en evolución sea representativo de toda la comunidad técnica que está liderando el camino en esta área tan importante de tecnología y desarrollo de programación". [6] Sin embargo, más tarde se reveló que AMD había sido objeto de una demanda por infracción de marca registrada por parte de la empresa suiza [[Arctic GmbH |Arctic]], que utilizó el nombre "Fusion" para una línea de productos de suministro de energía . [7]
La segunda generación de APU para computadoras de escritorio y portátiles, con nombre en código Trinity , se anunció en el Financial Analyst Day de AMD de 2010 [8] [9] y se lanzó en octubre de 2012. [10] Presentaba núcleos de CPU Piledriver y núcleos de GPU de la serie Radeon HD 7000 en el zócalo FM2 . [11] AMD lanzó una nueva APU basada en la microarquitectura Piledriver el 12 de marzo de 2013 para computadoras portátiles/móviles y el 4 de junio de 2013 para computadoras de escritorio con el nombre en código Richland . [12] La segunda generación de APU para dispositivos de bajo consumo, Brazos 2.0 , usaba exactamente el mismo chip de APU, pero funcionaba a una mayor velocidad de reloj y renombraba la GPU como serie Radeon HD 7000 y usaba un nuevo chip controlador de E/S.
Los chips semipersonalizados se introdujeron en las consolas de videojuegos Microsoft Xbox One y Sony PlayStation 4 , [13] [14] y, posteriormente, en las consolas Microsoft Xbox Series X|S y Sony PlayStation 5 .
El 14 de enero de 2014 se lanzó una tercera generación de esta tecnología, que presenta una mayor integración entre la CPU y la GPU. La variante de escritorio y portátil tiene el nombre en código Kaveri y se basa en la arquitectura Steamroller , mientras que las variantes de bajo consumo, con nombres en código Kabini y Temash , se basan en la arquitectura Jaguar . [15]
Desde la introducción de los procesadores basados en Zen , AMD renombró sus APU como Ryzen con gráficos Radeon y Athlon con gráficos Radeon , con unidades de escritorio asignadas con el sufijo G en sus números de modelo (por ejemplo, Ryzen 5 3400 G y Athlon 3000 G ) para distinguirlos de los procesadores regulares o con gráficos básicos y también para diferenciarlos de sus antiguas APU de la serie A de la era Bulldozer . Las contrapartes móviles siempre se emparejaron con gráficos Radeon independientemente de los sufijos.
En noviembre de 2017, HP lanzó Envy x360, con la APU Ryzen 5 2500U, la primera APU de cuarta generación, basada en la arquitectura de CPU Zen y la arquitectura de gráficos Vega. [16]
AMD es miembro fundador de la Heterogeneous System Architecture (HSA) Foundation y, por lo tanto, trabaja activamente en el desarrollo de HSA en cooperación con otros miembros. Las siguientes implementaciones de hardware y software están disponibles en los productos de la marca APU de AMD:
Tipo | Función de HSA | Implementado por primera vez | Notas |
---|---|---|---|
Plataforma optimizada | Compatibilidad con GPU Compute C++ | APU Trinity 2012 | Admite instrucciones OpenCL C++ y la extensión de lenguaje C++ AMP de Microsoft . Esto facilita la programación de la CPU y la GPU trabajando juntas para procesar cargas de trabajo paralelas. |
MMU consciente de HSA | La GPU puede acceder a toda la memoria del sistema a través de los servicios de traducción y la gestión de errores de página de la MMU HSA. | ||
Gestión de energía compartida | La CPU y la GPU ahora comparten el presupuesto de energía. La prioridad recae en el procesador más adecuado para las tareas actuales. | ||
Integración arquitectónica | Gestión de memoria heterogénea : la MMU de la CPU y la IOMMU de la GPU comparten el mismo espacio de direcciones. [17] [18] | PlayStation 4 2014 , APU Kaveri | La CPU y la GPU ahora acceden a la memoria con el mismo espacio de direcciones. Los punteros ahora se pueden pasar libremente entre la CPU y la GPU, lo que permite la copia cero . |
Memoria totalmente coherente entre CPU y GPU | La GPU ahora puede acceder y almacenar en caché datos de regiones de memoria coherentes en la memoria del sistema, y también hacer referencia a los datos de la memoria caché de la CPU. Se mantiene la coherencia de la memoria caché. | ||
La GPU utiliza memoria del sistema paginable a través de punteros de CPU | La GPU puede aprovechar la memoria virtual compartida entre la CPU y la GPU, y la memoria del sistema paginable ahora puede ser referenciada directamente por la GPU, en lugar de ser copiada o anclada antes de acceder. | ||
Integración de sistemas | Cambio de contexto de cómputo de GPU | Unidad auxiliar Carrizo 2015 | Las tareas de cómputo en la GPU se pueden cambiar de contexto, lo que permite un entorno multitarea y también una interpretación más rápida entre aplicaciones, cómputo y gráficos. |
Prelación de gráficos de GPU | Las tareas gráficas de larga ejecución se pueden anticipar para que los procesos tengan acceso de baja latencia a la GPU. | ||
Calidad del servicio [17] | Además del cambio de contexto y la prelación, los recursos de hardware se pueden igualar o priorizar entre múltiples usuarios y aplicaciones. |
La siguiente tabla muestra las características de los procesadores AMD con gráficos 3D, incluidas las APU (ver también: Lista de procesadores AMD con gráficos 3D ).
Plataforma | Potencia alta, estándar y baja | Consumo bajo y ultrabajo | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Nombre en clave | Servidor | Básico | Toronto | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Micro | Kioto | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
De oficina | Actuación | Rafael | Fénix | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Corriente principal | Llano | Trinidad | Tierra rica | Kaveri | Kaveri Refrescante (Godavari) | Carrizo | Cresta de Bristol | Cresta del cuervo | Picasso | Renoir | Cézanne | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Entrada | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Básico | Cabaña | Dalí | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Móvil | Actuación | Renoir | Cézanne | Rembrandt | Cordillera del Dragón | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Corriente principal | Llano | Trinidad | Tierra rica | Kaveri | Carrizo | Cresta de Bristol | Cresta del cuervo | Picasso | Renoir Lucienne | Cézanne Barceló | Fénix | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Entrada | Dalí | Mendocino | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Básico | Desna, Ontario, Zacate | Cabañas, Temash | Beema, Mullins | Carrizo-L | Cresta de piedra | Abadejo | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Incorporado | Trinidad | Águila calva | Halcón Merlín , Halcón Pardo | Búho cornudo | Halcón gris | Ontario, Zacate | Cabaña | Águila esteparia , águila coronada , familia LX | Halcón de la pradera | Cernícalo bandeado | Halcón de río | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Liberado | Agosto de 2011 | Octubre de 2012 | Junio de 2013 | Enero de 2014 | 2015 | Junio de 2015 | Junio de 2016 | Octubre de 2017 | Enero de 2019 | Marzo de 2020 | Enero de 2021 | Enero de 2022 | septiembre 2022 | Enero de 2023 | Enero de 2011 | Mayo de 2013 | Abril de 2014 | Mayo de 2015 | Febrero de 2016 | Abril de 2019 | Julio de 2020 | Junio de 2022 | Noviembre de 2022 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Microarquitectura de CPU | K10 | Martillo de hincar | Apisonadora | Excavador | " Excavadora+ " [19] | zen | Zen+ | Zen 2 | Zen 3 | Zen 3+ | Zen 4 | Gato montés | Jaguar | Puma | Puma+ [20] | " Excavadora+ " | zen | Zen+ | " Zen 2+ " | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Es un | x86-64 versión 1 | x86-64 versión 2 | x86-64 versión 3 | x86-64 versión 4 | x86-64 versión 1 | x86-64 versión 2 | x86-64 versión 3 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Enchufe | De oficina | Actuación | — | AM5 | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Corriente principal | — | AM4 | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Entrada | FM1 | FM2 | FM2+ | FM2+ [a] , AM4 | AM4 | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Básico | — | — | AM1 | — | FP5 | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Otro | FS1 | FS1+ , FP2 | FP3 | FP4 | FP5 | FP6 | 7PM | FL1 | FP7 FP7r2 FP8 | ? | FT1 | FT3 | FT3b | FP4 | FP5 | FT5 | FP5 | FT6 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Versión PCI Express | 2.0 | 3.0 | 4.0 | 5.0 | 4.0 | 2.0 | 3.0 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
CXL | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fab. ( nm ) | GF 32SHP ( Inversión pública de Hong Kong ) | GF 28SHP (HKMG a granel) | GF 14LPP ( FinFET a granel) | GF 12LP (FinFET a granel) | TSMC N7 (FinFET a granel) | TSMC N6 (FinFET a granel) | CCD: TSMC N5 (FinFET a granel) cIOD: TSMC N6 (FinFET a granel) | TSMC 4 nm (FinFET a granel) | TSMC N40 (a granel) | TSMC N28 (granel de HKMG) | GF 28SHP (HKMG a granel) | GF 14LPP ( FinFET a granel) | GF 12LP (FinFET a granel) | TSMC N6 (FinFET a granel) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Área de la matriz (mm 2 ) | 228 | 246 | 245 | 245 | 250 | 210 [21] | 156 | 180 | 210 | CCD: (2x) 70 cd/m2: 122 | 178 | 75 (+ 28 FCH ) | 107 | ? | 125 | 149 | ~100 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
TDP mínimo (W) | 35 | 17 | 12 | 10 | 15 | 65 | 35 | 4.5 | 4 | 3,95 | 10 | 6 | 12 | 8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
TDP máximo de APU (W) | 100 | 95 | 65 | 45 | 170 | 54 | 18 | 25 | 6 | 54 | 15 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Reloj base máximo de la APU de serie (GHz) | 3 | 3.8 | 4.1 | 4.1 | 3.7 | 3.8 | 3.6 | 3.7 | 3.8 | 4.0 | 3.3 | 4.7 | 4.3 | 1,75 | 2.2 | 2 | 2.2 | 3.2 | 2.6 | 1.2 | 3.35 | 2.8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo de APU por nodo [b] | 1 | 1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Número máximo de núcleos por CPU | 1 | 2 | 1 | 1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
CCX máximo por núcleo | 1 | 2 | 1 | 1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo de núcleos por CCX | 4 | 8 | 2 | 4 | 2 | 4 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo de núcleos de CPU [c] por APU | 4 | 8 | 16 | 8 | 2 | 4 | 2 | 4 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo de subprocesos por núcleo de CPU | 1 | 2 | 1 | 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Estructura de canalización de números enteros | 3+3 | 2+2 | 4+2 | 4+2+1 | 1+3+3+1+2 | 1+1+1+1 | 2+2 | 4+2 | 4+2+1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
i386, i486, i586, CMOV, NOPL, i686, PAE , NX bit , CMPXCHG16B, AMD-V , RVI , ABM y LAHF/SAHF de 64 bits | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IOMMU [d] | — | versión 2 | versión 1 | versión 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
BMI1 , AES-NI , CLMUL y F16C | — | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
MOVIMIENTO | — | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
AVIC , BMI2 , RDRAND y MWAITX/MONITORX | — | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SME [e] , TSME [e] , ADX , SHA , RDSEED , SMAP , SMEP , XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT, CLZERO y PTE Coalescente | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GMET , WBNOINVD, CLWB, QOS, PQE-BW, RDPID, RDPRU y MCOMMIT | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
MPK , VAES | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SGX | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
FPU por núcleo | 1 | 0,5 | 1 | 1 | 0,5 | 1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Tuberías por FPU | 2 | 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ancho de la tubería FPU | 128 bits | 256 bits | 80 bits | 128 bits | 256 bits | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Conjunto de instrucciones de CPU nivel SIMD | SSE4a [f] | AVX | AVX2 | AVX-512 | ESSE3 | AVX | AVX2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
¡3DAhora! | ¡3DAhora!+ | — | — | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
PREFETCH/PREFETCHW | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GFNI | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
AMX | — | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
FMA4 , LWP, TBM y XOP | — | — | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
FMA3 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
XADN de AMD | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Caché de datos L1 por núcleo (KiB) | 64 | 16 | 32 | 32 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Asociatividad de caché de datos L1 (vías) | 2 | 4 | 8 | 8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Cachés de instrucciones L1 por núcleo | 1 | 0,5 | 1 | 1 | 0,5 | 1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo total de caché de instrucciones L1 de APU (KiB) | 256 | 128 | 192 | 256 | 512 | 256 | 64 | 128 | 96 | 128 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Asociatividad de la caché de instrucciones L1 (vías) | 2 | 3 | 4 | 8 | 2 | 3 | 4 | 8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Cachés L2 por núcleo | 1 | 0,5 | 1 | 1 | 0,5 | 1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máxima cantidad total de caché L2 de APU (MiB) | 4 | 2 | 4 | 16 | 1 | 2 | 1 | 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Asociatividad de caché L2 (vías) | 16 | 8 | 16 | 8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Caché L3 integrado máximo por CCX (MiB) | — | 4 | 16 | 32 | — | 4 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo V-Cache 3D por CCD (MiB) | — | 64 | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo total de caché L3 en CCD por APU (MiB) | 4 | 8 | 16 | 64 | 4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máx. V-Cache 3D total por APU (MiB) | — | 64 | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máxima memoria caché L3 de la placa por APU (MiB) | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo total de caché L3 por APU (MiB) | 4 | 8 | 16 | 128 | 4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Asociatividad de caché L3 de APU (vías) | 16 | 16 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Esquema de caché L3 | Víctima | Víctima | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máx. caché L4 | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Compatibilidad máxima con DRAM de serie | DDR3-1866 | DDR3-2133 | DDR3-2133 , DDR4-2400 | DDR4-2400 | DDR4-2933 | DDR4-3200 , LPDDR4-4266 | DDR5-4800 , LPDDR5-6400 | DDR5-5200 | DDR5-5600 , LPDDR5x -7500 | DDR3L -1333 | DDR3L-1600 | DDR3L-1866 | DDR3-1866 , DDR4-2400 | DDR4-2400 | DDR4-1600 | DDR4-3200 | LPDDR5-5500 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Máximo de canales DRAM por APU | 2 | 1 | 2 | 1 | 2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ancho de banda máximo de DRAM (GB/s) por APU | 29.866 | 34.132 | 38.400 | 46.932 | 68.256 | 102.400 | 83.200 | 120.000 | 10.666 | 12.800 | 14.933 | 19.200 | 38.400 | 12.800 | 51.200 | 88.000 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Microarquitectura de GPU | TeraScale 2 (VLIW5) | TeraScale 3 (VLIW4) | GCN 2da generación | GCN de tercera generación | GCN 5ta generación [22] | ADNr 2 | ADNr 3 | TeraScale 2 (VLIW5) | GCN 2da generación | GCN 3ra generación [22] | GCN 5ta generación | ADNr 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Conjunto de instrucciones de la GPU | Conjunto de instrucciones de TeraScale | Conjunto de instrucciones GCN | Conjunto de instrucciones RDNA | Conjunto de instrucciones de TeraScale | Conjunto de instrucciones GCN | Conjunto de instrucciones RDNA | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Reloj base de GPU de serie máximo (MHz) | 600 | 800 | 844 | 866 | 1108 | 1250 | 1400 | 2100 | 2400 | 400 | 538 | 600 | ? | 847 | 900 | 1200 | 600 | 1300 | 1900 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GFLOPS base de GPU de serie máximos [g] | 480 | 614.4 | 648.1 | 886.7 | 1134.5 | 1760 | 1971.2 | 2150.4 | 3686.4 | 102.4 | 86 | ? | ? | ? | 345.6 | 460.8 | 230.4 | 1331.2 | 486,4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Motor 3D [h] | Hasta 400:20:8 | Hasta 384:24:6 | Hasta 512:32:8 | Hasta 704:44:16 [23] | Hasta 512:32:8 | 768:48:8 | 128:8:4 | 80:8:4 | 128:8:4 | Hasta 192:12:8 | Hasta 192:12:4 | 192:12:4 | Hasta 512:?:? | 128:?:? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IOMMUv1 | IOMMUV2 | IOMMUv1 | ? | IOMMUV2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Descodificador de vídeo | UVD3.0 | UVD 4.2 | UVD6.0 | VCN 1.0 [24] | VCN 2.1 [25] | VCN 2.2 [25] | VCN 3.1 | ? | UVD3.0 | UVD 4.0 | UVD 4.2 | UVD6.0 | UVD6.3 | VCN 1.0 | VCN 3.1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Codificador de vídeo | — | VCE 1.0 | VCE 2.0 | VCE 3.1 | — | VCE 2.0 | VCE 3.1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Movimiento fluido AMD | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ahorro de energía de la GPU | Juego de poder | Sintonizador de potencia | Juego de poder | PotenciaTune [26] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Audio verdadero | — | [27] | ? | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sincronización libre | 1 2 | 1 2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HDCP [i] | ? | 1.4 | 2.2 | 2.3 | ? | 1.4 | 2.2 | 2.3 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Listo para jugar [i] | — | 3.0 aún no | — | 3.0 aún no | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pantallas compatibles [j] | 2–3 | 2–4 | 3 | 3 (computadora de escritorio) 4 (móvil, integrado) | 4 | 2 | 3 | 4 | 4 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
/drm/radeon [k] [29] [30] | — | — | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
/drm/amdgpu [k] [31] | — | [32] | — | [32] |
Las APU de AMD tienen módulos de CPU, caché y un procesador gráfico de clase discreta, todo en la misma matriz y utilizando el mismo bus. Esta arquitectura permite el uso de aceleradores gráficos, como OpenCL, con el procesador gráfico integrado. [33] El objetivo es crear una APU "totalmente integrada" que, según AMD, eventualmente contará con "núcleos heterogéneos" capaces de procesar tanto el trabajo de la CPU como de la GPU de manera automática, según los requisitos de la carga de trabajo. [34]
La primera generación de APU, lanzada en junio de 2011, se utilizó tanto en computadoras de escritorio como en portátiles. Se basó en la arquitectura K10 y se construyó sobre un proceso de 32 nm con dos a cuatro núcleos de CPU en una potencia de diseño térmico (TDP) de 65-100 W y gráficos integrados basados en la serie Radeon HD 6000 con soporte para DirectX 11 , OpenGL 4.2 y OpenCL 1.2. En comparaciones de rendimiento con el Intel Core i3-2105 de precio similar , la APU Llano fue criticada por su bajo rendimiento de CPU [37] y elogiada por su mejor rendimiento de GPU. [38] [39] AMD fue criticada más tarde por abandonar Socket FM1 después de una generación. [40]
La plataforma AMD Brazos se presentó el 4 de enero de 2011, dirigida a los mercados de subportátiles , netbooks y de formato pequeño de bajo consumo. [3] Cuenta con la APU AMD C-Series de 9 vatios (nombre en código: Ontario) para netbooks y dispositivos de bajo consumo, así como la APU AMD E-Series de 18 vatios (nombre en código: Zacate) para portátiles de gama media y económica, equipos todo en uno y ordenadores de sobremesa de formato pequeño. Ambas APU cuentan con uno o dos núcleos Bobcat x86 y una GPU Radeon Evergreen Series con compatibilidad total con DirectX11, DirectCompute y OpenCL, incluida la aceleración de vídeo UVD3 para vídeo HD, incluido 1080p . [3]
El 5 de junio de 2011, AMD amplió la plataforma Brazos con el anuncio de la APU AMD Z-Series de 5,9 vatios (nombre en código: Desna) diseñada para el mercado de las tabletas . [41] La APU Desna se basa en la APU Ontario de 9 vatios. Se lograron ahorros de energía al reducir los voltajes de la CPU, la GPU y el puente norte, reduciendo los relojes inactivos de la CPU y la GPU, así como introduciendo un modo de control térmico de hardware. [41] También se introdujo un modo de núcleo turbo bidireccional .
AMD anunció la plataforma Brazos-T el 9 de octubre de 2012. Comprendía la APU AMD Z-Series de 4,5 vatios (con nombre en código Hondo ) y el Fusion Controller Hub (FCH) A55T, diseñado para el mercado de las tabletas. [42] [43] La APU Hondo es un rediseño de la APU Desna. AMD redujo el consumo de energía optimizando la APU y el FCH para las tabletas. [44] [45]
La plataforma Deccan, que incluía las APU Krishna y Wichita, se canceló en 2011. AMD había planeado originalmente lanzarlas en la segunda mitad de 2012. [46]
La primera iteración de la plataforma de segunda generación, lanzada en octubre de 2012, trajo mejoras en el rendimiento de la CPU y la GPU tanto a los equipos de escritorio como a los portátiles. La plataforma cuenta con 2 a 4 núcleos de CPU Piledriver construidos en un proceso de 32 nm con un TDP entre 65 W y 100 W, y una GPU basada en la serie Radeon HD7000 con soporte para DirectX 11, OpenGL 4.2 y OpenCL 1.2. La APU Trinity fue elogiada por las mejoras en el rendimiento de la CPU en comparación con la APU Llano. [49]
El lanzamiento de esta segunda iteración de esta generación fue el 12 de marzo de 2013 para las piezas móviles y el 5 de junio de 2013 para las piezas de escritorio.
En enero de 2013, las APU Kabini y Temash basadas en Jaguar se dieron a conocer como las sucesoras de las APU Ontario, Zacate y Hondo basadas en Bobcat. [53] [54] [55] La APU Kabini está dirigida a los mercados de bajo consumo, subportátiles, netbooks, ultradelgados y de formato pequeño, mientras que la APU Temash está dirigida a los mercados de tabletas, consumo ultrabajo y formato pequeño. [55] Los dos a cuatro núcleos Jaguar de las APU Kabini y Temash presentan numerosas mejoras arquitectónicas con respecto a los requisitos de energía y el rendimiento, como soporte para instrucciones x86 más nuevas, un mayor conteo de IPC , un modo de estado de energía CC6 y puerta de reloj . [56] [57] [58] Kabini y Temash son los primeros SoC x86 de cuatro núcleos de AMD, y también los primeros de la historia . [59] Los concentradores de controlador de fusión (FCH) integrados para Kabini y Temash tienen los nombres en código "Yangtze" y "Salton", respectivamente. [60] El FCH de Yangtze admite dos puertos USB 3.0, dos puertos SATA de 6 Gbit/s, así como los protocolos xHCI 1.0 y SD/SDIO 3.0 para compatibilidad con tarjetas SD. [60] Ambos chips cuentan con gráficos basados en GCN compatibles con DirectX 11.1, así como numerosas mejoras de HSA. [53] [54] Fueron fabricados en un proceso de 28 nm en un paquete de matriz de rejilla de bolas FT3 por Taiwan Semiconductor Manufacturing Company (TSMC), y fueron lanzados el 23 de mayo de 2013. [56] [61] [62]
Se reveló que tanto la PlayStation 4 como la Xbox One estarán equipadas con APU semipersonalizadas de 8 núcleos derivadas de Jaguar.
La tercera generación de la plataforma, cuyo nombre en código es Kaveri, se lanzó parcialmente el 14 de enero de 2014. [65] Kaveri contiene hasta cuatro núcleos de CPU Steamroller con una velocidad de reloj de 3,9 GHz con un modo turbo de 4,1 GHz, hasta una GPU Graphics Core Next de 512 núcleos, dos unidades de decodificación por módulo en lugar de una (lo que permite que cada núcleo decodifique cuatro instrucciones por ciclo en lugar de dos), AMD TrueAudio, [66] Mantle API , [67] un ARM Cortex-A5 MPCore en chip, [68] y se lanzará con un nuevo zócalo, FM2+. [69] Ian Cutress y Rahul Garg de Anandtech afirmaron que Kaveri representaba la realización unificada del sistema en un chip de la adquisición de ATI por parte de AMD. Se descubrió que el rendimiento de la APU Kaveri A8-7600 de 45 W era similar al de la pieza Richland de 100 W, lo que llevó a afirmar que AMD realizó mejoras significativas en el rendimiento de los gráficos integrados por vatio; [63] sin embargo, se descubrió que el rendimiento de la CPU estaba por detrás de los procesadores Intel con especificaciones similares, un retraso que era poco probable que se resolviera en las APU de la familia Bulldozer. [63] El componente A8-7600 se retrasó de un lanzamiento en el primer trimestre a un lanzamiento en el primer semestre porque los componentes de la arquitectura Steamroller supuestamente no escalaban bien a velocidades de reloj más altas. [70]
AMD anunció el lanzamiento de la APU Kaveri para el mercado móvil el 4 de junio de 2014 en Computex 2014, [64] poco después del anuncio accidental en el sitio web de AMD el 26 de mayo de 2014. [71] El anuncio incluía componentes destinados a los segmentos de voltaje estándar, bajo voltaje y voltaje ultrabajo del mercado. En las pruebas de rendimiento de acceso temprano de un prototipo de computadora portátil Kaveri, AnandTech descubrió que el FX-7600P de 35 W era competitivo con el Intel i7-4500U de 17 W de precio similar en los puntos de referencia sintéticos centrados en la CPU, y era significativamente mejor que los sistemas de GPU integrada anteriores en los puntos de referencia centrados en la GPU. [72] Tom's Hardware informó sobre el rendimiento del Kaveri FX-7600P contra el Intel i7-4702MQ de 35 W , y descubrió que el i7-4702MQ era significativamente mejor que el FX-7600P en pruebas comparativas sintéticas centradas en la CPU, mientras que el FX-7600P era significativamente mejor que el iGPU Intel HD 4600 del i7-4702MQ en los cuatro juegos que se pudieron probar en el tiempo disponible para el equipo. [64]
{{cite web}}
: CS1 maint: numeric names: authors list (link){{cite web}}
: CS1 maint: numeric names: authors list (link)