Apisonadora (microarquitectura)

Microarquitectura de AMD
Steamroller - Familia 15h (3.ª generación)
información general
Lanzado14 de enero de 2014 ; hace 10 años ( 14 de enero de 2014 )
Fabricante común
Arquitectura y clasificación
Nodo tecnológico28 nm de potencia de vapor de agua [1]
Conjunto de instruccionesAMD64 ( x86-64 )
Especificaciones físicas
Zócalos
Productos, modelos, variantes
Nombre del núcleo
Historia
PredecesorPiledriver - Familia 15h (2.ª generación)
SucesorExcavadora - Familia 15h (4.ª generación)
Estado de soporte
iGPU no compatible

AMD Steamroller Family 15h es una microarquitectura desarrollada por AMD para las APU AMD , que sucedió a Piledriver a principios de 2014 como la microarquitectura de tercera generación basada en Bulldozer . [2] Las APU Steamroller continúan utilizando módulos de dos núcleos como sus predecesoras, aunque apuntan a lograr mayores niveles de paralelismo.

Microarquitectura

Steamroller aún cuenta con módulos de dos núcleos que se encuentran en los diseños Bulldozer y Piledriver llamados multi-hilo agrupado (CMT), lo que significa que un módulo se comercializa como un procesador de doble núcleo. [3] El enfoque de Steamroller es para un mayor paralelismo. [4] Las mejoras se centran en decodificadores de instrucciones independientes para cada núcleo dentro de un módulo, 25% más de los despachos de ancho máximo por hilo, mejores programadores de instrucciones, predictor de bifurcación de perceptrón mejorado, cachés más grandes e inteligentes, hasta un 30% menos de errores de caché de instrucciones, tasa de predicción errónea de bifurcación reducida en un 20%, caché L2 redimensionable dinámicamente, cola de microoperaciones, [5] más recursos de registro interno y controlador de memoria mejorado.

AMD estimó que estas mejoras aumentarán las instrucciones por ciclo (IPC) hasta un 30% en comparación con el núcleo Bulldozer de primera generación, manteniendo al mismo tiempo las altas frecuencias de reloj de Piledriver con un menor consumo de energía. [3] El resultado final fue una mejora del IPC de un solo subproceso del 9% y una mejora del IPC de múltiples subprocesos del 18% con respecto a Piledriver. [6]

Steamroller, la microarquitectura para CPU, así como Graphics Core Next , la microarquitectura para GPU, están emparejadas en las líneas APU para soportar características especificadas en la Arquitectura de Sistema Heterogéneo .

Historia

En 2011, AMD anunció una línea de procesadores de tercera generación basada en Bulldozer para 2013, [7] con Next Generation Bulldozer como título provisorio, utilizando el proceso de fabricación de 28 nm. [8]

El 21 de septiembre de 2011, unas diapositivas filtradas de AMD indicaron que esta tercera generación de núcleos Bulldozer tenía el nombre en código Steamroller . [9] [10]

En enero de 2014, las primeras APU Kaveri estuvieron disponibles. [11]

Desde mayo de 2015 hasta marzo de 2016 se lanzaron nuevas APU llamadas Kaveri-refresh (nombre en código Godavari). [12]

Características

La siguiente tabla muestra las características de los procesadores AMD con gráficos 3D, incluidas las APU (ver también: Lista de procesadores AMD con gráficos 3D ).

PlataformaPotencia alta, estándar y bajaConsumo bajo y ultrabajo
Nombre en claveServidorBásicoToronto
MicroKioto
De oficinaActuaciónRafaelFénix
Corriente principalLlanoTrinidadTierra ricaKaveriKaveri Refrescante (Godavari)CarrizoCresta de BristolCresta del cuervoPicassoRenoirCézanne
Entrada
BásicoCabañaDalí
MóvilActuaciónRenoirCézanneRembrandtCordillera del Dragón
Corriente principalLlanoTrinidadTierra ricaKaveriCarrizoCresta de BristolCresta del cuervoPicassoRenoir
Lucienne
Cézanne
Barceló
Fénix
EntradaDalíMendocino
BásicoDesna, Ontario, ZacateCabañas, TemashBeema, MullinsCarrizo-LCresta de piedraAbadejo
IncorporadoTrinidadÁguila calvaHalcón Merlín ,
Halcón Pardo
Búho cornudoHalcón grisOntario, ZacateCabañaÁguila esteparia , águila coronada ,
familia LX
Halcón de la praderaCernícalo bandeadoHalcón de río
LiberadoAgosto de 2011Octubre de 2012Junio ​​de 2013Enero de 20142015Junio ​​de 2015Junio ​​de 2016Octubre de 2017Enero de 2019Marzo de 2020Enero de 2021Enero de 2022septiembre 2022Enero de 2023Enero de 2011Mayo de 2013Abril de 2014Mayo de 2015Febrero de 2016Abril de 2019Julio de 2020Junio ​​de 2022Noviembre de 2022
Microarquitectura de CPUK10Martillo de hincarApisonadoraExcavador" Excavadora+ " [13]zenZen+Zen 2Zen 3Zen 3+Zen 4Gato montésJaguarPumaPuma+ [14]" Excavadora+ "zenZen+" Zen 2+ "
Es unx86-64 versión 1x86-64 versión 2x86-64 versión 3x86-64 versión 4x86-64 versión 1x86-64 versión 2x86-64 versión 3
EnchufeDe oficinaActuaciónAM5
Corriente principalAM4
EntradaFM1FM2FM2+FM2+ [a] , AM4AM4
BásicoAM1FP5
OtroFS1FS1+ , FP2FP3FP4FP5FP67PMFL1FP7
FP7r2
FP8
?FT1FT3FT3bFP4FP5FT5FP5FT6
Versión PCI Express2.03.04.05.04.02.03.0
CXL
Fab. ( nm )GF 32SHP
( Inversión pública de Hong Kong )
GF 28SHP
(HKMG a granel)
GF 14LPP
( FinFET a granel)
GF 12LP
(FinFET a granel)
TSMC N7
(FinFET a granel)
TSMC N6
(FinFET a granel)
CCD: TSMC N5
(FinFET a granel)

cIOD: TSMC N6
(FinFET a granel)
TSMC 4 nm
(FinFET a granel)
TSMC N40
(a granel)
TSMC N28
(granel de HKMG)
GF 28SHP
(HKMG a granel)
GF 14LPP
( FinFET a granel)
GF 12LP
(FinFET a granel)
TSMC N6
(FinFET a granel)
Área de la matriz (mm 2 )228246245245250210 [15]156180210CCD: (2x) 70
cd/m2: 122
17875 (+ 28 FCH )107?125149~100
TDP mínimo (W)351712101565354.543,95106128
TDP máximo de APU (W)10095654517054182565415
Reloj base máximo de la APU de serie (GHz)33.84.14.13.73.83.63.73.84.03.34.74.31,752.222.23.22.61.23.352.8
Máximo de APU por nodo [b]11
Número máximo de núcleos por CPU1211
CCX máximo por núcleo1211
Máximo de núcleos por CCX482424
Máximo de núcleos de CPU [c] por APU481682424
Máximo de subprocesos por núcleo de CPU1212
Estructura de canalización de números enteros3+32+24+24+2+11+3+3+1+21+1+1+12+24+24+2+1
i386, i486, i586, CMOV, NOPL, i686, PAE , NX bit , CMPXCHG16B, AMD-V , RVI , ABM y LAHF/SAHF de 64 bitsSíSí
IOMMU [d]versión 2versión 1versión 2
BMI1 , AES-NI , CLMUL y F16CSíSí
MOVIMIENTOSí
AVIC , BMI2 , RDRAND y MWAITX/MONITORXSí
SME [e] , TSME [e] , ADX , SHA , RDSEED , SMAP , SMEP , XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT, CLZERO y PTE CoalescenteSíSí
GMET , WBNOINVD, CLWB, QOS, PQE-BW, RDPID, RDPRU y MCOMMITSíSí
MPK , VAESSí
SGX
FPU por núcleo10,5110,51
Tuberías por FPU22
Ancho de la tubería FPU128 bits256 bits80 bits128 bits256 bits
Conjunto de instrucciones de CPU nivel SIMDSSE4a [f]AVXAVX2AVX-512ESSE3AVXAVX2
¡3DAhora!¡3DAhora!+
PREFETCH/PREFETCHWSíSí
GFNISí
AMX
FMA4 , LWP, TBM y XOPSíSí
FMA3SíSí
XADN de AMDSí
Caché de datos L1 por núcleo (KiB)64163232
Asociatividad de caché de datos L1 (vías)2488
Cachés de instrucciones L1 por núcleo10,5110,51
Máximo total de caché de instrucciones L1 de APU (KiB)2561281922565122566412896128
Asociatividad de la caché de instrucciones L1 (vías)23482348
Cachés L2 por núcleo10,5110,51
Máxima cantidad total de caché L2 de APU (MiB)424161212
Asociatividad de caché L2 (vías)168168
Caché L3 integrado máximo por CCX (MiB)416324
Máximo V-Cache 3D por CCD (MiB)64
Máximo total de caché L3 en CCD por APU (MiB)4816644
Máx. V-Cache 3D total por APU (MiB)64
Máxima memoria caché L3 de la placa por APU (MiB)
Máximo total de caché L3 por APU (MiB)48161284
Asociatividad de caché L3 de APU (vías)1616
Esquema de caché L3VíctimaVíctima
Máx. caché L4
Compatibilidad máxima con DRAM de serieDDR3-1866DDR3-2133DDR3-2133 , DDR4-2400DDR4-2400DDR4-2933DDR4-3200 , LPDDR4-4266DDR5-4800 , LPDDR5-6400DDR5-5200DDR5-5600 , LPDDR5x -7500DDR3L -1333DDR3L-1600DDR3L-1866DDR3-1866 , DDR4-2400DDR4-2400DDR4-1600DDR4-3200LPDDR5-5500
Máximo de canales DRAM por APU21212
Ancho de banda máximo de DRAM (GB/s) por APU29.86634.13238.40046.93268.256102.40083.200120.00010.66612.80014.93319.20038.40012.80051.20088.000
Microarquitectura de GPUTeraScale 2 (VLIW5)TeraScale 3 (VLIW4)GCN 2da generaciónGCN de tercera generaciónGCN 5ta generación [16]ADNr 2ADNr 3TeraScale 2 (VLIW5)GCN 2da generaciónGCN 3ra generación [16]GCN 5ta generaciónADNr 2
Conjunto de instrucciones de la GPUConjunto de instrucciones de TeraScaleConjunto de instrucciones GCNConjunto de instrucciones RDNAConjunto de instrucciones de TeraScaleConjunto de instrucciones GCNConjunto de instrucciones RDNA
Reloj base de GPU de serie máximo (MHz)60080084486611081250140021002400400538600?847900120060013001900
GFLOPS base de GPU de serie máximos [g]480614.4648.1886.71134.517601971.22150.43686.4102.486???345.6460.8230.41331.2486,4
Motor 3D [h]Hasta 400:20:8Hasta 384:24:6Hasta 512:32:8Hasta 704:44:16 [17]Hasta 512:32:8768:48:8128:8:480:8:4128:8:4Hasta 192:12:8Hasta 192:12:4192:12:4Hasta 512:?:?128:?:?
IOMMUv1IOMMUV2IOMMUv1?IOMMUV2
Descodificador de vídeoUVD3.0UVD 4.2UVD6.0VCN 1.0 [18]VCN 2.1 [19]VCN2.2 [19]VCN 3.1?UVD3.0UVD 4.0UVD 4.2UVD6.0UVD6.3VCN 1.0VCN 3.1
Codificador de vídeoVCE 1.0VCE 2.0VCE 3.1VCE 2.0VCE 3.1
Movimiento fluido AMDNoSíNoNoSíNo
Ahorro de energía de la GPUJuego de poderSintonizador de potenciaJuego de poderPowerTune [20]
Audio verdaderoSí[21]?Sí
Sincronización libre1
2
1
2
HDCP [i]?1.42.22.3?1.42.22.3
Listo para jugar [i]3.0 aún no3.0 aún no
Pantallas compatibles [j]2–32–433 (computadora de escritorio)
4 (móvil, integrado)
42344
/drm/radeon[k] [23] [24]SíSí
/drm/amdgpu[k] [25]Sí[26]Sí[26]
  1. ^ Para los modelos de excavadoras FM2+: A8-7680, A6-7480 y Athlon X4 845.
  2. ^ Una PC sería un nodo.
  3. ^ Una APU combina una CPU y una GPU. Ambas tienen núcleos.
  4. ^ Requiere soporte de firmware.
  5. ^ ab Requiere soporte de firmware.
  6. ^ Sin SSE4. Sin SSSE3.
  7. ^ El rendimiento de precisión simple se calcula a partir de la velocidad del reloj del núcleo base (o aumentada) en función de una operación FMA .
  8. ^ Sombreadores unificados  : unidades de mapeo de texturas  : unidades de salida de renderizado
  9. ^ ab Para reproducir contenido de video protegido, también se requiere compatibilidad con tarjeta, sistema operativo, controlador y aplicaciones. Para esto también se necesita una pantalla compatible con HDCP. HDCP es obligatorio para la salida de ciertos formatos de audio, lo que impone restricciones adicionales a la configuración multimedia.
  10. ^ Para alimentar más de dos pantallas, los paneles adicionales deben tener soporte nativo para DisplayPort . [22] Alternativamente, se pueden emplear adaptadores activos de DisplayPort a DVI/HDMI/VGA.
  11. ^ab DRM ( Direct Rendering Manager ) es un componente del núcleo de Linux. La compatibilidad que se muestra en esta tabla se refiere a la versión más actual.

Procesadores

Líneas APU

  1. APU de la serie A de Kaveri
  2. APU de Berlín - cancelada
    • Anunciada en 2013 por AMD [36], la APU Berlín estaba dirigida a los mercados empresariales y de servidores y contaba con cuatro núcleos Steamroller , hasta 512 procesadores de flujo y soporte para memoria ECC .

Líneas FX (descontinuadas)

En noviembre de 2013 AMD confirmó que no actualizaría la serie FX en 2014, ni su versión Socket AM3+ , ni tampoco recibiría una versión Steamroller con un nuevo socket. [37] [38]

Sin embargo, AMD lanzó un FX-770K basado en Kaveri para computadoras de escritorio y un FX-7600P para dispositivos móviles, que son básicamente APU con sus gráficos integrados deshabilitados, de manera similar a la línea Athlon X4 FM2+. Esas APU se lanzaron solo para fabricantes de equipos originales.

Líneas de servidor (canceladas)

Las hojas de ruta de servidores de AMD para 2014 mostraron: [39] [40]

  • APU de Berlín : arquitectura Steamroller x86 de cuatro núcleos (como se describe arriba) para clústeres de medios y computación de 1 procesador (1P)
  • CPU de Berlín : arquitectura Steamroller x86 de cuatro núcleos para clústeres de servicios empresariales y web 1P
  • CPU Seattle : arquitectura AArch64 Cortex-A57 de 4/8 núcleos (Opteron A1100) para clústeres de servicios empresariales y web 1P [41]
  • CPU de Varsovia : arquitectura Piledriver (Bulldozer de segunda generación) x86 de hasta 16 núcleos ( Opteron 6338P y 6370P ) para servidores 2P/4P [42]

Sin embargo, los planes para los productos Opteron de Steamroller se cancelaron, probablemente debido a la baja eficiencia energética lograda en esta generación de la arquitectura Bulldozer . La eficiencia energética aumentó considerablemente en la siguiente generación, Excavator , que superó a Jaguar en rendimiento por vatio y aproximadamente duplicó el rendimiento por vatio con respecto a Steamroller (por ejemplo, 20,74 pt/W frente a 10,85 pt/W al comparar APU móviles similares utilizando métricas arbitrarias aproximadas). [43] [44]

Referencias

  1. ^ "Página 2 - Análisis de los procesadores AMD Kaveri A10-7850K y A8-7600: ¿Valió la pena esperar por el primer chip verdaderamente heterogéneo?". ExtremeTech . Consultado el 19 de febrero de 2014 .
  2. ^ "Revisión de AMD Kaveri: A8-7600 y A10-7850K probados". Anandtech.com. 2014-01-14 . Consultado el 2014-02-08 .
  3. ^ ab "AMD: vamos por buen camino con la microarquitectura Steamroller en 2013". X-bit labs. 31 de marzo de 2013. Archivado desde el original el 25 de octubre de 2013. Consultado el 29 de septiembre de 2013 .
  4. ^ Su, Lisa (2012-02-02). "Consumerización, nube, convergencia" (PDF) . AMD 2012 Financial Analyst Day . Sunnyvale, California: Advanced Micro Devices. p. 26. Consultado el 2012-02-04 .
  5. ^ Anand Lal Shimpi (28 de agosto de 2012). "Detalles de la apisonadora de AMD: núcleo Bulldozer de tercera generación" . Consultado el 16 de noviembre de 2013 .
  6. ^ Miller, Michael J. (14 de febrero de 2014). "Ivytown, Steamroller, 14 y 16 nm Process Highlight ISSCC". Forwardthinking.pcmag.com . Consultado el 19 de febrero de 2014 .
  7. ^ Anton Shilov (9 de noviembre de 2010). «AMD planea lanzar un microprocesador de veinte núcleos en 2012». X-bit labs. Archivado desde el original el 5 de febrero de 2012. Consultado el 23 de enero de 2012 .
  8. ^ "Día del analista financiero 2012". 2 de febrero de 2012. Archivado desde el original el 6 de septiembre de 2014. Consultado el 29 de septiembre de 2013 .
  9. ^ "Hosszútávú mobil útiterv szivárgott ki az AMD-től - ¡PROHARDVER! Processzor hír". Prohardver.hu. 21 de septiembre de 2011 . Consultado el 23 de enero de 2012 .
  10. ^ "Nueva hoja de ruta AMD sobre la futura APU en el programa de 2012 y 2013 para el mercado móvil". 2011-09-21. Archivado desde el original el 11 de enero de 2013 . Consultado el 23 de enero de 2012 .
  11. ^ Joel Hruska (14 de enero de 2014). "Revisión de AMD Kaveri A10-7850K y A8-7600: ¿Valió la pena esperar por el primer chip verdaderamente heterogéneo?". extremetech.com . Consultado el 17 de enero de 2014 .
  12. ^ "12 款 APU 及 CPU 準備出發, 「Godavari」為 AMD 產品新代號". Zona VR . Archivado desde el original el 11 de febrero de 2017 . Consultado el 8 de febrero de 2017 .
  13. ^ "AMD anuncia la séptima generación de APU: Excavator mk2 en Bristol Ridge y Stoney Ridge para portátiles". 31 de mayo de 2016. Consultado el 3 de enero de 2020 .
  14. ^ "La familia de APU "Carrizo" de AMD Mobile está diseñada para ofrecer un salto significativo en rendimiento y eficiencia energética en 2015" (Nota de prensa). 20 de noviembre de 2014 . Consultado el 16 de febrero de 2015 .
  15. ^ "Guía de comparación de CPU para dispositivos móviles Rev. 13.0 Página 5: Lista completa de CPU para dispositivos móviles AMD". TechARP.com . Consultado el 13 de diciembre de 2017 .
  16. ^ ab "GPU AMD VEGA10 y VEGA11 detectadas en el controlador OpenCL". VideoCardz.com . Consultado el 6 de junio de 2017 .
  17. ^ Cutress, Ian (1 de febrero de 2018). "Zen Cores y Vega: APU Ryzen para AM4 – AMD Tech Day en CES: se revela la hoja de ruta para 2018, con APU Ryzen, Zen+ en 12 nm, Vega en 7 nm". Anandtech . Consultado el 7 de febrero de 2018 .
  18. ^ Larabel, Michael (17 de noviembre de 2017). "Radeon VCN Encode Support Lands in Mesa 17.4 Git". Phoronix . Consultado el 20 de noviembre de 2017 .
  19. ^ ab "La APU AMD Ryzen 5000G 'Cezanne' obtiene las primeras imágenes de matriz de alta resolución, 10,7 mil millones de transistores en un paquete de 180 mm2". wccftech . 12 de agosto de 2021 . Consultado el 25 de agosto de 2021 .
  20. ^ Tony Chen; Jason Greaves, "Arquitectura Graphics Core Next (GCN) de AMD" (PDF) , AMD , consultado el 13 de agosto de 2016
  21. ^ "Una mirada técnica a la arquitectura Kaveri de AMD". Semi Accurate . Consultado el 6 de julio de 2014 .
  22. ^ "¿Cómo conecto tres o más monitores a una tarjeta gráfica AMD Radeon™ HD 5000, HD 6000 y HD 7000 Series?". AMD . Consultado el 8 de diciembre de 2014 .
  23. ^ Airlie, David (26 de noviembre de 2009). "DisplayPort compatible con el controlador KMS integrado en el kernel de Linux 2.6.33" . Consultado el 16 de enero de 2016 .
  24. ^ "Matriz de características de Radeon". freedesktop.org . Consultado el 10 de enero de 2016 .
  25. ^ Deucher, Alexander (16 de septiembre de 2015). «XDC2015: AMDGPU» (PDF) . Consultado el 16 de enero de 2016 .
  26. ^ ab Michel Dänzer (17 de noviembre de 2016). "[ANUNCIO] xf86-video-amdgpu 1.2.0". listas.x.org .
  27. ^ "AMD revela más detalles sobre Kaveri: HSA, TrueAudio, Mantle". Archivado desde el original el 4 de agosto de 2016. Consultado el 16 de noviembre de 2013 .
  28. ^ "Las APU "Kaveri" de próxima generación de AMD requerirán nuevas placas base". 30 de mayo de 2013. Archivado desde el original el 7 de junio de 2013 . Consultado el 9 de junio de 2013 .
  29. ^ "Una mirada técnica a la arquitectura Kaveri de AMD". SemiAccurate . 15 de enero de 2014.
  30. ^ "Arquitectura detallada de la APU AMD Kaveri". 4 de julio de 2013.
  31. ^ "Multimonitor: Civilization V en A10-7850K "Kaveri"". YouTube .
  32. ^ "Revisión de la APU AMD A8-7600 Kaveri: la GPU integrada, HSA y hUMA". 14 de enero de 2014.
  33. ^ "Rendimiento gráfico del AMD A10-7850K". 14 de febrero de 2014. Consultado el 2 de abril de 2014 .
  34. ^ "AMD añadirá procesadores ARM para aumentar la seguridad de los chips". 14 de junio de 2012. Consultado el 3 de septiembre de 2013 .
  35. ^ "AMD y ARM Fusion redefinen más allá de x86" . Consultado el 10 de noviembre de 2013 .
  36. ^ "La APU para servidores AMD Berlin ofrece un adelanto de la próxima APU Kaveri con 4 núcleos Steamroller y 512 GCN SP". 19 de junio de 2013. Consultado el 29 de septiembre de 2013 .
  37. ^ Anton Shilov (13 de noviembre de 2013). "AMD planea introducir microprocesadores FX de próxima generación el año que viene". xbitlabs.com. Archivado desde el original el 1 de diciembre de 2019. Consultado el 16 de noviembre de 2013 .
  38. ^ Josh Walrath (4 de septiembre de 2013). "El cambio de procesador de AMD: el futuro realmente es la fusión" . Consultado el 29 de septiembre de 2013 .
  39. ^ "Berlín y Varsovia son el futuro de la línea de servidores x86 de AMD". The Tech Report. 18 de junio de 2013. Consultado el 29 de septiembre de 2013 .
  40. ^ Mujtaba, Hassan (26 de diciembre de 2013). "La hoja de ruta de AMD Opteron revela detalles de la próxima generación de APU Toronto y Carrizo". WCCF Tech . Consultado el 15 de enero de 2015 .
  41. ^ Mendoza, Menchie (13 de agosto de 2014). «AMD presenta el chip para servidor ARM 'Seattle' de 64 bits». Tech Times . Consultado el 15 de enero de 2015 .
  42. ^ Gasior, Geoff (22 de enero de 2014). "Se añaden CPU Warsaw de 16 núcleos a la línea Opteron". The Tech Report . Consultado el 15 de enero de 2015 .
  43. ^ "Opteron X2150 vs A10 8700P". cpuboss.com. Archivado desde el original el 16 de noviembre de 2016. Consultado el 15 de noviembre de 2016 .
  44. ^ "AMD A10 8700P vs 7300". cpuboss.com. Archivado desde el original el 27 de noviembre de 2016. Consultado el 15 de noviembre de 2016 .
Obtenido de "https://es.wikipedia.org/w/index.php?title=Aplanadora_(microarquitectura)&oldid=1244407786"