información general | |
---|---|
Lanzado | Móvil 17 de julio de 2024 Escritorio 8 de agosto de 2024 Servidor 10 de octubre de 2024 ( 17-07-2024 ) ( 08-08-2024 ) ( 10/10/2024 ) |
Diseñado por | AMD |
Fabricante común | |
Código CPUID | Familia 1Ah |
Cache | |
Caché L1 | 80 KB (por núcleo):
|
Caché L2 | 1 MB (por núcleo) |
Caché L3 |
|
Arquitectura y clasificación | |
Nodo tecnológico | TSMC N4X (CCD Zen 5) TSMC N3E (CCD Zen 5c) TSMC N6 ( IOD ) TSMC N4P (móvil) |
Conjunto de instrucciones | AMD64 (x86-64) |
Extensiones | |
Especificaciones físicas | |
Núcleos |
|
Memoria (RAM) | |
Zócalos |
|
Productos, modelos, variantes | |
Nombres de códigos de productos |
|
Nombres de marca | |
Historia | |
Predecesor | Zen 4 |
Sucesor | Zen 6 |
Zen 5 es el nombre de una microarquitectura de CPU de AMD , que se muestra en su hoja de ruta en mayo de 2022, [3] se lanzó para dispositivos móviles en julio de 2024 y para computadoras de escritorio en agosto de 2024. [4] Es el sucesor de Zen 4 y actualmente se fabrica en el proceso N4X de TSMC . [5] También está previsto que Zen 5 se fabrique en el proceso N3E en el futuro. [6]
La microarquitectura Zen 5 impulsa los procesadores de escritorio de la serie Ryzen 9000 (nombre en código "Granite Ridge"), los procesadores de servidor Epyc 9005 (nombre en código "Turin"), [7] y los procesadores móviles delgados y livianos Ryzen AI 300 (nombre en código "Strix Point"). [8]
Zen 5 se mencionó oficialmente por primera vez durante la presentación de los procesadores Ryzen de AMD: un año después, el 9 de abril de 2018. [9]
Una hoja de ruta mostrada durante el Día del Analista Financiero de AMD el 9 de junio de 2022 confirmó que Zen 5 y Zen 5c se lanzarían en variantes de 3 nm y 4 nm en 2024. [10] Los primeros detalles sobre la arquitectura Zen 5 prometían una "front end re-canalizada y una amplia emisión" con "optimizaciones integradas de IA y aprendizaje automático".
Durante la conferencia telefónica sobre los resultados del cuarto trimestre de 2023 de AMD, el 30 de enero de 2024, la directora ejecutiva de AMD, Lisa Su, afirmó que los productos Zen 5 "llegarían en la segunda mitad del año". [11]
Zen 5 es un rediseño completo de Zen 4 con un front-end más amplio, un mayor rendimiento de punto flotante y una predicción de bifurcaciones más precisa. [12]
Zen 5 fue diseñado teniendo en mente los procesos de 4 nm y 3 nm. Esto actuó como una póliza de seguro para AMD en caso de que la producción en masa de sus nodos N3 de TSMC enfrentara retrasos, problemas importantes de defectos en las obleas o problemas de capacidad. Un analista de la industria estimó que los primeros rendimientos de las obleas N3 eran del 55%, mientras que otros estimaron que los rendimientos eran similares a los de N5, entre el 60 y el 80%. [13] [14] Además, Apple , como el cliente más grande de TSMC, tiene acceso prioritario a los nodos de proceso más recientes. En 2022, Apple fue responsable del 23% de los 72 mil millones de dólares en ingresos totales de TSMC. [15] Después de que N3 comenzara a aumentar a fines de 2022, Apple compró la totalidad de la capacidad de producción temprana de obleas N3B de TSMC para fabricar sus SoC A17 y M3. [16] Los procesadores de escritorio y servidor Zen 5 continúan utilizando el nodo N6 para la fabricación de la matriz de E/S. [17]
Los CCD Zen 5 se fabrican en el nodo N4X de TSMC, que está diseñado para admitir frecuencias más altas para aplicaciones de computación de alto rendimiento (HPC). [18] Los procesadores móviles basados en Zen 4 se fabricaron en el nodo N4P, que está más orientado a la eficiencia energética. N4X mantiene la compatibilidad IP con N4P y ofrece una ganancia de frecuencia del 6 % sobre N4P con la misma potencia, pero viene con la desventaja de una fuga moderada. [19] En comparación con el nodo N5 utilizado para producir CCD Zen 4, N4X puede permitir frecuencias hasta un 15 % más altas mientras funciona a 1,2 V. [20]
El CCD Zen 5, cuyo nombre en código es "Eldora", tiene un tamaño de chip de 70,6 mm2 , una reducción del 0,5 % en el área del CCD de 71 mm2 de Zen 4, al tiempo que logra un aumento del 28 % en la densidad de transistores debido al nodo de proceso N4X. [21] El CCD de Zen 5 contiene 8.315 mil millones de transistores en comparación con los 6.5 mil millones de transistores del CCD de Zen 4. [22] El tamaño de un núcleo Zen 5 individual es en realidad mayor que el de un núcleo Zen 4, pero el CCD se ha reducido mediante la reducción de la caché L3. El chip monolítico utilizado por los procesadores móviles "Strix Point", fabricado en el nodo N4P de menor potencia de TSMC, mide 232,5 mm2 de área. [21]
Los cambios de Zen 5 en la predicción de bifurcaciones son la divergencia más significativa con respecto a cualquier microarquitectura Zen anterior. El predictor de bifurcaciones en un núcleo intenta predecir el resultado cuando hay rutas de código divergentes. El predictor de bifurcaciones de Zen 5 puede operar con dos por adelantado, donde puede intentar predecir dos rutas de código por adelantado antes de que se ejecuten en lugar de predecir una ruta de código, esperar a que se ejecute y luego predecir la siguiente. [23] Los predictores de bifurcaciones con dos por adelantado se han discutido en investigaciones académicas que se remontan al artículo de 1996 de André Seznec et al . "Multiple-block ahead branch predictors". [24] 28 años después de que se propusiera por primera vez en la investigación académica, la arquitectura Zen 5 de AMD se convirtió en la primera microarquitectura en implementar por completo la predicción de bifurcaciones con dos por adelantado. La mayor precarga de datos ayuda al predictor de bifurcaciones.
Zen 5 contiene 6 unidades lógicas aritméticas (ALU), en comparación con las 4 ALU de las arquitecturas Zen anteriores. Una mayor cantidad de ALU que manejan operaciones enteras comunes puede aumentar el rendimiento entero escalar por ciclo en un 50 %. [25]
El motor vectorial de Zen 5 cuenta con 4 canales de coma flotante en comparación con los 3 canales de Zen 4. Zen 4 introdujo las instrucciones AVX-512. Las capacidades de AVX-512 se han ampliado con Zen 5 con una duplicación del ancho del canal de coma flotante a una ruta de datos de coma flotante nativa de 512 bits. La ruta de datos AVX-512 se puede configurar según el producto. Los procesadores de escritorio de la serie Ryzen 9000 y los procesadores de servidor EPYC 9005 cuentan con la ruta de datos completa de 512 bits, pero los procesadores móviles Ryzen AI 300 cuentan con una ruta de datos de 256 bits para reducir el consumo de energía. La instrucción AVX-512 se ha ampliado a las instrucciones VNNI/VEX. Además, hay un mayor bfloat16
rendimiento que es beneficioso para las cargas de trabajo de IA.
El front-end más amplio de la arquitectura Zen 5 requiere cachés más grandes y un mayor ancho de banda de memoria para mantener los núcleos alimentados con datos. La caché L1 por núcleo se ha incrementado de 64 KB a 80 KB por núcleo. La caché de instrucciones L1 sigue siendo la misma en 32 KB, pero la caché de datos L1 se ha incrementado de 32 KB a 48 KB por núcleo. Además, el ancho de banda de la caché de datos L1 para tuberías de unidad de punto flotante de 512 bits también se ha duplicado. La asociatividad de la caché de datos L1 ha aumentado de 8 vías a 12 vías para adaptarse a su mayor tamaño.
La caché L2 se mantiene en 1 MB, pero su asociatividad ha aumentado de 8 a 16 vías. Zen 5 también tiene un ancho de banda de caché L2 duplicado de 64 bytes por ciclo.
La caché L3 se llena a partir de las víctimas de la caché L2 y de los fallos en vuelo. La latencia para acceder a la caché L3 se ha reducido en 3,5 ciclos. [26] Un Zen 5 Core Complex Die (CCD) contiene 32 MB de caché L3 compartidos entre los 8 núcleos. En los CCD Zen 5 3D V-Cache, se coloca una pieza de silicio que contiene 64 MB de caché L3 adicional debajo de los núcleos en lugar de encima como en las generaciones anteriores para un total de 96 MB. [27] Esto permite una mayor frecuencia del núcleo en comparación con las implementaciones de 3D V-Cache de la generación anterior que eran sensibles a voltajes más altos. El Ryzen 7 9800X3D basado en Zen 5 tiene una frecuencia base aumentada de 500 MHz con respecto al Ryzen 7 7800X3D basado en Zen 4 y permite el overclocking por primera vez. [28]
Las APU Ryzen AI 300, cuyo nombre en código es "Strix Point", cuentan con 24 MB de caché L3 total que se divide en dos matrices de caché independientes. 16 MB de caché L3 dedicada se comparten entre los 4 núcleos Zen 5 y 8 MB se comparten entre los 8 núcleos Zen 5c. [29] Los núcleos Zen 5c no pueden acceder a la matriz de caché L3 de 16 MB y viceversa. [30]
Cache | Zen 4 | Zen 5 | |
---|---|---|---|
Datos L1 | Tamaño | 32 KB | 48 KB |
Asociatividad | 8 vías | 12 vías | |
Ancho de banda | 32B/cl | 64B/cl | |
Instrucciones L1 | Tamaño | 32 KB | 32 KB |
Asociatividad | 8 vías | 8 vías | |
Ancho de banda | 64B/cl | 64B/cl | |
L2 | Tamaño | 1 MB | 1 MB |
Asociatividad | 8 vías | 16 vías | |
Ancho de banda | 32B/cl | 64B/cl | |
Nivel 3 | Tamaño | 32 MB | 32 MB |
Asociatividad | 16 vías | 16 vías | |
Ancho de banda | 32B/clk Lectura 16B/clk Escritura | 32B/clk Lectura 16B/clk Escritura |
Otras características y cambios en la arquitectura Zen 5, en comparación con Zen 4 , incluyen:
Atributo | Zen 4 | Zen 5 |
---|---|---|
L1/L2 entre pares | 1.5K/7K | 16K/8K |
Pila de direcciones de retorno | 32 | 52 |
Liga de lectura italoamericana nivel 1/nivel 2 | 64/512 | 64/2048 |
Bytes de instrucciones obtenidos/decodificados/ciclo | 32 | 64 |
Asociatividad de caché de operaciones | 12 vías | 16 vías |
Ancho de banda de caché de Op | 9 macrooperaciones | 12 inst o inst fusionado |
Ancho de banda de despacho (macrooperaciones/ciclo) | 6 | 8 |
Programador de AGU | 3x24 aluminio/aluminio | 56 |
Programador ALU | 1x24 aluminio | 88 |
ALU/AGU | 4/3 | 6/4 |
Int PRF (rojo/bandera) | 224/126 | 240/192 |
Registro vectorial | 192 | 384 |
Cola preprogramada de FP | 64 | 96 |
Programador FP | 2x32 | 3x38 |
Tubos FP | 3 | 4 |
Ancho del vector | 256 | 256b/512b |
Cola de retiro/ROB | 320 | 448 |
Las tuberías de memoria LS admiten carga y almacenamiento | 3/1 | 4/2 |
DTLB Nivel 1/L2 | 72/3072 | 96/4096 |
AMD anunció una línea inicial de cuatro modelos de procesadores Ryzen 9000 el 3 de junio de 2024, incluidos un Ryzen 5, un Ryzen 7 y dos modelos Ryzen 9. Fabricados en un proceso de 4 nm, los procesadores cuentan con entre 6 y 16 núcleos. [34] Los procesadores Ryzen 9000 se lanzaron en agosto de 2024.
Características comunes de las CPU de escritorio Ryzen 9000:
Marca y modelo | Núcleos ( hilos ) | Frecuencia de reloj ( GHz ) | Caché L3 (total) | TDP | Chips | Configuración básica [i] | Fecha de lanzamiento | Precio de lanzamiento [a] | ||
---|---|---|---|---|---|---|---|---|---|---|
Base | Aumentar | |||||||||
Ryzen 9 | 9950X [35] [36] | 16 (32) | 4.3 | 5.7 | 64 MB | 170 W | 2 × CCD 1 × E/S | 2 × 8 | 15 de agosto de 2024 | US$649 |
9900X [35] [36] | 12 (24) | 4.4 | 5.6 | 120 W | 2 × 6 | US$499 | ||||
Ryzen 7 | 9800X3D [37] [38] | 8 (16) | 4.7 | 5.2 | 96 MB | 1 × CCD 1 × E/S | 1 × 8 | 7 de noviembre de 2024 | US$479 | |
9700X [35] [36] | 3.8 | 5.5 | 32 MB | 65 W [b] | 8 de agosto de 2024 | US$359 | ||||
Ryzen 5 | 9600X [35] [36] | 6 (12) | 3.9 | 5.4 | 1 × 6 | US$279 |
La serie Ryzen AI 300 de procesadores ultradelgados de alto rendimiento para portátiles se anunció el 3 de junio de 2024. Con el nombre en código Strix Point , estos procesadores se nombran bajo un nuevo sistema de numeración de modelos similar a la numeración de modelos Core y Core Ultra de Intel. Strix Point cuenta con un motor Ryzen AI de tercera generación basado en XDNA 2, que proporciona hasta 50 TOPS de rendimiento de unidad de procesamiento neuronal. Los gráficos integrados se actualizaron a RDNA 3.5, y los modelos de gama alta tienen 16 CU de GPU y 12 núcleos de CPU, un aumento del máximo de 8 núcleos de CPU en los procesadores móviles ultradelgados Ryzen de la generación anterior. [39] Los portátiles con procesadores de la serie Ryzen AI 300 se lanzaron el 17 de julio. [40]
Características comunes de las APU para portátiles Ryzen AI 300:
Marca y modelo | UPC | GPU | Unidad de procesamiento central ( Ryzen AI ) | TDP | Fecha de lanzamiento | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Núcleos ( hilos ) | Reloj ( GHz ) | Caché L3 (total) | Modelo | Reloj (GHz) | ||||||||
Total | Zen 5 | zen 5c | Base | Impulsar [a] | ||||||||
Ryzen AI 9 | (PROFESIONAL) HX 375 | 12 (24) | 4 (8) | 8 (16) | 2.0 | 5.1 | 24 MB | 890M 16 UC | 2.9 | 55 TOPES | 15–54 W | 2 de junio de 2024 [42] |
(PRO) HX 370 [43] | 50 TOPS | |||||||||||
365 [43] | 10 (20) | 6 (12) | 5.0 | 880M 12 UC | ||||||||
Ryzen AI 7 | PRO 360 [44] [45] | 8 (16) | 3 (6) | 5 (10) | 16 MB | 10 de octubre de 2024 [46] |
Junto con los procesadores de escritorio Granite Ridge y los procesadores móviles Strix Point, la serie Epyc 9005 de procesadores de servidor de alto rendimiento, con nombre en código Turin , también se anunció en Computex el 3 de junio de 2024. Utiliza el mismo zócalo SP5 que los procesadores de la serie Epyc 9004 anteriores, y tendrá hasta 128 núcleos y 256 subprocesos en el modelo de gama alta. Turin se construirá sobre un proceso de 4 nm de TSMC . [47]
Características comunes de los procesadores de servidor EPYC 9000:
Marca y modelo | Núcleos ( hilos ) | Frecuencia de reloj ( GHz ) | Caché L3 (total) | TDP | Chips | Configuración básica [i] | Fecha de lanzamiento | Precio de lanzamiento [a] | ||
---|---|---|---|---|---|---|---|---|---|---|
Base | Aumentar | |||||||||
Epyc | 9755 | 128 (256) | 2.7 | 4.1 | 512 MB | 500 vatios | 16 × CCD 1 × E/S | 16 × 8 | 10 de octubre de 2024 | US$12.984 |
9655 | 96 (192) | 2.6 | 4.5 | 384 MB | 400 vatios | 12 × CCD 1 × E/S | 12 × 8 | US$11.852 | ||
9565 | 72 (144) | 3.15 | 4.3 | 12 × 6 | US$10.486 | |||||
9575F | 64 (128) | 3.3 | 5.0 | 256 MB | 8 × CCD 1 × E/S | 8 × 8 | US$11.791 | |||
9555 | 3.2 | 4.4 | 360 W | US$9.826 | ||||||
9535 | 2.4 | 4.3 | 300 vatios | US$8.992 | ||||||
9475F | 48 (96) | 3,65 | 4.8 | 400 vatios | 8 × 6 | US$7.592 | ||||
9455 | 3.15 | 4.4 | 300 vatios | US$5.412 | ||||||
9365 | 36 (72) | 3.4 | 4.3 | 192 MB | 6 × CCD 1 × E/S | 6 × 6 | US$4.341 |
En Computex también se mostró una variante del Epyc 9005 que utiliza núcleos Zen 5c. Tendrá un máximo de 192 núcleos y 384 subprocesos y se fabricará con un proceso de 3 nm . [47]
Características comunes de los procesadores de servidor EPYC Dense 9000:
Marca y modelo | Núcleos ( hilos ) | Frecuencia de reloj ( GHz ) | Caché L3 (total) | TDP | Chips | Configuración básica [i] | Fecha de lanzamiento | Precio de lanzamiento [a] | ||
---|---|---|---|---|---|---|---|---|---|---|
Base | Aumentar | |||||||||
Epyc | 9965 | 192 (384) | 2.25 | 3.7 | 384 MB | 500 vatios | 12 × CCD 1 × E/S | 12 × 16 | 10 de octubre de 2024 | US$14.813 |
9845 | 160 (360) | 2.1 | 320 MB | 390 W | 10 × CCD 1 × E/S | 10 × 16 | US$13.564 | |||
9825 | 144 (288) | 2.2 | 384 MB | 12 × CCD 1 × E/S | 12 × 12 | US$13.006 | ||||
9745 | 128 (256) | 2.4 | 256 MB | 400 vatios | 8 × CCD 1 × E/S | 8 × 16 | US$12.141 | |||
9645 | 96 (192) | 2.3 | 320 W | 8 × 12 | US$11.048 |
Zen 5c es una variante compacta del núcleo Zen 5, dirigido principalmente a clientes de servidores de computación en la nube a hiperescala. [48] Sucederá al núcleo Zen 4c .