Sintetizador de realidad RSX

GPU para PlayStation 3
El sintetizador de realidad RSX en una placa base de PlayStation 3

El RSX 'Reality Synthesizer ' es una unidad de procesamiento gráfico (GPU) patentada codesarrollada por Nvidia y Sony para la consola de juegos PlayStation 3. Se basa en el procesador gráfico Nvidia 7800GTX y, según Nvidia, es una arquitectura híbrida G70/G71 (anteriormente conocida como NV47) con algunas modificaciones. El RSX tiene canales de sombreado de vértices y píxeles separados . La GPU hace uso de 256 MB de RAM GDDR3 a 650 MHz con una velocidad de transmisión efectiva de 1,3 GHz y hasta 224 MB de la memoria principal XDR de 3,2 GHz a través de la CPU (480 MB máximo). Aunque lleva la mayor parte del procesamiento gráfico, el Cell Broadband Engine , la CPU de la consola , también se utiliza de forma complementaria para algunas cargas computacionales relacionadas con los gráficos de la consola.


Presupuesto

Longitud del chip en la parte inferior: 4,28 cm

A menos que se indique lo contrario, las siguientes especificaciones se basan en un comunicado de prensa de Sony en la conferencia E3 2005, [1] diapositivas de la misma conferencia, [2] y diapositivas de una presentación de Sony en la Game Developer's Conference de 2006. [ cita requerida ]

El RSX tiene un rendimiento de punto flotante de 192 GFLOPS . [3]

  • Reloj de sombreado de píxeles de 550 MHz / Reloj de sombreado de vértices de 500 MHz en un proceso de 90 nm (reducido a 65 nm en 2008 [4] a 40 nm en 2010 [5] ), y a 28 nm en 2013, más de 300 millones de transistores
  • Basado en NV47 ( arquitectura Nvidia GeForce 7800 )
  • Pequeño endian
  • 24 unidades de filtrado de textura (TF) y 8 unidades de direccionamiento de textura de vértice (TA)
    • 24 muestras filtradas por reloj
    • Velocidad máxima de relleno de Texel: 13,2 gigapixeles por segundo (24 texturas * 550 MHz)
    • 32 muestras de textura sin filtrar por reloj (8 TA * 4 muestras de textura)
    • 8 unidades de salida de renderizado (ROP)/canalizaciones de renderizado de píxeles
      • Tasa máxima de relleno de píxeles (teórica): 4,4 gigapíxeles por segundo
      • Frecuencia máxima de muestreo del buffer Z : 8,8 gigamuestras por segundo (2 muestras Z * 8 ROP * 550 MHz)
    • Máximo de operaciones de producto escalar : 51 mil millones por segundo (combinado con CPU Cell)
    • La precisión de píxeles de 128 bits ofrece una representación de alto rango dinámico
  • 256 MB de RAM GDDR3 a 650 MHz
    • Ancho de bus de memoria de 128 bits
    • Ancho de banda de lectura y escritura de 20,8 GB/s
  • Interfaz de bus FlexIO de celda
    • Ancho del bus de interfaz de memoria Rambus XDR : 56 bits de 64 bits (serie)
    • 20 GB/s de lectura en la memoria Cell y XDR
    • 15 GB/s de escritura en la memoria Cell y XDR
  • 576 KB de caché de textura (96 KB por cada cuadrilátero de píxeles)
  • Soporte para PSGL (OpenGL ES 1.1 + Nvidia Cg )
  • Compatibilidad con la compresión de texturas S3 [6]

Otras características: Soporte para filtrado de texturas bilineal, trilineal , anisotrópico, quincunx , antialiasing quincunx, hasta 4x MSAA , SSAA , Alpha to Coverage y Alphakill.

Números de modelo

90 nm:

  • CXD2971AGB
  • CXD2971DGB
  • CXD2971 ES
  • CXD2971-1 ES
  • CXD297BGe

65 nm:

  • CXD2982
  • CXD2982 ES
  • CXD2991 ES
  • CXD2991BGB
  • CXD2991GGB
  • CXD2991CGB
  • CXD2991EGB

40 nm:

  • CXD5300AGB
  • CXD5300A1 ES
  • CXD5301DGB
  • CXD5302DGB
  • CXD5302A1 ES

Estructura de la memoria física GDDR3 local

  • Memoria total 256 MB
  • 2 particiones (128 MB)
  • Bus de 64 bits por partición
  • 8 bancos por partición (16 MB)
  • 4096 páginas por banco (4 KB) -> Dirección de fila de 12 bits
  • Bloque de memoria en una página -> Dirección de columna de 9 bits
  • Granularidad de acceso mínima = 8 bytes -> igual que el ancho de bus entre RSX <> GDDR

Mapa de memoria RSX

Aunque el RSX tiene 256 MB de RAM GDDR3, no toda es utilizable. Los últimos 4 MB están reservados para realizar un seguimiento del estado interno del RSX y de los comandos emitidos. Los 4 MB de datos de la GPU contienen RAMIN, RAMHT, RAMFC, objetos DMA, objetos gráficos y el contexto gráfico. A continuación, se muestra un desglose de la dirección dentro de los 256 MB del RSX.

Rango de direccionesTamañoComentario
0000000-FBFFFF252 MBBúfer de cuadros
FC00000-FFFFFFF4MBDatos de la GPU
FF80000-FFFFFFF512 KBRAMIN: Memoria de instancia
FF90000-FF93FFF16 KBRAMHT: Tabla hash
FFA0000-FFA0FFF4 KBRAMFC: Contexto FIFO
FFC0000-FFCFFFF64 KBObjetos DMA
FFD0000-FFDFFFF64 KBObjetos gráficos
FFE0000-FFFFFFF128 KBGRÁFICO: Contexto gráfico

Además de la memoria GDDR3 local, RSX también puede acceder a la memoria XDR principal, que está limitada a:

  • 0 MB - 256 MB (0x00000000 - 0x0FFFFFFF)
-o-
  • 0 MB - 512 MB (0x00000000 - 0x1FFFFFFF)

Velocidad, ancho de banda y latencia

Ancho de banda del sistema (máximo teórico):

  • Celular hacia/desde 256 MB XDR: 25,6 GB/s
  • Celda a RSX (IOIFO): 20 GB/s (práctico: 15,8 GB/s con un tamaño de paquete de 128 B)
  • Celda de RSX (IOIFI): 15 GB/s (práctico: 11,9 GB/s con un tamaño de paquete de 128 B)
  • RSX a/desde 256 MB GDDR3: 20,8 GB/s (@ 650 MHz)

Debido a la disposición antes mencionada de la ruta de comunicación entre los diferentes chips y a las diferencias de latencia y ancho de banda entre los diversos componentes, existen diferentes velocidades de acceso según la dirección del acceso en relación con el origen y el destino. El siguiente es un gráfico que muestra la velocidad de lectura y escritura en la memoria GDDR3 y XDR desde el punto de vista de Cell y RSX. Tenga en cuenta que se trata de velocidades medidas (en lugar de calculadas) y deberían ser peores si se trata de acceso RSX y GDDR3, ya que estas cifras se midieron cuando el RSX funcionaba a 550 MHz y la memoria GDDR3 a 700 MHz. La PS3 que se entrega con el RSX funciona a 500 MHz (front end y back end, aunque los sombreadores de píxeles se ejecutan por separado en el interior a 550 MHz). Además, la memoria GDDR3 también funcionaba a una velocidad inferior, a 650 MHz.

Tabla de velocidad

Procesador256 MB XDR256 MB GDDR3
Lectura de celda16,8 GB/s16 MB/s (15,6 MB/s a 650 MHz)
Escritura de celda24,9 GB/s4 GB/s
Lectura RSX15,5 GB/s22,4 GB/s (20,8 GB/s a 650 MHz)
Escritura RSX10,6 GB/s22,4 GB/s (20,8 GB/s a 650 MHz)

Debido a la lentitud de la velocidad de lectura de celdas de la memoria GDDR3 de 256 MB, es más eficiente que la celda funcione en XDR y que luego el RSX extraiga datos de XDR y los escriba en GDDR3 para enviarlos a la pantalla HDMI . Por eso se incluyeron instrucciones de búsqueda de texturas adicionales en el RSX para permitir la carga de datos desde la memoria XDR (en lugar de la memoria GDDR3 local).

Bibliotecas RSX

El RSX está dedicado a los gráficos 3D y los desarrolladores pueden usar diferentes bibliotecas API para acceder a sus funciones. La forma más fácil es usar PSGL de alto nivel, que es básicamente OpenGL|ES con una canalización programable añadida, sin embargo, esto no es popular debido a la sobrecarga de rendimiento en una CPU de consola relativamente débil. En un nivel inferior, los desarrolladores pueden usar LibGCM , que es una API que crea búferes de comandos RSX en un nivel inferior. (PSGL en realidad se implementa sobre LibGCM). Esto se hace configurando comandos (a través del contexto FIFO) y objetos DMA y emitiéndolos al RSX a través de llamadas DMA.

Diferencias con la arquitectura G70

El RSX 'Reality Synthesizer' se basa en la arquitectura G70, pero presenta algunos cambios en el núcleo. [7] La ​​mayor diferencia entre los dos chips es la forma en que funciona el ancho de banda de la memoria. El G70 solo admite la renderización en la memoria local , mientras que el RSX puede renderizar tanto en la memoria del sistema como en la memoria local. Dado que la renderización desde la memoria del sistema tiene una latencia mucho mayor en comparación con la renderización desde la memoria local, la arquitectura del chip tuvo que modificarse para evitar una penalización de rendimiento. Esto se logró ampliando el tamaño del chip para acomodar búferes y cachés más grandes para mantener lleno el canal de gráficos . El resultado fue que el RSX solo tiene el 60% del ancho de banda de memoria local del G70, lo que hace necesario que los desarrolladores utilicen la memoria del sistema para lograr los objetivos de rendimiento. [7]

DiferenciaRSXTarjeta gráfica Nvidia 7800GTX
Bus de memoria GDDR3128 bits256 bits
ROP816
Transformación posterior y caché de iluminación63 vértices máximos45 vértices máximos
Caché de textura total por cada cuadrilátero de canales de píxeles (L1 y L2)96 kB48 kB
Interfaz de CPUFlexIOPCI Express 16x
Tecnología28 nm/40 nm/65 nm/90 nm110 nm

Otras características/diferencias del RSX incluyen:

  • Más instrucciones de sombreado
  • Lógica de búsqueda de textura adicional (ayuda a RSX a transportar datos desde XDR)
  • Normalización rápida de vectores

Notas de prensa

El personal de Sony fue citado en la revista PlayStation Magazine diciendo que "el RSX comparte muchos aspectos internos con NVIDIA 7800 , que se basa en la arquitectura G70". [ cita requerida ] Dado que el G70 es capaz de realizar 136 operaciones de sombreado por ciclo de reloj, se esperaba que el RSX presentara la misma cantidad de canales de sombreado de píxeles y vértices paralelos que el G70, que contiene 24 canales de píxeles y 8 vértices.

El director ejecutivo de Nvidia, Jen-Hsun Huang, declaró durante la conferencia de prensa previa al show de Sony en el E3 2005 que la RSX es dos veces más potente que la GeForce 6800 Ultra. [2]

Puerta de impacto

En el caso de la PlayStation 3 , el RSX se fabricó originalmente con el proceso de 90 nm, antes de pasar al proceso de 65 nm , 40 nm y, finalmente, al de 28 nm . La versión de 90 nm del RSX se empaquetó (en el contexto de la tensión térmica) con elementos de empaquetado de matriz incompatibles . Estos factores hacen que la matriz de rejilla de bolas (BGA) entre el intercalador del chip y su matriz falle a un ritmo anormalmente rápido.

Algunos de los factores de fracaso incluyen:

  • Diferentes coeficientes de expansión térmica (CTE) de los distintos componentes sobre y dentro del intercalador y la matriz. Esto hace que estos componentes se expandan a diferentes velocidades, lo que genera tensión de corte en el BGA. [8]
  • Diferentes densidades de transistores en la matriz, así como el uso de piezas específicas más que otras, lo que hace que algunas partes de la matriz se calienten más rápido que otras. Esto hace que las distintas piezas se expandan a diferentes velocidades, lo que en última instancia hace que algunas partes del BGA del RSX fallen más rápido que otras [9].
  • Electromigración del BGA que genera huecos dentro de la soldadura. Estos huecos aceleran el fallo del BGA. [10]
  • En la PS3, el RSX se empaquetó con el proceso Flip Chip Ball Grid Array (FCBGA) . El relleno de matriz presente en el RSX tiene una temperatura de transición muy baja en comparación con las temperaturas de funcionamiento de la PlayStation 3 durante un juego intenso. [11] Esto hace que pase a un estado en el que no admite la soldadura entre la matriz y el intercalador. [12]

Véase también

Referencias

  1. ^ "SONY COMPUTER ENTERTAINMENT INC. LANZARÁ SU SISTEMA DE ENTRETENIMIENTO INFORMÁTICO DE PRÓXIMA GENERACIÓN, PLAYSTATION3, EN LA PRIMAVERA DE 2006" (Comunicado de prensa). Sony Computer Entertainment Inc. 16 de mayo de 2005.
  2. ^ ab "Sony presenta PlayStation 3, que se lanzará en 2006". AnandTech. 16 de mayo de 2005.
  3. ^ Klug, Anand Lal Shimpi, Brian. "Análisis de arquitectura y vista previa de NVIDIA Tegra K1". www.anandtech.com . Consultado el 13 de agosto de 2024 .{{cite web}}: CS1 maint: varios nombres: lista de autores ( enlace )
  4. ^ "El chip gráfico de la PS3 pasará a ser de 65 nm en otoño". Edge Online. 26 de junio de 2008.
  5. ^ "La PS3 de Sony se ha actualizado con un chip gráfico RSX de 40 nm más frío, y se esperan ganancias (actualizado)". Engadget. 26 de abril de 2010.
  6. ^ Gantayat, Anoop (30 de enero de 2006). "Nuevas herramientas de PS3". IGN.com . Consultado el 28 de agosto de 2006 .
  7. ^ ab "Xbox 360 de Microsoft, PS3 de Sony: una discusión sobre hardware" . Consultado el 8 de marzo de 2014 .
  8. ^ Young Yang, Se; Kim, Ilho; Lee, Soon-Bok (2008). "Un estudio sobre el comportamiento de fatiga térmica de las uniones soldadas en condiciones de ciclo de potencia". IEEE Transactions on Components and Packaging Technologies . 31 : 3–12. doi :10.1109/TCAPT.2007.906294.
  9. ^ Demerjian, Charlie (1 de septiembre de 2008). "Por qué los chips de Nvidia son defectuosos". The Inquirer . Archivado desde el original el 25 de mayo de 2009. Consultado el 12 de noviembre de 2023 .
  10. ^ Hau-Riege, Christine; Yau, YouWen (2018). Confiabilidad de electromigración de bolas de soldadura . doi :10.1109/IPFA.2018.8452576.
  11. ^ Hillman, C; Blattau, N; Sharon, G. "Low Tg Underfill: The Good, The Bad, and The Ugly" (PDF) . Consultado el 19 de marzo de 2024 .
  12. ^ Vissa, U; Butel, N; Rowatt, J; Thielen, C. (2006). Un enfoque sistemático para la calificación de encapsulados flip-chip de baja K de 90 nm . doi :10.1109/ECTC.2006.1645618.
Obtenido de "https://es.wikipedia.org/w/index.php?title=Sintetizador_de_realidad_RSX&oldid=1250320101"