Turing (microarquitectura)

Turing
Lanzado	20 de septiembre de 2018 ; hace 6 años (2018-09-20)
Diseñado por	Nvidia
Fabricado por	Compañía de gestión de telecomunicaciones;
Proceso de fabricación	TSMC 12FFC
Nombre(s) clave	TU10x ; TU11x
Serie de productos
De oficina	Serie GeForce GTX 16 ; Serie GeForce RTX 20;
Profesional/estación de trabajo	Quadro RTX;
Servidor/centro de datos	Tesla T4;
Presupuesto
Calcular	28,5 TFLOPS (FP16); 14,2 TFLOPS (FP32);
Caché L1	96 KB (por SM)
Caché L2	De 2 MB a 6 MB
Soporte de memoria	Memoria GDDR6 ; HBM2
Compatibilidad con PCIe	PCIe 3.0
API de gráficos compatibles
DirectX	DirectX 12 Ultimate (nivel de función 12_2)
Direct3D	Direct3D 12.0
Modelo de sombreado	Modelo de sombreado 6.7
OpenCL	OpenCL 3.0
OpenGL	OpenGL 4.6
CUDA	Capacidad de cómputo 7.5
Vulcano	Vulcano 1.3
Motor de medios
Codificar códecs	H.264; H.265;
Decodificar códecs	H.264; H.265;
Profundidad de bits de color	8 bits; 10 bits;
Codificador(es) compatible(s)	NVENC
Salidas de pantalla	Puerto de pantalla 1.4a; HDMI 2.0b; USB-C;
Historia
Predecesor	Pascal
Variante	Volta (centro de datos/HPC)
Sucesor	Amperio

Microarquitectura de GPU de Nvidia

Turing es el nombre en clave de una microarquitectura de unidad de procesamiento gráfico (GPU) desarrollada por Nvidia . Lleva el nombre del destacado matemático y científico informático Alan Turing . La arquitectura se presentó por primera vez en agosto de 2018 en SIGGRAPH 2018 en las tarjetas Quadro RTX orientadas a estaciones de trabajo , ^[2] y una semana después en Gamescom en las tarjetas gráficas de consumo de la serie GeForce 20. ^[3] Basándose en el trabajo preliminar de Volta , su predecesor exclusivo de HPC , la arquitectura Turing presenta los primeros productos de consumo capaces de realizar trazado de rayos en tiempo real , un objetivo de larga data de la industria de los gráficos por computadora. Los elementos clave incluyen procesadores de inteligencia artificial dedicados ("núcleos Tensor") y procesadores de trazado de rayos dedicados ("núcleos RT"). Turing aprovecha DXR , OptiX y Vulkan para acceder al trazado de rayos. En febrero de 2019, Nvidia lanzó las GPU de la serie GeForce 16 , que utilizan el nuevo diseño Turing pero carecen de los núcleos RT y Tensor.

Turing se fabrica utilizando el proceso de fabricación de semiconductores FinFET de 12 nm de TSMC . La GPU TU102 de alta gama incluye 18,6 mil millones de transistores fabricados mediante este proceso. ^[1] Turing también utiliza memoria GDDR6 de Samsung Electronics y, anteriormente, de Micron Technology .

Detalles

La microarquitectura de Turing combina varios tipos de núcleos de procesador especializados y permite una implementación de trazado de rayos en tiempo real limitado. ^[4] Esto se acelera mediante el uso de nuevos núcleos RT (trazado de rayos), que están diseñados para procesar árboles cuádruples y jerarquías esféricas, y acelerar las pruebas de colisión con triángulos individuales.

Características de Turing:

Núcleos CUDA (SM, Streaming Multiprocessor)
- Capacidad de cómputo 7.5
- sombreadores rasterizados tradicionales y computación
- Ejecución simultánea de operaciones de números enteros y de punto flotante (heredado de Volta)
Núcleos de trazado de rayos (RT)
- Aceleración de la jerarquía del volumen delimitador ^[5]
- sombras, oclusión ambiental , iluminación, reflejos
Núcleos tensoriales (IA)
- inteligencia artificial
- operaciones con matrices grandes
- Supermuestreo de aprendizaje profundo (DLSS)
Controlador de memoria compatible con GDDR6 / HBM2
DisplayPort 1.4a con compresión de flujo de pantalla (DSC) 1.2
Conjunto de funciones J de PureVideo para decodificación de vídeo por hardware
Mejora de GPU 4
Puente NVLink con apilamiento de VRAM que agrupa la memoria de varias tarjetas
Enlace virtual de realidad virtual
Codificación de hardware NVENC

La memoria GDDR6 es producida por Samsung Electronics para la serie Quadro RTX. ^[6] La serie RTX 20 se lanzó inicialmente con chips de memoria Micron , antes de cambiar a chips Samsung en noviembre de 2018. ^[7]

Rasterización

Nvidia informó mejoras en el rendimiento de rasterización (CUDA) para títulos existentes de aproximadamente un 30 a 50 % en comparación con la generación anterior. ^[8]^[9]

Trazado de rayos

El trazado de rayos realizado por los núcleos RT se puede utilizar para producir reflejos, refracciones y sombras, reemplazando las técnicas raster tradicionales como los mapas cúbicos y los mapas de profundidad . Sin embargo, en lugar de reemplazar la rasterización por completo, la información recopilada del trazado de rayos se puede utilizar para aumentar el sombreado con información que es mucho más fotorrealista , especialmente en lo que respecta a la acción fuera de la cámara. Nvidia dijo que el rendimiento del trazado de rayos aumentó aproximadamente 8 veces con respecto a la arquitectura de consumo anterior, Pascal.

Núcleos tensoriales

La generación de la imagen final se acelera aún más mediante los núcleos Tensor, que se utilizan para rellenar los espacios en blanco en una imagen parcialmente renderizada, una técnica conocida como eliminación de ruido. Los núcleos Tensor ejecutan el resultado del aprendizaje profundo para codificar cómo, por ejemplo, aumentar la resolución de las imágenes generadas por una aplicación o un juego específicos. En el uso principal de los núcleos Tensor, se analiza un problema a resolver en una supercomputadora, a la que se le enseña mediante ejemplos qué resultados se desean, y la supercomputadora determina un método a utilizar para lograr esos resultados, lo que luego se hace con los núcleos Tensor del consumidor. Estos métodos se entregan a través de actualizaciones de controladores a los consumidores. ^[8] La supercomputadora utiliza una gran cantidad de núcleos Tensor por sí misma.

Turing muere

Comparación de matrices de Turing
Morir	TU102 ^[10]	TU104 ^[11]	TU106 ^[12]	TU116 ^[13]	TU117 ^[14]
Tamaño del troquel	754 milímetros ^cuadrados	545 milímetros ^cuadrados	445 milímetros ^cuadrados	284 milímetros ^cuadrados	200 milímetros ^cuadrados
Transistores	18.6B	13.6B	10.8B	6.6B	4.7B
Densidad de transistores	24,7 toneladas métricas/ ^mm2	25,0 toneladas métricas/ ^mm2	24,3 toneladas métricas/ ^mm2	23,2 toneladas métricas/ ^mm2	23,5 toneladas métricas/ ^mm2
Clústeres de procesamiento de gráficos (GPC)	6	6	3	3	2
Multiprocesadores de transmisión (SM)	72	48	36	24	16
Núcleos CUDA	4608	3072	2304	1536	1024
Unidades de mapeo de texturas	288	192	144	96	64
Unidades de salida de renderizado	96	64	64	48	32
Núcleos tensoriales	576	384	288	—
Núcleos RT	72	48	36	—
Caché L1	6,75 MB	4,5 MB	3,375 MB	2,25 MB	1,5 MB
Caché L1	96 KB por SM
Caché L2	6MB	4MB	4MB	1,5 MB	1 MB

Desarrollo

La plataforma de desarrollo de Turing se llama RTX. Se puede acceder a las funciones de trazado de rayos de RTX mediante DXR de Microsoft , OptiX y también mediante extensiones Vulkan (esta última también está disponible en los controladores de Linux). ^[15] Incluye acceso a funciones aceleradas por IA a través de NGX. Las funcionalidades Mesh Shader y Shading Rate Image son accesibles mediante extensiones DirectX 12 , Vulkan y OpenGL en plataformas Windows y Linux. ^[16]

La actualización de octubre de 2018 de Windows 10 incluye el lanzamiento público de DirectX Raytracing. ^[17]^[18]

Productos que utilizan Turing

Serie GeForce MX
- Computadora portátil GeForce MX450
- Computadora portátil GeForce MX550
Serie GeForce 16
- GeForce GTX 1630
- Portátil con GeForce GTX 1650
- GeForce GTX 1650
- GeForce GTX 1650 Super
- Portátil con GeForce GTX 1650 Ti
- GeForce GTX 1660
- GeForce GTX 1660 Super
- Portátil con GeForce GTX 1660 Ti
- GeForce GTX 1660 Ti
Serie GeForce 20
- Portátil con GeForce RTX 2060
- GeForce RTX 2060
- GeForce RTX 2060 Super
- Portátil GeForce RTX 2070
- GeForce RTX 2070
- Computadora portátil GeForce RTX 2070 Super
- GeForce RTX 2070 Super
- Portátil con GeForce RTX 2080
- GeForce RTX 2080
- Computadora portátil GeForce RTX 2080 Super
- GeForce RTX 2080 Super
- GeForce RTX 2080 Ti
- Titán RTX
Nvidia Quadro
- Portátil con Quadro RTX 3000
- Computadora portátil Quadro RTX 4000
- Tarjeta gráfica Quadro RTX 4000
- Computadora portátil Quadro RTX 5000
- Tarjeta gráfica Quadro RTX 5000
- Computadora portátil Quadro RTX 6000
- Tarjeta gráfica Quadro RTX 6000
- Tarjeta gráfica Quadro RTX 8000
- Computadora portátil Quadro T1000
- Computadora portátil Quadro T2000
- T400
- T400 4 GB
- Portátil T500
- Portátil T600
- T600
- T1000
- T1000 8 GB
- Portátil T1200
Nvidia Tesla
- Tesla T4
- Tesla T10
- Tesla T40

Véase también

Referencias

^ ab "Arquitectura de GPU Turing de Nvidia: gráficos reinventados" (PDF) . Nvidia . 2018 . Consultado el 28 de junio de 2019 .
^ Smith, Ryan (13 de agosto de 2018). "NVIDIA revela la arquitectura de GPU Turing de próxima generación: NVIDIA apuesta por el trazado de rayos, GDDR6 y más". AnandTech . Consultado el 9 de abril de 2023 .
^ Smith, Ryan (20 de agosto de 2018). "NVIDIA anuncia la serie GeForce RTX 20: RTX 2080 Ti y 2080 el 20 de septiembre, RTX 2070 en octubre". AnandTech . Consultado el 9 de abril de 2023 .
^ Warren, Tom (20 de agosto de 2018). «Nvidia anuncia la serie de GPU RTX 2000 con '6 veces más rendimiento' y trazado de rayos». The Verge . Consultado el 20 de agosto de 2018 .
^ Oh, Nate (14 de septiembre de 2018). "Análisis profundo de la arquitectura de la GPU NVIDIA Turing: preludio de GeForce RTX". AnandTech . Consultado el 9 de abril de 2023 .
^ Mujtaba, Hassan (14 de agosto de 2018). "La memoria GDDR6 de Samsung alimenta las tarjetas Quadro RTX basadas en GPU Turing de NVIDIA". Wccftech . Consultado el 9 de abril de 2023 .
^ Maislinger, Florian (21 de noviembre de 2018). «RTX 2080 Ti defectuosa: Nvidia cambia de Micron a Samsung para la memoria GDDR6». PC Builder's Club . Consultado el 15 de julio de 2019 .
^ ab "#BeForTheGame". Contracción nerviosa .
^ Fisher, Jeff (20 de agosto de 2018). «GeForce RTX impulsa la era dorada de los juegos de PC con trazado de rayos en tiempo real». Nvidia . Consultado el 9 de abril de 2023 .
^ "Especificaciones de la GPU NVIDIA TU102". TechPowerUp .
^ "Especificaciones de la GPU NVIDIA TU104". TechPowerUp .
^ "Especificaciones de la GPU NVIDIA TU106". TechPowerUp .
^ "Especificaciones de la GPU NVIDIA TU116". TechPowerUp .
^ "Especificaciones de la GPU NVIDIA TU117". TechPowerUp .
^ «Plataforma NVIDIA RTX». Nvidia . 20 de julio de 2018 . Consultado el 9 de abril de 2023 .
^ "Extensiones de Turing para Vulkan y OpenGL". Nvidia . 11 de septiembre de 2018 . Consultado el 9 de abril de 2023 .
^ Pelletier, Sean (2 de octubre de 2018). «Actualización de Windows 10 de octubre de 2018: un catalizador para los juegos con trazado de rayos». Nvidia . Consultado el 9 de abril de 2023 .
^ van Rhyn, Jacques (2 de octubre de 2018). «DirectX Raytracing y la actualización de octubre de 2018 de Windows 10». Microsoft . Consultado el 9 de abril de 2023 .

Enlaces externos

Documento técnico sobre la arquitectura de la GPU Turing de Nvidia
Página de Nvidia sobre Turing
Blog de Nvidia sobre trazado de rayos frente a rasterización
Arquitectura NVIDIA Turing en profundidad
Blog para desarrolladores de Microsoft sobre el trazado de rayos en DirectX

[TuringWhitepaper-1] "Arquitectura de GPU Turing de Nvidia: gráficos reinventados" (PDF) . Nvidia . 2018 . Consultado el 28 de junio de 2019 .

[2] Smith, Ryan (13 de agosto de 2018). "NVIDIA revela la arquitectura de GPU Turing de próxima generación: NVIDIA apuesta por el trazado de rayos, GDDR6 y más". AnandTech . Consultado el 9 de abril de 2023 .

[3] Smith, Ryan (20 de agosto de 2018). "NVIDIA anuncia la serie GeForce RTX 20: RTX 2080 Ti y 2080 el 20 de septiembre, RTX 2070 en octubre". AnandTech . Consultado el 9 de abril de 2023 .

[4] Warren, Tom (20 de agosto de 2018). «Nvidia anuncia la serie de GPU RTX 2000 con '6 veces más rendimiento' y trazado de rayos». The Verge . Consultado el 20 de agosto de 2018 .

[anandarch-5] Oh, Nate (14 de septiembre de 2018). "Análisis profundo de la arquitectura de la GPU NVIDIA Turing: preludio de GeForce RTX". AnandTech . Consultado el 9 de abril de 2023 .

[6] Mujtaba, Hassan (14 de agosto de 2018). "La memoria GDDR6 de Samsung alimenta las tarjetas Quadro RTX basadas en GPU Turing de NVIDIA". Wccftech . Consultado el 9 de abril de 2023 .

[7] Maislinger, Florian (21 de noviembre de 2018). «RTX 2080 Ti defectuosa: Nvidia cambia de Micron a Samsung para la memoria GDDR6». PC Builder's Club . Consultado el 15 de julio de 2019 .

[Keynote-8] "#BeForTheGame". Contracción nerviosa .

[fisher-9] Fisher, Jeff (20 de agosto de 2018). «GeForce RTX impulsa la era dorada de los juegos de PC con trazado de rayos en tiempo real». Nvidia . Consultado el 9 de abril de 2023 .

[10] "Especificaciones de la GPU NVIDIA TU102". TechPowerUp .

[11] "Especificaciones de la GPU NVIDIA TU104". TechPowerUp .

[12] "Especificaciones de la GPU NVIDIA TU106". TechPowerUp .

[13] "Especificaciones de la GPU NVIDIA TU116". TechPowerUp .

[14] "Especificaciones de la GPU NVIDIA TU117". TechPowerUp .

[nvidiartx-15] «Plataforma NVIDIA RTX». Nvidia . 20 de julio de 2018 . Consultado el 9 de abril de 2023 .

[16] "Extensiones de Turing para Vulkan y OpenGL". Nvidia . 11 de septiembre de 2018 . Consultado el 9 de abril de 2023 .

[17] Pelletier, Sean (2 de octubre de 2018). «Actualización de Windows 10 de octubre de 2018: un catalizador para los juegos con trazado de rayos». Nvidia . Consultado el 9 de abril de 2023 .

[18] van Rhyn, Jacques (2 de octubre de 2018). «DirectX Raytracing y la actualización de octubre de 2018 de Windows 10». Microsoft . Consultado el 9 de abril de 2023 .