Lanzado | 20 de septiembre de 2018 (2018-09-20) |
---|---|
Diseñado por | Nvidia |
Fabricado por | |
Proceso de fabricación | TSMC 12FFC |
Nombre(s) clave | TU10x TU11x |
Serie de productos | |
De oficina | |
Profesional/estación de trabajo | |
Servidor/centro de datos | |
Presupuesto | |
Calcular |
|
Caché L1 | 96 KB (por SM) |
Caché L2 | De 2 MB a 6 MB |
Soporte de memoria | Memoria GDDR6 HBM2 |
Compatibilidad con PCIe | PCIe 3.0 |
API de gráficos compatibles | |
DirectX | DirectX 12 Ultimate (nivel de función 12_2) |
Direct3D | Direct3D 12.0 |
Modelo de sombreado | Modelo de sombreado 6.7 |
OpenCL | OpenCL 3.0 |
OpenGL | OpenGL 4.6 |
CUDA | Capacidad de cómputo 7.5 |
Vulcano | Vulcano 1.3 |
Motor de medios | |
Codificar códecs | |
Decodificar códecs | |
Profundidad de bits de color |
|
Codificador(es) compatible(s) | NVENC |
Salidas de pantalla | |
Historia | |
Predecesor | Pascal |
Variante | Volta (centro de datos/HPC) |
Sucesor | Amperio |
Turing es el nombre en clave de una microarquitectura de unidad de procesamiento gráfico (GPU) desarrollada por Nvidia . Lleva el nombre del destacado matemático y científico informático Alan Turing . La arquitectura se presentó por primera vez en agosto de 2018 en SIGGRAPH 2018 en las tarjetas Quadro RTX orientadas a estaciones de trabajo , [2] y una semana después en Gamescom en las tarjetas gráficas de consumo de la serie GeForce 20. [3] Basándose en el trabajo preliminar de Volta , su predecesor exclusivo de HPC , la arquitectura Turing presenta los primeros productos de consumo capaces de realizar trazado de rayos en tiempo real , un objetivo de larga data de la industria de los gráficos por computadora. Los elementos clave incluyen procesadores de inteligencia artificial dedicados ("núcleos Tensor") y procesadores de trazado de rayos dedicados ("núcleos RT"). Turing aprovecha DXR , OptiX y Vulkan para acceder al trazado de rayos. En febrero de 2019, Nvidia lanzó las GPU de la serie GeForce 16 , que utilizan el nuevo diseño Turing pero carecen de los núcleos RT y Tensor.
Turing se fabrica utilizando el proceso de fabricación de semiconductores FinFET de 12 nm de TSMC . La GPU TU102 de alta gama incluye 18,6 mil millones de transistores fabricados mediante este proceso. [1] Turing también utiliza memoria GDDR6 de Samsung Electronics y, anteriormente, de Micron Technology .
La microarquitectura de Turing combina varios tipos de núcleos de procesador especializados y permite una implementación de trazado de rayos en tiempo real limitado. [4] Esto se acelera mediante el uso de nuevos núcleos RT (trazado de rayos), que están diseñados para procesar árboles cuádruples y jerarquías esféricas, y acelerar las pruebas de colisión con triángulos individuales.
Características de Turing:
La memoria GDDR6 es producida por Samsung Electronics para la serie Quadro RTX. [6] La serie RTX 20 se lanzó inicialmente con chips de memoria Micron , antes de cambiar a chips Samsung en noviembre de 2018. [7]
Nvidia informó mejoras en el rendimiento de rasterización (CUDA) para títulos existentes de aproximadamente un 30 a 50 % en comparación con la generación anterior. [8] [9]
El trazado de rayos realizado por los núcleos RT se puede utilizar para producir reflejos, refracciones y sombras, reemplazando las técnicas raster tradicionales como los mapas cúbicos y los mapas de profundidad . Sin embargo, en lugar de reemplazar la rasterización por completo, la información recopilada del trazado de rayos se puede utilizar para aumentar el sombreado con información que es mucho más fotorrealista , especialmente en lo que respecta a la acción fuera de la cámara. Nvidia dijo que el rendimiento del trazado de rayos aumentó aproximadamente 8 veces con respecto a la arquitectura de consumo anterior, Pascal.
La generación de la imagen final se acelera aún más mediante los núcleos Tensor, que se utilizan para rellenar los espacios en blanco en una imagen parcialmente renderizada, una técnica conocida como eliminación de ruido. Los núcleos Tensor ejecutan el resultado del aprendizaje profundo para codificar cómo, por ejemplo, aumentar la resolución de las imágenes generadas por una aplicación o un juego específicos. En el uso principal de los núcleos Tensor, se analiza un problema a resolver en una supercomputadora, a la que se le enseña mediante ejemplos qué resultados se desean, y la supercomputadora determina un método a utilizar para lograr esos resultados, lo que luego se hace con los núcleos Tensor del consumidor. Estos métodos se entregan a través de actualizaciones de controladores a los consumidores. [8] La supercomputadora utiliza una gran cantidad de núcleos Tensor por sí misma.
Morir | TU102 [10] | TU104 [11] | TU106 [12] | TU116 [13] | TU117 [14] |
---|---|---|---|---|---|
Tamaño del troquel | 754 milímetros cuadrados | 545 milímetros cuadrados | 445 milímetros cuadrados | 284 milímetros cuadrados | 200 milímetros cuadrados |
Transistores | 18.6B | 13.6B | 10.8B | 6.6B | 4.7B |
Densidad de transistores | 24,7 toneladas métricas/ mm2 | 25,0 toneladas métricas/ mm2 | 24,3 toneladas métricas/ mm2 | 23,2 toneladas métricas/ mm2 | 23,5 toneladas métricas/ mm2 |
Clústeres de procesamiento de gráficos (GPC) | 6 | 6 | 3 | 3 | 2 |
Multiprocesadores de transmisión (SM) | 72 | 48 | 36 | 24 | 16 |
Núcleos CUDA | 4608 | 3072 | 2304 | 1536 | 1024 |
Unidades de mapeo de texturas | 288 | 192 | 144 | 96 | 64 |
Unidades de salida de renderizado | 96 | 64 | 64 | 48 | 32 |
Núcleos tensoriales | 576 | 384 | 288 | — | |
Núcleos RT | 72 | 48 | 36 | ||
Caché L1 | 6,75 MB | 4,5 MB | 3,375 MB | 2,25 MB | 1,5 MB |
96 KB por SM | |||||
Caché L2 | 6MB | 4MB | 4MB | 1,5 MB | 1 MB |
La plataforma de desarrollo de Turing se llama RTX. Se puede acceder a las funciones de trazado de rayos de RTX mediante DXR de Microsoft , OptiX y también mediante extensiones Vulkan (esta última también está disponible en los controladores de Linux). [15] Incluye acceso a funciones aceleradas por IA a través de NGX. Las funcionalidades Mesh Shader y Shading Rate Image son accesibles mediante extensiones DirectX 12 , Vulkan y OpenGL en plataformas Windows y Linux. [16]
La actualización de octubre de 2018 de Windows 10 incluye el lanzamiento público de DirectX Raytracing. [17] [18]