Fecha de lanzamiento | 19 de febrero de 2013 ( 19 de febrero de 2013 ) |
---|---|
Nombre en clave |
|
Arquitectura | |
Modelos | Serie GeForce
|
Transistores |
|
Proceso de fabricación | |
Tarjetas | |
Nivel de entrada |
|
Gama media |
|
De gama alta |
|
Entusiasta |
|
Soporte API | |
DirectX | Direct3D 11.0 ( nivel de función 11_0) [2] [3] Shader Model 6.7 (Maxwell), Shader Model 6.5 (Kepler) o Shader Model 5.1 (Fermi) |
OpenCL | OpenCL 3.0 [a] |
OpenGL | OpenGL 4.6 |
Vulcano | Vulkan 1.2 [1] SPIR-V |
Historia | |
Predecesor | Serie GeForce 600 |
Variante | Serie GeForce 800M |
Sucesor | Serie GeForce 900 |
Estado de soporte | |
Tarjetas Fermi no compatibles. Actualizaciones de seguridad para Kepler hasta septiembre de 2024. Maxwell totalmente compatible. |
La serie GeForce 700 (estilizada como GEFORCE GTX 700 SERIES ) es una serie de unidades de procesamiento gráfico desarrolladas por Nvidia . Si bien se trata principalmente de una actualización de la microarquitectura Kepler (chips con nombre en código GK), algunas tarjetas utilizan Fermi (GF) y las tarjetas posteriores utilizan Maxwell (GM). Las tarjetas de la serie GeForce 700 se lanzaron por primera vez en 2013, comenzando con el lanzamiento de la GeForce GTX Titan el 19 de febrero de 2013, seguida por la GeForce GTX 780 el 23 de mayo de 2013. Los primeros chips móviles de la serie GeForce 700 se lanzaron en abril de 2013.
GK110 fue diseñado y comercializado teniendo en mente el rendimiento computacional. Contiene 7.1 mil millones de transistores. Este modelo también intenta maximizar la eficiencia energética mediante la ejecución de tantas tareas como sea posible en paralelo según las capacidades de sus procesadores de streaming.
Con GK110, se observan aumentos en el espacio de memoria y el ancho de banda tanto para el archivo de registros como para la caché L2 en comparación con los modelos anteriores. A nivel de SMX, el espacio del archivo de registros de GK110 ha aumentado a 256 KB compuesto por 64 K de registros de 32 bits, en comparación con los 32 K de registros de 32 bits de Fermi que suman un total de 128 KB. En cuanto a la caché L2, el espacio de caché L2 de GK110 aumentó hasta 1,5 MB, el doble que en GF110. Tanto el ancho de banda de la caché L2 como del archivo de registros también se han duplicado. El rendimiento en escenarios de escasez de registros también mejora, ya que hay más registros disponibles para cada hilo. Esto va de la mano con un aumento del número total de registros que cada hilo puede abordar, pasando de 63 registros por hilo a 255 registros por hilo con GK110.
Con GK110, Nvidia también modificó la caché de texturas de la GPU para que se use con fines computacionales. Con un tamaño de 48 KB, en el área computacional la caché de texturas se convierte en una caché de solo lectura, especializada en cargas de trabajo de acceso a memoria no alineada. Además, se agregaron capacidades de detección de errores para que sea más seguro su uso con cargas de trabajo que dependen de ECC . [4]
Se agregó Dynamic Super Resolution (DSR) a las GPU Kepler con los últimos controladores de Nvidia. [5]
La serie GeForce 700 contiene características de las GK104 y GK110. Los miembros de la serie 700 basados en Kepler agregan las siguientes características estándar a la familia GeForce.
Derivado de GK104:
Nuevas características de GK110:
Con GK110, Nvidia optó por aumentar el rendimiento computacional. El mayor cambio con respecto a GK104 es que en lugar de 8 núcleos CUDA FP64 dedicados, GK110 tiene hasta 64, lo que le otorga 8 veces el rendimiento FP64 de un GK104 SMX. El SMX también ve un aumento en el espacio para el archivo de registro. El espacio del archivo de registro ha aumentado a 256 KB en comparación con Fermi. La caché de texturas también se ha mejorado. Con un espacio de 48 KB, la caché de texturas puede convertirse en una caché de solo lectura para cargas de trabajo de cómputo. [4]
En un nivel bajo, GK110 incluye instrucciones y operaciones adicionales para mejorar aún más el rendimiento. Las nuevas instrucciones de mezcla permiten que los subprocesos dentro de un warp compartan datos sin volver a la memoria, lo que hace que el proceso sea mucho más rápido que el método anterior de carga/compartir/almacenar. Las operaciones atómicas también se han revisado, acelerando la velocidad de ejecución de las operaciones atómicas y agregando algunas operaciones FP64 que antes solo estaban disponibles para datos FP32. [4]
Hyper-Q expande las colas de trabajo del hardware GK110 de 1 a 32. La importancia de esto es que tener una sola cola de trabajo significaba que Fermi podía estar subocupado en ocasiones, ya que no había suficiente trabajo en esa cola para llenar cada SM. Al tener 32 colas de trabajo, GK110 puede, en muchos escenarios, lograr una mayor utilización al poder colocar diferentes flujos de tareas en lo que de otro modo sería un SMX inactivo. La naturaleza simple de Hyper-Q se refuerza aún más por el hecho de que se asigna fácilmente a MPI, una interfaz de paso de mensajes común que se usa con frecuencia en HPC. Como los algoritmos heredados basados en MPI que se diseñaron originalmente para sistemas de múltiples CPU que se vieron obstaculizados por falsas dependencias ahora tienen una solución. Al aumentar la cantidad de trabajos MPI, es posible utilizar Hyper-Q en estos algoritmos para mejorar la eficiencia, todo sin cambiar el código en sí. [4]
Las GPU Nvidia Kepler de la serie GeForce 700 son totalmente compatibles con DirectX 11.0.
La capacidad de paralelismo dinámico permite que los núcleos puedan enviar a otros núcleos. Con Fermi, solo la CPU podía enviar a un núcleo, lo que implicaba una cierta cantidad de sobrecarga al tener que comunicarse con la CPU. Al darles a los núcleos la capacidad de enviar a sus propios núcleos secundarios, GK110 puede ahorrar tiempo al no tener que volver a la CPU y, en el proceso, liberar la CPU para que trabaje en otras tareas. [4]
La serie GeForce 700 fue diseñada para la arquitectura de escritorio. Se esperaba que con el tiempo se lanzaran productos más económicos y de menor rendimiento. Kepler admite funciones 11.1 con el nivel de funciones 11_0 a través de la API DirectX 11.1, sin embargo, Nvidia no habilitó cuatro funciones no relacionadas con juegos en el hardware de Kepler (para 11_1). [6] [7]
Algunas implementaciones pueden utilizar especificaciones diferentes.
Modelo | Lanzamiento | Nombre en clave | Fab ( nm ) | Interfaz de bus | Configuración básica 1 | Velocidad del reloj | Tasa de llenado | Memoria | Compatibilidad con API (versión) | Potencia de procesamiento 2 (GFLOPS) | TDP (vatios) | Notas | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Núcleo ( MHz ) | Sombreador ( MHz ) | Memoria ( MT/s ) | Píxel ( GP /s) | Textura ( GT /s) | Tamaño ( MB ) | Ancho de banda ( GB /s) | Tipo | Ancho de bus ( bit ) | DirectX | OpenGL | OpenCL | Vulcano | |||||||||
GeForce 705M [11] | 1 de junio de 2013 | GF119 [b] | 40 | PCIe 2.0 x16 | 48:8:4 | 775 | 1550 | 1800 | 1.48 | 5.9 | hasta 2048 | ? | DDR3 | 64 | 12.0 (11_0) | 4.6 | 1.1 | 1.3 | 141,7 | 12 | 520M con nueva marca |
GeForce 710M [12] | 1 de abril de 2013 | GF117 [b] | 28 | 96:16:4 | 775 | 1550 | 1800 | 3.1 | 12.4 | hasta 2048 | 14.4 | 64 | 297.6 | 15 | |||||||
GeForce GT 720M [13] | 1 de abril de 2013 | 96:16:4 | 800 | 1600 | 1600 | 2.5 | 10 | hasta 2048 | 12.8 | 64 | 240 | 33 | |||||||||
25 de diciembre de 2013 | GK208 | 192:16:8 | 800 | 2.9 | 11.5 | 1.2 | 276 | 33 | |||||||||||||
GeForce GT 730M [14] | 1 de abril de 2013 | GK107 | PCIe 3.0 x16 | 384:32:16 | 725 | 725 | 1800 | 5.8 | 23 | hasta 2048 | 14,4 – 64,0 | Memoria DDR3 GDDR5 | 128 | 1.1 | 552.2 | 33 | |||||
6 de marzo de 2014 | GK208 | PCIe 2.0 x8 | 384:16:8 | 5.8 | 11.5 | 64 | |||||||||||||||
GeForce GT 735M [15] | 1 de abril de 2013 | PCIe 2.0 x8 | 384:32:8 | 889 | 889 | 2000 | 4.6 | 9.2 | hasta 2048 | 16.0 | DDR3 | 64 | 1.2 | 441.6 | 33 | ||||||
GeForce GT 740M [16] | 1 de abril de 2013 | GK107 | PCIe 3.0 x16 | 384:32:16 | 810-1033 | 810-1033 | 1800/3600 | 6.48 | 25.9 | hasta 2048 | 14,4 – 57,6 | Memoria DDR3 GDDR5 | 128 | 1.1 | 622.1 | 45 | |||||
20 de junio de 2013 | GK208 | PCIe 3.0 x8 | 384:32:8 | 980-1033 | 980-1033 | 8.3 | 33.1 | 64 | 1.2 | 752.6 | 33 | ||||||||||
GeForce GT 745M [17] | 1 de abril de 2013 | GK107 | PCIe 3.0 x16 | 384:32:16 | 837 | 837 | 2000 – 5000 | 4.39 | 17.6 | hasta 2048 | 32,0 – 80,0 | 128 | 642,8 | 45 | |||||||
GeForce GT 750M [18] | 1 de abril de 2013 | 384:32:16 | 967 | 967 | 2000 – 5000 | 7.53 | 30.1 | hasta 4096 | 32 – 80 | 128 | 1.1 | 722,7 | 50 | ||||||||
GeForce GT 755M [19] | Desconocido | 384:32:16 | 1020 | 1020 | 5400 | 15.7 | 31.4 | hasta 2048 | 86.4 | Memoria GDDR5 | 128 | 752.6 | 50 | ||||||||
GeForce GTX 760M [20] | 30 de mayo de 2013 | GK106 | 768:64:16 | 657 | 657 | 4008 | 10 | 40.2 | 2048 | 64.1 | 128 | 964.6 | 55 | ||||||||
GeForce GTX 765M [21] | 30 de mayo de 2013 | 768:64:16 | 850 | 850 | 4008 | 12.8 | 51 | 2048 | 64.1 | 128 | 1.2 | 1224 | 75 | ||||||||
GeForce GTX 770M [22] | 30 de mayo de 2013 | 960:80:24 | 811 | 811 | 4008 | 14.1 | 56,5 | 3072 | 96.2 | 192 | 1356 | 75 | |||||||||
GeForce GTX 780M [23] | 30 de mayo de 2013 | GK104 | 1536:128:32 | 823 | 823 | 5000 | 24.7 | 98,7 | 4096 | 160.0 | 256 | 2369 | 100 |
Modelo | Lanzamiento | Nombre en clave | Fab ( nm ) | Transistores (millones) | Tamaño de la matriz (mm 2 ) | Interfaz de bus | Recuento de SMX | Configuración del núcleo [a] | Frecuencia de reloj | Tasa de llenado | Configuración de memoria | Versión API compatible | Potencia de procesamiento ( GFLOPS ) [b] | TDP (vatios) | Precio de lanzamiento (USD) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Base ( MHz ) | Aumento promedio ( MHz ) | Impulso máximo [c] ( MHz ) | Memoria ( MHz ) | Píxel ( GP /s) | Textura ( GT /s) | Tamaño ( MB ) | Ancho de banda ( GB /s) | Tipo de DRAM | Ancho de bus ( bit ) | Vulcano [d] | Direct3D [es] | OpenGL | OpenCL | Precisión simple | Doble precisión | |||||||||||
GeForce GT 705 [27] [f] | 27 de marzo de 2014 | GF119-300-A1 | TSMC de 40 nm | 292 | 79 | PCIe 2.0 x16 | 1 | 48:8:4 | 810 | — | — | 898 (1796) | 3.24 | 6.5 | 512 1024 | 14.4 | DDR3 | 64 | n / A | 12 | 4.6 | 1.1 | 155,5 | 19.4 | 29 | Fabricante de equipos originales (OEM) |
GeForce GT 710 [28] | GK208-301-A1 | TSMC de 28 nm | 1020 | 79 | PCIe 2.0 x8 | 192:16:8 | 823 | — | — | 900 (1800) | 6.6 | 13.2 | 512 | 64 | 1.2 | 1.2 | 316.0 | 13.2 | ||||||||
26 de enero de 2016 | GK208-203-B1 | PCIe 2.0 x8, PCIe x1 | 192:16:8 | 954 | — | — | 900 (1800) 1253 (5010) | 7.6 | 15.3 | 1024 2048 | 14,4 40,0 | Memoria DDR3 GDDR5 | 366 | 15.3 | 19 | 35–45 dólares | ||||||||||
GeForce GT 720 [29] | 27 de marzo de 2014 | GK208-201-B1 | PCIe 2.0 x8 | 192:16:8 | 797 | — | — | 900 (1800) 1253 (5010) | 6.4 | 12.8 | 1024 2048 | 14,4 40,0 | 306 | 12.8 | 49–59 dólares | |||||||||||
GeForce GT 730 [30] [g] [h] | 18 de junio de 2014 | GK208-301-A1 | 2 | 384:16:8 | 902 | — | — | 900 (1800) | 7.22 | 14.44 | 1024 [31] 2048 4096 | 14.4 | DDR3 | 692.7 | 28.9 | 23 | 69–79 dólares | |||||||||
GK208-400-A1 | 384:16:8 | 902 | — | — | 1250 (5000) | 7.22 | 14.44 | 1024 2048 [32] | 40.0 | Memoria GDDR5 | 25 | |||||||||||||||
GF108 | TSMC de 40 nm | 585 | 116 | PCIe 2.0 x16 | 96:16:4 | 700 | — | — | 900 (1800) | 2.8 | 11.0 | 1024 2048 4096 | 28.8 | DDR3 | 128 | n / A | 1.1 | 268,8 | 33.6 | 49 | ||||||
GeForce GT 740 [i] | 29 de mayo de 2014 | GK107-425-A2 | Motor TSMC de 28 CV | 1270 | 118 | PCIe 3.0 x16 | 384:32:16 | 993 | — | — | 891 (1782) | 15.9 | 31.8 | 28.5 | 128 | 1.2 | 1.2 | 762.6 | 31.8 | 64 | $89–99 | |||||
384:32:16 | 993 | — | — | 1252 (5008) | 15.9 | 31.8 | 80.1 | Memoria GDDR5 | ||||||||||||||||||
GeForce GTX 745 | 18 de febrero de 2014 | GM107-220-A2 | 1870 | 148 | 3 | 384:24:16 | 1033 | Desconocido | Desconocido | 900 (1800) | 16.5 | 24.8 | 1024 4096 | 28.8 | DDR3 | 1.3 | 793.3 | 24.8 | 55 | Fabricante de equipos originales (OEM) | ||||||
GeForce GTX 750 | GM107-300-A2 | 4 | 512:32:16 | 1020 | 1085 | 1163 | 1250 (5000) | 16.3 | 32.6 | 1024 2048 4096 [33] | 80 | Memoria GDDR5 | 1044.5 | 32.6 | $119 | |||||||||||
GeForce GTX 750 Ti | GM107-400-A2 | 5 | 640:40:16 | 1020 | 1085 | 1200 | 1350 (5400) | 16.3 | 40.8 | 1024 2048 4096 | 86.4 | 1305.6 | 40.8 | 60 | $149 | |||||||||||
GeForce GTX 760 de 192 bits | 17 de octubre de 2013 | GK104-200-KD-A2 | 3540 | 294 | 6 | 1152:96:24 | 824 | 888 | 889 | 1450 (5800) | 19.8 | 79.1 | 1536 3072 | 139.2 | 192 | 1.2 | 1896.2 | 79.0 | 130 | Fabricante de equipos originales (OEM) | ||||||
GeForce GTX 760 | 25 de junio de 2013 | GK104-225-A2 | 1152:96:32 | 980 | 1033 | 1124 | 1502 (6008) | 31.4 [j] | 94 | 2048 4096 | 192.3 | 256 | 2257.9 | 94.1 | 170 | $249 ($219) | ||||||||||
GeForce GTX 760 Ti [k] | 27 de septiembre de 2013 [34] | GK104 | 7 | 1344:112:32 | 915 | 980 | 1084 | 1502 (6008) | 29.3 | 102.5 | 2048 | 192.3 | 2459.5 | 102.5 | Fabricante de equipos originales (OEM) | |||||||||||
GeForce GTX 770 | 30 de mayo de 2013 | GK104-425-A2 | 8 | 1536:128:32 | 1046 | 1085 | 1130 | 1752.5 (7010) | 33.5 | 134 | 2048 4096 | 224 | 3213.3 | 133,9 | 230 | $399 ($329) | ||||||||||
GeForce GTX 780 | 23 de mayo de 2013 | GK110-300-A1 | 7080 | 561 | 12 | 2304:192:48 | 863 | 900 | 1002 | 1502 (6008) | 41.4 [j] | 160,5 | 3072 6144 [35] | 288.4 | 384 | 3976.7 | 165,7 | $649 ($499) | ||||||||
GeForce GTX 780 Ti [36] [37] [38] | 7 de noviembre de 2013 | GK110-425-B1 | 15 | 2880:240:48 | 876 | 928 | 1019 | 1752.5 (7010) | 42.0 [j] | 210.2 | 3072 | 336,5 | 5045.7 | 210.2 | $699 | |||||||||||
GeForce GTX TITAN [39] [40] [41] | 21 de febrero de 2013 | GK110-400-A1 | 14 | 2688:224:48 | 837 | 876 | 993 | 1502 (6008) | 40.2 | 187,5 | 6144 | 288.4 | 4499.7 | 1300 [42] -1499.9 | $999 | |||||||||||
GeForce GTX TITAN Negra | 18 de febrero de 2014 | GK110-430-B1 | 15 | 2880:240:48 | 889 | 980 | 1058 | 1752.5 (7010) | 42.7 | 213.4 | 336,5 | 5120.6 | 1706.9 | |||||||||||||
GeForce GTX TITAN Z | 28 de mayo de 2014 | 2x GK110-350-B1 [43] | 2x7080 | 2x561 | 2x15 | 2x2880:240:48 | 705 | 876 | Desconocido | 1752.5 (7010) | 2x33,8 | 2x169 | 2x6144 | 2x336,5 | 2x384 | 4.5 | 5046x2 | 1682x2 [44] | 375 | $2999 | ||||||
Modelo | Lanzamiento | Nombre en clave | Fab ( nm ) | Transistores (millones) | Tamaño de la matriz (mm 2 ) | Interfaz de bus | Recuento de SMX | Configuración del núcleo [a] | Frecuencia de reloj | Tasa de llenado | Configuración de memoria | Versión API compatible | Potencia de procesamiento ( GFLOPS ) [k] | TDP (vatios) | Precio de lanzamiento (USD) | |||||||||||
Base ( MHz ) | Aumento promedio ( MHz ) | Impulso máximo [c] ( MHz ) | Memoria ( MHz ) | Píxel ( GP /s) | Textura ( GT /s) | Tamaño ( MB ) | Ancho de banda ( GB /s) | Tipo de DRAM | Ancho de bus ( bit ) | Vulcano | Direct3D [es] | OpenGL | OpenCL | Precisión simple | Doble precisión |
Nvidia dejó de lanzar controladores de 32 bits para sistemas operativos de 32 bits después de que se lanzara el último controlador Release 390.x, 391.35, en marzo de 2018. [45]
Las GPU para portátiles Kepler pasaron al soporte heredado en abril de 2019 y dejaron de recibir actualizaciones de seguridad en abril de 2020. [46] Todas las GPU para portátiles de la familia 7xxM se vieron afectadas por este cambio.
Nvidia anunció que después de la versión 470 de los controladores, trasladaría el soporte de los controladores para los sistemas operativos Windows 7 y Windows 8.1 al estado heredado y continuaría brindando actualizaciones de seguridad críticas para estos sistemas operativos hasta septiembre de 2024. [47]
Nvidia anunció que todas las GPU de escritorio Kepler restantes pasarían a tener soporte heredado a partir de septiembre de 2021 y recibirían soporte para actualizaciones de seguridad críticas hasta septiembre de 2024. [48] Las Nvidia GeForce GTX 745, 750 y 750 Ti de la familia de GPU de escritorio 7xx no se verían afectadas por este cambio.
En Windows, el último controlador que soporta completamente CUDA con capacidad de cómputo de 64 bits 3.5 para Kepler en Windows 7 y Windows 8.1 de 64 bits es 388.71, probado con los últimos CUDA-Z y GPU-Z; después de ese controlador, la compatibilidad con CUDA de 64 bits deja de funcionar para la serie GeForce 700 GK110 con arquitectura Kepler.
El último controlador en el que la detección del tipo de monitor funciona correctamente en Windows XP es 352.86. [49]
El pico de fp64 calculado de Titan es de 1,5 TFlops. Sin embargo, bajo una carga pesada en el modo fp64, la tarjeta puede alcanzar una frecuencia inferior a los 837 MHz indicados para permanecer dentro de las especificaciones térmicas y de potencia.