Las operaciones de punto flotante por segundo ( FLOPS , flops o flop/s ) son una medida del rendimiento informático , útil en campos de cálculos científicos que requieren cálculos de punto flotante . [ 1]
Para estos casos, es una medida más precisa que medir instrucciones por segundo . [ cita requerida ]
Nombre | Unidad | Valor |
---|---|---|
kilo FLOPS | kFLOPS | 10 3 |
mega -flops | MFLOPS | 10 6 |
gigaflops | GFLOPS | 10 9 |
tera FLOPS | TFLOPS | 10 12 |
peta FRACASOS | PFLOPS | 10 15 |
exa FLOPS | EFLOPS | 10 18 |
Zetta FRACASOS | ZFLOPS | 10 21 |
Yotta FRACASOS | YFLOPS | 10 24 |
RONNA FLOPS | RFLOPS | 10 27 |
Quetta FLOPS | QFLOPS | 10 30 |
La aritmética de punto flotante es necesaria para números reales muy grandes o muy pequeños , o cálculos que requieren un amplio rango dinámico. La representación de punto flotante es similar a la notación científica, excepto que las computadoras usan base dos (con raras excepciones), en lugar de base diez . El esquema de codificación almacena el signo, el exponente (en base dos para Cray y VAX , base dos o diez para formatos de punto flotante IEEE y base 16 para IBM Floating Point Architecture ) y la mantisa (número después del punto de base ). Si bien se utilizan varios formatos similares, el más común es ANSI/IEEE Std. 754-1985 . Este estándar define el formato para números de 32 bits llamados precisión simple , así como números de 64 bits llamados precisión doble y números más largos llamados precisión extendida (usados para resultados intermedios). Las representaciones de punto flotante pueden admitir un rango mucho más amplio de valores que el punto fijo, con la capacidad de representar números muy pequeños y números muy grandes. [2]
La exponenciación inherente al cálculo de punto flotante asegura un rango dinámico mucho mayor (los números más grandes y más pequeños que se pueden representar), lo que es especialmente importante cuando se procesan conjuntos de datos en los que algunos de los datos pueden tener un rango extremadamente grande de valores numéricos o donde el rango puede ser impredecible. Por lo tanto, los procesadores de punto flotante son ideales para aplicaciones que requieren un uso intensivo de recursos computacionales. [3]
FLOPS y MIPS son unidades de medida para el rendimiento computacional numérico de una computadora. Las operaciones de punto flotante se usan típicamente en campos como la investigación computacional científica, así como en el aprendizaje automático . Sin embargo, antes de fines de la década de 1980, el hardware de punto flotante (es posible implementar aritmética de punto flotante en software sobre cualquier hardware de números enteros) era típicamente una característica opcional, y se decía que las computadoras que lo tenían eran "computadoras científicas", o que tenían capacidad de " computación científica ". Por lo tanto, la unidad MIPS era útil para medir el rendimiento de números enteros de cualquier computadora, incluidas aquellas sin tal capacidad, y para tener en cuenta las diferencias de arquitectura, también se usaban MOPS (millones de operaciones por segundo) similares ya en 1970 [4] . Tenga en cuenta que además de la aritmética de números enteros (o de punto fijo), los ejemplos de operación de números enteros incluyen el movimiento de datos (A a B) o la prueba de valores (Si A = B, entonces C). Es por eso que el MIPS como punto de referencia de rendimiento es adecuado cuando se utiliza un ordenador en consultas de bases de datos, procesamiento de textos, hojas de cálculo o para ejecutar múltiples sistemas operativos virtuales. [5] [6] En 1974, David Kuck acuñó los términos flops y megaflops para la descripción del rendimiento de las supercomputadoras de la época por el número de cálculos de punto flotante que realizaban por segundo. [7] Esto era mucho mejor que utilizar el MIPS prevaleciente para comparar ordenadores, ya que esta estadística normalmente tenía poca relación con la capacidad aritmética de la máquina en tareas científicas.
Los FLOPS en un sistema HPC se pueden calcular utilizando esta ecuación: [8]
Esto se puede simplificar al caso más común: una computadora que tiene exactamente 1 CPU:
Los FLOPS se pueden registrar en diferentes medidas de precisión, por ejemplo, la lista de supercomputadoras TOP500 clasifica las computadoras por operaciones de 64 bits ( formato de punto flotante de doble precisión ) por segundo, abreviado como FP64 . [9] Hay medidas similares disponibles para operaciones de 32 bits ( FP32 ) y 16 bits ( FP16 ).
Microarquitectura | Arquitectura del conjunto de instrucciones | FP64 | FP32 | FP16 |
---|---|---|---|---|
Procesador Intel | ||||
Intel 80486 | x87 (32 bits) | ? | 0,128 [11] | ? |
| x87 (32 bits) | ? | 0,5 [11] | ? |
| MMX (64 bits) | ? | 1 [12] | ? |
Intel P6 Pentium III | SSE (64 bits) | ? | 2 [12] | ? |
Procesador Intel NetBurst Pentium 4 (Willamette, Northwood) | SSE2 (64 bits) | 2 | 4 | ? |
Intel P6 Pentium M | SSE2 (64 bits) | 1 | 2 | ? |
SSE3 (64 bits) | 2 | 4 | ? | |
4 | 8 | ? | ||
Intel Atom ( Bonnell , Saltwell , Silvermont y Goldmont ) | SSE3 (128 bits) | 2 | 4 | ? |
Puente Sandy de Intel ( Puente Sandy , Puente Ivy ) | AVX (256 bits) | 8 | 16 | 0 |
| AVX2 y FMA (256 bits) | 16 | 32 | 0 |
Intel Xeon Phi ( Rincón de los Caballeros ) | IMCI (512 bits) | 16 | 32 | 0 |
| AVX-512 y FMA (512 bits) | 32 | 64 | 0 |
Procesador AMD | ||||
Bobcat de AMD | AMD64 (64 bits) | 2 | 4 | 0 |
4 | 8 | 0 | ||
AMD K10 | SSE4/4a (128 bits) | 4 | 8 | 0 |
Bulldozer AMD [13] ( Martillo hincador , Apisonadora , Excavadora ) | 4 | 8 | 0 | |
AVX2 y FMA (decodificación de 128 bits y 256 bits) [18] | 8 | 16 | 0 | |
AVX2 y FMA (256 bits) | 16 | 32 | 0 | |
Procesador ARM | ||||
ARM Cortex-A7, A9, A15 | ARMv7 | 1 | 8 | 0 |
ARM Cortex-A32, A35 | ARMv8 | 2 | 8 | 0 |
BRAZO Cortex-A53 , A55 , A57 , [13] A72 , A73 , A75 | ARMv8 | 4 | 8 | 0 |
Procesadores ARM Cortex-A76 , A77 y A78 | ARMv8 | 8 | 16 | 0 |
ARM Cortex-X1 | ARMv8 | 16 | 32 | ? |
Qualcomm Krait | ARMv8 | 1 | 8 | 0 |
Qualcomm Kryo (1xx - 3xx) | ARMv8 | 2 | 8 | 0 |
Qualcomm Kryo (4xx - 5xx) | ARMv8 | 8 | 16 | 0 |
Samsung Exynos M1 y M2 | ARMv8 | 2 | 8 | 0 |
Samsung Exynos M3 y M4 | ARMv8 | 3 | 12 | 0 |
IBM PowerPC A2 (Blue Gene/Q) | ? | 8 | 8 (como FP64) | 0 |
Hitachi SH-4 [20] [21] | SH-4 | 1 | 7 | 0 |
GPU de Nvidia | ||||
Nvidia Curie ( serie GeForce 6 y serie GeForce 7 ) | PTX | ? | 8 | ? |
Nvidia Tesla 2.0 (GeForce GTX 260-295) | PTX | ? | 2 | ? |
Nvidia Fermi (solo GeForce GTX 465–480, 560 Ti, 570–590) | PTX | 1/4 (bloqueado por el conductor, 1 en el hardware) | 2 | 0 |
Nvidia Fermi (sólo Quadro 600–2000) | PTX | 1/8 | 2 | 0 |
Nvidia Fermi (solo Quadro 4000–7000, Tesla) | PTX | 1 | 2 | 0 |
Nvidia Kepler (GeForce (excepto Titan y Titan Black), Quadro (excepto K6000), Tesla K10) | PTX | 1/12 (para GK110 : bloqueado por el conductor, 2/3 en el hardware) | 2 | 0 |
Nvidia Kepler (GeForce GTX Titan y Titan Black, Quadro K6000, Tesla (excepto K10)) | PTX | 2/3 | 2 | 0 |
PTX | 1/16 | 2 | 1/32 | |
Nvidia Pascal (solo Quadro GP100 y Tesla P100) | PTX | 1 | 2 | 4 |
Nvidia Volta [22] | PTX | 1 | 2 ( FP32 ) + 2 ( INT32 ) | 16 |
Nvidia Turing (solo GeForce 16XX ) | PTX | 1/16 | 2 (FP32) + 2 (INT32) | 4 |
Nvidia Turing (todas excepto GeForce 16XX ) | PTX | 1/16 | 2 (FP32) + 2 (INT32) | 16 |
Nvidia Ampere [23] [24] (solo Tesla A100/A30) | PTX | 2 | 2 (FP32) + 2 (INT32) | 32 |
Nvidia Ampere (todas las GeForce y Quadro, Tesla A40/A10) | PTX | 1/32 | 2 (FP32) + 0 (INT32) o 1 (FP32) + 1 (INT32) | 8 |
GPU AMD | ||||
AMD TeraScale 1 ( serie Radeon HD 4000 ) | TeraScale 1 | 0,4 | 2 | ? |
AMD TeraScale 2 ( serie Radeon HD 5000 ) | TeraScale 2 | 1 | 2 | ? |
AMD TeraScale 3 ( serie Radeon HD 6000 ) | TeraScale 3 | 1 | 4 | ? |
AMD GCN (solo Radeon Pro W 8100–9100) | GCN | 1 | 2 | ? |
AMD GCN (todos excepto Radeon Pro W 8100–9100, Vega 10–20) | GCN | 1/8 | 2 | 4 |
AMD GCN Vega 10 | GCN | 1/8 | 2 | 4 |
AMD GCN Vega 20 (solo Radeon VII) | GCN | 1/2 (bloqueado por el conductor, 1 en el hardware) | 2 | 4 |
AMD GCN Vega 20 (solo Radeon Instinct MI50 / MI60 y Radeon Pro VII) | GCN | 1 | 2 | 4 |
ADNr | 1/8 | 2 | 4 | |
AMD RDNA3 | ADNr | 1/8? | 4 | 8? |
ADNc de AMD | ADNc | 1 | 4 (Tensor) [27] | 16 |
CDNA 2 de AMD | ADNc 2 | 4 (Tensor) | 4 (Tensor) | 16 |
GPU Intel | ||||
Intel Xe-LP (Iris Xe MAX) [28] | Xe | 1/2? | 2 | 4 |
Intel Xe-HPG (Alquimista de arco) [28] | Xe | 0 | 2 | 16 |
Intel Xe-HPC (Ponte Vecchio) [29] | Xe | 2 | 2 | 32 |
GPU de Qualcomm | ||||
Qualcomm Adreno 5x0 | Adreno 5xx | 1 | 2 | 4 |
Qualcomm Adreno 6x0 | Adreno 6xx | 1 | 2 | 4 |
Núcleo gráfico | ||||
Graphcore Colossus GC2 [30] [31] | ? | 0 | 16 | 64 |
| ? | 0 | 32 | 128 |
Supercomputadora | ||||
ENIAC a 100 kHz en 1945 | 0,004 [34] (~0,00000003 FLOPS/ W ) | |||
Procesador de 48 bits a 208 kHz en CDC 1604 en 1960 | ||||
Procesador de 60 bits a 10 MHz en CDC 6600 en 1964 | 0,3 (FP60) | |||
Procesador de 60 bits a 10 MHz en CDC 7600 en 1967 | 1.0 (FP60) | |||
Cray-1 a 80 MHz en 1976 | 2 (700 FLOPS/W) | |||
CDC Cyber 205 a 50 MHz en 1981 Compilador FORTRAN (ANSI 77 con extensiones vectoriales) | 8 | 16 | ||
Transputador IMS T800-20 a 20 MHz en 1987 | 0,08 [35] | |||
Paralelo E16 @ 1000 MHz en 2012 | 2 [36] (5,0 GFLOPS/W) [37] | |||
Paralelo E64 a 800 MHz en 2012 | 2 [38] (50,0 GFLOPS/W) [37] | |||
Microarquitectura | Arquitectura del conjunto de instrucciones | FP64 | FP32 | FP16 |
En junio de 1997, el ASCI Red de Intel fue el primer ordenador del mundo en alcanzar un teraFLOPS o más. Bill Camp, director de Sandia, afirmó que el ASCI Red tenía la mayor fiabilidad de cualquier superordenador jamás construido y "era el punto más alto de la supercomputación en cuanto a longevidad, precio y rendimiento". [39]
La supercomputadora SX-9 de NEC fue el primer procesador vectorial del mundo en superar los 100 gigaFLOPS por núcleo individual.
En junio de 2006, el instituto de investigación japonés RIKEN anunció un nuevo ordenador , el MDGRAPE-3 . El rendimiento del ordenador alcanza un petaFLOPS, casi dos veces más rápido que el Blue Gene/L, pero el MDGRAPE-3 no es un ordenador de uso general, por lo que no aparece en la lista Top500.org . Tiene canales de simulación de dinámica molecular especiales .
En 2007, Intel Corporation presentó el chip experimental multinúcleo POLARIS , que alcanza 1 teraFLOPS a 3,13 GHz. El chip de 80 núcleos puede elevar este resultado a 2 teraFLOPS a 6,26 GHz, aunque la disipación térmica a esta frecuencia supera los 190 vatios. [40]
En junio de 2007, Top500.org informó que la supercomputadora IBM Blue Gene/L era la más rápida del mundo , con un pico de 596 teraFLOPS. [41] La Cray XT4 alcanzó el segundo puesto con 101,7 teraFLOPS.
El 26 de junio de 2007, IBM anunció la segunda generación de su supercomputadora de gama alta, denominada Blue Gene/P y diseñada para funcionar de forma continua a velocidades superiores a un petaFLOPS, más rápida que la Blue Gene/L. Cuando se configura para ello, puede alcanzar velocidades superiores a tres petaFLOPS. [42]
El 25 de octubre de 2007, NEC Corporation de Japón emitió un comunicado de prensa en el que anunciaba su modelo SX-9 de la serie SX , [43] afirmando que era la supercomputadora vectorial más rápida del mundo. La SX-9 cuenta con la primera CPU capaz de alcanzar un rendimiento vectorial máximo de 102,4 gigaFLOPS por núcleo único.
El 4 de febrero de 2008, la NSF y la Universidad de Texas en Austin abrieron pruebas de investigación a gran escala en una supercomputadora AMD y Sun llamada Ranger , [44] el sistema de supercomputación más poderoso del mundo para investigación científica abierta, que opera a una velocidad sostenida de 0,5 petaFLOPS.
El 25 de mayo de 2008, una supercomputadora estadounidense construida por IBM , llamada Roadrunner , alcanzó el hito computacional de un petaFLOPS. Encabezó la lista TOP500 de junio de 2008 y noviembre de 2008 de las supercomputadoras más poderosas (excluyendo las computadoras de red ). [45] [46] La computadora está ubicada en el Laboratorio Nacional de Los Álamos en Nuevo México. El nombre de la computadora hace referencia al ave del estado de Nuevo México , el correcaminos mayor ( Geococcyx californianus ). [47]
En junio de 2008, AMD lanzó la serie ATI Radeon HD 4800, que según se informa son las primeras GPU que alcanzan un teraFLOPS. El 12 de agosto de 2008, AMD lanzó la tarjeta gráfica ATI Radeon HD 4870X2 con dos GPU Radeon R770 que suman un total de 2,4 teraFLOPS.
En noviembre de 2008, una actualización de la supercomputadora Cray Jaguar en el Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía (DOE) elevó la potencia de cálculo del sistema a un pico de 1,64 petaFLOPS, convirtiendo a Jaguar en el primer sistema de petaFLOPS del mundo dedicado a la investigación abierta . A principios de 2009, la supercomputadora recibió el nombre de una criatura mítica, Kraken . Kraken fue declarada la supercomputadora administrada por universidades más rápida del mundo y la sexta más rápida en general en la lista TOP500 de 2009. En 2010, Kraken se actualizó y puede operar más rápido y es más potente.
En 2009, el Cray Jaguar alcanzó 1,75 petaFLOPS, superando al IBM Roadrunner y ocupando el primer puesto en la lista TOP500 . [48]
En octubre de 2010, China presentó la Tianhe-1 , una supercomputadora que opera a una velocidad máxima de cómputo de 2,5 petaFLOPS. [49] [50]
En 2010, [actualizar]el procesador de PC más rápido alcanzó los 109 gigaFLOPS ( Intel Core i7 980 XE ) [51] en cálculos de doble precisión. Las GPU son considerablemente más potentes. Por ejemplo, los procesadores de computación GPU Nvidia Tesla C2050 alcanzan alrededor de 515 gigaFLOPS [52] en cálculos de doble precisión, y el AMD FireStream 9270 alcanza un máximo de 240 gigaFLOPS. [53]
En noviembre de 2011, se anunció que Japón había alcanzado 10,51 petaFLOPS con su computadora K. [54] Tiene 88.128 procesadores SPARC64 VIIIfx en 864 racks , con un rendimiento teórico de 11,28 petaFLOPS. Recibe su nombre de la palabra japonesa "kei", que significa 10 cuatrillones , [55] correspondiente a la velocidad objetivo de 10 petaFLOPS.
El 15 de noviembre de 2011, Intel presentó un único procesador basado en x86, cuyo nombre en código era "Knights Corner", capaz de soportar más de un teraFLOPS en una amplia gama de operaciones DGEMM . Intel destacó durante la demostración que se trataba de un teraFLOPS sostenido (no "teraFLOPS puros" que otros utilizan para obtener números más altos pero menos significativos) y que era el primer procesador de propósito general que alguna vez superaba el teraFLOPS. [56] [57]
El 18 de junio de 2012, el sistema de supercomputadora Sequoia de IBM , con sede en el Laboratorio Nacional Lawrence Livermore (LLNL) de Estados Unidos, alcanzó 16 petaFLOPS, estableciendo un récord mundial y obteniendo el primer lugar en la última lista TOP500. [58]
El 12 de noviembre de 2012, la lista TOP500 certificó a Titan como la supercomputadora más rápida del mundo según el benchmark LINPACK, con 17,59 petaFLOPS. [59] [60] Fue desarrollada por Cray Inc. en el Laboratorio Nacional de Oak Ridge y combina procesadores AMD Opteron con tecnologías de unidad de procesamiento gráfico (GPU) NVIDIA Tesla "Kepler". [61] [62]
El 10 de junio de 2013, la Tianhe-2 de China fue clasificada como la más rápida del mundo con 33,86 petaFLOPS. [63]
El 20 de junio de 2016, el Sunway TaihuLight de China fue clasificado como el más rápido del mundo con 93 petaFLOPS en el benchmark LINPACK (de un total de 125 petaFLOPS pico). El sistema se instaló en el Centro Nacional de Supercomputación en Wuxi y representó un rendimiento mayor que el de los siguientes cinco sistemas más potentes de la lista TOP500 en ese momento combinados. [64]
En junio de 2019, Summit , una supercomputadora construida por IBM que ahora funciona en el Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía (DOE), obtuvo el primer puesto con un rendimiento de 148,6 petaFLOPS en High Performance Linpack (HPL), el parámetro de referencia utilizado para clasificar la lista TOP500. Summit tiene 4356 nodos, cada uno equipado con dos CPU Power9 de 22 núcleos y seis GPU NVIDIA Tesla V100. [65]
En junio de 2022, la Frontier de Estados Unidos fue la supercomputadora más potente del TOP500, alcanzando 1102 petaFlops (1.102 exaFlops) en los puntos de referencia LINPACK. [66]
En noviembre de 2024, la supercomputadora a exaescala El Capitan de los Estados Unidos , alojada en el Laboratorio Nacional Lawrence Livermore en Livermore , desplazó a Frontier como la supercomputadora más rápida del mundo en la 64.a edición del Top500 (noviembre de 2024) .
La computación distribuida utiliza Internet para conectar computadoras personales y lograr más FLOPS:
Fecha | USD aproximado por GFLOPS | Plataforma que ofrece el menor costo por GFLOPS | Comentarios | |
---|---|---|---|---|
Sin ajustar | 2023 [77] | |||
1945 | $1,265 billones | $21.409 billones | ENIAC : $487,000 en 1945 y $8,242,000 en 2023. | $487,000 /0,000 000 385 GFLOPS . Computadora digital electrónica de primera generación ( basada en tubos de vacío ). |
1961 | $18.672 mil millones | $190.38 mil millones | Una instalación básica de un IBM 7030 Stretch tenía un coste en aquel momento de 7,78 millones de dólares cada uno. | El IBM 7030 Stretch realiza una multiplicación de punto flotante cada2,4 microsegundos . [78] Computadora de segunda generación ( basada en transistores ). |
1984 | $18.750.000 | $54,988,789 | Cray X-MP /48 | 15.000.000 dólares/0,8 GFLOPS. Computadora de tercera generación ( basada en circuitos integrados ). |
1997 | $30,000 | $56,940 | Dos clústeres Beowulf de 16 procesadores con microprocesadores Pentium Pro [79] | |
Abril de 2000 | $1,000 | $1,798 | Cúmulo de Beowulf de Bunyip | Bunyip fue el primer sub-Tecnología informática de 1 MFLOPS por dólar estadounidense . Ganó el premio Gordon Bell en 2000. |
Mayo de 2000 | $640 | $1,132 | KLAT2 | KLAT2 fue la primera tecnología informática que se adaptó a grandes aplicaciones sin dejar de ser...1 dólar estadounidense por MFLOPS . [80] |
Agosto de 2003 | $83,86 | $138,9 | KASY0 | KASY0 fue la primera supercomputadora que costó menos de 100 dólares por GFLOPS . KASY0 alcanzó 471 GFLOPS en HPL de 32 bits. Con un costo de menos de 39.500 dólares, es la primera supercomputadora que supera los 100 dólares por GFLOPS. [81] |
Agosto de 2007 | $48,31 | $70,99 | Microlobo | A partir de agosto de 2007, esteSe puede construir un cluster Beowulf "personal" de 26 GFLOPS por $1256. [82] |
Marzo de 2011 | $1,80 | $2,44 | HPU4Ciencia | Este clúster de 30.000 dólares se construyó utilizando únicamente hardware de calidad "para juegos" disponible comercialmente. [83] |
Agosto de 2012 | 75,00¢ | 99,54¢ | Sistema con cuatro procesadores AMD Radeon 7970 | Computadora de escritorio con cuatro procesadores AMD Radeon 7970 que alcanzan 16 TFLOPS de rendimiento computacional de precisión simple y 4 TFLOPS de precisión doble. El costo total del sistema fue de $3000; se construyó utilizando solo hardware disponible comercialmente. [84] |
Junio de 2013 | 21,68¢ | 28,36¢ | Sony PlayStation 4 | Se indica que la Sony PlayStation 4 tiene un rendimiento máximo de1,84 TFLOPS , a un precio de $399 [85] |
Noviembre 2013 | 16,11¢ | 21,07¢ | Sistema AMD Sempron 145 y GeForce GTX 760 | Construido con piezas disponibles comercialmente, un sistema que utiliza un AMD Sempron 145 y tres Nvidia GeForce GTX 760 alcanza un total de6,771 TFLOPS por un coste total de 1.090,66 dólares estadounidenses . [86] |
Diciembre de 2013 | 12,41¢ | 16,23¢ | Sistema Pentium G550 y Radeon R9 290 | Fabricado con piezas disponibles comercialmente. Intel Pentium G550 y AMD Radeon R9 290 alcanzan un máximo de4,848 TFLOPS, un total de 681,84 dólares estadounidenses . [87] |
Enero de 2015 | 7,85¢ | 10,09¢ | Sistema Celeron G1830 y Radeon R9 295X2 | Fabricado con piezas disponibles comercialmente. Intel Celeron G1830 y AMD Radeon R9 295X2 alcanzan un máximo de más de11,5 TFLOPS por un total de 902,57 dólares estadounidenses . [88] [89] |
Junio de 2017 | 6,00¢ | 7,46¢ | Sistema AMD Ryzen 7 1700 y AMD Radeon Vega Frontier Edition | Construido con piezas disponibles comercialmente. La CPU AMD Ryzen 7 1700 combinada con tarjetas AMD Radeon Vega FE en CrossFire alcanza un máximo de más de50 TFLOPS por poco menos de 3.000 dólares estadounidenses para el sistema completo. [90] |
Octubre de 2017 | 2,73¢ | 3,39¢ | Sistema Intel Celeron G3930 y AMD RX Vega 64 | Construido con piezas disponibles comercialmente. Tres tarjetas gráficas AMD RX Vega 64 brindan un poco más de 75 TFLOPS de precisión media (38 TFLOPS SP o 2,6 TFLOPS DP cuando se combinan con la CPU) a un precio de aproximadamente $2050 para el sistema completo. [91] |
Noviembre 2020 | 3,14¢ | 3,7¢ | Sistema AMD Ryzen 3600 y 3 NVIDIA RTX 3080 | AMD Ryzen 3600 a 484 GFLOPS y 199,99 USD 3 NVIDIA RTX 3080 a 29 770 GFLOPS cada una y $699,99 GFLOPS totales del sistema = 89.794 / TFLOPS = 89,794 Costo total del sistema, incluidas piezas realistas pero de bajo costo; en comparación con otro ejemplo = $2839 [92] Dólar estadounidense /GFLOP = $0,0314 |
Noviembre 2020 | 3,88¢ | 4,57¢ | PlayStation 5 | La edición digital de Sony PlayStation 5 está catalogada como una consola con un rendimiento máximo de 10,28 TFLOPS (20,56 TFLOPS con media precisión) a un precio minorista de 399 dólares. [93] |
Noviembre 2020 | 4,11¢ | 4,84¢ | Serie Xbox X | Se indica que la Xbox Series X de Microsoft tiene un rendimiento máximo de 12,15 TFLOPS (24,30 TFLOPS con media precisión) a un precio minorista de $499. [94] |
Septiembre de 2022 | 1,94¢ | 2,02¢ | RTX 4090 | La RTX 4090 de Nvidia tiene un rendimiento máximo de 82,6 TFLOPS (1,32 PFLOPS con precisión de 8 bits) a un precio minorista de $1599. [95] |
Mayo de 2023 | 1,25¢ | 1,25¢ | Radeon RX 7600 | La RX 7600 de AMD tiene un rendimiento máximo de 21,5 TFLOPS a un precio minorista de $269. [96] |
Cualquier investigador de una institución estadounidense puede presentar una propuesta para solicitar una asignación de ciclos en el sistema.