Operaciones de punto flotante por segundo

Medida del rendimiento del ordenador

Las operaciones de punto flotante por segundo ( FLOPS , flops o flop/s ) son una medida del rendimiento informático , útil en campos de cálculos científicos que requieren cálculos de punto flotante . [ 1]

Para estos casos, es una medida más precisa que medir instrucciones por segundo . [ cita requerida ]

Aritmética de punto flotante

Multiplicadores para flops
NombreUnidadValor
kilo FLOPSkFLOPS10 3
mega -flopsMFLOPS10 6
gigaflopsGFLOPS10 9
tera FLOPSTFLOPS10 12
peta FRACASOSPFLOPS10 15
exa FLOPSEFLOPS10 18
Zetta FRACASOSZFLOPS10 21
Yotta FRACASOSYFLOPS10 24
RONNA FLOPSRFLOPS10 27
Quetta FLOPSQFLOPS10 30

La aritmética de punto flotante es necesaria para números reales muy grandes o muy pequeños , o cálculos que requieren un amplio rango dinámico. La representación de punto flotante es similar a la notación científica, excepto que las computadoras usan base dos (con raras excepciones), en lugar de base diez . El esquema de codificación almacena el signo, el exponente (en base dos para Cray y VAX , base dos o diez para formatos de punto flotante IEEE y base 16 para IBM Floating Point Architecture ) y la mantisa (número después del punto de base ). Si bien se utilizan varios formatos similares, el más común es ANSI/IEEE Std. 754-1985 . Este estándar define el formato para números de 32 bits llamados precisión simple , así como números de 64 bits llamados precisión doble y números más largos llamados precisión extendida (usados ​​para resultados intermedios). Las representaciones de punto flotante pueden admitir un rango mucho más amplio de valores que el punto fijo, con la capacidad de representar números muy pequeños y números muy grandes. [2]

Rango dinámico y precisión

La exponenciación inherente al cálculo de punto flotante asegura un rango dinámico mucho mayor (los números más grandes y más pequeños que se pueden representar), lo que es especialmente importante cuando se procesan conjuntos de datos en los que algunos de los datos pueden tener un rango extremadamente grande de valores numéricos o donde el rango puede ser impredecible. Por lo tanto, los procesadores de punto flotante son ideales para aplicaciones que requieren un uso intensivo de recursos computacionales. [3]

Rendimiento computacional

FLOPS y MIPS son unidades de medida para el rendimiento computacional numérico de una computadora. Las operaciones de punto flotante se usan típicamente en campos como la investigación computacional científica, así como en el aprendizaje automático . Sin embargo, antes de fines de la década de 1980, el hardware de punto flotante (es posible implementar aritmética de punto flotante en software sobre cualquier hardware de números enteros) era típicamente una característica opcional, y se decía que las computadoras que lo tenían eran "computadoras científicas", o que tenían capacidad de " computación científica ". Por lo tanto, la unidad MIPS era útil para medir el rendimiento de números enteros de cualquier computadora, incluidas aquellas sin tal capacidad, y para tener en cuenta las diferencias de arquitectura, también se usaban MOPS (millones de operaciones por segundo) similares ya en 1970 [4] . Tenga en cuenta que además de la aritmética de números enteros (o de punto fijo), los ejemplos de operación de números enteros incluyen el movimiento de datos (A a B) o la prueba de valores (Si A = B, entonces C). Es por eso que el MIPS como punto de referencia de rendimiento es adecuado cuando se utiliza un ordenador en consultas de bases de datos, procesamiento de textos, hojas de cálculo o para ejecutar múltiples sistemas operativos virtuales. [5] [6] En 1974, David Kuck acuñó los términos flops y megaflops para la descripción del rendimiento de las supercomputadoras de la época por el número de cálculos de punto flotante que realizaban por segundo. [7] Esto era mucho mejor que utilizar el MIPS prevaleciente para comparar ordenadores, ya que esta estadística normalmente tenía poca relación con la capacidad aritmética de la máquina en tareas científicas.

FLOPS del superordenador más grande a lo largo del tiempo

Los FLOPS en un sistema HPC se pueden calcular utilizando esta ecuación: [8]

FRACASOS = bastidores × nodos estante × enchufes nodo × núcleos enchufe × ciclos segundo × Fracasos ciclo . {\displaystyle {\text{FLOPS}}={\text{racks}}\times {\frac {\text{nodos}}{\text{rack}}}\times {\frac {\text{sockets}}{\text{nodo}}}\times {\frac {\text{núcleos}}{\text{socket}}}\times {\frac {\text{ciclos}}{\text{segundo}}}\times {\frac {\text{FLOPs}}{\text{ciclo}}}.}

Esto se puede simplificar al caso más común: una computadora que tiene exactamente 1 CPU:

FRACASOS = núcleos × ciclos segundo × Fracasos ciclo . {\displaystyle {\text{FLOPS}}={\text{núcleos}}\times {\frac {\text{ciclos}}{\text{segundo}}}\times {\frac {\text{FLOPs}}{\text{ciclo}}}.}

Los FLOPS se pueden registrar en diferentes medidas de precisión, por ejemplo, la lista de supercomputadoras TOP500 clasifica las computadoras por operaciones de 64 bits ( formato de punto flotante de doble precisión ) por segundo, abreviado como FP64 . [9] Hay medidas similares disponibles para operaciones de 32 bits ( FP32 ) y 16 bits ( FP16 ).

Operaciones de punto flotante por ciclo de reloj para varios procesadores

Operaciones de punto flotante por ciclo de reloj por núcleo [10]
MicroarquitecturaArquitectura del conjunto de instruccionesFP64FP32FP16
Procesador Intel
Intel 80486x87 (32 bits)?0,128 [11]?
x87 (32 bits)?0,5 [11]?
MMX (64 bits)?1 [12]?
Intel P6 Pentium IIISSE (64 bits)?2 [12]?
Procesador Intel NetBurst Pentium 4 (Willamette, Northwood)SSE2 (64 bits)24?
Intel P6 Pentium MSSE2 (64 bits)12?
SSE3 (64 bits)24?
48?
Intel Atom ( Bonnell , Saltwell , Silvermont y Goldmont )SSE3 (128 bits)24?
Puente Sandy de Intel ( Puente Sandy , Puente Ivy )AVX (256 bits)8160
AVX2 y FMA (256 bits)16320
Intel Xeon Phi ( Rincón de los Caballeros )IMCI (512 bits)16320
AVX-512 y FMA (512 bits)32640
Procesador AMD
Bobcat de AMDAMD64 (64 bits)240
480
AMD K10SSE4/4a (128 bits)480
Bulldozer AMD [13] ( Martillo hincador , Apisonadora , Excavadora )
  • AVX (128 bits) (Bulldozer, Steamroller)
  • AVX2 (128 bits) (Excavadora)
  • FMA3 (Bulldozer) [14]
  • FMA3/4 (Hinchador de pilotes, excavadora)
480
  • AMD Zen (serie Ryzen 1000, serie Threadripper 1000, Epyc Naples )
  • AMD Zen+ [13] [15] [16] [17] (serie Ryzen 2000, serie Threadripper 2000)
AVX2 y FMA (decodificación de 128 bits y 256 bits) [18]8160
  • AMD Zen 2 [19] (Serie Ryzen 3000, serie Threadripper 3000, Epyc Rome ))
  • AMD Zen 3 (serie Ryzen 5000, Epyc Milán )
AVX2 y FMA (256 bits)16320
Procesador ARM
ARM Cortex-A7, A9, A15ARMv7180
ARM Cortex-A32, A35ARMv8280
BRAZO Cortex-A53 , A55 , A57 , [13] A72 , A73 , A75ARMv8480
Procesadores ARM Cortex-A76 , A77 y A78ARMv88160
ARM Cortex-X1ARMv81632?
Qualcomm KraitARMv8180
Qualcomm Kryo (1xx - 3xx)ARMv8280
Qualcomm Kryo (4xx - 5xx)ARMv88160
Samsung Exynos M1 y M2ARMv8280
Samsung Exynos M3 y M4ARMv83120
IBM PowerPC A2 (Blue Gene/Q)?88 (como FP64)0
Hitachi SH-4 [20] [21]SH-4170
GPU de Nvidia
Nvidia Curie ( serie GeForce 6 y serie GeForce 7 )PTX?8?
Nvidia Tesla 2.0 (GeForce GTX 260-295)PTX?2?
Nvidia Fermi (solo GeForce GTX 465–480, 560 Ti, 570–590)PTX1/4 (bloqueado por el conductor, 1 en el hardware)20
Nvidia Fermi (sólo Quadro 600–2000)PTX1/820
Nvidia Fermi (solo Quadro 4000–7000, Tesla)PTX120
Nvidia Kepler (GeForce (excepto Titan y Titan Black), Quadro (excepto K6000), Tesla K10)PTX1/12 (para GK110 : bloqueado por el conductor, 2/3 en el hardware)20
Nvidia Kepler (GeForce GTX Titan y Titan Black, Quadro K6000, Tesla (excepto K10))PTX2/320
  • Nvidia Maxwell
  • Nvidia Pascal (todas excepto Quadro GP100 y Tesla P100)
PTX1/1621/32
Nvidia Pascal (solo Quadro GP100 y Tesla P100)PTX124
Nvidia Volta [22]PTX12 ( FP32 ) + 2 ( INT32 )16
Nvidia Turing (solo GeForce 16XX )PTX1/162 (FP32) + 2 (INT32)4
Nvidia Turing (todas excepto GeForce 16XX )PTX1/162 (FP32) + 2 (INT32)16
Nvidia Ampere [23] [24] (solo Tesla A100/A30)PTX22 (FP32) + 2 (INT32)32
Nvidia Ampere (todas las GeForce y Quadro, Tesla A40/A10)PTX1/322 (FP32) + 0 (INT32) o 1 (FP32) + 1 (INT32)8
GPU AMD
AMD TeraScale 1 ( serie Radeon HD 4000 )TeraScale 10,42?
AMD TeraScale 2 ( serie Radeon HD 5000 )TeraScale 212?
AMD TeraScale 3 ( serie Radeon HD 6000 )TeraScale 314?
AMD GCN (solo Radeon Pro W 8100–9100)GCN12?
AMD GCN (todos excepto Radeon Pro W 8100–9100, Vega 10–20)GCN1/824
AMD GCN Vega 10GCN1/824
AMD GCN Vega 20 (solo Radeon VII)GCN1/2 (bloqueado por el conductor, 1 en el hardware)24
AMD GCN Vega 20 (solo Radeon Instinct MI50 / MI60 y Radeon Pro VII)GCN124
ADNr1/824
AMD RDNA3ADNr1/8?48?
ADNc de AMDADNc14 (Tensor) [27]16
CDNA 2 de AMDADNc 24 (Tensor)4 (Tensor)16
GPU Intel
Intel Xe-LP (Iris Xe MAX) [28]Xe1/2?24
Intel Xe-HPG (Alquimista de arco) [28]Xe0216
Intel Xe-HPC (Ponte Vecchio) [29]Xe2232
GPU de Qualcomm
Qualcomm Adreno 5x0Adreno 5xx124
Qualcomm Adreno 6x0Adreno 6xx124
Núcleo gráfico
Graphcore Colossus GC2 [30] [31]?01664
  • Tarjeta gráfica Graphcore Colossus GC200 Mk2 [32]
  • Arco Graphcore-2000 [33]
?032128
Supercomputadora
ENIAC a 100 kHz en 19450,004 [34] (~0,00000003 FLOPS/ W )
Procesador de 48 bits a 208 kHz en CDC 1604 en 1960
Procesador de 60 bits a 10 MHz en CDC 6600 en 19640,3 (FP60)
Procesador de 60 bits a 10 MHz en CDC 7600 en 19671.0 (FP60)
Cray-1 a 80 MHz en 19762 (700 FLOPS/W)
CDC Cyber ​​205 a 50 MHz en 1981

Compilador FORTRAN (ANSI 77 con extensiones vectoriales)

816
Transputador IMS T800-20 a 20 MHz en 19870,08 [35]
Paralelo E16 @ 1000 MHz en 20122 [36] (5,0 GFLOPS/W) [37]
Paralelo E64 a 800 MHz en 20122 [38] (50,0 GFLOPS/W) [37]
MicroarquitecturaArquitectura del conjunto de instruccionesFP64FP32FP16

Récords de rendimiento

Registros de computadora individuales

En junio de 1997, el ASCI Red de Intel fue el primer ordenador del mundo en alcanzar un teraFLOPS o más. Bill Camp, director de Sandia, afirmó que el ASCI Red tenía la mayor fiabilidad de cualquier superordenador jamás construido y "era el punto más alto de la supercomputación en cuanto a longevidad, precio y rendimiento". [39]

La supercomputadora SX-9 de NEC fue el primer procesador vectorial del mundo en superar los 100 gigaFLOPS por núcleo individual.

En junio de 2006, el instituto de investigación japonés RIKEN anunció un nuevo ordenador , el MDGRAPE-3 . El rendimiento del ordenador alcanza un petaFLOPS, casi dos veces más rápido que el Blue Gene/L, pero el MDGRAPE-3 no es un ordenador de uso general, por lo que no aparece en la lista Top500.org . Tiene canales de simulación de dinámica molecular especiales .

En 2007, Intel Corporation presentó el chip experimental multinúcleo POLARIS , que alcanza 1 teraFLOPS a 3,13 GHz. El chip de 80 núcleos puede elevar este resultado a 2 teraFLOPS a 6,26 GHz, aunque la disipación térmica a esta frecuencia supera los 190 vatios. [40]

En junio de 2007, Top500.org informó que la supercomputadora IBM Blue Gene/L era la más rápida del mundo , con un pico de 596 teraFLOPS. [41] La Cray XT4 alcanzó el segundo puesto con 101,7 teraFLOPS.

El 26 de junio de 2007, IBM anunció la segunda generación de su supercomputadora de gama alta, denominada Blue Gene/P y diseñada para funcionar de forma continua a velocidades superiores a un petaFLOPS, más rápida que la Blue Gene/L. Cuando se configura para ello, puede alcanzar velocidades superiores a tres petaFLOPS. [42]

El 25 de octubre de 2007, NEC Corporation de Japón emitió un comunicado de prensa en el que anunciaba su modelo SX-9 de la serie SX , [43] afirmando que era la supercomputadora vectorial más rápida del mundo. La SX-9 cuenta con la primera CPU capaz de alcanzar un rendimiento vectorial máximo de 102,4 gigaFLOPS por núcleo único.

El 4 de febrero de 2008, la NSF y la Universidad de Texas en Austin abrieron pruebas de investigación a gran escala en una supercomputadora AMD y Sun llamada Ranger , [44] el sistema de supercomputación más poderoso del mundo para investigación científica abierta, que opera a una velocidad sostenida de 0,5 petaFLOPS.

El 25 de mayo de 2008, una supercomputadora estadounidense construida por IBM , llamada Roadrunner , alcanzó el hito computacional de un petaFLOPS. Encabezó la lista TOP500 de junio de 2008 y noviembre de 2008 de las supercomputadoras más poderosas (excluyendo las computadoras de red ). [45] [46] La computadora está ubicada en el Laboratorio Nacional de Los Álamos en Nuevo México. El nombre de la computadora hace referencia al ave del estado de Nuevo México , el correcaminos mayor ( Geococcyx californianus ). [47]

En junio de 2008, AMD lanzó la serie ATI Radeon HD 4800, que según se informa son las primeras GPU que alcanzan un teraFLOPS. El 12 de agosto de 2008, AMD lanzó la tarjeta gráfica ATI Radeon HD 4870X2 con dos GPU Radeon R770 que suman un total de 2,4 teraFLOPS.

En noviembre de 2008, una actualización de la supercomputadora Cray Jaguar en el Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía (DOE) elevó la potencia de cálculo del sistema a un pico de 1,64 petaFLOPS, convirtiendo a Jaguar en el primer sistema de petaFLOPS del mundo dedicado a la investigación abierta . A principios de 2009, la supercomputadora recibió el nombre de una criatura mítica, Kraken . Kraken fue declarada la supercomputadora administrada por universidades más rápida del mundo y la sexta más rápida en general en la lista TOP500 de 2009. En 2010, Kraken se actualizó y puede operar más rápido y es más potente.

En 2009, el Cray Jaguar alcanzó 1,75 petaFLOPS, superando al IBM Roadrunner y ocupando el primer puesto en la lista TOP500 . [48]

En octubre de 2010, China presentó la Tianhe-1 , una supercomputadora que opera a una velocidad máxima de cómputo de 2,5 petaFLOPS. [49] [50]

En 2010, [actualizar]el procesador de PC más rápido alcanzó los 109 gigaFLOPS ( Intel Core i7 980 XE ) [51] en cálculos de doble precisión. Las GPU son considerablemente más potentes. Por ejemplo, los procesadores de computación GPU Nvidia Tesla C2050 alcanzan alrededor de 515 gigaFLOPS [52] en cálculos de doble precisión, y el AMD FireStream 9270 alcanza un máximo de 240 gigaFLOPS. [53]

En noviembre de 2011, se anunció que Japón había alcanzado 10,51 petaFLOPS con su computadora K. [54] Tiene 88.128 procesadores SPARC64 VIIIfx en 864 racks , con un rendimiento teórico de 11,28 petaFLOPS. Recibe su nombre de la palabra japonesa "kei", que significa 10 cuatrillones , [55] correspondiente a la velocidad objetivo de 10 petaFLOPS.

El 15 de noviembre de 2011, Intel presentó un único procesador basado en x86, cuyo nombre en código era "Knights Corner", capaz de soportar más de un teraFLOPS en una amplia gama de operaciones DGEMM . Intel destacó durante la demostración que se trataba de un teraFLOPS sostenido (no "teraFLOPS puros" que otros utilizan para obtener números más altos pero menos significativos) y que era el primer procesador de propósito general que alguna vez superaba el teraFLOPS. [56] [57]

El 18 de junio de 2012, el sistema de supercomputadora Sequoia de IBM , con sede en el Laboratorio Nacional Lawrence Livermore (LLNL) de Estados Unidos, alcanzó 16 petaFLOPS, estableciendo un récord mundial y obteniendo el primer lugar en la última lista TOP500. [58]

El 12 de noviembre de 2012, la lista TOP500 certificó a Titan como la supercomputadora más rápida del mundo según el benchmark LINPACK, con 17,59 petaFLOPS. [59] [60] Fue desarrollada por Cray Inc. en el Laboratorio Nacional de Oak Ridge y combina procesadores AMD Opteron con tecnologías de unidad de procesamiento gráfico (GPU) NVIDIA Tesla "Kepler". [61] [62]

El 10 de junio de 2013, la Tianhe-2 de China fue clasificada como la más rápida del mundo con 33,86 petaFLOPS. [63]

El 20 de junio de 2016, el Sunway TaihuLight de China fue clasificado como el más rápido del mundo con 93 petaFLOPS en el benchmark LINPACK (de un total de 125 petaFLOPS pico). El sistema se instaló en el Centro Nacional de Supercomputación en Wuxi y representó un rendimiento mayor que el de los siguientes cinco sistemas más potentes de la lista TOP500 en ese momento combinados. [64]

En junio de 2019, Summit , una supercomputadora construida por IBM que ahora funciona en el Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía (DOE), obtuvo el primer puesto con un rendimiento de 148,6 petaFLOPS en High Performance Linpack (HPL), el parámetro de referencia utilizado para clasificar la lista TOP500. Summit tiene 4356 nodos, cada uno equipado con dos CPU Power9 de 22 núcleos y seis GPU NVIDIA Tesla V100. [65]

En junio de 2022, la Frontier de Estados Unidos fue la supercomputadora más potente del TOP500, alcanzando 1102 petaFlops (1.102 exaFlops) en los puntos de referencia LINPACK. [66]

En noviembre de 2024, la supercomputadora a exaescala El Capitan de los Estados Unidos , alojada en el Laboratorio Nacional Lawrence Livermore en Livermore , desplazó a Frontier como la supercomputadora más rápida del mundo en la 64.a edición del Top500 (noviembre de 2024) .

Registros de computación distribuida

La computación distribuida utiliza Internet para conectar computadoras personales y lograr más FLOPS:

  • A partir de abril de 2020 [actualizar], la red Folding@home tiene más de 2,3 exaFLOPS de potencia informática total. [67] [68] [69] [70] Es la red informática distribuida más potente, siendo la primera en superar 1 exaFLOPS de potencia informática total. Este nivel de rendimiento se posibilita principalmente gracias al esfuerzo acumulativo de una amplia gama de potentes unidades de GPU y CPU . [71]
  • A diciembre de 2020 [actualizar], toda la red BOINC promedia alrededor de 31 petaFLOPS. [72]
  • A junio de 2018 [actualizar], SETI@home , que emplea la plataforma de software BOINC , tiene un promedio de 896 teraFLOPS. [73]
  • A partir de junio de 2018 [actualizar], Einstein@Home , un proyecto que utiliza la red BOINC , procesa 3 petaFLOPS. [74]
  • A partir de junio de 2018 [actualizar], MilkyWay@home , utilizando la infraestructura BOINC , calcula 847 teraFLOPS. [75]
  • A partir de junio de 2020 [actualizar], GIMPS , que busca números primos de Mersenne , mantiene 1354 teraFLOPS. [76]

Costo de la computación

Costos de hardware

FechaUSD aproximado por GFLOPSPlataforma que ofrece el menor costo por GFLOPSComentarios
Sin ajustar2023 [77]
1945$1,265 billones$21.409 billonesENIAC : $487,000 en 1945 y $8,242,000 en 2023.$487,000 /0,000 000 385  GFLOPS . Computadora digital electrónica de primera generación ( basada en tubos de vacío ).
1961$18.672 mil millones$190.38 mil millonesUna instalación básica de un IBM 7030 Stretch tenía un coste en aquel momento de 7,78 millones de dólares cada uno.El IBM 7030 Stretch realiza una multiplicación de punto flotante cada2,4  microsegundos . [78] Computadora de segunda generación ( basada en transistores ).
1984$18.750.000$54,988,789Cray X-MP /4815.000.000 dólares/0,8 GFLOPS. Computadora de tercera generación ( basada en circuitos integrados ).
1997$30,000$56,940Dos clústeres Beowulf de 16 procesadores con microprocesadores Pentium Pro [79]
Abril de 2000$1,000$1,798Cúmulo de Beowulf de BunyipBunyip fue el primer sub-Tecnología informática de 1 MFLOPS por dólar estadounidense . Ganó el premio Gordon Bell en 2000.
Mayo de 2000$640$1,132KLAT2KLAT2 fue la primera tecnología informática que se adaptó a grandes aplicaciones sin dejar de ser...1 dólar estadounidense por MFLOPS . [80]
Agosto de 2003$83,86$138,9KASY0KASY0 fue la primera supercomputadora que costó menos de 100 dólares por GFLOPS . KASY0 alcanzó 471 GFLOPS en HPL de 32 bits. Con un costo de menos de 39.500 dólares, es la primera supercomputadora que supera los 100 dólares por GFLOPS. [81]
Agosto de 2007$48,31$70,99MicroloboA partir de agosto de 2007, esteSe puede construir un cluster Beowulf "personal" de 26 GFLOPS por $1256. [82]
Marzo de 2011$1,80$2,44HPU4CienciaEste clúster de 30.000 dólares se construyó utilizando únicamente hardware de calidad "para juegos" disponible comercialmente. [83]
Agosto de 201275,00¢99,54¢Sistema con cuatro procesadores AMD Radeon 7970Computadora de escritorio con cuatro procesadores AMD Radeon 7970 que alcanzan 16 TFLOPS de rendimiento computacional de precisión simple y 4 TFLOPS de precisión doble. El costo total del sistema fue de $3000; se construyó utilizando solo hardware disponible comercialmente. [84]
Junio ​​de 201321,68¢28,36¢Sony PlayStation 4Se indica que la Sony PlayStation 4 tiene un rendimiento máximo de1,84  TFLOPS , a un precio de $399 [85]
Noviembre 201316,11¢21,07¢Sistema AMD Sempron 145 y GeForce GTX 760Construido con piezas disponibles comercialmente, un sistema que utiliza un AMD Sempron 145 y tres Nvidia GeForce GTX 760 alcanza un total de6,771 TFLOPS por un coste total de 1.090,66 dólares estadounidenses . [86]
Diciembre de 201312,41¢16,23¢Sistema Pentium G550 y Radeon R9 290Fabricado con piezas disponibles comercialmente. Intel Pentium G550 y AMD Radeon R9 290 alcanzan un máximo de4,848 TFLOPS, un total de 681,84 dólares estadounidenses . [87]
Enero de 20157,85¢10,09¢Sistema Celeron G1830 y Radeon R9 295X2Fabricado con piezas disponibles comercialmente. Intel Celeron G1830 y AMD Radeon R9 295X2 alcanzan un máximo de más de11,5 TFLOPS por un total de 902,57 dólares estadounidenses . [88] [89]
Junio ​​de 20176,00¢7,46¢Sistema AMD Ryzen 7 1700 y AMD Radeon Vega Frontier EditionConstruido con piezas disponibles comercialmente. La CPU AMD Ryzen 7 1700 combinada con tarjetas AMD Radeon Vega FE en CrossFire alcanza un máximo de más de50 TFLOPS por poco menos de 3.000 dólares estadounidenses para el sistema completo. [90]
Octubre de 20172,73¢3,39¢Sistema Intel Celeron G3930 y AMD RX Vega 64Construido con piezas disponibles comercialmente. Tres tarjetas gráficas AMD RX Vega 64 brindan un poco más de 75 TFLOPS de precisión media (38 TFLOPS SP o 2,6 TFLOPS DP cuando se combinan con la CPU) a un precio de aproximadamente $2050 para el sistema completo. [91]
Noviembre 20203,14¢3,7¢Sistema AMD Ryzen 3600 y 3 NVIDIA RTX 3080AMD Ryzen 3600 a 484 GFLOPS y 199,99 USD

3 NVIDIA RTX 3080 a 29 770 GFLOPS cada una y $699,99

GFLOPS totales del sistema = 89.794 / TFLOPS = 89,794

Costo total del sistema, incluidas piezas realistas pero de bajo costo; en comparación con otro ejemplo = $2839 [92]

Dólar estadounidense /GFLOP = $0,0314

Noviembre 20203,88¢4,57¢PlayStation 5La edición digital de Sony PlayStation 5 está catalogada como una consola con un rendimiento máximo de 10,28 TFLOPS (20,56 TFLOPS con media precisión) a un precio minorista de 399 dólares. [93]
Noviembre 20204,11¢4,84¢Serie Xbox XSe indica que la Xbox Series X de Microsoft tiene un rendimiento máximo de 12,15 TFLOPS (24,30 TFLOPS con media precisión) a un precio minorista de $499. [94]
Septiembre de 20221,94¢2,02¢RTX 4090La RTX 4090 de Nvidia tiene un rendimiento máximo de 82,6 TFLOPS (1,32 PFLOPS con precisión de 8 bits) a un precio minorista de $1599. [95]
Mayo de 20231,25¢1,25¢Radeon RX 7600La RX 7600 de AMD tiene un rendimiento máximo de 21,5 TFLOPS a un precio minorista de $269. [96]


Véase también

Referencias

  1. ^ "Comprender las medidas de rendimiento de supercomputadoras y la capacidad del sistema de almacenamiento". kb.iu.edu . Consultado el 23 de marzo de 2024 .
  2. ^ Punto flotante. Recuperado el 25 de diciembre de 2009.
  3. ^ Resumen: Punto fijo (entero) vs. punto flotante Archivado el 31 de diciembre de 2009 en Wayback Machine . Consultado el 25 de diciembre de 2009.
  4. ^ Nota técnica de la NASA. Administración Nacional de Aeronáutica y del Espacio. 1970.
  5. ^ Punto fijo versus punto flotante. Recuperado el 25 de diciembre de 2009.
  6. ^ Manipulación de datos y cálculo matemático. Recuperado el 25 de diciembre de 2009.
  7. ^ Kuck, DJ (1974). Fundamentos de la capacidad de los sistemas informáticos. Departamento de Comercio de los Estados Unidos, Oficina Nacional de Normas.
  8. ^ ""Nodes, Sockets, Cores and FLOPS, Oh, My" por el Dr. Mark R. Fernandez, Ph.D." Archivado desde el original el 13 de febrero de 2019 . Consultado el 12 de febrero de 2019 .
  9. ^ "PREGUNTAS FRECUENTES". top500.org . Consultado el 23 de junio de 2020 .
  10. ^ "Operaciones de punto flotante por segundo (FLOPS)".
  11. ^ desde "home.iae.nl".
  12. ^ ab "Poder computacional a lo largo de la historia". alternativewars.com . Consultado el 13 de febrero de 2021 .
  13. ^ abcde Dolbeau, Romain (2017). "FLOPS pico teóricos por conjunto de instrucciones: un tutorial". Revista de supercomputación . 74 (3): 1341–1377. doi :10.1007/s11227-017-2177-5. S2CID  3540951.
  14. ^ "Nuevas instrucciones de soporte para Bulldozer (FMA3) y Piledriver (FMA3+4 y CVT, BMI, TBM)" (PDF) .
  15. ^ "Blog de CPU de Agner: resultados de las pruebas de AMD Ryzen".
  16. ^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ "cada núcleo ahora tiene un par de unidades FMA de 128 bits propias"
  17. ^ Mike Clark (23 de agosto de 2016). Una nueva arquitectura de núcleo x86 para la próxima generación de computación (PDF) . HotChips 28. AMD. Archivado desde el original (PDF) el 31 de julio de 2020. Consultado el 8 de octubre de 2017 .Página 7
  18. ^ "La microarquitectura de las CPU Intel y AMD" (PDF) .
  19. ^ "Discurso inaugural de Lisa Su, directora ejecutiva de AMD, en COMPUTEX 2019". youtube.com . 27 de mayo de 2019. Archivado desde el original el 11 de diciembre de 2021.
  20. ^ "Sistemas de entretenimiento y procesador de alto rendimiento SH-4" (PDF) . Hitachi Review . 48 (2). Hitachi : 58–63. 1999 . Consultado el 21 de junio de 2019 .
  21. ^ "Arquitectura DSP de próxima generación SH-4 para VoIP" (PDF) . Hitachi . 2000 . Consultado el 21 de junio de 2019 .
  22. ^ "Dentro de Volta: la GPU para centros de datos más avanzada del mundo". 10 de mayo de 2017.
  23. ^ "Arquitectura Ampere de NVIDIA en profundidad". 14 de mayo de 2020.
  24. ^ "Las GPU NVIDIA A100 impulsan el centro de datos moderno". NVIDIA .
  25. ^ Schilling, Andreas (10 de junio de 2019). "Die RDNA-Architektur - Página 2". Hardwareluxx .
  26. ^ "Especificaciones de la AMD Radeon RX 5700 XT". TechPowerUp .
  27. ^ "Acelerador AMD Instinct MI100".
  28. ^ ab "Introducción a la arquitectura Xe-HPG".
  29. ^ "GPU Intel Data Center Max". 9 de noviembre de 2022.
  30. ^ "250 TFLOPs/s para dos chips con precisión mixta FP16". youtube.com . 26 de octubre de 2018.
  31. ^ Archivado en Ghostarchive y Wayback Machine: "Estimación a través del consumo de energía de que FP32 es 1/4 de FP16 y que la frecuencia de reloj es inferior a 1,5 GHz". youtube.com . 25 de octubre de 2017.
  32. ^ Archivado en Ghostarchive y Wayback Machine: "Presentación de los sistemas IPU Mk2 de Graphcore". youtube.com . 15 de julio de 2020.
  33. ^ "Máquina IPU Bow-2000". docs.graphcore.ai/ .
  34. ^ ENIAC]] a 100 kHz con 385 Flops "Computadoras de antaño". clear.rice.edu . Consultado el 26 de febrero de 2021 .
  35. ^ "Arquitectura del IMS T800". transputer.net . Consultado el 28 de diciembre de 2023 .
  36. ^ Microprocesador Epiphany-III de 16 núcleos y 65 nm (E16G301) // admin (19 de agosto de 2012)
  37. ^ ab Feldman, Michael (22 de agosto de 2012). "Adapteva presenta un chip de 64 núcleos". HPCWire . Consultado el 3 de septiembre de 2014 .
  38. ^ Microprocesador Epiphany-IV de 64 núcleos y 28 nm (E64G401) // admin (19 de agosto de 2012)
  39. ^ "ASCI Red de Sandia, la primera supercomputadora de teraflop del mundo, está fuera de servicio" (PDF) . Archivado desde el original (PDF) el 5 de noviembre de 2010. Consultado el 17 de noviembre de 2011 .
  40. ^ Richard Swinburne (30 de abril de 2007). "La llegada de la computación en teraflop". bit-tech.net . Consultado el 9 de febrero de 2012 .
  41. ^ "Publicada la 29.ª lista TOP500 de las supercomputadoras más rápidas del mundo". Top500.org . 23 de junio de 2007. Archivado desde el original el 9 de mayo de 2008. Consultado el 8 de julio de 2008 .
  42. ^ "Junio ​​de 2008". TOP500 . Consultado el 8 de julio de 2008 .
  43. ^ "NEC lanza la supercomputadora vectorial más rápida del mundo, SX-9". NEC. 25 de octubre de 2007. Consultado el 8 de julio de 2008 .
  44. ^ "University of Texas at Austin, Texas Advanced Computing Center". Archivado desde el original el 1 de agosto de 2009. Consultado el 13 de septiembre de 2010. Cualquier investigador de una institución estadounidense puede presentar una propuesta para solicitar una asignación de ciclos en el sistema.
  45. ^ Sharon Gaudin (9 de junio de 2008). "IBM's Roadrunner smashes 4-minute mile of supercomputing". Computerworld. Archivado desde el original el 24 de diciembre de 2008. Consultado el 10 de junio de 2008 .
  46. ^ "Austin ISC08". Top500.org. 14 de noviembre de 2008. Archivado desde el original el 22 de febrero de 2012. Consultado el 9 de febrero de 2012 .
  47. ^ Fildes, Jonathan (9 de junio de 2008). «Supercomputer sets petaflop pace» (Supercomputadora establece ritmo de petaflop). BBC News . Consultado el 8 de julio de 2008 .
  48. ^ Greenberg, Andy (16 de noviembre de 2009). "Cray destrona a IBM en supercomputación". Forbes .
  49. ^ "China se proclama campeona de las supercomputadoras". BBC News. 28 de octubre de 2010.
  50. ^ Dillow, Clay (28 de octubre de 2010). "China presenta una supercomputadora de 2507 petaflops, la más rápida del mundo". Popsci.com . Consultado el 9 de febrero de 2012 .
  51. ^ "Intel Core i7-980X Extreme Edition: ¿listo para obtener puntajes increíbles?: Matemáticas: Sandra Aritmética, Criptografía, Microsoft Excel". Techgage . 10 de marzo de 2010 . Consultado el 9 de febrero de 2012 .
  52. ^ "Supercomputadora personal NVIDIA Tesla". Nvidia.com . Consultado el 9 de febrero de 2012 .
  53. ^ "Acelerador de cómputo GPU AMD FireStream 9270". Amd.com . Consultado el 9 de febrero de 2012 .
  54. ^ "El 'ordenador K' alcanza su objetivo de 10 petaflops". Fujitsu.com . Consultado el 9 de febrero de 2012 .
  55. ^ Ver números japoneses
  56. ^ "El rincón de los caballeros de Intel: coprocesador de 22 nm con más de 50 núcleos". 16 de noviembre de 2011. Consultado el 16 de noviembre de 2011 .
  57. ^ "Intel presenta 1 TFLOP/s Knight's Corner" . Consultado el 16 de noviembre de 2011 .
  58. ^ Clark, Don (18 de junio de 2012). «IBM Computer Sets Speed ​​Record». The Wall Street Journal . Consultado el 18 de junio de 2012 .
  59. ^ "La supercomputadora estadounidense Titan es la más rápida del mundo". BBC. 12 de noviembre de 2012. Consultado el 28 de febrero de 2013 .
  60. ^ "Oak Ridge ocupa el primer puesto en la última lista TOP500 con Titan | TOP500 Supercomputer Sites". Top500.org. 12 de noviembre de 2012. Consultado el 28 de febrero de 2013 .
  61. ^ Montalbano, Elizabeth (11 de octubre de 2011). «Oak Ridge Labs construye la supercomputadora más rápida». Informationweek . Consultado el 9 de febrero de 2012 .
  62. ^ Tibken, Shara (29 de octubre de 2012). "La supercomputadora Titan debuta para la investigación científica abierta | Cutting Edge". News.CNet.com . Consultado el 28 de febrero de 2013 .
  63. ^ "La supercomputadora china es ahora la más rápida del mundo, por mucho". Revista Forbes . 17 de junio de 2013. Consultado el 17 de junio de 2013 .
  64. ^ Feldman, Michael. "China avanza en la lista TOP500 de supercomputadoras y pone fin a la supremacía estadounidense". Top500.org . Consultado el 31 de diciembre de 2016 .
  65. ^ "Junio ​​de 2018". Top500.org . Consultado el 17 de julio de 2018 .
  66. ^ "TOP500".
  67. ^ "CPU y GPU activas de Folding@Home por SO". Foldingathome.org . Consultado el 8 de abril de 2020 .
  68. ^ Folding@home (25 de marzo de 2020). "Gracias a nuestra INCREÍBLE comunidad, ¡hemos cruzado la barrera de exaFLOP! Eso es más de 1.000.000.000.000.000.000 de operaciones por segundo, lo que nos hace aproximadamente 10 veces más rápidos que IBM Summit. pic.twitter.com/mPMnb4xdH3". @foldingathome . Consultado el 4 de abril de 2020 .
  69. ^ "Folding@Home supera la barrera de la exaescala, ahora más rápido que docenas de supercomputadoras - ExtremeTech". extremetech.com . Consultado el 4 de abril de 2020 .
  70. ^ "Folding@Home supera los 1,5 ExaFLOPS en la batalla contra el Covid-19". TechSpot . 26 de marzo de 2020 . Consultado el 4 de abril de 2020 .
  71. ^ "El apoyo de Sony Computer Entertainment al proyecto Folding@home en PlayStation™3 recibe este año el premio "Good Design Gold Award"" (Nota de prensa). Sony Computer Entertainment Inc. 6 de noviembre de 2008. Archivado desde el original el 31 de enero de 2009 . Consultado el 11 de diciembre de 2008 .
  72. ^ "PODER COMPUTACIONAL DE BOINC". BOINC . Consultado el 28 de diciembre de 2020 .
  73. ^ "Descripción general del crédito SETI@Home". BOINC . Consultado el 15 de junio de 2018 .
  74. ^ "Descripción general de Einstein@Home Credit". BOINC . Consultado el 15 de junio de 2018 .
  75. ^ "Descripción general del crédito MilkyWay@Home". BOINC . Consultado el 15 de junio de 2018 .
  76. ^ "Tecnología informática distribuida de servidores PrimeNet de Internet para la gran búsqueda de Mersenne Prime en Internet". GIMPS . Consultado el 15 de junio de 2018 .
  77. ^ 1634–1699: McCusker, JJ (1997). ¿Cuánto es eso en dinero real? Un índice de precios histórico para su uso como deflactor de valores monetarios en la economía de los Estados Unidos: adiciones y correcciones (PDF) . American Antiquarian Society .1700–1799: McCusker, JJ (1992). ¿Cuánto es eso en dinero real? Un índice de precios histórico para su uso como deflactor de valores monetarios en la economía de los Estados Unidos (PDF) . American Antiquarian Society .1800–presente: Banco de la Reserva Federal de Minneapolis. «Índice de precios al consumidor (estimación) 1800–» . Consultado el 29 de febrero de 2024 .
  78. ^ "El IBM 7030 (STRETCH)". Norman Hardy . Consultado el 24 de febrero de 2017 .
  79. ^ "Loki y Hyglac". Loki-www.lanl.gov. 13 de julio de 1997. Archivado desde el original el 21 de julio de 2011. Consultado el 9 de febrero de 2012 .
  80. ^ "Kentucky Linux Athlon Testbed 2 (KLAT2)". The Aggregate . Consultado el 9 de febrero de 2012 .
  81. ^ "Haveland-Robinson Associates - Página de inicio". Haveland-Robinson Associates . 23 de agosto de 2003 . Consultado el 14 de noviembre de 2024 .
  82. ^ "Microwulf: un cluster personal y portátil de Beowulf". Archivado desde el original el 12 de septiembre de 2007. Consultado el 9 de febrero de 2012 .
  83. ^ Adam Stevenson, Yann Le Du y Mariem El Afrit. "Computación de alto rendimiento en PC para gamers". Ars Technica . 31 de marzo de 2011.
  84. ^ Tom Logan (9 de enero de 2012). "Reseña de la cámara HD7970 Quadfire Eyefinity". OC3D.net .
  85. ^ "Sony desata una guerra de precios con la PS4 a 399 dólares". CNBC . 11 de junio de 2013.
  86. ^ "FreezePage". Archivado desde el original el 16 de noviembre de 2013. Consultado el 9 de mayo de 2020 .
  87. ^ "FreezePage". Archivado desde el original el 19 de diciembre de 2013. Consultado el 9 de mayo de 2020 .
  88. ^ "FreezePage". Archivado desde el original el 10 de enero de 2015. Consultado el 9 de mayo de 2020 .
  89. ^ "Revisión de la Radeon R9 295X2 de 8 GB: Project Hydra obtiene refrigeración líquida". 8 de abril de 2014.
  90. ^ Pérez, Carol E. (13 de julio de 2017). "Construcción de una caja de aprendizaje profundo AMD Vega de 50 teraflops por menos de 3000 dólares". Intuition Machine . Consultado el 26 de julio de 2017 .
  91. ^ "lowest_$/fp16 - Lista de piezas guardadas de mattebaughman - Celeron G3930 2.9GHz Dual-Core, Radeon RX VEGA 64 8GB (3-Way CrossFire), XON-350_BK ATX Mid Tower". pcpartpicker.com . Consultado el 13 de septiembre de 2017 .
  92. ^ "System Builder". pcpartpicker.com . Consultado el 7 de diciembre de 2020 .
  93. ^ "Especificaciones de la GPU de AMD Playstation 5". techpowerup.com . Consultado el 12 de mayo de 2021 .
  94. ^ "Xbox Series X | Xbox". xbox.com . Consultado el 21 de septiembre de 2021 .
  95. ^ "Nvidia anuncia que la RTX 4090 llegará el 12 de octubre y la RTX 4080 más adelante". tomshardware.com . 20 de septiembre de 2022 . Consultado el 20 de septiembre de 2022 .
  96. ^ "Revisión de AMD Radeon RX 7600: actualizaciones incrementales". tomshardware.com . 24 de mayo de 2023 . Consultado el 24 de mayo de 2023 .
Obtenido de "https://es.wikipedia.org/w/index.php?title=Operaciones_de_punto_flotante_por_segundo&oldid=1261511167"