Операций с плавающей точкой в секунду ( FLOPS , флопс или флоп/с ) — это мера производительности компьютера в вычислениях , полезная в областях научных вычислений, требующих вычислений с плавающей точкой . [1]
В таких случаях это более точная мера, чем измерение инструкций в секунду . [ необходима ссылка ]
Имя | Единица | Ценить |
---|---|---|
кило ФЛОПС | кФЛОПС | 10 3 |
мега ФЛОПС | МФЛОПС | 10 6 |
гига ФЛОПС | ГФЛОПС | 10 9 |
тера ФЛОПС | ТФЛОПС | 10 12 |
пета ФЛОПС | ПФЛОПС | 10 15 |
exa ФЛОПС | ЭФЛОПС | 10 18 |
зетта ФЛОПС | ЗФЛОПС | 10 21 |
yotta FLOPS | YFLOPS | 10 24 |
ронна ФЛОПС | RFLOPS | 10 27 |
кветта ФЛОПС | QFLOPS | 10 30 |
Арифметика с плавающей точкой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей точкой похоже на научную запись, за исключением того, что все выполняется в системе счисления с основанием два, а не десять. Схема кодирования сохраняет знак, показатель степени (в системе с основанием два для Cray и VAX , в системе с основанием два или десять для форматов с плавающей точкой IEEE и в системе с основанием 16 для архитектуры с плавающей точкой IBM ) и мантисса (число после запятой ). Хотя используется несколько похожих форматов, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также 64-битных чисел, называемых двойной точностью , и более длинных чисел, называемых расширенной точностью (используется для промежуточных результатов). Представления с плавающей точкой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной точкой, с возможностью представления очень маленьких чисел и очень больших чисел. [2]
Возведение в степень, присущее вычислениям с плавающей точкой, обеспечивает гораздо больший динамический диапазон — наибольшие и наименьшие числа, которые могут быть представлены, — что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно большой диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей точкой идеально подходят для вычислительно интенсивных приложений. [3]
FLOPS и MIPS — единицы измерения численной вычислительной производительности компьютера. Операции с плавающей точкой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов оборудование с плавающей точкой (возможно реализовать арифметику FP в программном обеспечении на любом целочисленном оборудовании) обычно было необязательной функцией, и компьютеры, которые имели ее, назывались «научными компьютерами» или имели возможность « научных вычислений ». Таким образом, единица MIPS была полезна для измерения целочисленной производительности любого компьютера, включая те, у которых не было такой возможности, и для учета различий в архитектуре, аналогичная единица MOPS (миллион операций в секунду) также использовалась еще в 1970 году [4] . Обратите внимание, что помимо целочисленной (или фиксированной) арифметики, примеры целочисленных операций включают перемещение данных (от A до B) или проверку значений (если A = B, то C). Вот почему MIPS как эталон производительности является адекватным показателем, когда компьютер используется для запросов к базам данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [5] [6] В 1974 году Дэвид Кук ввел термины «флопс» и «мегафлопс» для описания производительности суперкомпьютеров того времени по количеству вычислений с плавающей точкой, которые они выполняли в секунду. [7] Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины при выполнении научных задач.
FLOPS в HPC-системе можно рассчитать с помощью следующего уравнения: [8]
Это можно упростить до самого распространенного случая: компьютер, имеющий ровно 1 ЦП:
FLOPS может быть записан в различных единицах измерения точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры по 64-битным ( формат с плавающей точкой двойной точности ) операциям в секунду, сокращенно FP64 . [9] Аналогичные единицы измерения доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.
Микроархитектура | Архитектура набора инструкций | ФП64 | ФП32 | FP16 |
---|---|---|---|---|
Процессор Intel | ||||
Интел 80486 | x87 (32-бит) | ? | 0,128 [11] | ? |
| x87 (32-бит) | ? | 0,5 [11] | ? |
| ММХ (64-бит) | ? | 1 [12] | ? |
Intel P6 Pentium III | SSE (64-бит) | ? | 2 [12] | ? |
Intel NetBurst Pentium 4 (Уилламетт, Нортвуд) | SSE2 (64-бит) | 2 | 4 | ? |
Intel P6 Pentium M | SSE2 (64-бит) | 1 | 2 | ? |
SSE3 (64-бит) | 2 | 4 | ? | |
4 | 8 | ? | ||
Intel Atom ( Боннелл , Солтвелл , Сильвермонт и Голдмонт ) | SSE3 (128-бит) | 2 | 4 | ? |
Intel Sandy Bridge ( Sandy Bridge , Ivy Bridge ) | AVX (256-бит) | 8 | 16 | 0 |
| AVX2 и FMA (256-бит) | 16 | 32 | 0 |
Intel Xeon Phi ( Уголок рыцарей ) | IMCI (512-бит) | 16 | 32 | 0 |
| AVX-512 и FMA (512-бит) | 32 | 64 | 0 |
AMD ЦП | ||||
AMD Бобкэт | AMD64 (64-бит) | 2 | 4 | 0 |
4 | 8 | 0 | ||
AMD K10 | SSE4/4a (128-бит) | 4 | 8 | 0 |
Бульдозер AMD [13] ( Копатель , Паровой каток , Экскаватор ) | 4 | 8 | 0 | |
AVX2 и FMA (128-битное, 256-битное декодирование) [18] | 8 | 16 | 0 | |
AVX2 и FMA (256-бит) | 16 | 32 | 0 | |
ARM-процессор | ||||
ARM Cortex-A7, A9, A15 | ARMv7 | 1 | 8 | 0 |
ARM Cortex-A32, A35 | ARMv8 | 2 | 8 | 0 |
ARM Cortex-A53 , A55 , A57 , [13] A72 , A73 , A75 | ARMv8 | 4 | 8 | 0 |
ARM Cortex-A76 , A77 , A78 | ARMv8 | 8 | 16 | 0 |
ARM Cortex-X1 | ARMv8 | 16 | 32 | ? |
Qualcomm Крайт | ARMv8 | 1 | 8 | 0 |
Qualcomm Kryo (1xx - 3xx) | ARMv8 | 2 | 8 | 0 |
Qualcomm Kryo (4xx - 5xx) | ARMv8 | 8 | 16 | 0 |
Samsung Exynos M1 и M2 | ARMv8 | 2 | 8 | 0 |
Samsung Exynos M3 и M4 | ARMv8 | 3 | 12 | 0 |
IBM PowerPC A2 (Blue Gene/Q) | ? | 8 | 8 (как FP64) | 0 |
Хитачи SH-4 [20] [21] | Ш-4 | 1 | 7 | 0 |
Графический процессор Nvidia | ||||
Nvidia Curie ( серии GeForce 6 и GeForce 7 ) | ПТХ | ? | 8 | ? |
NVIDIA Tesla 2.0 (GeForce GTX 260–295) | ПТХ | ? | 2 | ? |
Nvidia Fermi (только GeForce GTX 465–480, 560 Ti, 570–590) | ПТХ | 1/4 (заблокировано драйвером, 1 аппаратно) | 2 | 0 |
Nvidia Fermi (только Quadro 600–2000) | ПТХ | 1/8 | 2 | 0 |
Nvidia Fermi (только Quadro 4000–7000, Tesla) | ПТХ | 1 | 2 | 0 |
Nvidia Kepler (GeForce (кроме Titan и Titan Black), Quadro (кроме K6000), Tesla K10) | ПТХ | 1/12 (для GK110 : заблокировано драйвером, 2/3 аппаратно) | 2 | 0 |
Nvidia Kepler (GeForce GTX Titan и Titan Black, Quadro K6000, Tesla (кроме K10)) | ПТХ | 2/3 | 2 | 0 |
ПТХ | 1/16 | 2 | 1/32 | |
Nvidia Pascal (только Quadro GP100 и Tesla P100) | ПТХ | 1 | 2 | 4 |
Nvidia Вольта [22] | ПТХ | 1 | 2 ( FP32 ) + 2 ( INT32 ) | 16 |
Nvidia Turing (только GeForce 16XX ) | ПТХ | 1/16 | 2 (FP32) + 2 (INT32) | 4 |
Nvidia Turing (все, кроме GeForce 16XX ) | ПТХ | 1/16 | 2 (FP32) + 2 (INT32) | 16 |
Nvidia Ampere [23] [24] (только Tesla A100/A30) | ПТХ | 2 | 2 (FP32) + 2 (INT32) | 32 |
Nvidia Ampere (все GeForce и Quadro, Tesla A40/A10) | ПТХ | 1/32 | 2 (FP32) + 0 (INT32) или 1 (FP32) + 1 (INT32) | 8 |
AMD графический процессор | ||||
AMD TeraScale 1 ( серия Radeon HD 4000 ) | ТераСкале 1 | 0,4 | 2 | ? |
AMD TeraScale 2 ( серия Radeon HD 5000 ) | ТераСкале 2 | 1 | 2 | ? |
AMD TeraScale 3 ( серия Radeon HD 6000 ) | ТераСкале 3 | 1 | 4 | ? |
AMD GCN (только Radeon Pro W 8100–9100) | ГЦН | 1 | 2 | ? |
AMD GCN (все, кроме Radeon Pro W 8100–9100, Vega 10–20) | ГЦН | 1/8 | 2 | 4 |
AMD GCN Vega 10 | ГЦН | 1/8 | 2 | 4 |
AMD GCN Vega 20 (только Radeon VII) | ГЦН | 1/2 (заблокировано драйвером, 1 аппаратно) | 2 | 4 |
AMD GCN Vega 20 (только Radeon Instinct MI50 / MI60 и Radeon Pro VII) | ГЦН | 1 | 2 | 4 |
РДНК | 1/8 | 2 | 4 | |
AMD RDNA3 | РДНК | 1/8? | 4 | 8? |
AMD CDNA | КДНК | 1 | 4 (Тензор) [27] | 16 |
AMD CDNA 2 | КДНК 2 | 4 (Тензор) | 4 (Тензор) | 16 |
Графический процессор Intel | ||||
Intel Xe-LP (Iris Xe MAX) [28] | Хе | 1/2? | 2 | 4 |
Intel Xe-HPG (Арк Алхимик) [28] | Хе | 0 | 2 | 16 |
Intel Xe-HPC (Понте Веккьо) [29] | Хе | 2 | 2 | 32 |
Графический процессор Qualcomm | ||||
Qualcomm Adreno 5x0 | Адрено 5xx | 1 | 2 | 4 |
Qualcomm Adreno 6x0 | Адрено 6xx | 1 | 2 | 4 |
Графкор | ||||
Графкор Колосс GC2 [30] [31] | ? | 0 | 16 | 64 |
| ? | 0 | 32 | 128 |
Суперкомпьютер | ||||
ENIAC @ 100 кГц в 1945 году | 0,004 [34] (~0,00000003 FLOPS/ Вт ) | |||
48-битный процессор @ 208 кГц в CDC 1604 в 1960 году | ||||
60-битный процессор @ 10 МГц в CDC 6600 в 1964 году | 0,3 (ФП60) | |||
60-битный процессор @ 10 МГц в CDC 7600 в 1967 году | 1.0 (ФП60) | |||
Cray-1 @ 80 МГц в 1976 году | 2 (700 ФЛОПС/Вт) | |||
CDC Cyber 205 @ 50 МГц в 1981 году Компилятор FORTRAN (ANSI 77 с векторными расширениями) | 8 | 16 | ||
Транспьютер IMS T800-20 @ 20 МГц в 1987 году | 0,08 [35] | |||
Parallella E16 @ 1000 МГц в 2012 г. | 2 [36] (5,0 ГФЛОПС/Вт) [37] | |||
Parallella E64 @ 800 МГц в 2012 г. | 2 [38] (50,0 ГФЛОПС/Вт) [37] | |||
Микроархитектура | Архитектура набора инструкций | ФП64 | ФП32 | FP16 |
В июне 1997 года ASCI Red от Intel стал первым в мире компьютером, достигшим одного терафлопса и более. Директор Sandia Билл Кэмп сказал, что ASCI Red имел лучшую надежность среди всех когда-либо созданных суперкомпьютеров и «был высшей точкой суперкомпьютеров по долговечности, цене и производительности». [39]
Суперкомпьютер SX-9 компании NEC стал первым в мире векторным процессором, производительность которого превысила 100 гигаФлопс на одно ядро.
В июне 2006 года японский исследовательский институт RIKEN анонсировал новый компьютер MDGRAPE -3 . Производительность компьютера достигает одного петафлопса, что почти в два раза быстрее, чем у Blue Gene/L, но MDGRAPE-3 не является компьютером общего назначения, поэтому он не появляется в списке Top500.org . Он имеет специализированные конвейеры для моделирования молекулярной динамики.
К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , который достигает 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип может поднять этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [40]
В июне 2007 года сайт Top500.org сообщил, что самым быстрым компьютером в мире является суперкомпьютер IBM Blue Gene/L , пиковая производительность которого составляет 596 терафлопс. [41] Cray XT4 занял второе место с показателем 101,7 терафлопс.
26 июня 2007 года IBM анонсировала второе поколение своего топового суперкомпьютера, названного Blue Gene/P и разработанного для непрерывной работы на скоростях, превышающих один петафлопс, быстрее, чем Blue Gene/L. При соответствующей настройке он может достигать скоростей, превышающих три петафлопса. [42]
25 октября 2007 года корпорация NEC из Японии выпустила пресс-релиз, анонсирующий модель серии SX SX-9 , [43] утверждая, что это самый быстрый в мире векторный суперкомпьютер. SX-9 оснащен первым процессором, способным обеспечить пиковую векторную производительность 102,4 гигаФЛОПС на одно ядро.
4 февраля 2008 года Национальный научный фонд и Техасский университет в Остине начали полномасштабные исследования на суперкомпьютере AMD , Sun под названием Ranger [44] , самой мощной в мире суперкомпьютерной системе для открытых научных исследований, которая работает с постоянной скоростью 0,5 петафлопс.
25 мая 2008 года американский суперкомпьютер, созданный IBM , названный « Roadrunner », достиг вычислительного рубежа в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров за июнь и ноябрь 2008 года (исключая грид-компьютеры ). [45] [46] Компьютер находится в Лос-Аламосской национальной лаборатории в Нью-Мексико. Название компьютера отсылает к птице штата Нью-Мексико , большой дорожной бегунке ( Geococcyx californianus ). [47]
В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которая, как сообщается, стала первым графическим процессором, достигшим одного терафлопса. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770, суммарно достигающими 2,4 терафлопса.
В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Национальной лаборатории Оук-Ридж (ORNL) Министерства энергетики (DOE) увеличила вычислительную мощность системы до пиковых 1,64 петафлопс, что сделало Jaguar первой в мире системой петафлопс, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракен . Кракен был объявлен самым быстрым в мире суперкомпьютером, управляемым университетом, и шестым по скорости в общем списке TOP500 2009 года. В 2010 году Кракен был модернизирован и теперь может работать быстрее и мощнее.
В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, обойдя IBM Roadrunner и заняв первое место в списке TOP500 . [48]
В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, работающий с пиковой скоростью вычислений 2,5 петафлопс. [49] [50]
По состоянию на 2010 год [обновлять]самый быстрый процессор ПК достиг 109 гигаФЛОПС ( Intel Core i7 980 XE ) [51] в вычислениях с двойной точностью. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU выполняют около 515 гигаФЛОПС [52] в вычислениях с двойной точностью, а AMD FireStream 9270 достигает пика в 240 гигаФЛОПС. [53]
В ноябре 2011 года было объявлено , что Япония достигла 10,51 петафлопс с ее компьютером K. [54] Он имеет 88 128 процессоров SPARC64 VIIIfx в 864 стойках с теоретической производительностью 11,28 петафлопс. Он назван в честь японского слова «kei», которое означает 10 квадриллионов , [55] что соответствует целевой скорости 10 петафлопс.
15 ноября 2011 года Intel продемонстрировала один процессор на базе x86 под кодовым названием «Knights Corner», поддерживающий более терафлопса на широком спектре операций DGEMM . Intel подчеркнула во время демонстрации, что это был поддерживаемый терафлопс (а не «сырой терафлопс», используемый другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, когда-либо преодолевший терафлопс. [56] [57]
18 июня 2012 года суперкомпьютерная система Sequoia компании IBM , базирующаяся в Ливерморской национальной лаборатории имени Лоуренса (LLNL), США, достигла производительности в 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [58]
12 ноября 2012 года список TOP500 сертифицировал Titan как самый быстрый в мире суперкомпьютер по результатам теста LINPACK с производительностью 17,59 петафлопс. [59] [60] Он был разработан компанией Cray Inc. в Национальной лаборатории Оук-Ридж и сочетает в себе процессоры AMD Opteron с технологиями графического процессора (GPU) NVIDIA Tesla «Kepler». [61] [62]
10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с производительностью 33,86 петафлопс. [63]
20 июня 2016 года китайская Sunway TaihuLight была признана самой быстрой в мире с 93 петафлопсами на бенчмарке LINPACK (из 125 пиковых петафлопс). Система была установлена в Национальном суперкомпьютерном центре в Уси и показала большую производительность, чем следующие пять самых мощных систем в списке TOP500 в то время вместе взятые. [64]
В июне 2019 года Summit , суперкомпьютер, созданный IBM, который сейчас работает в Национальной лаборатории Оук-Ридж (ORNL) Министерства энергетики (DOE), занял первое место с производительностью 148,6 петафлопс на High Performance Linpack (HPL), бенчмарке, используемом для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [65]
В июне 2022 года американский Frontier стал самым мощным суперкомпьютером в рейтинге TOP500, достигнув 1102 петафлопс (1,102 эксафлопс) в тестах LINPACK. [66]
Распределенные вычисления используют Интернет для связи персональных компьютеров с целью достижения большего количества FLOPS:
Дата | Приблизительная стоимость в долларах США за GFLOPS | Платформа, обеспечивающая самую низкую стоимость за GFLOPS | Комментарии | |
---|---|---|---|---|
Нескорректированный | 2023 [77] | |||
1945 | 130 триллионов долларов | 2 квадриллиона долларов | ENIAC : 487 000 долларов в 1945 году и 7 916 000 долларов в 2022 году. | 487 000 долл. США /0,000 000 385 ГФЛОПС . Электронный цифровой компьютер первого поколения ( на электронных лампах ). |
1961 | 20 миллиардов долларов | 204 миллиарда долларов | Базовая установка IBM 7030 Stretch на тот момент стоила 7,78 млн долларов США за штуку. | IBM 7030 Stretch выполняет одно умножение с плавающей точкой каждые2,4 микросекунды . [78] Компьютер второго поколения ( на транзисторах ). |
1984 | 20 000 000 долларов США | 100 000 000 долларов США | Крэй X-MP /48 | 15 000 000 долларов США /0,8 GFLOPS . Компьютер третьего поколения ( на базе интегральных схем ). |
1997 | 30 000 долларов США | 57 000 долларов США | Два 16-процессорных кластера Beowulf с микропроцессорами Pentium Pro [79] | |
Апрель 2000 г. | 1000 долларов США | 2000 долларов США | Скопление Буньип Беовульф | Буньип был первым под-1 доллар США / Технология вычислений MFLOPS . В 2000 году она получила премию Гордона Белла. |
Май 2000 г. | 640 долларов | 1000 долларов США | КЛАТ2 | KLAT2 была первой вычислительной технологией, которая масштабировалась до больших приложений, оставаясь при этом1 доллар США /МФЛОПС . [80] |
Август 2003 г. | 90 долларов | 100 долларов | KASY0 | KASY0 была первой вычислительной технологией стоимостью менее 100 ГФЛОПС . [81] |
Август 2007 г. | 50 долларов | 70 долларов | Микровульф | По состоянию на август 2007 года это«Персональный» кластер Beowulf мощностью 26 ГФЛОПС можно построить за 1256 долларов. [82] |
Март 2011 г. | 1,80$ | 2$ | HPU4Science | Этот кластер стоимостью 30 000 долларов был построен исключительно с использованием имеющегося в продаже оборудования «игрового» класса. [83] |
Август 2012 г. | 0,75$ | 1 доллар | Система Quad AMD Radeon 7970 | Четырехъядерный настольный компьютер AMD Radeon 7970 , достигающий 16 TFLOPS одинарной точности, 4 TFLOPS двойной точности вычислительной производительности. Общая стоимость системы составила $3000; построена только с использованием коммерчески доступного оборудования. [84] |
Июнь 2013 г. | 0,22$ | 0,3$ | Сони Плейстейшен 4 | Sony PlayStation 4 имеет пиковую производительность1,84 TFLOPS , по цене $400 [85] |
Ноябрь 2013 г. | 0,16$ | 0,21$ | Система AMD Sempron 145 и GeForce GTX 760 | Система, созданная с использованием имеющихся в продаже деталей, включающая один AMD Sempron 145 и три Nvidia GeForce GTX 760, достигает в общей сложности6,771 TFLOPS на общую сумму 1090,66 долларов США . [86] |
Декабрь 2013 г. | 0,12$ | 0,16$ | Система Pentium G550 и Radeon R9 290 | Создан с использованием коммерчески доступных деталей. Intel Pentium G550 и AMD Radeon R9 290 достигают максимума4,848 TFLOPS в общей сложности 681,84 долл. США . [87] |
Январь 2015 г. | 0,08$ | 0,1$ | Система Celeron G1830 и Radeon R9 295X2 | Создан с использованием коммерчески доступных деталей. Intel Celeron G1830 и AMD Radeon R9 295X2 достигают более11,5 TFLOPS на общую сумму 902,57 долл. США . [88] [89] |
Июнь 2017 г. | 0,06$ | 0,07$ | Система AMD Ryzen 7 1700 и AMD Radeon Vega Frontier Edition | Создан с использованием имеющихся в продаже деталей. Процессор AMD Ryzen 7 1700 в сочетании с видеокартами AMD Radeon Vega FE в CrossFire достигает более50 TFLOPS по цене чуть менее 3000 долларов США за полную систему. [90] |
Октябрь 2017 г. | 0,03$ | 0,04$ | Система Intel Celeron G3930 и AMD RX Vega 64 | Построено с использованием коммерчески доступных деталей. Три видеокарты AMD RX Vega 64 обеспечивают чуть более 75 TFLOPS половинной точности (38 TFLOPS SP или 2,6 TFLOPS DP в сочетании с CPU) по цене ~$2050 за полную систему. [91] |
Ноябрь 2020 г. | 0,03$ | 0,03$ | Система AMD Ryzen 3600 и 3× NVIDIA RTX 3080 | AMD Ryzen 3600 @ 484 ГФЛОПС и $199.99 3× NVIDIA RTX 3080 @ 29,770 GFLOPS каждая и $699.99 Общая производительность системы GFLOPS = 89,794 / TFLOPS = 89.2794 Общая стоимость системы, включая реалистичные, но недорогие детали; в сравнении с другим примером = 2839 долл. США [92] Доллар США /ГФЛОП = 0,0314 долл. США |
Ноябрь 2020 г. | 0,04$ | 0,04$ | Плейстейшен 5 | Sony PlayStation 5 Digital Edition имеет пиковую производительность 10,28 TFLOPS (20,58 TFLOPS при половинной точности) по розничной цене 399 долларов США. [93] |
Ноябрь 2020 г. | 0,04$ | 0,04$ | Xbox серии X | Xbox Series X от Microsoft имеет пиковую производительность 12,15 TFLOPS (24,30 TFLOPS при половинной точности) при розничной цене 499 долларов США. [94] |
Сентябрь 2022 г. | 0,02$ | 0,02$ | RTX4090 | Видеокарта Nvidia RTX 4090 имеет пиковую производительность 82,6 TFLOPS (1,32 PFLOPS при 8-битной точности) по розничной цене 1599 долларов США. [95] |
Май 2023 г. | 0,01$ | 0,01$ | Радеон RX 7600 | AMD RX 7600 имеет пиковую производительность 21,5 TFLOPS при розничной цене 269 долларов США. [96] |
Любой исследователь в американском учреждении может подать предложение о выделении циклов в системе.