Операций с плавающей точкой в ​​секунду

Мера производительности компьютера

Операций с плавающей точкой в ​​секунду ( FLOPS , флопс или флоп/с ) — это мера производительности компьютера в вычислениях , полезная в областях научных вычислений, требующих вычислений с плавающей точкой . [1]

В таких случаях это более точная мера, чем измерение инструкций в секунду . [ необходима ссылка ]

Арифметика с плавающей точкой

Множители для флопов
ИмяЕдиницаЦенить
кило ФЛОПСкФЛОПС10 3
мега ФЛОПСМФЛОПС10 6
гига ФЛОПСГФЛОПС10 9
тера ФЛОПСТФЛОПС10 12
пета ФЛОПСПФЛОПС10 15
exa ФЛОПСЭФЛОПС10 18
зетта ФЛОПСЗФЛОПС10 21
yotta FLOPSYFLOPS10 24
ронна ФЛОПСRFLOPS10 27
кветта ФЛОПСQFLOPS10 30

Арифметика с плавающей точкой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей точкой похоже на научную запись, за исключением того, что все выполняется в системе счисления с основанием два, а не десять. Схема кодирования сохраняет знак, показатель степени (в системе с основанием два для Cray и VAX , в системе с основанием два или десять для форматов с плавающей точкой IEEE и в системе с основанием 16 для архитектуры с плавающей точкой IBM ) и мантисса (число после запятой ). Хотя используется несколько похожих форматов, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также 64-битных чисел, называемых двойной точностью , и более длинных чисел, называемых расширенной точностью (используется для промежуточных результатов). Представления с плавающей точкой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной точкой, с возможностью представления очень маленьких чисел и очень больших чисел. [2]

Динамический диапазон и точность

Возведение в степень, присущее вычислениям с плавающей точкой, обеспечивает гораздо больший динамический диапазон — наибольшие и наименьшие числа, которые могут быть представлены, — что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно большой диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей точкой идеально подходят для вычислительно интенсивных приложений. [3]

Вычислительная производительность

FLOPS и MIPS — единицы измерения численной вычислительной производительности компьютера. Операции с плавающей точкой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов оборудование с плавающей точкой (возможно реализовать арифметику FP в программном обеспечении на любом целочисленном оборудовании) обычно было необязательной функцией, и компьютеры, которые имели ее, назывались «научными компьютерами» или имели возможность « научных вычислений ». Таким образом, единица MIPS была полезна для измерения целочисленной производительности любого компьютера, включая те, у которых не было такой возможности, и для учета различий в архитектуре, аналогичная единица MOPS (миллион операций в секунду) также использовалась еще в 1970 году [4] . Обратите внимание, что помимо целочисленной (или фиксированной) арифметики, примеры целочисленных операций включают перемещение данных (от A до B) или проверку значений (если A = B, то C). Вот почему MIPS как эталон производительности является адекватным показателем, когда компьютер используется для запросов к базам данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [5] [6] В 1974 году Дэвид Кук ввел термины «флопс» и «мегафлопс» для описания производительности суперкомпьютеров того времени по количеству вычислений с плавающей точкой, которые они выполняли в секунду. [7] Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины при выполнении научных задач.

FLOPS крупнейшего суперкомпьютера с течением времени

FLOPS в HPC-системе можно рассчитать с помощью следующего уравнения: [8]

ПРОВАЛЫ = стойки × узлы стойка × розетки узел × ядра розетка × циклы второй × Провалы цикл . {\displaystyle {\text{FLOPS}}={\text{racks}}\times {\frac {\text{nodes}}{\text{rack}}}\times {\frac {\text{sockets}}{\text{node}}}\times {\frac {\text{cores}}{\text{socket}}}\times {\frac {\text{cycles}}{\text{second}}}\times {\frac {\text{FLOPs}}{\text{cycle}}}.}

Это можно упростить до самого распространенного случая: компьютер, имеющий ровно 1 ЦП:

ПРОВАЛЫ = ядра × циклы второй × Провалы цикл . {\displaystyle {\text{FLOPS}}={\text{cores}}\times {\frac {\text{cyclos}}{\text{second}}}\times {\frac {\text{FLOPs}}{\text{cycle}}}.}

FLOPS может быть записан в различных единицах измерения точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры по 64-битным ( формат с плавающей точкой двойной точности ) операциям в секунду, сокращенно FP64 . [9] Аналогичные единицы измерения доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.

Операции с плавающей точкой за такт для различных процессоров

Операции с плавающей точкой за такт на ядро ​​[10]
МикроархитектураАрхитектура набора инструкцийФП64ФП32FP16
Процессор Intel
Интел 80486x87 (32-бит)?0,128 [11]?
x87 (32-бит)?0,5 [11]?
ММХ (64-бит)?1 [12]?
Intel P6 Pentium IIISSE (64-бит)?2 [12]?
Intel NetBurst Pentium 4 (Уилламетт, Нортвуд)SSE2 (64-бит)24?
Intel P6 Pentium MSSE2 (64-бит)12?
SSE3 (64-бит)24?
48?
Intel Atom ( Боннелл , Солтвелл , Сильвермонт и Голдмонт )SSE3 (128-бит)24?
Intel Sandy Bridge ( Sandy Bridge , Ivy Bridge )AVX (256-бит)8160
AVX2 и FMA (256-бит)16320
Intel Xeon Phi ( Уголок рыцарей )IMCI (512-бит)16320
AVX-512 и FMA (512-бит)32640
AMD ЦП
AMD БобкэтAMD64 (64-бит)240
480
AMD K10SSE4/4a (128-бит)480
Бульдозер AMD [13] ( Копатель , Паровой каток , Экскаватор )
  • AVX (128-бит) (Бульдозер, Каток)
  • AVX2 (128-бит) (Экскаватор)
  • FMA3 (Бульдозер) [14]
  • FMA3/4 (Копер, Экскаватор)
480
  • AMD Zen (серия Ryzen 1000, серия Threadripper 1000, Epyc Naples )
  • AMD Zen+ [13] [15] [16] [17] (серия Ryzen 2000, серия Threadripper 2000)
AVX2 и FMA (128-битное, 256-битное декодирование) [18]8160
  • AMD Zen 2 [19] (серия Ryzen 3000, серия Threadripper 3000, Epyc Rome ))
  • AMD Zen 3 (серия Ryzen 5000, Epyc Milan )
AVX2 и FMA (256-бит)16320
ARM-процессор
ARM Cortex-A7, A9, A15ARMv7180
ARM Cortex-A32, A35ARMv8280
ARM Cortex-A53 , A55 , A57 , [13] A72 , A73 , A75ARMv8480
ARM Cortex-A76 , A77 , A78ARMv88160
ARM Cortex-X1ARMv81632?
Qualcomm КрайтARMv8180
Qualcomm Kryo (1xx - 3xx)ARMv8280
Qualcomm Kryo (4xx - 5xx)ARMv88160
Samsung Exynos M1 и M2ARMv8280
Samsung Exynos M3 и M4ARMv83120
IBM PowerPC A2 (Blue Gene/Q)?88 (как FP64)0
Хитачи SH-4 [20] [21]Ш-4170
Графический процессор Nvidia
Nvidia Curie ( серии GeForce 6 и GeForce 7 )ПТХ?8?
NVIDIA Tesla 2.0 (GeForce GTX 260–295)ПТХ?2?
Nvidia Fermi (только GeForce GTX 465–480, 560 Ti, 570–590)ПТХ1/4 (заблокировано драйвером, 1 аппаратно)20
Nvidia Fermi (только Quadro 600–2000)ПТХ1/820
Nvidia Fermi (только Quadro 4000–7000, Tesla)ПТХ120
Nvidia Kepler (GeForce (кроме Titan и Titan Black), Quadro (кроме K6000), Tesla K10)ПТХ1/12 (для GK110 : заблокировано драйвером, 2/3 аппаратно)20
Nvidia Kepler (GeForce GTX Titan и Titan Black, Quadro K6000, Tesla (кроме K10))ПТХ2/320
ПТХ1/1621/32
Nvidia Pascal (только Quadro GP100 и Tesla P100)ПТХ124
Nvidia Вольта [22]ПТХ12 ( FP32 ) + 2 ( INT32 )16
Nvidia Turing (только GeForce 16XX )ПТХ1/162 (FP32) + 2 (INT32)4
Nvidia Turing (все, кроме GeForce 16XX )ПТХ1/162 (FP32) + 2 (INT32)16
Nvidia Ampere [23] [24] (только Tesla A100/A30)ПТХ22 (FP32) + 2 (INT32)32
Nvidia Ampere (все GeForce и Quadro, Tesla A40/A10)ПТХ1/322 (FP32) + 0 (INT32) или 1 (FP32) + 1 (INT32)8
AMD графический процессор
AMD TeraScale 1 ( серия Radeon HD 4000 )ТераСкале 10,42?
AMD TeraScale 2 ( серия Radeon HD 5000 )ТераСкале 212?
AMD TeraScale 3 ( серия Radeon HD 6000 )ТераСкале 314?
AMD GCN (только Radeon Pro W 8100–9100)ГЦН12?
AMD GCN (все, кроме Radeon Pro W 8100–9100, Vega 10–20)ГЦН1/824
AMD GCN Vega 10ГЦН1/824
AMD GCN Vega 20 (только Radeon VII)ГЦН1/2 (заблокировано драйвером, 1 аппаратно)24
AMD GCN Vega 20 (только Radeon Instinct MI50 / MI60 и Radeon Pro VII)ГЦН124
РДНК1/824
AMD RDNA3РДНК1/8?48?
AMD CDNAКДНК14 (Тензор) [27]16
AMD CDNA 2КДНК 24 (Тензор)4 (Тензор)16
Графический процессор Intel
Intel Xe-LP (Iris Xe MAX) [28]Хе1/2?24
Intel Xe-HPG (Арк Алхимик) [28]Хе0216
Intel Xe-HPC (Понте Веккьо) [29]Хе2232
Графический процессор Qualcomm
Qualcomm Adreno 5x0Адрено 5xx124
Qualcomm Adreno 6x0Адрено 6xx124
Графкор
Графкор Колосс GC2 [30] [31]?01664
  • Графкор Колосс GC200 Mk2 [32]
  • Графкор Лук-2000 [33]
?032128
Суперкомпьютер
ENIAC @ 100 кГц в 1945 году0,004 [34] (~0,00000003 FLOPS/ Вт )
48-битный процессор @ 208 кГц в CDC 1604 в 1960 году
60-битный процессор @ 10 МГц в CDC 6600 в 1964 году0,3 (ФП60)
60-битный процессор @ 10 МГц в CDC 7600 в 1967 году1.0 (ФП60)
Cray-1 @ 80 МГц в 1976 году2 (700 ФЛОПС/Вт)
CDC Cyber ​​205 @ 50 МГц в 1981 году

Компилятор FORTRAN (ANSI 77 с векторными расширениями)

816
Транспьютер IMS T800-20 @ 20 МГц в 1987 году0,08 [35]
Parallella E16 @ 1000 МГц в 2012 г.2 [36] (5,0 ГФЛОПС/Вт) [37]
Parallella E64 @ 800 МГц в 2012 г.2 [38] (50,0 ГФЛОПС/Вт) [37]
МикроархитектураАрхитектура набора инструкцийФП64ФП32FP16

Рекорды производительности

Отдельные записи компьютера

В июне 1997 года ASCI Red от Intel стал первым в мире компьютером, достигшим одного терафлопса и более. Директор Sandia Билл Кэмп сказал, что ASCI Red имел лучшую надежность среди всех когда-либо созданных суперкомпьютеров и «был высшей точкой суперкомпьютеров по долговечности, цене и производительности». [39]

Суперкомпьютер SX-9 компании NEC стал первым в мире векторным процессором, производительность которого превысила 100 гигаФлопс на одно ядро.

В июне 2006 года японский исследовательский институт RIKEN анонсировал новый компьютер MDGRAPE -3 . Производительность компьютера достигает одного петафлопса, что почти в два раза быстрее, чем у Blue Gene/L, но MDGRAPE-3 не является компьютером общего назначения, поэтому он не появляется в списке Top500.org . Он имеет специализированные конвейеры для моделирования молекулярной динамики.

К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , который достигает 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип может поднять этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [40]

В июне 2007 года сайт Top500.org сообщил, что самым быстрым компьютером в мире является суперкомпьютер IBM Blue Gene/L , пиковая производительность которого составляет 596 терафлопс. [41] Cray XT4 занял второе место с показателем 101,7 терафлопс.

26 июня 2007 года IBM анонсировала второе поколение своего топового суперкомпьютера, названного Blue Gene/P и разработанного для непрерывной работы на скоростях, превышающих один петафлопс, быстрее, чем Blue Gene/L. При соответствующей настройке он может достигать скоростей, превышающих три петафлопса. [42]

25 октября 2007 года корпорация NEC из Японии выпустила пресс-релиз, анонсирующий модель серии SX SX-9 , [43] утверждая, что это самый быстрый в мире векторный суперкомпьютер. SX-9 оснащен первым процессором, способным обеспечить пиковую векторную производительность 102,4 гигаФЛОПС на одно ядро.

4 февраля 2008 года Национальный научный фонд и Техасский университет в Остине начали полномасштабные исследования на суперкомпьютере AMD , Sun под названием Ranger [44] , самой мощной в мире суперкомпьютерной системе для открытых научных исследований, которая работает с постоянной скоростью 0,5 петафлопс.

25 мая 2008 года американский суперкомпьютер, созданный IBM , названный « Roadrunner », достиг вычислительного рубежа в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров за июнь и ноябрь 2008 года (исключая грид-компьютеры ). [45] [46] Компьютер находится в Лос-Аламосской национальной лаборатории в Нью-Мексико. Название компьютера отсылает к птице штата Нью-Мексико , большой дорожной бегунке ( Geococcyx californianus ). [47]

В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которая, как сообщается, стала первым графическим процессором, достигшим одного терафлопса. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770, суммарно достигающими 2,4 терафлопса.

В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Национальной лаборатории Оук-Ридж (ORNL) Министерства энергетики (DOE) увеличила вычислительную мощность системы до пиковых 1,64 петафлопс, что сделало Jaguar первой в мире системой петафлопс, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракен . Кракен был объявлен самым быстрым в мире суперкомпьютером, управляемым университетом, и шестым по скорости в общем списке TOP500 2009 года. В 2010 году Кракен был модернизирован и теперь может работать быстрее и мощнее.

В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, обойдя IBM Roadrunner и заняв первое место в списке TOP500 . [48]

В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, работающий с пиковой скоростью вычислений 2,5 петафлопс. [49] [50]

По состоянию на 2010 год [обновлять]самый быстрый процессор ПК достиг 109 гигаФЛОПС ( Intel Core i7 980 XE ) [51] в вычислениях с двойной точностью. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU выполняют около 515 гигаФЛОПС [52] в вычислениях с двойной точностью, а AMD FireStream 9270 достигает пика в 240 гигаФЛОПС. [53]

В ноябре 2011 года было объявлено , что Япония достигла 10,51 петафлопс с ее компьютером K. [54] Он имеет 88 128 процессоров SPARC64 VIIIfx в 864 стойках с теоретической производительностью 11,28 петафлопс. Он назван в честь японского слова «kei», которое означает 10 квадриллионов , [55] что соответствует целевой скорости 10 петафлопс.

15 ноября 2011 года Intel продемонстрировала один процессор на базе x86 под кодовым названием «Knights Corner», поддерживающий более терафлопса на широком спектре операций DGEMM . Intel подчеркнула во время демонстрации, что это был поддерживаемый терафлопс (а не «сырой терафлопс», используемый другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, когда-либо преодолевший терафлопс. [56] [57]

18 июня 2012 года суперкомпьютерная система Sequoia компании IBM , базирующаяся в Ливерморской национальной лаборатории имени Лоуренса (LLNL), США, достигла производительности в 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [58]

12 ноября 2012 года список TOP500 сертифицировал Titan как самый быстрый в мире суперкомпьютер по результатам теста LINPACK с производительностью 17,59 петафлопс. [59] [60] Он был разработан компанией Cray Inc. в Национальной лаборатории Оук-Ридж и сочетает в себе процессоры AMD Opteron с технологиями графического процессора (GPU) NVIDIA Tesla «Kepler». [61] [62]

10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с производительностью 33,86 петафлопс. [63]

20 июня 2016 года китайская Sunway TaihuLight была признана самой быстрой в мире с 93 петафлопсами на бенчмарке LINPACK (из 125 пиковых петафлопс). Система была установлена ​​в Национальном суперкомпьютерном центре в Уси и показала большую производительность, чем следующие пять самых мощных систем в списке TOP500 в то время вместе взятые. [64]

В июне 2019 года Summit , суперкомпьютер, созданный IBM, который сейчас работает в Национальной лаборатории Оук-Ридж (ORNL) Министерства энергетики (DOE), занял первое место с производительностью 148,6 петафлопс на High Performance Linpack (HPL), бенчмарке, используемом для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [65]

В июне 2022 года американский Frontier стал самым мощным суперкомпьютером в рейтинге TOP500, достигнув 1102 петафлопс (1,102 эксафлопс) в тестах LINPACK. [66]

Распределенные вычислительные записи

Распределенные вычисления используют Интернет для связи персональных компьютеров с целью достижения большего количества FLOPS:

  • По состоянию на апрель 2020 года [обновлять]сеть Folding@home имеет более 2,3 exaFLOPS общей вычислительной мощности. [67] [68] [69] [70] Это самая мощная распределенная компьютерная сеть, которая первой в истории преодолела 1 exaFLOPS общей вычислительной мощности. Такой уровень производительности в первую очередь обеспечивается совокупными усилиями огромного массива мощных графических процессоров и центральных процессоров . [71]
  • По состоянию на декабрь 2020 года [обновлять]вся сеть BOINC в среднем производит около 31 петафлопса. [72]
  • По состоянию на июнь 2018 года [обновлять]средняя производительность SETI@home , использующего программную платформу BOINC , составляет 896 терафлопс. [73]
  • По состоянию на июнь 2018 года [обновлять]проект Einstein @Home , использующий сеть BOINC , достигал производительности 3 петафлопс. [74]
  • По состоянию на июнь 2018 года [обновлять]MilkyWay @home , использующий инфраструктуру BOINC , выполняет вычисления со скоростью 847 терафлопс. [75]
  • По состоянию на июнь 2020 года [обновлять]GIMPS , выполняющий поиск простых чисел Мерсенна , поддерживает производительность 1354 терафлопс. [76]

Стоимость вычислений

Стоимость оборудования

ДатаПриблизительная стоимость в долларах США за GFLOPSПлатформа, обеспечивающая самую низкую стоимость за GFLOPSКомментарии
Нескорректированный2023 [77]
1945130 триллионов долларов2 квадриллиона долларовENIAC : 487 000 долларов в 1945 году и 7 916 000 долларов в 2022 году.487 000 долл. США /0,000 000 385  ГФЛОПС . Электронный цифровой компьютер первого поколения ( на электронных лампах ).
196120 миллиардов долларов204 миллиарда долларовБазовая установка IBM 7030 Stretch на тот момент стоила 7,78 млн долларов США за штуку.IBM 7030 Stretch выполняет одно умножение с плавающей точкой каждые2,4  микросекунды . [78] Компьютер второго поколения ( на транзисторах ).
198420 000 000 долларов США100 000 000 долларов СШАКрэй X-MP /4815 000 000 долларов США /0,8 GFLOPS . Компьютер третьего поколения ( на базе интегральных схем ).
199730 000 долларов США57 000 долларов СШАДва 16-процессорных кластера Beowulf с микропроцессорами Pentium Pro [79]
Апрель 2000 г.1000 долларов США2000 долларов СШАСкопление Буньип БеовульфБуньип был первым под-1 доллар США / Технология вычислений MFLOPS . В 2000 году она получила премию Гордона Белла.
Май 2000 г.640 долларов1000 долларов СШАКЛАТ2KLAT2 была первой вычислительной технологией, которая масштабировалась до больших приложений, оставаясь при этом1 доллар США /МФЛОПС . [80]
Август 2003 г.90 долларов100 долларовKASY0KASY0 была первой вычислительной технологией стоимостью менее 100 ГФЛОПС . [81]
Август 2007 г.50 долларов70 долларовМикровульфПо состоянию на август 2007 года это«Персональный» кластер Beowulf мощностью 26 ГФЛОПС можно построить за 1256 долларов. [82]
Март 2011 г.1,80$2$HPU4ScienceЭтот кластер стоимостью 30 000 долларов был построен исключительно с использованием имеющегося в продаже оборудования «игрового» класса. [83]
Август 2012 г.0,75$1 долларСистема Quad AMD Radeon 7970Четырехъядерный настольный компьютер AMD Radeon 7970 , достигающий 16 TFLOPS одинарной точности, 4 TFLOPS двойной точности вычислительной производительности. Общая стоимость системы составила $3000; построена только с использованием коммерчески доступного оборудования. [84]
Июнь 2013 г.0,22$0,3$Сони Плейстейшен 4Sony PlayStation 4 имеет пиковую производительность1,84  TFLOPS , по цене $400 [85]
Ноябрь 2013 г.0,16$0,21$Система AMD Sempron 145 и GeForce GTX 760Система, созданная с использованием имеющихся в продаже деталей, включающая один AMD Sempron 145 и три Nvidia GeForce GTX 760, достигает в общей сложности6,771 TFLOPS на общую сумму 1090,66 долларов США . [86]
Декабрь 2013 г.0,12$0,16$Система Pentium G550 и Radeon R9 290Создан с использованием коммерчески доступных деталей. Intel Pentium G550 и AMD Radeon R9 290 достигают максимума4,848 TFLOPS в общей сложности 681,84 долл. США . [87]
Январь 2015 г.0,08$0,1$Система Celeron G1830 и Radeon R9 295X2Создан с использованием коммерчески доступных деталей. Intel Celeron G1830 и AMD Radeon R9 295X2 достигают более11,5 TFLOPS на общую сумму 902,57 долл. США . [88] [89]
Июнь 2017 г.0,06$0,07$Система AMD Ryzen 7 1700 и AMD Radeon Vega Frontier EditionСоздан с использованием имеющихся в продаже деталей. Процессор AMD Ryzen 7 1700 в сочетании с видеокартами AMD Radeon Vega FE в CrossFire достигает более50 TFLOPS по цене чуть менее 3000 долларов США за полную систему. [90]
Октябрь 2017 г.0,03$0,04$Система Intel Celeron G3930 и AMD RX Vega 64Построено с использованием коммерчески доступных деталей. Три видеокарты AMD RX Vega 64 обеспечивают чуть более 75 TFLOPS половинной точности (38 TFLOPS SP или 2,6 TFLOPS DP в сочетании с CPU) по цене ~$2050 за полную систему. [91]
Ноябрь 2020 г.0,03$0,03$Система AMD Ryzen 3600 и 3× NVIDIA RTX 3080AMD Ryzen 3600 @ 484 ГФЛОПС и $199.99

3× NVIDIA RTX 3080 @ 29,770 GFLOPS каждая и $699.99

Общая производительность системы GFLOPS = 89,794 / TFLOPS = 89.2794

Общая стоимость системы, включая реалистичные, но недорогие детали; в сравнении с другим примером = 2839 долл. США [92]

Доллар США /ГФЛОП = 0,0314 долл. США

Ноябрь 2020 г.0,04$0,04$Плейстейшен 5Sony PlayStation 5 Digital Edition имеет пиковую производительность 10,28 TFLOPS (20,58 TFLOPS при половинной точности) по розничной цене 399 долларов США. [93]
Ноябрь 2020 г.0,04$0,04$Xbox серии XXbox Series X от Microsoft имеет пиковую производительность 12,15 TFLOPS (24,30 TFLOPS при половинной точности) при розничной цене 499 долларов США. [94]
Сентябрь 2022 г.0,02$0,02$RTX4090Видеокарта Nvidia RTX 4090 имеет пиковую производительность 82,6 TFLOPS (1,32 PFLOPS при 8-битной точности) по розничной цене 1599 долларов США. [95]
Май 2023 г.0,01$0,01$Радеон RX 7600AMD RX 7600 имеет пиковую производительность 21,5 TFLOPS при розничной цене 269 долларов США. [96]


Смотрите также

Ссылки

  1. ^ "Понять показатели производительности суперкомпьютера и емкости системы хранения". kb.iu.edu . Получено 23 марта 2024 г. .
  2. Плавающая точка. Получено 25 декабря 2009 г.
  3. Резюме: Фиксированная точка (целые числа) против плавающей точки. Архивировано 31 декабря 2009 г. на Wayback Machine. Получено 25 декабря 2009 г.
  4. ^ Техническая записка НАСА. Национальное управление по аэронавтике и исследованию космического пространства. 1970.
  5. ^ Фиксированная и плавающая точка. Получено 25 декабря 2009 г.
  6. ^ Обработка данных и математические вычисления. Получено 25 декабря 2009 г.
  7. ^ Кук, DJ (1974). Основы производительности компьютерных систем. Министерство торговли США, Национальное бюро стандартов.
  8. ^ ""Nodes, Sockets, Cores and FLOPS, Oh, My" д-ра Марка Р. Фернандеса, доктора философии." Архивировано из оригинала 13 февраля 2019 г. . Получено 12 февраля 2019 г. .
  9. ^ "ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ". top500.org . Получено 23 июня 2020 г. .
  10. ^ «Операций с плавающей точкой в ​​секунду (FLOPS)».
  11. ^ ab "home.iae.nl".
  12. ^ ab "Вычислительная мощность на протяжении истории". alternativewars.com . Получено 13 февраля 2021 г. .
  13. ^ abcde Дольбо, Ромен (2017). «Теоретический пик FLOPS на набор инструкций: учебник». Журнал суперкомпьютеров . 74 (3): 1341–1377. doi :10.1007/s11227-017-2177-5. S2CID  3540951.
  14. ^ "Поддержка новых инструкций для Bulldozer (FMA3) и Piledriver (FMA3+4 и CVT, BMI, TBM)" (PDF) .
  15. ^ «Блог Агнера о процессорах — результаты испытаний AMD Ryzen» .
  16. ^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ "каждое ядро ​​теперь имеет пару собственных 128-битных блоков FMA"
  17. ^ Майк Кларк (23 августа 2016 г.). Новая архитектура ядра x86 для следующего поколения вычислений (PDF) . HotChips 28. AMD. Архивировано из оригинала (PDF) 31 июля 2020 г. Получено 8 октября 2017 г.страница 7
  18. ^ «Микроархитектура процессоров Intel и AMD» (PDF) .
  19. ^ "Выступление генерального директора AMD Лизы Су на COMPUTEX 2019". youtube.com . 27 мая 2019 г. Архивировано из оригинала 11 декабря 2021 г.
  20. ^ "Entertainment Systems and High-Performance Processor SH-4" (PDF) . Обзор Hitachi . 48 (2). Hitachi : 58–63. 1999 . Получено 21 июня 2019 .
  21. ^ "SH-4 Next-Generation DSP Architecture for VoIP" (PDF) . Hitachi . 2000 . Получено 21 июня 2019 .
  22. ^ «Внутри Volta: самый передовой в мире графический процессор для центров обработки данных». 10 мая 2017 г.
  23. ^ «Подробный обзор архитектуры NVIDIA Ampere». 14 мая 2020 г.
  24. ^ "Графические процессоры NVIDIA A100 обеспечивают работу современных центров обработки данных". NVIDIA .
  25. Шиллинг, Андреас (10 июня 2019 г.). «Die RDNA-Architektur - Страница 2». Аппаратное обеспечениеluxx .
  26. ^ "Характеристики AMD Radeon RX 5700 XT". TechPowerUp .
  27. ^ "Ускоритель AMD Instinct MI100".
  28. ^ ab "Введение в архитектуру Xe-HPG".
  29. ^ "Intel Data Center GPU Max". 9 ноября 2022 г.
  30. ^ "250 TFLOPs/s для двух чипов со смешанной точностью FP16". youtube.com . 26 октября 2018 г.
  31. Архивировано в Ghostarchive и Wayback Machine: «Оценка по энергопотреблению, что FP32 составляет 1/4 от FP16, а тактовая частота ниже 1,5 ГГц». youtube.com . 25 октября 2017 г.
  32. Архивировано в Ghostarchive и Wayback Machine: «Представляем системы Mk2 IPU от Graphcore». youtube.com . 15 июля 2020 г.
  33. ^ "Bow-2000 IPU-Machine". docs.graphcore.ai/ .
  34. ^ ENIAC]] @ 100 кГц с 385 флопсами «Компьютеры прошлого». clear.rice.edu . Получено 26 февраля 2021 г. .
  35. ^ "Архитектура IMS T800". transputer.net . Получено 28 декабря 2023 г. .
  36. ^ Epiphany-III 16-ядерный 65-нм микропроцессор (E16G301) // admin (19 августа 2012 г.)
  37. ^ ab Feldman, Michael (22 августа 2012 г.). "Adapteva представляет 64-ядерный чип". HPCWire . Получено 3 сентября 2014 г. .
  38. ^ Epiphany-IV 64-ядерный 28-нм микропроцессор (E64G401) // admin (19 августа 2012 г.)
  39. ^ "Sandia's ASCI Red, первый в мире суперкомпьютер терафлоп, выведен из эксплуатации" (PDF) . Архивировано из оригинала (PDF) 5 ноября 2010 г. . Получено 17 ноября 2011 г. .
  40. Ричард Суинберн (30 апреля 2007 г.). «Приход TeraFLOP Computing». bit-tech.net . Получено 9 февраля 2012 г. .
  41. ^ "29-й список TOP500 самых быстрых суперкомпьютеров мира опубликован". Top500.org . 23 июня 2007 г. Архивировано из оригинала 9 мая 2008 г. Получено 8 июля 2008 г.
  42. ^ "Июнь 2008". TOP500 . Получено 8 июля 2008 .
  43. ^ "NEC запускает самый быстрый в мире векторный суперкомпьютер SX-9". NEC. 25 октября 2007 г. Получено 8 июля 2008 г.
  44. ^ "Техасский университет в Остине, Техасский передовой вычислительный центр". Архивировано из оригинала 1 августа 2009 г. Получено 13 сентября 2010 г. Любой исследователь в американском учреждении может подать предложение о выделении циклов в системе.
  45. Шарон Годен (9 июня 2008 г.). «IBM Roadrunner преодолевает милю суперкомпьютеров за 4 минуты». Computerworld. Архивировано из оригинала 24 декабря 2008 г. Получено 10 июня 2008 г.
  46. ^ "Austin ISC08". Top500.org. 14 ноября 2008 г. Архивировано из оригинала 22 февраля 2012 г. Получено 9 февраля 2012 г.
  47. ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп петафлоп». BBC News . Получено 8 июля 2008 г.
  48. Гринберг, Энди (16 ноября 2009 г.). «Cray свергает IBM в области суперкомпьютеров». Forbes .
  49. ^ "Китай претендует на суперкомпьютерную корону". BBC News. 28 октября 2010 г.
  50. ^ Диллоу, Клэй (28 октября 2010 г.). «Китай представил 2507-петафлопсный суперкомпьютер — самый быстрый в мире». Popsci.com . Получено 9 февраля 2012 г.
  51. ^ "Intel Core i7-980X Extreme Edition – готовы к крутым результатам?: Математика: Sandra Arithmetic, Crypto, Microsoft Excel". Techgage . 10 марта 2010 г. Получено 9 февраля 2012 г.
  52. ^ "NVIDIA Tesla Personal Supercomputer". Nvidia.com . Получено 9 февраля 2012 г.
  53. ^ "AMD FireStream 9270 GPU Compute Accelerator". Amd.com . Получено 9 февраля 2012 г. .
  54. ^ "'K computer' достиг цели в 10 петафлопс". Fujitsu.com . Получено 9 февраля 2012 г. .
  55. ^ Смотрите японские номера
  56. ^ "Intel's Knights Corner: 50+ Core 22nm Co-processor". 16 ноября 2011 г. Получено 16 ноября 2011 г.
  57. ^ "Intel представляет 1 TFLOP/s Knight's Corner" . Получено 16 ноября 2011 г. .
  58. Кларк, Дон (18 июня 2012 г.). «IBM Computer устанавливает рекорд скорости». The Wall Street Journal . Получено 18 июня 2012 г.
  59. ^ "US Titan supercomputer clocked as a world's fastest". BBC. 12 ноября 2012 г. Получено 28 февраля 2013 г.
  60. ^ "Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan | TOP500 Supercomputer Sites". Top500.org. 12 ноября 2012 г. Получено 28 февраля 2013 г.
  61. ^ Монтальбано, Элизабет (11 октября 2011 г.). «Oak Ridge Labs строит самый быстрый суперкомпьютер». Informationweek . Получено 9 февраля 2012 г.
  62. ^ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер Titan дебютирует для открытых научных исследований | Cutting Edge». News.CNet.com . Получено 28 февраля 2013 г.
  63. ^ "Китайский суперкомпьютер теперь самый быстрый в мире – намного быстрее". Журнал Forbes . 17 июня 2013 г. Получено 17 июня 2013 г.
  64. ^ Фельдман, Майкл. «Китай вырывается вперед в списке суперкомпьютеров TOP500, положив конец превосходству США». Top500.org . Получено 31 декабря 2016 г.
  65. ^ "Июнь 2018". Top500.org . Получено 17 июля 2018 .
  66. ^ https://en.wikipedia.org/wiki/TOP500 [ пустой URL ]
  67. ^ "Folding@Home Active CPUs & GPUs by OS". foldingathome.org . Получено 8 апреля 2020 г. .
  68. ^ Folding@home (25 марта 2020 г.). «Благодаря нашему УДИВИТЕЛЬНОМУ сообществу мы преодолели барьер exaFLOP! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас примерно в 10 раз быстрее, чем IBM Summit! pic.twitter.com/mPMnb4xdH3». @foldingathome . Получено 4 апреля 2020 г.
  69. ^ "Folding@Home преодолевает барьер экзафлопсности, теперь быстрее десятков суперкомпьютеров - ExtremeTech". extremetech.com . Получено 4 апреля 2020 г. .
  70. ^ «Folding@Home превышает 1,5 Эксафлопса в битве против Covid-19». TechSpot . 26 марта 2020 г. Получено 4 апреля 2020 г.
  71. ^ "Sony Computer Entertainment's Support for Folding@home Project on PlayStation™3 Receives This Year's "Good Design Gold Award"" (пресс-релиз). Sony Computer Entertainment Inc. 6 ноября 2008 г. Архивировано из оригинала 31 января 2009 г. Получено 11 декабря 2008 г.
  72. ^ "BOINC Computing Power". BOINC . Получено 28 декабря 2020 г. .
  73. ^ "Обзор SETI@Home Credit". BOINC . Получено 15 июня 2018 г.
  74. ^ "Обзор кредита Einstein@Home". BOINC . Получено 15 июня 2018 г.
  75. ^ "Обзор кредита MilkyWay@Home". BOINC . Получено 15 июня 2018 г.
  76. ^ "Интернет PrimeNet Server Distributed Computing Technology for the Great Internet Mersenne Prime Search". GIMPS . Получено 15 июня 2018 г.
  77. ^ 1634–1699: McCusker, JJ (1997). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов: Дополнения и исправления (PDF) . Американское антикварное общество .1700–1799: Маккаскер, Дж. Дж. (1992). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора стоимости денег в экономике Соединенных Штатов (PDF) . Американское антикварное общество .1800–настоящее время: Федеральный резервный банк Миннеаполиса. "Индекс потребительских цен (оценка) 1800–" . Получено 29 февраля 2024 г.
  78. ^ "IBM 7030 (STRETCH)". Норман Харди . Получено 24 февраля 2017 г.
  79. ^ "Loki and Hyglac". Loki-www.lanl.gov. 13 июля 1997 г. Архивировано из оригинала 21 июля 2011 г. Получено 9 февраля 2012 г.
  80. ^ "Kentucky Linux Athlon Testbed 2 (KLAT2)". The Aggregate . Получено 9 февраля 2012 г.
  81. ^ "KASY0". The Aggregate . 22 августа 2003 г. Получено 9 февраля 2012 г.
  82. ^ "Microulf: Персональный, Портативный Кластер Beowulf". Архивировано из оригинала 12 сентября 2007 г. Получено 9 февраля 2012 г.
  83. ^ Адам Стивенсон, Янн Ле Ду и Марием Эль Африт. «Высокопроизводительные вычисления на игровых ПК». Ars Technica . 31 марта 2011 г.
  84. Том Логан (9 января 2012 г.). "Обзор HD7970 Quadfire Eyefinity". OC3D.net .
  85. ^ «Sony разжигает ценовую войну, предлагая PS4 по цене $399». CNBC . 11 июня 2013 г.
  86. ^ "FreezePage". Архивировано из оригинала 16 ноября 2013 г. Получено 9 мая 2020 г.
  87. ^ "FreezePage". Архивировано из оригинала 19 декабря 2013 г. Получено 9 мая 2020 г.
  88. ^ "FreezePage". Архивировано из оригинала 10 января 2015 г. Получено 9 мая 2020 г.
  89. ^ "Обзор Radeon R9 295X2 8 ГБ: Project Hydra получает жидкостное охлаждение". 8 апреля 2014 г.
  90. ^ Перес, Кэрол Э. (13 июля 2017 г.). «Создание 50-терафлопсного AMD Vega Deep Learning Box менее чем за 3 тыс. долларов». Intuition Machine . Получено 26 июля 2017 г.
  91. ^ "lowest_$/fp16 - список сохраненных деталей mattebaughman - Celeron G3930 2.9GHz Dual-Core, Radeon RX VEGA 64 8GB (3-Way CrossFire), XON-350_BK ATX Mid Tower". pcpartpicker.com . Получено 13 сентября 2017 г. .
  92. ^ "System Builder". pcpartpicker.com . Получено 7 декабря 2020 г. .
  93. ^ "AMD Playstation 5 GPU Specs". techpowerup.com . Получено 12 мая 2021 г. .
  94. ^ "Xbox Series X | Xbox". xbox.com . Получено 21 сентября 2021 г. .
  95. ^ "Nvidia анонсирует RTX 4090 12 октября, RTX 4080 — позже". tomshardware.com . 20 сентября 2022 г. . Получено 20 сентября 2022 г. .
  96. ^ "Обзор AMD Radeon RX 7600: постепенные обновления". tomshardware.com . 24 мая 2023 г. . Получено 24 мая 2023 г. .
Взято с "https://en.wikipedia.org/w/index.php?title=Операции_с_плавающей_точкой_в_секунду&oldid=1249366560"