Общая информация | |
---|---|
Запущен | 2010 |
Прекращено | 2020 [1] |
Продается | Интел |
Разработано | Интел |
Обычный производитель |
|
Производительность | |
Макс. тактовая частота ЦП | 1,053 ГГц – 1,7 ГГц |
Кэш | |
Кэш L1 | 32 КБ на ядро |
кэш L2 | 512 КБ на ядро |
Архитектура и классификация | |
Приложение | Суперкомпьютеры Высокопроизводительные вычисления |
Технологический узел | 45 нм транзисторы в 14 нм транзисторы ( tri-gate ) |
Микроархитектура | Ларраби |
Набор инструкций | x86-16 (кроме форм-фактора сопроцессора), IA-32 , x86-64 [2] |
Расширения | |
Физические характеристики | |
Ядра |
|
Память (ОЗУ) |
|
Розетки | |
Продукция, модели, варианты | |
Основные имена |
|
Модель |
|
Xeon Phi [3] — это снятая с производства серия многоядерных процессоров x86 , разработанная и произведенная Intel . Она предназначалась для использования в суперкомпьютерах, серверах и высокопроизводительных рабочих станциях. Ее архитектура позволяла использовать стандартные языки программирования и интерфейсы прикладного программирования (API), такие как OpenMP . [4] [5]
Xeon Phi был запущен в 2010 году. Поскольку изначально он был основан на более раннем дизайне GPU ( кодовое название «Larrabee» ) от Intel [6] , который был отменен в 2009 году [7] , он разделял области применения с GPU. Основное различие между Xeon Phi и GPGPU, такими как Nvidia Tesla, заключалось в том, что Xeon Phi с ядром, совместимым с x86, мог, с меньшими модификациями, запускать программное обеспечение, которое изначально было нацелено на стандартный x86 CPU.
Первоначально в виде дополнительных карт на базе PCI Express , продукт второго поколения под кодовым названием Knights Landing был анонсирован в июне 2013 года. [8] Эти чипы второго поколения могли использоваться как автономные ЦП, а не просто как дополнительная карта.
В июне 2013 года суперкомпьютер Tianhe-2 в Национальном суперкомпьютерном центре в Гуанчжоу (NSCC-GZ) был объявлен [9] самым быстрым суперкомпьютером в мире (по состоянию на июнь 2023 года [обновлять]он занимает 10-е место [10] ). Он использовал сопроцессоры Intel Xeon Phi и процессоры Ivy Bridge -EP Xeon E5 v2 для достижения производительности 33,86 петафлопс. [11]
Линейка продуктов Xeon Phi напрямую конкурировала с линейками Nvidia Tesla и AMD Radeon Instinct карт глубокого обучения и GPGPU. Она была прекращена из-за отсутствия спроса и проблем Intel с ее 10-нм узлом. [12 ]
Кодовое имя | Процесс | Комментарии |
---|---|---|
Найтс Ферри | 45 нм | предлагается как карта PCI Express; получена из проекта Larrabee |
Уголок Рыцарей | 22 нм | производный от P54C; векторный процессор; первое устройство, которое будет анонсировано как Xeon Phi ; кодирование, подобное AVX-512 |
Рыцари Десант | 14 нм | полученный из Silvermont/Airmont (Intel Atom); [13] AVX-512 |
Рыцарская мельница | 14 нм | почти идентичен Knights Landing, но оптимизирован для глубокого обучения |
Рыцарский Холм | 10 нм | отменено |
Микроархитектура Larrabee (разрабатывается с 2006 года [14] ) представила очень широкие (512-битные) блоки SIMD для архитектуры x86 , расширенной до многопроцессорной системы с когерентным кэшем , подключенной через кольцевую шину к памяти; каждое ядро было способно к четырехпоточной многопоточности. Поскольку дизайн был предназначен как для GPU, так и для вычислений общего назначения, чипы Larrabee также включали специализированное оборудование для выборки текстур. [15] [16] Проект по производству розничного продукта GPU непосредственно из исследовательского проекта Larrabee был завершен в мае 2010 года. [17]
Другим современным исследовательским проектом Intel, реализующим архитектуру x86 на многоядерном процессоре, был « Однокристальный облачный компьютер » (прототип представлен в 2009 году [18] ), проект, имитирующий вычислительный компьютерный центр обработки данных на одном чипе с несколькими независимыми ядрами: прототип включал 48 ядер на чип с аппаратной поддержкой выборочного управления частотой и напряжением ядер для максимизации энергоэффективности, а также включал ячеистую сеть для обмена сообщениями между чипами. Проект не имел когерентных ядер кэша и был сосредоточен на принципах, которые позволили бы масштабировать проект на гораздо большее количество ядер. [19]
Исследовательский чип Teraflops ( прототип представлен в 2007 году [20] ) представляет собой экспериментальный 80-ядерный чип с двумя блоками с плавающей точкой на ядро, реализующий 96-битную архитектуру VLIW вместо архитектуры x86. [21] Проект исследовал методы межъядерной связи, управление питанием на чипе и достиг 1,01 TFLOPS на частоте 3,16 ГГц, потребляя 62 Вт энергии. [22] [23]
Прототип платы Intel Many Integrated Core (MIC), названной Knights Ferry , включающей процессор под кодовым названием Aubrey Isle, был анонсирован 31 мая 2010 года. Было заявлено, что продукт является производным от проекта Larrabee и других исследований Intel, включая Single-chip Cloud Computer . [24] [25]
Продукт разработки предлагался в виде карты PCIe с 32 упорядоченными ядрами на частоте до 1,2 ГГц с четырьмя потоками на ядро, 2 ГБ памяти GDDR5 [26] и 8 МБ когерентного кэша L2 (256 КБ на ядро с 32 КБ кэша L1) и потребляемой мощностью ~300 Вт [26] , построенной по 45-нм техпроцессу. [27] В ядре Aubrey Isle 1024-битная кольцевая шина (512-битная двунаправленная) соединяет процессоры с основной памятью. [28] Производительность одной платы превысила 750 GFLOPS. [27] Платы-прототипы поддерживают только инструкции с плавающей запятой одинарной точности . [29]
Первоначальными разработчиками были CERN , Корейский институт информации о науке и технологиях (KISTI) и Центр суперкомпьютеров Лейбница . Поставщиками оборудования для прототипных плат были IBM, SGI, HP, Dell и другие. [30]
Линейка продуктов Knights Corner производится по 22-нм техпроцессу с использованием технологии Intel Tri-gate с более чем 50 ядрами на чип и является первым многоядерным коммерческим продуктом Intel. [24] [27]
В июне 2011 года SGI объявила о партнерстве с Intel для использования архитектуры MIC в своих высокопроизводительных вычислительных продуктах. [31] В сентябре 2011 года было объявлено, что Техасский передовой вычислительный центр (TACC) будет использовать карты Knights Corner в своем 10-петафлопсном суперкомпьютере "Stampede", обеспечивая 8 петафлопс вычислительной мощности. [32] Согласно "Stampede: A Comprehensive Petascale Computing Environment" "второе поколение Intel (Knights Landing) MIC будет добавлено, когда станет доступно, увеличив совокупную пиковую производительность Stampede как минимум до 15 петафлопс." [33]
15 ноября 2011 года Intel продемонстрировала раннюю кремниевую версию процессора Knights Corner. [34] [35]
5 июня 2012 года Intel выпустила программное обеспечение с открытым исходным кодом и документацию по Knights Corner. [36]
18 июня 2012 года на Гамбургской международной суперкомпьютерной конференции 2012 года компания Intel объявила , что Xeon Phi станет торговой маркой , используемой для всех продуктов на базе архитектуры Many Integrated Core. [3] [37] [38] [39] [40] [41] [42] В июне 2012 года компания Cray объявила, что будет предлагать 22-нм чипы «Knight's Corner» (под торговой маркой «Xeon Phi») в качестве сопроцессора в своих системах «Cascade». [43] [44]
В июне 2012 года ScaleMP анонсировала обновление виртуализации, позволяющее использовать Xeon Phi в качестве прозрачного расширения процессора, что позволяет запускать устаревший код MMX / SSE без изменения кода. [45] Важным компонентом ядра сопроцессора Intel Xeon Phi является его векторный процессор (VPU). [46] VPU имеет новый 512-битный набор инструкций SIMD, официально известный как Intel Initial Many Core Instructions (Intel IMCI). Таким образом, VPU может выполнять 16 операций с одинарной точностью (SP) или 8 операций с двойной точностью (DP) за цикл. VPU также поддерживает инструкции Fused Multiply-Add (FMA) и, следовательно, может выполнять 32 операции SP или 16 операций DP с плавающей точкой за цикл. Он также обеспечивает поддержку целых чисел. VPU также имеет расширенный математический блок (EMU), который может выполнять такие операции, как обратные числа, квадратный корень и логарифм, тем самым позволяя выполнять эти операции векторным способом с высокой пропускной способностью. EMU работает путем вычисления полиномиальных приближений этих функций.
12 ноября 2012 года компания Intel анонсировала два семейства сопроцессоров Xeon Phi, использующих 22-нм техпроцесс: Xeon Phi 3100 и Xeon Phi 5110P. [47] [48] [49] Xeon Phi 3100 будет способен выполнять более 1 терафлопса инструкций с плавающей точкой двойной точности с пропускной способностью памяти 240 ГБ/с при 300 Вт. [47] [48] [49] Xeon Phi 5110P будет способен выполнять 1,01 терафлопса инструкций с плавающей точкой двойной точности с пропускной способностью памяти 320 ГБ/с при 225 Вт. [47] [48] [49] Xeon Phi 7120P будет способен выполнять 1,2 терафлопса инструкций с плавающей точкой двойной точности с пропускной способностью памяти 352 ГБ/с при 300 Вт.
17 июня 2013 года суперкомпьютер Tianhe-2 был объявлен [9] TOP500 самым быстрым в мире. Tianhe-2 использовал процессоры Intel Ivy Bridge Xeon и Xeon Phi для достижения 33,86 петафлопс. Он был самым быстрым в списке в течение двух с половиной лет, последний раз в ноябре 2015 года. [50]
Ядра Knights Corner основаны на модифицированной версии дизайна P54C , используемой в оригинальном Pentium. [51] Основой архитектуры Intel MIC является использование наследия x86 путем создания x86-совместимой многопроцессорной архитектуры, которая может использовать существующие программные инструменты распараллеливания. [27] Инструменты программирования включают OpenMP , [52] OpenCL , [53] Cilk / Cilk Plus и специализированные версии Fortran, C++ [54] и математических библиотек от Intel . [55]
Элементы дизайна, унаследованные от проекта Larrabee, включают x86 ISA, 4-канальный SMT на ядро, 512-битные блоки SIMD, 32 КБ кэша инструкций L1, 32 КБ кэша данных L1, когерентный кэш L2 (512 КБ на ядро [56] ) и сверхширокую кольцевую шину, соединяющую процессоры и память.
Инструкции SIMD Knights Corner 512-bit имеют много общих внутренних функций с расширением AVX-512. Документация по набору инструкций доступна на сайте Intel под расширением KNC. [57] [58] [59] [60]
Имя | Серийный код | Ядра ( потоки @ 4× ядра) | Тактовая частота (МГц) | кэш L2 | Память GDDR5 ECC | Пиковая производительность DP (GFLOPS) | ТДП (Вт) | Система охлаждения | Форм-фактор | Выпущенный | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | Каналы | Полоса пропускания ГБ/с | |||||||||
Xeon Phi 3110X [61] | SE3110X | 61 (244) | 1053 | – | 30,5 МБ | 6 ГБ | 12 | 240 | 1028 | 300 | Голая доска | Карта PCIe 2.0 x16 | Ноябрь, 2012 |
8 ГБ | 16 | 320 | |||||||||||
Xeon Phi 3120A [62] | SC3120A | 57 (228) | 1100 | – | 28,5 МБ | 6 ГБ | 12 | 240 | 1003 | 300 | Вентилятор/ радиатор | 17 июня 2013 г. | |
Xeon Phi 3120P [63] | SC3120P | 57 (228) | 1100 | – | 28,5 МБ | 6 ГБ | 12 | 240 | 1003 | 300 | Пассивный радиатор | 17 июня 2013 г. | |
Xeon Phi 31S1P [64] | BC31S1P | 57 (228) | 1100 | – | 28,5 МБ | 8 ГБ | 16 | 320 | 1003 | 270 | Пассивный радиатор | 17 июня 2013 г. | |
Xeon Phi 5110P [65] | SC5110P | 60 (240) | 1053 | – | 30.0 МБ | 8 ГБ | 16 | 320 | 1011 | 225 | Пассивный радиатор | 12 ноя 2012 | |
Xeon Phi 5120D [66] | SC5120D | 60 (240) | 1053 | - | 30.0 МБ | 8 ГБ | 16 | 352 | 1011 | 245 | Голая доска | SFF 230-контактная карта | 17 июня 2013 г. |
BC5120D | |||||||||||||
Xeon Phi SE10P [67] | SE10P | 61 (244) | 1100 | - | 30,5 МБ | 8 ГБ | 16 | 352 | 1074 | 300 | Пассивный радиатор | Карта PCIe 2.0 x16 | 12 ноября 2012 г. |
Xeon Phi SE10X [68] | SE10X | 61 (244) | 1100 | – | 30,5 МБ | 8 ГБ | 16 | 352 | 1074 | 300 | Голая доска | 12 ноября 2012 г. | |
Xeon Phi 7110P [69] | SC7110P | 61 (244) | 1100 | 1250 | 30,5 МБ | 16 Гб | 16 | 352 | 1220 | 300 | Пассивный радиатор | ??? | |
Xeon Phi 7110X [70] | SC7110X | 61 (244) | 1250 | ??? | 30,5 МБ | 16 Гб | 16 | 352 | 1220 | 300 | Голая доска | ??? | |
Xeon Phi 7120A [71] | SC7120A | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 Гб | 16 | 352 | 1208 | 300 | Вентилятор/радиатор | 6 апреля 2014 г. | |
Xeon Phi 7120D [72] | SC7120D | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 Гб | 16 | 352 | 1208 | 270 | Голая доска | SFF 230-контактная карта | Март ??, 2014 |
Xeon Phi 7120P [73] | SC7120P | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 Гб | 16 | 352 | 1208 | 300 | Пассивный радиатор | Карта PCIe 2.0 x16 | 17 июня 2013 г. |
Xeon Phi 7120X [74] | SC7120X | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 Гб | 16 | 352 | 1208 | 300 | Голая доска | 17 июня 2013 г. |
Кодовое название для второго поколения архитектуры MIC от Intel. [33] Intel впервые официально раскрыла подробности о своих продуктах Intel Xeon Phi второго поколения 17 июня 2013 года. [11] Intel заявила, что следующее поколение продуктов на базе архитектуры Intel MIC будет доступно в двух формах: как сопроцессор или хост-процессор (ЦП), и будет производиться с использованием 14-нм технологического процесса Intel. Продукты Knights Landing будут включать интегрированную память на корпусе для значительно более высокой пропускной способности памяти.
Knights Landing содержит до 72 ядер Airmont (Atom) с четырьмя потоками на ядро, [75] [76] используя сокет LGA 3647 [77] поддерживая до 384 ГБ «дальней» DDR4 2133 RAM и 8–16 ГБ сложенной «ближней» 3D MCDRAM , версии гибридного куба памяти . Каждое ядро имеет два 512-битных векторных блока и поддерживает инструкции SIMD AVX-512 , в частности Intel AVX-512 Foundational Instructions (AVX-512F) с инструкциями Intel AVX-512 Conflict Detection (AVX-512CD), Intel AVX-512 Exponential and Reciprocal Instructions (AVX-512ER) и Intel AVX-512 Prefetch Instructions (AVX-512PF). Поддержка IMCI была удалена в пользу AVX-512. [78]
Национальный центр научных вычислений в области энергетических исследований объявил, что вторая фаза его новейшей суперкомпьютерной системы «Cori» будет использовать сопроцессоры Knights Landing Xeon Phi. [79]
20 июня 2016 года Intel выпустила семейство продуктов Intel Xeon Phi x200 на основе архитектуры Knights Landing, подчеркнув его применимость не только к традиционным рабочим нагрузкам моделирования, но и к машинному обучению . [80] [81] Модельный ряд, анонсированный при запуске, включал только Xeon Phi загрузочного форм-фактора, но две его версии: стандартные процессоры и процессоры с интегрированной архитектурой Intel Omni-Path Fabric. [82] Последняя обозначается суффиксом F в номере модели. Ожидается, что интегрированная фабрика обеспечит лучшую задержку при более низкой стоимости, чем дискретные высокопроизводительные сетевые карты. [80]
14 ноября 2016 года 48-й список TOP500 содержал две системы, использующие Knights Landing в Топ-10. [83]
Вариант сопроцессора Knight's Landing на базе PCIe никогда не предлагался на общем рынке и был снят с производства к августу 2017 года. [84] Сюда входили карты сопроцессоров 7220A, 7240P и 7220P.
Intel объявила о прекращении разработки Knights Landing летом 2018 года. [85]
Все модели могут повышать свою пиковую скорость, добавляя 200 МГц к своей базовой частоте при работе только одного или двух ядер. При работе от трех до максимального числа ядер чипы могут повышать только на 100 МГц выше базовой частоты. Все чипы выполняют код высокого AVX на частоте, сниженной на 200 МГц. [86]
Имя | Серийный код | Ядра (потоки @ 4× ядра) | Тактовая частота (МГц) | кэш L2 | MCDRAM-память | Память DDR4 | ТДП (Вт) | Система охлаждения | Форм-фактор | Выпущенный | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | ЧБ | Емкость | ЧБ | ||||||||
Xeon Phi 7220A [87] | SC7220A | 68 (272) | 1200 | 1400 | 34 МБ | 16 Гб | 400+ ГБ/с | 384 ГБ | 102,4 ГБ/с | 275 | Активный радиатор | Карта PCIe 3.0 x16 | ??? |
Xeon Phi 7220P [88] | SC7220P | Пассивный радиатор | |||||||||||
Xeon Phi 7240P [89] | SC7240P | 1300 | 1500 |
Серия Xeon Phi 7200 | Номер спецификации | Ядра (Потоки) | Тактовая частота (МГц) | кэш L2 | MCDRAM-память | Память DDR4 | Пиковый DP вычислить | ТДП (Вт) | Гнездо | Дата выпуска | Номер детали | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | ЧБ | Емкость | ЧБ | |||||||||
Xeon Phi 7210 [90] | SR2ME (B0) | 64 (256) | 1300 | 1500 | 32 МБ | 16 Гб | 400+ ГБ/с | 384 ГБ | 102,4 ГБ/с | 2662 ГФЛОПС | 215 | SVLCLGA3647 | 20 июня 2016 г. | HJ8066702859300 |
SR2X4 (B0) | ||||||||||||||
Xeon Phi 7210F [91] | SR2X5 (B0) | 230 | HJ8066702975000 | |||||||||||
Xeon Phi 7230 [92] | SR2MF (B0) | 215 | HJ8066702859400 | |||||||||||
SR2X3 (B0) | ||||||||||||||
Xeon Phi 7230F [93] | SR2X2 (B0) | 230 | HJ8066702269002 | |||||||||||
Xeon Phi 7250 [94] | SR2MD (B0) | 68 (272) | 1400 | 1600 | 34 МБ | 3046 ГФЛОПС [95] | 215 | HJ8066702859200 | ||||||
SR2X1 (B0) | ||||||||||||||
Xeon Phi 7250F [96] | SR2X0 (B0) | 230 | HJ8066702268900 | |||||||||||
Xeon Phi 7290 [97] | SR2WY (B0) | 72 (288) | 1500 | 1700 | 36 МБ | 3456 ГФЛОПС | 245 | HJ8066702974700 | ||||||
Xeon Phi 7290F [98] | SR2WZ (B0) | 260 | HJ8066702975200 |
Knights Mill — кодовое название Intel для продукта Xeon Phi, специализирующегося на глубоком обучении , [99] первоначально выпущенного в декабре 2017 года. [100] Почти идентичный по спецификациям Knights Landing, Knights Mill включает оптимизации для лучшего использования инструкций AVX-512. Производительность с плавающей точкой одинарной и переменной точности увеличилась за счет производительности с плавающей точкой двойной точности.
Серия Xeon Phi 72x5 | Номер спецификации | Ядра (Потоки) | Тактовая частота (МГц) | кэш L2 | MCDRAM-память | Память DDR4 | Пиковый DP вычислить | ТДП (Вт) | Гнездо | Дата выпуска | Номер детали | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | ЧБ | Емкость | ЧБ | |||||||||
Xeon Phi 7235 | СР3ВФ (А0) | 64 (256) | 1300 | 1400 | 32 МБ | 16 Гб | 400+ ГБ/с | 384 ГБ | 102,4 ГБ/с | Будет объявлено дополнительно | 250 | SVLCLGA3647 | 4 квартал 2017 г. | HJ8068303823900 |
Xeon Phi 7255 | SR3VG (А0) | 68 (272) | 1100 | 1200 | 34 МБ | 115,2 ГБ/с | Будет объявлено дополнительно | 215 | HJ8068303826300 | |||||
Xeon Phi 7285 | SR3VE (А0) | 68 (272) | 1300 | 1400 | 34 МБ | 115,2 ГБ/с | Будет объявлено дополнительно | 250 | HJ8068303823800 | |||||
Xeon Phi 7295 | SR3VD (А0) | 72 (288) | 1500 | 1600 | 36 МБ | 115,2 ГБ/с | Будет объявлено дополнительно | 320 | HJ8068303823700 |
Knights Hill было кодовым названием архитектуры MIC третьего поколения, о которой Intel объявила первые подробности на SC14. [101] Она должна была производиться по 10-нм техпроцессу. [102]
Ожидалось, что Knights Hill будет использоваться в суперкомпьютере Aurora Министерства энергетики США , который будет развернут в Аргоннской национальной лаборатории . [103] [104] Однако Aurora была отложена в пользу использования «продвинутой архитектуры» с упором на машинное обучение. [105] [106]
В 2017 году Intel объявила, что Knights Hill был отменен в пользу другой архитектуры, созданной с нуля, чтобы обеспечить Exascale вычисления в будущем. Эта новая архитектура теперь ожидается в 2020–2021 годах [ нужно обновление ] . [107] [108]
В одном исследовании производительности и программируемости сообщается, что для достижения высокой производительности с Xeon Phi по-прежнему требуется помощь программистов и что недостаточно полагаться только на компиляторы с традиционными моделями программирования. [109] Другие исследования в различных областях, таких как науки о жизни [110] и глубокое обучение [111] , показали, что использование параллелизма потоков и SIMD Xeon Phi позволяет добиться значительного ускорения.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка )Intel Xeon Phi — это новая торговая марка для всех будущих продуктов на базе архитектуры Intel Many Integrated Core, ориентированных на HPC, предприятия, центры обработки данных и рабочие станции. Первый член семейства продуктов Intel Xeon Phi запланирован к массовому производству к концу 2012 г.