Дизайнер | Крей |
---|---|
Биты | 64-битный |
Введено | 2005 |
Версия | 3-е поколение Tera MTA |
Порядковый номер байтов | Big-endian |
Предшественник | Крей МТА-2 |
Преемник | Крей XMT2 |
Регистры | |
32 универсальных на поток (4096 на ЦП) 8 целевых на поток (1024 на ЦП) |
Cray XMT ( Cray eXtreme MultiThreading , [1] кодовое название Eldorado [2] ) — масштабируемая многопоточная архитектура суперкомпьютера с общей памятью от Cray , основанная на третьем поколении архитектуры Tera MTA , ориентированная на большие графовые задачи (например, семантические базы данных, большие данные , сопоставление с образцом ). [3] [4] [5] Представленная в 2005 году, она заменяет более раннюю неудачную Cray MTA-2 . Она использует процессоры Threadstorm3 внутри блейд-серверов Cray XT3 . Разработанная для использования стандартных деталей и существующих подсистем для других коммерческих систем, она смягчила недостатки Cray MTA-2, связанные с высокой стоимостью полностью индивидуального производства и поддержки. [2] Он принес различные существенные улучшения по сравнению с Cray MTA-2, наиболее заметными из которых стали почти утроение пиковой производительности, а также значительное увеличение максимального количества ЦП до 8192 и максимального объема памяти до 128 ТБ с максимальным объемом TLB данных 512 ТБ. [2] [3]
Cray XMT использует скремблированную [3] модель памяти с адресацией по содержимому [6] на модулях DDR1 ECC для неявной балансировки нагрузки доступа к памяти по всему общему глобальному адресному пространству системы. [5] Использование 4 дополнительных бит расширенной семантики памяти ( полный/пустой , пересылка и 2 бита прерывания ) на 64-битное слово памяти обеспечивает легкую, мелкозернистую синхронизацию во всей памяти. [7] Аппаратные прерывания отсутствуют, а аппаратные потоки выделяются инструкцией, а не ОС. [5] [7]
Фронтенд (узлы входа в систему, ввода-вывода и другие узлы обслуживания, использующие процессоры AMD Opteron и работающие под управлением SLES Linux ) и бэкенд (вычислительные узлы, использующие процессоры Threadstorm3 и работающие под управлением MTK, простого микроядра на базе BSD Unix [3] ) взаимодействуют через интерфейс LUC (Lightweight User Communication), двунаправленный клиент-серверный интерфейс в стиле RPC . [1] [5]
Общая информация | |
---|---|
Запущен | 2005 |
Прекращено | 2011 |
Разработано | Крей |
Производительность | |
Макс. тактовая частота ЦП | 500 МГц |
Скорости HyperTransport | до 300 ГТ/с |
Архитектура и классификация | |
Набор инструкций | МТА ИСА |
Физические характеристики | |
Ядра |
|
Гнездо | |
История | |
Предшественник | Процессор Cray MTA-2 |
Преемник | Threadstorm4 |
Threadstorm3 (называемый «процессором MT» [2] и Threadstorm до XMT2 [8] ) — это 64-битный одноядерный процессор VLIW barrel (совместимый с 940-контактным сокетом 940 , используемым процессорами AMD Opteron ) со 128 аппаратными потоками , на каждый из которых может быть отображен программный поток (эффективно создавая 128 аппаратных потоков на ЦП), работающий на частоте 500 МГц и использующий набор инструкций MTA или его надмножество. [7] [9] [nb 1] Он имеет 128 КБ, 4-канальный ассоциативный буфер данных. Каждый Threadstorm3 имеет 128 отдельных наборов регистров и счетчиков программ (по одному на каждый поток), которые достаточно [10] полностью переключаются контекстом в каждом цикле. [5] Его предполагаемая пиковая производительность составляет 1,5 GFLOPS . Он имеет 3 функциональных блока (память, объединенное умножение-сложение и управление), которые получают операции из одной и той же инструкции MTA и работают в одном цикле. [7] Каждый поток имеет 32 регистра общего назначения, 8 целевых регистров и слово состояния, содержащее счетчик программ. [6] Высокоуровневый контроль распределения заданий по потокам невозможен. [5] [nb 2] Из-за длины конвейера MTA, равной 21, каждый поток выбирается для повторного выполнения инструкций не ранее, чем через 21 цикл. [11] TDP пакета процессора составляет 30 Вт. [ 12]
Благодаря переключению контекста на уровне потоков в каждом цикле производительность процессоров Threadstorm не ограничивается временем доступа к памяти. В упрощенной модели на каждом такте выполняется инструкция одного из потоков, а другой запрос памяти ставится в очередь с пониманием того, что к моменту готовности следующего раунда выполнения запрошенные данные уже поступили. [13] Это противоречит многим традиционным архитектурам, которые задерживаются на доступе к памяти. Архитектура отлично подходит для схем обхода данных, где последующий доступ к памяти не может быть легко предсказан, и поэтому не очень подходит для традиционной модели кэширования. [1] Главным архитектором Threadstorm был Бертон Дж. Смит . [1]
Дизайнер | Крей |
---|---|
Биты | 64-бит |
Введено | 2011 |
Версия | 4-е поколение Tera MTA |
Порядковый номер байтов | Big-endian |
Предшественник | Крей XMT |
Регистры | |
32 универсальных на поток (4096 на ЦП) 8 целей на поток (1024 на ЦП) |
Cray XMT2 [3] (также «следующее поколение XMT» [8] или просто XMT [6] ) — масштабируемый многопоточный суперкомпьютер с общей памятью от Cray , основанный на четвертом поколении архитектуры Tera MTA . [5] Представленный в 2011 году, он заменяет Cray XMT, у которого были проблемы с точками перегрузки памяти. [8] Он использует процессоры Threadstorm4 внутри блейдов Cray XT5 и увеличивает емкость памяти в восемь раз до 512 ТБ и пропускную способность памяти в три раза (300 МГц вместо 200 МГц) по сравнению с XMT за счет использования вдвое большего количества модулей памяти на узел и DDR2. [6] [8] Он вводит соединение Node Pair Link между Threadstorm, а также узлы только с памятью, с пакетами Threadstorm4, у которых отключены компоненты CPU и HyperTransport 1.x. [5] Базовая модель памяти с зашифрованным контентом была унаследована от XMT. XMT2 использует 2 дополнительных бита EMS ( полный/пустой и расширенный ) вместо 4, как в XMT.
Общая информация | |
---|---|
Запущен | 2011 |
Прекращено | 2015? |
Разработано | Крей |
Производительность | |
Макс. тактовая частота ЦП | 500 МГц |
Скорости HyperTransport | до 400 ГТ/с |
Архитектура и классификация | |
Набор инструкций | МТА ИСА |
Физические характеристики | |
Ядра |
|
Гнездо | |
История | |
Предшественник | Threadstorm3 |
Threadstorm4 (также «Threadstorm IV» [1] и «Threadstorm 4.0» [nb 3] ) — это 64-битный одноядерный процессор VLIW barrel (совместимый с 1207-контактным разъемом Socket F , используемым процессорами AMD Opteron ) со 128 аппаратными потоками, очень похожий на своего предшественника Threadstorm3. Он оснащен улучшенным контроллером памяти с поддержкой DDR2 и дополнительными 8 регистрами прерываний на поток. Cray намеренно отказался от контроллера DDR3, сославшись на повторное использование существующей инфраструктуры Cray XT5 [nb 4] и более короткую длину пакета, чем DDR3. [nb 5] Хотя более длинная длина пакета может быть компенсирована более высокими скоростями DDR3, это также потребует больше энергии, чего инженеры Cray хотели избежать. [8]
После запуска XMT Cray исследовал возможный многоядерный вариант Threadstorm3, названный Scorpio . Большинство функций Threadstorm3 были сохранены, включая мультиплексирование многих аппаратных потоков на конвейере выполнения и реализацию дополнительных битов состояния для каждого 64-битного слова памяти. Позже Cray отказался от Scorpio, и проект не дал готового чипа. [3]
Разработка Threadstorm4, а также всей архитектуры MTA, тихо прекратилась после XMT2, вероятно, из-за конкуренции со стороны массовых процессоров, таких как Intel Xeon [14] и, возможно, Xeon Phi , хотя Cray никогда официально не прекращал ни XMT, ни XMT2. По состоянию на 2020 год Cray удалил всю клиентскую документацию как по XMT, так и по XMT2 из своего онлайн-каталога.
Cray XMT2 был куплен несколькими федеральными лабораториями и академическими учреждениями, а также некоторыми коммерческими клиентами HPC: например, CSCS (глобальная память 2 ТБ с 64 процессорами Threadstorm4), [15] Noblis CAHPC. [16] Большинство систем на базе XMT и XMT2 были выведены из эксплуатации к 2020 году.
Стив Скотт: Вы можете сделать это просто великолепно с Xeon. Мы не планируем делать еще один процессор ThreadStorm. Но для этого нужны некоторые программные технологии, которые исходят из наследия ThreadStorm.