Альпы (суперкомпьютер)

Альпы
Активныйэксплуатация 2024
СпонсорыШвейцарская Конфедерация
ОператорыШвейцарский национальный суперкомпьютерный центр (CSCS)
РасположениеЛугано-Корнадеро, Швейцария
АрхитектураHPE Cray EX254n: Nvidia GH200 Grace Hopper с комбинациями процессоров Grace 72 ARMv9-Neoverse-V2 и графических процессоров Hopper H100 Tensor Core (всего 1'305'600 ядер)
Власть10 МВт при полной нагрузке
Операционная системаЛинукс
Память144 терабайта (ТБ)
Скорость270 P FLOPS (Rмакс)
РейтингTOP500 : 6, июнь 2024 г.
Веб-сайтcscs.ch
Источники"Nvidia GH200 Grace Hopper Superchip"

Суперкомпьютер Alps — это высокопроизводительный компьютер, финансируемый Швейцарской Конфедерацией через ETH Domain , с главным местоположением в Лугано . Он является частью Швейцарского национального суперкомпьютерного центра (CSCS), который предоставляет вычислительные услуги для избранных научных клиентов. [1]

Швейцарский национальный суперкомпьютерный центр (CSCS) был основан в 1991 году. Этот центр управляет пользовательской лабораторией для вычислительных услуг. Примерами в прошлом являются анализ данных с Большого адронного коллайдера (LHC) в ЦЕРНе , хранение данных для рентгеновского лазера SwissFEL Института Пауля Шеррера и моделирование прогнозов погоды MeteoSwiss . [2] Эти вычислительные услуги со временем предоставлялись все более мощными вычислительными системами. С 2020 года и ввода в эксплуатацию высокопроизводительного компьютера HPE Cray EX для новых компьютеров используется название Alps . 14 сентября 2024 года был открыт новейший суперкомпьютер Alps HPE Cray EX254n . Еще раньше планируемая производительность Alps была описана как возможность обучения LLM GPT-3 от OpenAI за два дня. [3] Этот суперкомпьютер основан на интегральных схемах (ИС) Grace Hopper GH200 от Nvidia [4] [5] и достигает производительности 270 петафлопс в секунду, что означает 270 квадриллионов операций в секунду. В 2024 году он займет 6-е место ( список TOP500 ) среди самых быстрых компьютеров в мире, хотя внутренние компьютеры Meta , Microsoft , Alphabet Inc./Google LLC и Oracle , вероятно, более мощные, но их производительность неизвестна. Группа экспертов из различных естественных наук решает, кому разрешено использовать этот новый компьютер. Использование исследовательским сотрудничеством EPFL и Йельского института глобального здравоохранения уже одобрено. Эта исследовательская группа использует модель ИИ с открытым исходным кодом от Meta и обучила ее на Alps с данными о состоянии здоровья из медицинских исследований. С Alps ученые в Швейцарии получают инфраструктуру для использования многих возможностей искусственного интеллекта (ИИ). Новый суперкомпьютер используется в рамках швейцарской инициативы в области искусственного интеллекта (ИИ) Швейцарской высшей технической школы Цюриха и Федеральной политехнической школы Лозанны (EPFL) .

Структура

Офисное здание CSCS в Лугано, Швейцария
Подземное распределение водяного охлаждения для компьютеров CSCS

Для надлежащего размещения и эксплуатации современных суперкомпьютеров в Лугано-Корнадеро было построено новое здание центра обработки данных и прилегающее к нему офисное здание. Здание центра обработки данных состоит из трех этажей. На нижнем этаже размещается основная инфраструктура с первичным распределением электроэнергии и воды, а также аварийным питанием через батареи. Охлаждение компьютеров и зданий летом осуществляется озерной водой из озера Лугано. С глубины 45 метров в центр обработки данных по трубам длиной 2,8 км подается 460 литров холодной озерной воды в секунду. Там она охлаждает внутренний контур охлаждения компьютера через теплообменник. [6] Вторичное распределение осуществляется на среднем этаже с использованием распределительных устройств питания, которые позволяют гибко устанавливать компьютеры выше. Компьютеры расположены на верхнем этаже. [7] Новейший высокопараллельный суперкомпьютер Alps был поставлен компанией Hewlett Packard Enterprise (HPE), которая в 2019 году приобрела в качестве дочерней компании компанию Cray, специализирующуюся на суперкомпьютерах. Он установлен на площади 2000 м2 . Общая стоимость составила около 100 миллионов швейцарских франков.

Электроника

Интерьер шкафов электроники суперкомпьютера "Альпс"

Для достижения превосходной производительности комбинации центральных процессоров ( ЦП ) с графическими процессорами ( ГП ), а также их связанной памяти (128 ГБ LPDDR-5X RAM; 96 ГБ HBM-3) [8] размещаются в непосредственной близости на одной и той же монолитной интегральной схеме, предоставленной Nvidia . Массивы из 72 ЦП называются Grace и состоят из процессоров ARMv 9-Neoverse-V2, которые являются RISC- процессорами. 132 ГП называются Hopper H100 Tensor Core . [9] Комбинации указанных 72 ЦП вместе со 132 ГП, интегрированными в чип VLSI, называются GH200 Grace Hopper в памяти Grace Hopper . Всего в этой системе Alps доступно 1'305'600 процессорных ядер (ЦП и ГП). Обмен данными между 2'688 узлами происходит в сети типа Ethernet , называемой Slingshot-11, со скоростью 200 Гбит/с. [10] [8] Один узел состоит из четырех GH200 в конфигурации Quad GH200 . Каждый узел Quad GH200 действует как одна система NUMA с 288 ядрами ЦП и 4 ГП. ЦП Grace взаимодействуют через кэш-когерентное соединение, в то время как ГП Hopper взаимодействуют через NVLink. [11]

Операция

Команда CSCS разрабатывает специальное программное обеспечение для различных приложений. Потребляемая мощность компьютера при полной нагрузке составляет 10 МВт. Стоимость электроэнергии оценивается примерно в 15 миллионов швейцарских франков в год.

Ссылки

  1. ^ Джоя да Силва: ETH weiht einen der Contemporarysten KI-Supercomputer der Welt ein. В: Neue Zürcher Zeitung , 14 сентября 2024 г. Дата обращения 26 сентября 2024 г.
  2. ^ О CSCS. cscs.ch. Получено 26 сентября 2024 г.
  3. ^ Система Alp для продвижения исследований в области климата, физики и естественных наук с возможностями ИИ, в 7 раз более мощными, чем у нынешней ведущей в мире системы для ИИ на MLPerf. nvidia.com, 12 апреля 2021 г. Получено 26 сентября 2024 г.
  4. ^ Бенедикт Шван (01.06.2023). «Nvidia: Die KI aus dem Monstercomputer» (на немецком языке). Зейт Онлайн . Проверено 26 сентября 2024 г.
  5. ^ Neue Forschungsinfrastruktur: Суперкомпьютер «Альпы» eingeweiht. ETH Zürich, 14 сентября 2024 г. Дата обращения 26 сентября 2024 г.
  6. ^ Вода из озера для охлаждения суперкомпьютеров. cscs.ch 2015. Получено 26 сентября 2024 г.
  7. Новое инновационное здание для CSCS в Лугано. cscs.ch 2015. Получено 26 сентября 2024 г.
  8. ^ ab Alps: Спецификация системы. cscs.ch. Получено 1 октября 2024 г.
  9. ^ Техническое описание: NVIDIA GH200 Grace Hopper Superchip. nvidia.com. Получено 30 сентября 2024 г.
  10. ^ TOP500: Альпы, top500.org. Получено 30 сентября 2024 г.
  11. ^ Фуско, Луиджи и др. «Понимание перемещения данных в сильносвязанных гетерогенных системах: пример с суперчипом Грейс Хоппер». arXiv : 2408.11556 .
Взято с "https://en.wikipedia.org/w/index.php?title=Alps_(суперкомпьютер)&oldid=1266535669"