![]() | |
Активный | эксплуатация 2024 |
---|---|
Спонсоры | Швейцарская Конфедерация |
Операторы | Швейцарский национальный суперкомпьютерный центр (CSCS) |
Расположение | Лугано-Корнадеро, Швейцария |
Архитектура | HPE Cray EX254n: Nvidia GH200 Grace Hopper с комбинациями процессоров Grace 72 ARMv9-Neoverse-V2 и графических процессоров Hopper H100 Tensor Core (всего 1'305'600 ядер) |
Власть | 10 МВт при полной нагрузке |
Операционная система | Линукс |
Память | 144 терабайта (ТБ) |
Скорость | 270 P FLOPS (Rмакс) |
Рейтинг | TOP500 : 6, июнь 2024 г. |
Веб-сайт | cscs.ch |
Источники | "Nvidia GH200 Grace Hopper Superchip" |
Суперкомпьютер Alps — это высокопроизводительный компьютер, финансируемый Швейцарской Конфедерацией через ETH Domain , с главным местоположением в Лугано . Он является частью Швейцарского национального суперкомпьютерного центра (CSCS), который предоставляет вычислительные услуги для избранных научных клиентов. [1]
Швейцарский национальный суперкомпьютерный центр (CSCS) был основан в 1991 году. Этот центр управляет пользовательской лабораторией для вычислительных услуг. Примерами в прошлом являются анализ данных с Большого адронного коллайдера (LHC) в ЦЕРНе , хранение данных для рентгеновского лазера SwissFEL Института Пауля Шеррера и моделирование прогнозов погоды MeteoSwiss . [2] Эти вычислительные услуги со временем предоставлялись все более мощными вычислительными системами. С 2020 года и ввода в эксплуатацию высокопроизводительного компьютера HPE Cray EX для новых компьютеров используется название Alps . 14 сентября 2024 года был открыт новейший суперкомпьютер Alps HPE Cray EX254n . Еще раньше планируемая производительность Alps была описана как возможность обучения LLM GPT-3 от OpenAI за два дня. [3] Этот суперкомпьютер основан на интегральных схемах (ИС) Grace Hopper GH200 от Nvidia [4] [5] и достигает производительности 270 петафлопс в секунду, что означает 270 квадриллионов операций в секунду. В 2024 году он займет 6-е место ( список TOP500 ) среди самых быстрых компьютеров в мире, хотя внутренние компьютеры Meta , Microsoft , Alphabet Inc./Google LLC и Oracle , вероятно, более мощные, но их производительность неизвестна. Группа экспертов из различных естественных наук решает, кому разрешено использовать этот новый компьютер. Использование исследовательским сотрудничеством EPFL и Йельского института глобального здравоохранения уже одобрено. Эта исследовательская группа использует модель ИИ с открытым исходным кодом от Meta и обучила ее на Alps с данными о состоянии здоровья из медицинских исследований. С Alps ученые в Швейцарии получают инфраструктуру для использования многих возможностей искусственного интеллекта (ИИ). Новый суперкомпьютер используется в рамках швейцарской инициативы в области искусственного интеллекта (ИИ) Швейцарской высшей технической школы Цюриха и Федеральной политехнической школы Лозанны (EPFL) .
Для надлежащего размещения и эксплуатации современных суперкомпьютеров в Лугано-Корнадеро было построено новое здание центра обработки данных и прилегающее к нему офисное здание. Здание центра обработки данных состоит из трех этажей. На нижнем этаже размещается основная инфраструктура с первичным распределением электроэнергии и воды, а также аварийным питанием через батареи. Охлаждение компьютеров и зданий летом осуществляется озерной водой из озера Лугано. С глубины 45 метров в центр обработки данных по трубам длиной 2,8 км подается 460 литров холодной озерной воды в секунду. Там она охлаждает внутренний контур охлаждения компьютера через теплообменник. [6] Вторичное распределение осуществляется на среднем этаже с использованием распределительных устройств питания, которые позволяют гибко устанавливать компьютеры выше. Компьютеры расположены на верхнем этаже. [7] Новейший высокопараллельный суперкомпьютер Alps был поставлен компанией Hewlett Packard Enterprise (HPE), которая в 2019 году приобрела в качестве дочерней компании компанию Cray, специализирующуюся на суперкомпьютерах. Он установлен на площади 2000 м2 . Общая стоимость составила около 100 миллионов швейцарских франков.
Для достижения превосходной производительности комбинации центральных процессоров ( ЦП ) с графическими процессорами ( ГП ), а также их связанной памяти (128 ГБ LPDDR-5X RAM; 96 ГБ HBM-3) [8] размещаются в непосредственной близости на одной и той же монолитной интегральной схеме, предоставленной Nvidia . Массивы из 72 ЦП называются Grace и состоят из процессоров ARMv 9-Neoverse-V2, которые являются RISC- процессорами. 132 ГП называются Hopper H100 Tensor Core . [9] Комбинации указанных 72 ЦП вместе со 132 ГП, интегрированными в чип VLSI, называются GH200 Grace Hopper в памяти Grace Hopper . Всего в этой системе Alps доступно 1'305'600 процессорных ядер (ЦП и ГП). Обмен данными между 2'688 узлами происходит в сети типа Ethernet , называемой Slingshot-11, со скоростью 200 Гбит/с. [10] [8] Один узел состоит из четырех GH200 в конфигурации Quad GH200 . Каждый узел Quad GH200 действует как одна система NUMA с 288 ядрами ЦП и 4 ГП. ЦП Grace взаимодействуют через кэш-когерентное соединение, в то время как ГП Hopper взаимодействуют через NVLink. [11]
Команда CSCS разрабатывает специальное программное обеспечение для различных приложений. Потребляемая мощность компьютера при полной нагрузке составляет 10 МВт. Стоимость электроэнергии оценивается примерно в 15 миллионов швейцарских франков в год.