Проект КУПОЛ

Радиотелескоп и вычислительный проект

DOME — это финансируемый правительством Нидерландов проект IBM и ASTRON в форме государственно-частного партнерства, сосредоточенный на Square Kilometre Array (SKA), крупнейшем в мире запланированном радиотелескопе . SKA будет построен в Австралии и Южной Африке. Целью проекта DOME является разработка дорожной карты технологий, которая применима как к SKA, так и к IBM. 5-летний проект был начат в 2012 году и совместно финансируется правительством Нидерландов и IBM Research в Цюрихе, Швейцария, и ASTRON в Нидерландах. ^[1]^[2]^[3]^[4] Проект официально завершился 30 сентября 2017 года.

Проект DOME сосредоточен на трех областях вычислений: экологически чистых вычислениях , данных и потоковой передаче, а также нанофотонике и разделен на семь исследовательских проектов.

P1 Алгоритмы и машины – Поскольку традиционное масштабирование вычислений по сути уперлось в стену, необходим новый набор методологий и принципов для проектирования будущих крупномасштабных компьютеров. Это будет зонтичный проект для остальных шести.
Модели доступа P2 . При необходимости хранения петабайт данных в день необходимо разработать новый подход к многоуровневому хранению данных и средам хранения.
P3 Nano Photonics – Волоконно-оптическая связь на больших расстояниях и между системами не является чем-то новым, но предстоит еще многое сделать в области оптической связи внутри компьютерных систем и внутри самих телескопов.
Микросерверы P4 – новые требования к более высокой плотности вычислений, более высокой производительности на ватт и уменьшению сложности систем предполагают новый тип индивидуально спроектированного сервера
Ускорители P5 – в связи с выравниванием общей производительности вычислений будут изучаться специальные архитектуры для достижения следующего уровня производительности для специализированных задач, таких как обработка и анализ сигналов.
P6 Compressive Sampling – фундаментальные исследования в области специализированной обработки сигналов и алгоритмов машинного обучения для сбора, обработки и анализа радиоастрономических данных. Сжатое зондирование, алгебраические системы, машинное обучение и распознавание образов являются основными направлениями.
P7 Связь в реальном времени — сокращение задержек, вызванных избыточными сетевыми операциями в очень крупных системах, и оптимизация использования полосы пропускания связи таким образом, чтобы правильные данные попадали на нужный блок обработки в реальном времени.

P1 Алгоритмы и машины

За последние десятилетия конструкция компьютеров кардинально изменилась, но старые парадигмы все еще правят. Текущие конструкции основаны на отдельных компьютерах, работающих с небольшими наборами данных в одном месте. SKA столкнется с совершенно иной ситуацией, работая с чрезвычайно большим набором данных, собранным в бесчисленном количестве географически разделенных мест с использованием десятков тысяч отдельных компьютеров в режиме реального времени. Фундаментальные принципы проектирования такой машины должны быть пересмотрены. Параметры, касающиеся огибающей мощности, технологий ускорителей, распределения рабочей нагрузки, размера памяти, архитектуры ЦП, взаимосвязей узлов, должны быть исследованы, чтобы составить новую базу для проектирования. ^[5] Инструменты, полученные в результате этого проекта, будут открыты для исходного кода в начале 2018 года.

Это фундаментальное исследование послужит своего рода зонтиком для остальных шести направлений и поможет принять правильные решения относительно архитектурных направлений.

Первым шагом станет ретроспективный анализ конструкции телескопов LOFAR и MeerKAT и разработка инструмента проектирования для использования при проектировании очень больших и распределенных компьютеров.

Модели доступа P2

Этот проект будет сосредоточен на очень большом объеме данных, которые должен обрабатывать DOME. SKA будет генерировать петабайты данных ежедневно, и их необходимо обрабатывать по-разному в зависимости от срочности и географического положения, будь то рядом с телескопическими решетками или в центрах обработки данных. Необходимо разработать сложное многоуровневое решение с использованием множества технологий, которые в настоящее время выходят за рамки современного уровня техники. Движущими силами проектов будут минимально возможные затраты, доступность и энергоэффективность.

Этот многоуровневый подход будет объединять несколько различных видов программных технологий для анализа, просеивания, распределения, хранения и извлечения данных на оборудовании, начиная от традиционных носителей информации, таких как магнитная лента и жесткие диски, до недавно разработанных технологий, таких как память с изменением фазы . Пригодность различных носителей информации в значительной степени зависит от шаблонов использования при записи и чтении данных, и эти шаблоны будут меняться со временем, поэтому также должно быть место для изменений в конструкции. ^[6]

P3 Нано Фотоника

Транспортировка данных является основным фактором, влияющим на проектирование от самых крупных масштабов до самых мелких DOME. Стоимость электрической связи по медным проводам будет стимулировать применение маломощных фотонных соединений, от соединений между собирающими антеннами и центрами обработки данных до соединения устройств внутри компьютеров. IBM и ASTRON имеют передовые исследовательские программы в области нанофотоники , формирования луча и оптических связей , и они объединят свои усилия для новых проектов. ^[7]

Данный исследовательский проект разделен на четыре научно-исследовательских раздела, изучающих цифровые оптические соединения, аналоговые оптические соединения и аналоговую оптическую обработку сигналов.

Технология цифровых оптических соединений для плат обработки астрономических сигналов .
Аналоговая оптическая технология соединения для входных каскадов матриц фокальной плоскости .
Аналоговая оптическая технология соединения для фотонных фазированных приемных ячеек.
Аналоговая оптическая связь и технология обработки сигналов для фотонных решеток фокальной плоскости.

В феврале 2013 года на Международной конференции по твердотельным схемам (ISSCC) IBM и Федеральная политехническая школа Лозанны (EPFL) в Швейцарии продемонстрировали аналого-цифровой преобразователь (АЦП) со скоростью 100 Гбит/с . ^[8] В феврале 2014 года на ISSCC IBM и ASTRON продемонстрировали АЦП со скоростью 400 Гбит/с. ^[9]

Микросерверы P4

В 2012 году группа IBM под руководством Рональда П. Луйтена начала работу над проектом вычислительного плотного и энергоэффективного 64-битного сервера на основе стандартных компонентов под управлением Linux . Лучше всего этим целям отвечала конструкция системы на кристалле (SoC), в которой большинство необходимых компонентов размещалось бы на одном кристалле, и появилось определение «микросервера», в котором по сути вся материнская плата (за исключением оперативной памяти и загрузочной флэш-памяти) размещалась бы на кристалле. Были исследованы решения на базе ARM , x86 и Power ISA , и лучшим оказалось решение на базе двухъядерного процессора P5020 / четырехъядерного процессора P5040 на базе Power ISA от Freescale .

Дизайн

Полученный микросервер помещается в тот же форм-фактор, что и стандартный сокет FB-DIMM . Чип SoC, около 20 ГБ DRAM и несколько управляющих чипов (например, PSoC 3 от Cypress, используемый для мониторинга, отладки и загрузки ) составляют полный вычислительный узел с физическими размерами 133×55 мм. Контакты карты используются для SATA , пяти Гбит и двух 10 Гбит портов Ethernet , одного интерфейса SD-карты , одного интерфейса USB 2 и питания.

Вычислительная карта работает в пределах мощности 35 Вт с запасом до 70 Вт. Идея состоит в том, чтобы разместить около сотни таких вычислительных карт в 19-дюймовом ящике стойки 2U вместе с сетевыми коммутаторами для внешнего хранения и связи. Охлаждение будет осуществляться с помощью решения Aquasar для охлаждения горячей водой, впервые представленного суперкомпьютером SuperMUC в Германии.

Будущее

В конце 2013 года была выбрана новая SoC. Более новая 12-ядерная модель T4240 от Freescale значительно мощнее и работает в том же диапазоне мощности, что и T5020. Новая прототипная карта микросервера была создана и проверена для масштабного развертывания в полном 2U-ящике в начале 2014 года. Позже была разработана 8-ядерная плата ARMv8 с использованием детали LS2088A от NXP (ранее Freescale). В конце 2017 года IBM лицензирует технологию стартапу, который планирует вывести ее на рынок к середине 2018 года.

Ускорители P5

Традиционные высокопроизводительные процессоры достигли предела производительности в конце 2000-х годов, когда тактовая частота больше не могла быть увеличена из-за растущих требований к питанию. Одним из решений является включение оборудования для разгрузки наиболее распространенных и/или ресурсоемких задач на специализированное оборудование, называемое ускорителями . Эта область исследований попытается определить эти области и разработать алгоритмы и оборудование для преодоления узких мест. Вероятно, будут ускорители, выполняющие обнаружение шаблонов , синтаксический анализ , поиск данных и обработку сигналов . Оборудование будет двух классов: фиксированные ускорители для статических задач или программируемые ускорители для семейства задач со схожими характеристиками. Проект также рассмотрит массивно- параллельные вычисления с использованием графических процессоров массового производства . ^[10]

P6 Компрессионная выборка

Проект компрессионной выборки является фундаментальным исследованием обработки сигналов в сотрудничестве с Делфтским техническим университетом . В контексте радиоастрономии захват, анализ и обработка сигналов чрезвычайно интенсивны в вычислениях на огромных наборах данных. Цель состоит в том, чтобы выполнять выборку и сжатие одновременно и использовать машинное обучение для определения того, что сохранить, а что выбросить, желательно как можно ближе к сборщикам данных. Цель этого проекта заключается в разработке алгоритмов компрессионной выборки для использования при захвате сигнала и калибровке шаблонов для сохранения в постоянно растущем числе кластеров шаблонов . Исследование также будет решать проблему ухудшения качества шаблонов, обнаружения выбросов , классификации объектов и формирования изображений. ^[11]^[12]

P7 Связь в реальном времени

Перемещение данных от коллекторов к технологическим объектам традиционно задерживается из-за высокой задержки ввода-вывода , низкой пропускной способности соединений, а данные часто умножаются по пути из-за отсутствия целенаправленного проектирования сети связи. Этот исследовательский проект попытается сократить задержку до минимума и спроектировать системы ввода-вывода таким образом, чтобы данные записывались непосредственно в процессоры обработки на экзафлопсном компьютере . На первом этапе будут выявлены узкие места системы и исследован удаленный прямой доступ к памяти (RDMA). На втором этапе будет исследовано использование стандартной технологии RDMA в межсетевых соединениях. Третий этап включает разработку функциональных прототипов. ^[13]

Ссылки

^ DOME: Exascale Computer от IBM и ASTRON для радиотелескопа SKA
^ "NLeSC подписывает соглашение DOME с IBM и ASTRON". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ IBM рассматривает новые технологии для решения беспрецедентной задачи обработки данных
^ От Большого взрыва до Больших данных: ASTRON и IBM сотрудничают для изучения происхождения Вселенной
^ "ASTRON & IBM Center for Exascale Technology – Algorithms & Machines". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ "ASTRON & IBM Center for Exascale Technology – Access Patterns". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ "ASTRON & IBM Center for Exascale Technology – Nano Photonics". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ Исследования сверхбыстрого Ethernet повышают скорость Интернета до 100 Гбит/с
^ IBM открывает дверь в Интернет со скоростью 400 Гбит/с
^ "ASTRON & IBM Center for Exascale Technology – Accelerators". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ "ASTRON & IBM Center for Exascale Technology – Compressive Sampling". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ "Обработка данных и формирование изображений для будущих радиотелескопов (DRIFT)". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .
^ "ASTRON & IBM Center for Exascale Technology – RT Communication". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[1] DOME: Exascale Computer от IBM и ASTRON для радиотелескопа SKA

[2] "NLeSC подписывает соглашение DOME с IBM и ASTRON". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[3] IBM рассматривает новые технологии для решения беспрецедентной задачи обработки данных

[4] От Большого взрыва до Больших данных: ASTRON и IBM сотрудничают для изучения происхождения Вселенной

[5] "ASTRON & IBM Center for Exascale Technology – Algorithms & Machines". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[6] "ASTRON & IBM Center for Exascale Technology – Access Patterns". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[7] "ASTRON & IBM Center for Exascale Technology – Nano Photonics". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[8] Исследования сверхбыстрого Ethernet повышают скорость Интернета до 100 Гбит/с

[9] IBM открывает дверь в Интернет со скоростью 400 Гбит/с

[10] "ASTRON & IBM Center for Exascale Technology – Accelerators". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[11] "ASTRON & IBM Center for Exascale Technology – Compressive Sampling". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[12] "Обработка данных и формирование изображений для будущих радиотелескопов (DRIFT)". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .

[13] "ASTRON & IBM Center for Exascale Technology – RT Communication". Архивировано из оригинала 2014-07-14 . Получено 2014-07-02 .