DOME — это финансируемый правительством Нидерландов проект IBM и ASTRON в форме государственно-частного партнерства, сосредоточенный на Square Kilometre Array (SKA), крупнейшем в мире запланированном радиотелескопе . SKA будет построен в Австралии и Южной Африке. Целью проекта DOME является разработка дорожной карты технологий, которая применима как к SKA, так и к IBM. 5-летний проект был начат в 2012 году и совместно финансируется правительством Нидерландов и IBM Research в Цюрихе, Швейцария, и ASTRON в Нидерландах. [1] [2] [3] [4] Проект официально завершился 30 сентября 2017 года.
Проект DOME сосредоточен на трех областях вычислений: экологически чистых вычислениях , данных и потоковой передаче, а также нанофотонике и разделен на семь исследовательских проектов.
За последние десятилетия конструкция компьютеров кардинально изменилась, но старые парадигмы все еще правят. Текущие конструкции основаны на отдельных компьютерах, работающих с небольшими наборами данных в одном месте. SKA столкнется с совершенно иной ситуацией, работая с чрезвычайно большим набором данных, собранным в бесчисленном количестве географически разделенных мест с использованием десятков тысяч отдельных компьютеров в режиме реального времени. Фундаментальные принципы проектирования такой машины должны быть пересмотрены. Параметры, касающиеся огибающей мощности, технологий ускорителей, распределения рабочей нагрузки, размера памяти, архитектуры ЦП, взаимосвязей узлов, должны быть исследованы, чтобы составить новую базу для проектирования. [5] Инструменты, полученные в результате этого проекта, будут открыты для исходного кода в начале 2018 года.
Это фундаментальное исследование послужит своего рода зонтиком для остальных шести направлений и поможет принять правильные решения относительно архитектурных направлений.
Первым шагом станет ретроспективный анализ конструкции телескопов LOFAR и MeerKAT и разработка инструмента проектирования для использования при проектировании очень больших и распределенных компьютеров.
Этот проект будет сосредоточен на очень большом объеме данных, которые должен обрабатывать DOME. SKA будет генерировать петабайты данных ежедневно, и их необходимо обрабатывать по-разному в зависимости от срочности и географического положения, будь то рядом с телескопическими решетками или в центрах обработки данных. Необходимо разработать сложное многоуровневое решение с использованием множества технологий, которые в настоящее время выходят за рамки современного уровня техники. Движущими силами проектов будут минимально возможные затраты, доступность и энергоэффективность.
Этот многоуровневый подход будет объединять несколько различных видов программных технологий для анализа, просеивания, распределения, хранения и извлечения данных на оборудовании, начиная от традиционных носителей информации, таких как магнитная лента и жесткие диски, до недавно разработанных технологий, таких как память с изменением фазы . Пригодность различных носителей информации в значительной степени зависит от шаблонов использования при записи и чтении данных, и эти шаблоны будут меняться со временем, поэтому также должно быть место для изменений в конструкции. [6]
Транспортировка данных является основным фактором, влияющим на проектирование от самых крупных масштабов до самых мелких DOME. Стоимость электрической связи по медным проводам будет стимулировать применение маломощных фотонных соединений, от соединений между собирающими антеннами и центрами обработки данных до соединения устройств внутри компьютеров. IBM и ASTRON имеют передовые исследовательские программы в области нанофотоники , формирования луча и оптических связей , и они объединят свои усилия для новых проектов. [7]
Данный исследовательский проект разделен на четыре научно-исследовательских раздела, изучающих цифровые оптические соединения, аналоговые оптические соединения и аналоговую оптическую обработку сигналов.
В феврале 2013 года на Международной конференции по твердотельным схемам (ISSCC) IBM и Федеральная политехническая школа Лозанны (EPFL) в Швейцарии продемонстрировали аналого-цифровой преобразователь (АЦП) со скоростью 100 Гбит/с . [8] В феврале 2014 года на ISSCC IBM и ASTRON продемонстрировали АЦП со скоростью 400 Гбит/с. [9]
В 2012 году группа IBM под руководством Рональда П. Луйтена начала работу над проектом вычислительного плотного и энергоэффективного 64-битного сервера на основе стандартных компонентов под управлением Linux . Лучше всего этим целям отвечала конструкция системы на кристалле (SoC), в которой большинство необходимых компонентов размещалось бы на одном кристалле, и появилось определение «микросервера», в котором по сути вся материнская плата (за исключением оперативной памяти и загрузочной флэш-памяти) размещалась бы на кристалле. Были исследованы решения на базе ARM , x86 и Power ISA , и лучшим оказалось решение на базе двухъядерного процессора P5020 / четырехъядерного процессора P5040 на базе Power ISA от Freescale .
Полученный микросервер помещается в тот же форм-фактор, что и стандартный сокет FB-DIMM . Чип SoC, около 20 ГБ DRAM и несколько управляющих чипов (например, PSoC 3 от Cypress, используемый для мониторинга, отладки и загрузки ) составляют полный вычислительный узел с физическими размерами 133×55 мм. Контакты карты используются для SATA , пяти Гбит и двух 10 Гбит портов Ethernet , одного интерфейса SD-карты , одного интерфейса USB 2 и питания.
Вычислительная карта работает в пределах мощности 35 Вт с запасом до 70 Вт. Идея состоит в том, чтобы разместить около сотни таких вычислительных карт в 19-дюймовом ящике стойки 2U вместе с сетевыми коммутаторами для внешнего хранения и связи. Охлаждение будет осуществляться с помощью решения Aquasar для охлаждения горячей водой, впервые представленного суперкомпьютером SuperMUC в Германии.
В конце 2013 года была выбрана новая SoC. Более новая 12-ядерная модель T4240 от Freescale значительно мощнее и работает в том же диапазоне мощности, что и T5020. Новая прототипная карта микросервера была создана и проверена для масштабного развертывания в полном 2U-ящике в начале 2014 года. Позже была разработана 8-ядерная плата ARMv8 с использованием детали LS2088A от NXP (ранее Freescale). В конце 2017 года IBM лицензирует технологию стартапу, который планирует вывести ее на рынок к середине 2018 года.
Традиционные высокопроизводительные процессоры достигли предела производительности в конце 2000-х годов, когда тактовая частота больше не могла быть увеличена из-за растущих требований к питанию. Одним из решений является включение оборудования для разгрузки наиболее распространенных и/или ресурсоемких задач на специализированное оборудование, называемое ускорителями . Эта область исследований попытается определить эти области и разработать алгоритмы и оборудование для преодоления узких мест. Вероятно, будут ускорители, выполняющие обнаружение шаблонов , синтаксический анализ , поиск данных и обработку сигналов . Оборудование будет двух классов: фиксированные ускорители для статических задач или программируемые ускорители для семейства задач со схожими характеристиками. Проект также рассмотрит массивно- параллельные вычисления с использованием графических процессоров массового производства . [10]
Проект компрессионной выборки является фундаментальным исследованием обработки сигналов в сотрудничестве с Делфтским техническим университетом . В контексте радиоастрономии захват, анализ и обработка сигналов чрезвычайно интенсивны в вычислениях на огромных наборах данных. Цель состоит в том, чтобы выполнять выборку и сжатие одновременно и использовать машинное обучение для определения того, что сохранить, а что выбросить, желательно как можно ближе к сборщикам данных. Цель этого проекта заключается в разработке алгоритмов компрессионной выборки для использования при захвате сигнала и калибровке шаблонов для сохранения в постоянно растущем числе кластеров шаблонов . Исследование также будет решать проблему ухудшения качества шаблонов, обнаружения выбросов , классификации объектов и формирования изображений. [11] [12]
Перемещение данных от коллекторов к технологическим объектам традиционно задерживается из-за высокой задержки ввода-вывода , низкой пропускной способности соединений, а данные часто умножаются по пути из-за отсутствия целенаправленного проектирования сети связи. Этот исследовательский проект попытается сократить задержку до минимума и спроектировать системы ввода-вывода таким образом, чтобы данные записывались непосредственно в процессоры обработки на экзафлопсном компьютере . На первом этапе будут выявлены узкие места системы и исследован удаленный прямой доступ к памяти (RDMA). На втором этапе будет исследовано использование стандартной технологии RDMA в межсетевых соединениях. Третий этап включает разработку функциональных прототипов. [13]