MPPA — это архитектура MIMD (Multiple Instruction streams, Multiple Data) с распределенной памятью , доступ к которой осуществляется локально, а не глобально. Каждый процессор строго инкапсулирован, обращаясь только к своему коду и памяти. Связь точка-точка между процессорами напрямую реализуется в настраиваемом соединении. [1]
Массовый параллелизм MPPA и его архитектура распределенной памяти MIMD отличают его от многоядерных и многоядерных архитектур, которые имеют меньше процессоров и SMP или другую архитектуру общей памяти , в основном предназначенную для вычислений общего назначения. Он также отличается от GPGPU с архитектурой SIMD , используемой для приложений HPC . [2]
Программирование
Приложение MPPA разрабатывается путем его выражения в виде иерархической блок-схемы или рабочего процесса , основные объекты которого работают параллельно, каждый на своем процессоре. Аналогично, большие объекты данных могут быть разбиты и распределены по локальным запоминающим устройствам с параллельным доступом. Объекты взаимодействуют через параллельную структуру выделенных каналов. Цель состоит в том, чтобы максимизировать совокупную пропускную способность при минимизации локальной задержки, оптимизируя производительность и эффективность. Модель вычислений MPPA похожа на сеть процессов Кана или взаимодействующие последовательные процессы (CSP). [3]
MPPA, разработанные в компаниях, включают те, что были разработаны в: Ambric , PicoChip , Intel , [7] IntellaSys, GreenArrays, ASOCS , Tilera , Kalray , Coherent Logix, Tabula и Adapteva . Aspex (Ericsson) Linedancer отличается тем, что это был массив SIMD Massive wide , а не MPPA. Строго говоря, он мог бы квалифицироваться как SIMT, поскольку все 4096 из 3000 ядер вентилей имели собственную ассоциативную память. [8] [9]
Китайский проект Sunway разработал собственный 260-ядерный многоядерный чип SW26010 для суперкомпьютера TaihuLight , который по состоянию на 2016 год является самым быстрым суперкомпьютером в мире. [15] [16]
Процессоры Anton 3, разработанные DE Shaw Research для моделирования молекулярной динамики , содержат массивы из 576 процессоров, организованных в мозаичную сетку 12×24 пар ядер; маршрутизированная сеть связывает эти плитки вместе и простирается за пределы чипа к другим узлам в полной системе. [17] [18]
^ Майк Баттс, «Синхронизация через связь в массиве массива параллельных процессоров», IEEE Micro, т. 27, № 5, сентябрь/октябрь 2007 г., IEEE Computer Society
^ Майк Баттс, «Многоядерные и массивно-параллельные платформы и масштабируемость по закону Мура», Труды конференции по встраиваемым системам — Кремниевая долина, апрель 2008 г.
^ Майк Баттс, Брэд Бадлонг, Пол Уоссон, Эд Уайт, «Реконфигурируемые рабочие фермы на массиве массива параллельных процессоров», Труды FCCM, апрель 2008 г., IEEE Computer Society
^ Лоран Бонетто, «Масштабно-параллельные массивы обработки (MPPA) для встроенного HD-видео и обработки изображений (часть 1)», Video/Imaging DesignLine, 16 мая 2008 г. http://www.eetimes.com/document.asp?doc_id=1273823
^ Лоран Бонетто, «Масштабно-параллельные массивы обработки (MPPA) для встроенного HD-видео и обработки изображений (часть 2)», Video/Imaging DesignLine, 18 июля 2008 г. http://www.eetimes.com/document.asp?doc_id=1273830
^ Пол Чен, «Многорежимная обработка датчиков с использованием массивов массивов параллельных процессоров (MPPA)», Programmable Logic DesignLine, 18 марта 2008 г. http://www.pldesignline.com/howto/206904379
^ Вангал, Шрирам Р., Джейсон Ховард, Грегори Рул, Саурабх Диге, Ховард Уилсон, Джеймс Чанц, Дэвид Финан и др. «80-плиточный суб-100-ваттный терафлопсный процессор в 65-нм КМОП». Твердотельные схемы, IEEE Journal of 43, № 1 (2008): 29-41.
^ Крикелис, А. (1990). «Искусственная нейронная сеть на массивно-параллельной ассоциативной архитектуре». Международная конференция по нейронным сетям . стр. 673. doi :10.1007/978-94-009-0643-3_39. ISBN978-0-7923-0831-7.
^ Ю, Чжии, Майкл Меувсен, Райан Апперсон, Омар Саттари, Майкл Лай, Джереми Уэбб, Эрик Уорк, Тинуш Мохсенин, Мандип Сингх и Беван Баас. «Асинхронный массив простых процессоров для приложений DSP». На Международной конференции по твердотельным схемам IEEE (ISSCC'06), вып. 49, стр. 428-429. 2006 г.
^ Truong, Dean, Wayne Cheng, Tinoosh Mohsenin, Zhiyi Yu, Toney Jacobson, Gouri Landge, Michael Meeuwsen и др. «Вычислительная платформа на 167 процессоров с динамическим напряжением питания и динамическим масштабированием тактовой частоты на каждом процессоре». В симпозиуме по схемам VLSI, стр. 22-23. 2008
^ Майкл Бедфорд Тейлор, Джейсон Ким, Джейсон Миллер, Дэвид Венцлафф, Фэй Годрат, Бен Гринвальд, Генри Хоффман, Пол Джонсон, Уолтер Ли, Арвинд Сараф, Натан Шнидман, Фолькер Штрумпен, Саман Амарасингхе и Анант Агарвал, «Микропроцессор с несколькими программными счетчиками на 16 выпусков и сетью скалярных операндов «точка-точка»», Труды Международной конференции IEEE по твердотельным схемам, февраль 2003 г.
^ Юй, Чжии, Кайди Ю, Жуйцзинь Сяо, Хэн Цюань, Пэн Оу, Янь Ин, Хаофань Ян и Сяоян Цзэн. «16-ядерный процессор с частотой 800 МГц и мощностью 320 мВт, механизмами передачи сообщений и межъядерной связи с общей памятью». В сборнике технических документов конференции по твердотельным схемам (ISSCC), 2012 IEEE International, стр. 64-66. IEEE, 2012.
^ Оу, Пэн, Цзяцзе Чжан, Хэн Цюань, И Ли, Маофэй Хэ, Чжэн Юй, Сюэцю Юй и др. «65 нм 39GOPS/W 24-ядерный процессор с 11 Тбит/с/Вт пакетно-управляемой двухслойной сетью на кристалле с коммутацией каналов и гетерогенным массивом исполнения». В сборнике технических документов конференции по твердотельным схемам (ISSCC), 2013 IEEE International, стр. 56-57. IEEE, 2013.
^ Донгарра, Джек (20 июня 2016 г.). «Отчет о системе Sunway TaihuLight» (PDF) . www.netlib.org . Получено 20 июня 2016 г. .
^ Фу, Хаохуань; Ляо, Цзюньфэн; Ян, Цзиньчжэ; и др. (2016). «Суперкомпьютер Sunway TaihuLight: система и приложения». наук. Китай Инф. Наука . 59 (7). дои : 10.1007/s11432-016-5588-7 .
^ Шоу, Дэвид Э.; Адамс, Питер Дж.; Азария, Асаф; Банк, Джозеф А.; Батсон, Брэннон; Белл, Алистер; Бергдорф, Майкл; Бхатт, Джанви; Баттс, Дж. Адам; Коррейя, Тимоти; Диркс, Роберт М.; Дрор, Рон О.; Иствуд, Майкл П.; Эдвардс, Брюс; Эвен, Амос (14.11.2021). "Антон 3". Труды Международной конференции по высокопроизводительным вычислениям, сетям, хранению и анализу . Сент-Луис, Миссури: ACM. стр. 1–11. doi : 10.1145/3458817.3487397 . ISBN978-1-4503-8442-1. S2CID 239036976.
^ Адамс, Питер Дж.; Бэтсон, Брэннон; Белл, Алистер; Бхатт, Джанви; Баттс, Дж. Адам; Коррейя, Тимоти; Эдвардс, Брюс; Фельдманн, Питер; Фентон, Кристофер Х.; Форте, Энтони; Гальярдо, Джозеф; Гилл, Дженнетт; Горлатова, Мария; Грескамп, Брайан; Гроссман, Дж. П. (2021-08-22). "ΛNTON 3 ASIC: огнедышащий монстр для моделирования молекулярной динамики". Симпозиум IEEE Hot Chips 33 (HCS) 2021 года . Пало-Альто, Калифорния, США: IEEE. стр. 1–22. doi : 10.1109/HCS52781.2021.9567084. ISBN978-1-6654-1397-8. S2CID 239039245.