Общая информация | |
---|---|
Запущен | 2011 |
Производительность | |
Макс. тактовая частота ЦП | 2,85 ГГц – 3,0 ГГц |
Кэш | |
Кэш L1 | 8×(16+16) КБ |
кэш L2 | 8×128 кБ |
кэш L3 | 4 МБ |
Архитектура и классификация | |
Технологический узел | 40 нм |
Набор инструкций | СПАРК V9 |
Физические характеристики | |
Ядра |
|
Продукция, модели, варианты | |
Имя ядра |
|
История | |
Предшественник | СПАРК Т3 |
Преемник | СПАРК Т5 |
SPARC T4 — многоядерный микропроцессор SPARC, представленный в 2011 году корпорацией Oracle . Процессор разработан для обеспечения высокой многопоточной производительности (8 потоков на ядро, с 8 ядрами на чип), а также высокой однопоточной производительности на том же чипе. [1] Чип является процессором 4-го поколения [2] в семействе T-Series. Sun Microsystems вывела на рынок первый процессор T-Series ( UltraSPARC T1 ) в 2005 году.
Этот чип является первым чипом Sun/Oracle SPARC, использующим динамическую многопоточность [3] и внеочередное выполнение . [4] Он включает в себя один блок с плавающей точкой и один выделенный криптографический блок на ядро. [2] Ядра используют 64-битную архитектуру SPARC версии 9, работающую на частотах от 2,85 ГГц до 3,0 ГГц, и построены по 40 -нм техпроцессу с размером кристалла 403 мм 2 (0,625 кв. дюйма). [1]
Чип с восемью ядрами и восемью потоками на ядро, построенный по 40-нм техпроцессу и работающий на частоте 2,5 ГГц, был описан в дорожной карте процессоров Sun Microsystems 2009 года. Он имел кодовое название «Yosemite Falls» и был назначен на конец 2011 года. Ожидалось, что процессор представит новую микроархитектуру под кодовым названием «VT Core». Онлайновый технологический сайт The Register предположил, что этот чип будет называться «T4», будучи преемником SPARC T3 . [5] Продукт процессора Yosemite Falls оставался в дорожной карте процессоров Oracle Corporation после того, как компания поглотила Sun в начале 2010 года. [6] В декабре 2010 года вице-президент Oracle по разработке оборудования подтвердил, что процессор T4 будет разработан для улучшенной производительности на поток, с восемью ядрами и с ожидаемым выпуском в течение одного года. [7] [8]
Проект процессора был представлен на конференции Hot Chips 2011 года . [9] Ядра (переименованные в «S3» из «VT») включали двухэтапный целочисленный конвейер с 16 этапами и 11-тактный конвейер с плавающей точкой , оба из которых давали улучшения по сравнению с предыдущим ядром («S2»), используемым в процессоре SPARC T3 . Каждое ядро имело связанный кэш L1 объемом 16 КБ и кэш L1 объемом 16 КБ инструкций , а также унифицированный кэш L2 объемом 128 КБ . Все восемь ядер совместно используют кэш L3 объемом 4 МБ , а общее количество транзисторов составляет приблизительно 855 миллионов. [9] Проект был первым процессором Sun/Oracle SPARC с внеочередным выполнением [10] и первым процессором в семействе SPARC T-Series, включавшим возможность выдавать более одной инструкции за цикл исполнительным устройствам ядра. [11]
Процессор T4 был официально представлен как часть серверов Oracle SPARC T4 в сентябре 2011 года. [12] Первоначальные выпуски продукта однопроцессорного стоечного сервера T4-1 работали на частоте 2,85 ГГц. [3] Двухпроцессорный сервер T4-2 работал на той же частоте 2,85 ГГц, а четырехпроцессорный сервер T4-4 работал на частоте 3,0 ГГц. [13]
Ядро SPARC S3 также включает механизм приоритета потоков (называемый «динамической потоковой передачей»), посредством которого каждому потоку выделяются ресурсы в зависимости от потребности, что обеспечивает повышенную производительность. [9] Большинство ресурсов ядра S3 совместно используются всеми активными потоками, до 8 из них. Общие ресурсы включают структуры предсказания ветвлений , различные записи буфера и ресурсы выполнения вне очереди. Статическое распределение ресурсов резервирует ресурсы для потоков на основе политики, независимо от того, может ли поток использовать их или нет. Динамическая потоковая передача выделяет эти ресурсы потокам, которые готовы и будут их использовать, тем самым повышая производительность. [4]
Криптографическая производительность также была увеличена по сравнению с чипом T3 за счет усовершенствований дизайна, включая новый набор криптографических инструкций. [8] Криптографические сопроцессоры UltraSPARC T2 и T3 на уровне ядра были заменены ускорителями в ядре и криптографией на основе инструкций. Реализация разработана для достижения шифрования и дешифрования на скорости передачи данных на 10-гигабитных Ethernet-портах SPARC T4. [4]
Утверждается, что архитектурные изменения обеспечивают 5-кратное улучшение производительности целочисленных вычислений в одном потоке [9] и двукратное увеличение производительности на поток по сравнению с предыдущим поколением T3. [4] Опубликованный результат SPECjvm2008 для 16-ядерного T4-2 составляет 454 операции в секунду/мин [14] и 321 операцию в секунду/мин [15] для 32-ядерного T3-2, что составляет соотношение производительности на ядро 2,8x.