Общая информация | |
---|---|
Запущен | 12 октября 2011 г. ( 12 октября 2011 г. ) |
Обычный производитель | |
Архитектура и классификация | |
Технологический узел | 32 нм |
Набор инструкций | x86-64-v2 |
Физические характеристики | |
Гнездо | |
Продукция, модели, варианты | |
Основные имена | |
История | |
Предшественник | Семья 10ч (К10) |
Преемник | Piledriver - Family 15h (2-го поколения) |
AMD Bulldozer Family 15h — это микроархитектура микропроцессоров для линеек процессоров FX и Opteron , разработанная AMD для рынков настольных компьютеров и серверов. [1] [2] Bulldozer — кодовое название этого семейства микроархитектур. Оно было выпущено 12 октября 2011 года как преемник микроархитектуры K10 .
Bulldozer разработан с нуля, а не является развитием более ранних процессоров. [3] Ядро специально предназначено для вычислительных продуктов с TDP от 10 до 125 Вт . AMD заявляет о значительном повышении эффективности производительности на ватт в приложениях высокопроизводительных вычислений (HPC) с ядрами Bulldozer.
Ядра Bulldozer поддерживают большинство наборов инструкций, реализованных процессорами Intel ( Sandy Bridge ), доступных на момент их появления (включая SSSE3 , SSE4.1 , SSE4.2 , AES , CLMUL и AVX ), а также новые наборы инструкций, предложенные AMD: ABM , XOP , FMA4 и F16C . [4] [5] Только Bulldozer GEN4 ( Excavator ) поддерживает наборы инструкций AVX2 .
По данным AMD, процессоры на базе Bulldozer основаны на 32-нм техпроцессе «Кремний на изоляторе» (SOI) компании GlobalFoundries и повторно используют подход DEC к производительности многозадачных компьютеров, аргументируя это тем, что, согласно заметкам для прессы, он «балансирует выделенные и общие ресурсы компьютера, чтобы обеспечить очень компактную конструкцию с большим количеством блоков, которая легко воспроизводится на кристалле для масштабирования производительности». [6] Другими словами, устранив некоторые «избыточные» элементы, которые естественным образом проникают в многоядерные конструкции, AMD надеется лучше использовать возможности своего оборудования, потребляя при этом меньше энергии.
Реализации на основе Bulldozer, построенные на 32 нм SOI с HKMG, появились в октябре 2011 года как для серверов, так и для настольных компьютеров. Серверный сегмент включал двухчиповый (16-ядерный) процессор Opteron под кодовым названием Interlagos (для Socket G34 ) и одночиповый (4, 6 или 8 ядер) Valencia (для Socket C32 ), в то время как Zambezi (4, 6 и 8 ядер) были нацелены на настольные компьютеры на Socket AM3+ . [7] [8]
Bulldozer — это первая крупная переделка архитектуры процессоров AMD с 2003 года, когда компания выпустила свои процессоры K8, а также два 128-битных FMA -совместимых FPU , которые можно объединить в один 256-битный FPU. Эта конструкция сопровождается двумя целочисленными кластерами, каждый с 4 конвейерами (стадия выборки/декодирования является общей). Bulldozer также представила общий кэш L2 в новой архитектуре. AMD называет эту конструкцию «Модулем». Конструкция 16-ядерного процессора будет включать восемь таких «модулей», [9] но операционная система будет распознавать каждый «модуль» как два логических ядра.
Модульная архитектура состоит из многопоточного общего кэша L2 и FlexFPU, который использует одновременную многопоточность . Каждое физическое целочисленное ядро, два на модуль, является однопоточным, в отличие от Hyperthreading от Intel , где два виртуальных одновременных потока совместно используют ресурсы одного физического ядра. [10] [11]
В ретроспективном обзоре Джереми Лэрд из журнала APC прокомментировал проблемы Bulldozer, отметив, что он был медленнее, чем уходящий дизайн Phenom II K10, и что экосистема программного обеспечения ПК еще не «приняла» многопоточную модель. По его наблюдениям, проблемы привели к большим потерям для AMD, компания потеряла более 1 миллиарда долларов США в 2012 году, и что некоторые отраслевые обозреватели предсказывали банкротство к середине 2015 года. Позже компании удалось вернуться к прибыли. Упомянутыми причинами восстановления прибыльности были более ранняя продажа собственного производства в GlobalFoundries , а затем аутсорсинг производства в TSMC и создание нового дизайна процессора Ryzen . [12]
Bulldozer использовал «кластерную многопоточность» (Clustered Multithreading, CMT), технику, при которой некоторые части процессора совместно используются двумя потоками, а некоторые части уникальны для каждого потока. Предшествующие примеры такого подхода к нетрадиционной многопоточности можно проследить еще до процессора UltraSPARC T1 компании Sun Microsystems 2005 года . С точки зрения аппаратной сложности и функциональности модуль Bulldozer CMT равен двухъядерному процессору по его возможностям целочисленных вычислений, а с точки зрения вычислительной мощности с плавающей точкой — либо одноядерному процессору, либо двухъядерному процессору с ограниченными возможностями, в зависимости от того, насыщен ли код инструкциями с плавающей точкой в обоих потоках, работающих на одном модуле CMT, и выполняет ли FPU 128-битные или 256-битные операции с плавающей точкой. Причина этого в том, что для каждых двух целочисленных ядер, то есть в пределах одного модуля, существует один блок с плавающей точкой, состоящий из пары 128-битных исполнительных блоков FMAC .
CMT в некотором роде является более простой, но похожей на SMT философией проектирования ; обе конструкции пытаются эффективно использовать блоки исполнения; в любом методе, когда два потока конкурируют за некоторые конвейеры исполнения, происходит потеря производительности в одном или нескольких потоках. Благодаря выделенным целочисленным ядрам модули семейства Bulldozer работали примерно как двухъядерный двухпоточный процессор во время участков кода, которые были либо полностью целочисленными, либо смесью целочисленных и плавающих вычислений; тем не менее, из-за использования SMT общих конвейеров плавающей точки модуль будет работать аналогично одноядерному двухпоточному процессору SMT (SMT2) для пары потоков, насыщенных инструкциями с плавающей точкой. (Оба этих последних двух сравнения предполагают, что процессор обладает одинаково широким и производительным ядром исполнения, как целочисленным, так и плавающим, соответственно.)
И CMT, и SMT достигают пиковой эффективности при запуске целочисленного и плавающего кода на паре потоков. CMT сохраняет пиковую эффективность при работе на паре потоков, состоящих из целочисленного кода, в то время как при SMT один или оба потока будут работать хуже из-за конкуренции за целочисленные исполнительные блоки. Недостатком CMT является большее количество простаивающих целочисленных исполнительных блоков в однопоточном случае. В однопоточном случае CMT ограничен использованием не более половины целочисленных исполнительных блоков в своем модуле, в то время как SMT не накладывает такого ограничения. Большое ядро SMT с целочисленной схемой такой же ширины и скорости, как два ядра CMT, теоретически может на мгновение иметь вдвое большую целочисленную производительность в однопоточном случае. (Более реалистично для общего кода в целом, правило Поллака оценивает коэффициент ускорения в , или приблизительно 40% увеличения производительности.)
Процессоры CMT и типичный процессор SMT схожи в эффективном совместном использовании кэша L2 между парой потоков.
Более длинный конвейер позволил процессорам семейства Bulldozer достичь гораздо более высокой тактовой частоты по сравнению с предшественниками K10. Хотя это увеличило частоты и пропускную способность, более длинный конвейер также увеличил задержки и увеличил штрафы за неправильное предсказание ветвлений .
Ширина выпуска (и пиковое выполнение инструкций за цикл) ядер Jaguar, K10 и Bulldozer составляет 2, 3 и 4 соответственно. Это сделало Bulldozer более суперскалярной конструкцией по сравнению с Jaguar/Bobcat. Однако из-за несколько более широкого ядра K10 (в дополнение к отсутствию улучшений и оптимизаций в конструкции первого поколения) архитектура Bulldozer обычно работала с несколько более низким IPC по сравнению с ее предшественниками K10. Только после улучшений, внесенных в Piledriver и Steamroller, IPC семейства Bulldozer начал отчетливо превышать таковой у процессоров K10, таких как Phenom II.
Этот раздел пуст. Вы можете помочь, дополнив его. ( Март 2023 ) |
Первые коммерческие поставки процессоров Opteron на базе Bulldozer были объявлены 7 сентября 2011 года. [32] FX-4100, FX-6100, FX-8120 и FX-8150 были выпущены в октябре 2011 года; остальные процессоры AMD серии FX были выпущены в конце первого квартала 2012 года.
Модель | [Модули/ FPU ] Ядра/ потоки | Частота (ГГц) | Макс. турбо (ГГц) | кэш L2 | L3 (МБ) | ТДП (Вт) | Память DDR3 | Турбо Ядро 2.0 | Гнездо | |
---|---|---|---|---|---|---|---|---|---|---|
Полная загрузка | Половинная загрузка | |||||||||
FX-8100 | [4]8 | 2.8 | 3.1 | 3.7 | 4× 2МБ | 8 | 95 | 1866 | Да | АМ3+ |
FX-8120 | 3.1 | 3.4 | 4.0 | 125 | ||||||
FX-8140 | 3.2 | 3.6 | 4.1 | 95 | ||||||
FX-8150 | 3.6 | 3.9 | 4.2 | 125 | ||||||
FX-8170 | 3.9 | 4.2 | 4.5 | |||||||
FX-6100 | [3]6 | 3.3 | 3.6 | 3.9 | 3× 2МБ | 95 | ||||
FX-6120 | 3.6 | 3.9 | 4.2 | |||||||
FX-6130 | 3.6 | 3.8 | 3.9 | |||||||
FX-6200 | 3.8 | 4.0 | 4.1 | 125 | ||||||
FX-4100 | [2]4 | 3.6 | 3.7 | 3.8 | 2× 2МБ | 95 | ||||
FX-4120 | 3.9 | 4.0 | 4.1 | |||||||
FX-4130 | 3.8 | 3.9 | 4.0 | 4 | 125 | |||||
FX-4150 | 3.8 | 8 | 95/125 | |||||||
FX-4170 | 4.2 | 4.3 | 125 |
Основные источники: CPU-World [33] и Xbit-Labs [34]
Существует две серии процессоров на базе Bulldozer для серверов : серия Opteron 4200 ( Socket C32 , кодовое название Valencia, до четырех модулей) и серия Opteron 6200 ( Socket G34 , кодовое название Interlagos, до 8 модулей). [35] [36]
В ноябре 2015 года AMD подали в суд в соответствии с Законом о правовой защите прав потребителей Калифорнии и Законом о недобросовестной конкуренции за якобы искажение спецификаций чипов Bulldozer. В коллективном иске, поданном 26 октября в Окружной суд США по Северному округу Калифорнии, утверждается, что каждый модуль Bulldozer на самом деле является одним ядром ЦП с несколькими чертами двухъядерного процессора, а не настоящей двухъядерной конструкцией. [37] В августе 2019 года AMD согласилась урегулировать иск за 12,1 млн долларов. [38] [39]
24 октября 2011 года тесты первого поколения, проведенные Phoronix, подтвердили, что производительность процессора Bulldozer оказалась несколько ниже ожидаемой. [40] В нескольких тестах процессор показал результаты, аналогичные показателям предыдущего поколения Phenom 1060T.
Позже производительность существенно возросла, поскольку были выпущены различные оптимизации компилятора и исправления драйвера ЦП. [41] [42]
Первые процессоры Bulldozer были встречены неоднозначно. Было обнаружено, что FX-8150 плохо показал себя в тестах, которые не были высокопоточными, отставая от процессоров серии Intel Core i* второго поколения и сравнявшись или даже уступив собственному Phenom II X6 от AMD на более низких тактовых частотах. В высокопоточных тестах FX-8150 показал себя на одном уровне с Phenom II X6 и Intel Core i7 2600K , в зависимости от теста. Учитывая общую более стабильную производительность Intel Core i5 2500K по более низкой цене, эти результаты разочаровали многих обозревателей. Процессор оказался чрезвычайно прожорливым под нагрузкой, особенно при разгоне, по сравнению с Sandy Bridge от Intel . [43] [44]
13 октября 2011 года AMD заявила в своем блоге, что «в нашем сообществе есть некоторые, кто считает, что производительность продукта не соответствует их ожиданиям», но продемонстрировала тесты на реальных приложениях, где он превзошел Sandy Bridge i7 2600k и AMD X6 1100T. [45]
В январе 2012 года Microsoft выпустила два исправления для Windows 7 и Server 2008 R2, которые незначительно улучшают производительность процессоров Bulldozer, решая проблемы планирования потоков, возникшие после выпуска Bulldozer. [46] [47] [48]
6 марта 2012 года AMD опубликовала статью в базе знаний, в которой говорилось, что существует проблема совместимости с процессорами FX и некоторыми играми на широко используемой платформе цифровой дистрибуции игр Steam . AMD заявила, что предоставила обновление BIOS нескольким производителям материнских плат (а именно: Asus , Gigabyte Technology , MSI и ASRock ), которое должно исправить эту проблему. [49]
В сентябре 2014 года генеральный директор AMD Рори Рид признал, что дизайн Bulldozer не стал «элементом, который изменил правила игры», и что AMD пришлось жить с этим дизайном в течение четырех лет. [50]
31 августа 2011 года AMD и группа известных оверклокеров, включая Брайана Маклахлана, Сами Мякинена, Аарона Шрадина и Саймона Солотко, сумели установить новый мировой рекорд частоты ЦП, используя невыпущенный и разогнанный процессор FX-8150 Bulldozer. До этого дня рекорд составлял 8,309 ГГц, но Bulldozer в сочетании с охлаждением жидким гелием достиг нового максимума в 8,429 ГГц. С тех пор рекорд был побит Андре Янгом с использованием жидкого азота — 8,58 ГГц . [51] [52] 22 августа 2014 года, используя FX-8370 (Piledriver), The Stilt из Team Finland достиг максимальной частоты ЦП в 8,722 ГГц. [53]
Рекорды тактовой частоты ЦП, установленные разогнанными процессорами Bulldozer, были побиты лишь почти десятилетие спустя разгоном процессоров Intel Core Raptor Lake 13-го поколения в октябре 2022 года. [54]
Piledriver — кодовое название AMD для своей улучшенной микроархитектуры второго поколения на основе Bulldozer . Ядра AMD Piledriver используются вAPU и CPU на базе Socket FM2 Trinity и Richland , а также в CPU серии FX на базе Socket AM3+ Vishera . Piledriver был последним поколением в семействе Bulldozer, доступным для Socket AM3+ и имеющим кэш L3. Процессоры Piledriver, доступные для сокетов FM2 (и его мобильного варианта), не имели кэша L3, поскольку кэш L2 является кэшем последнего уровня для всех процессоров FM2/FM2+.
Steamroller — кодовое название микроархитектуры AMD третьего поколения, основанной на улучшенной версии Piledriver . Ядра Steamroller используются всерии APU и CPU на базе Socket FM2+ Kaveri .
Excavator — кодовое название ядра Bulldozer четвертого поколения. [55] Excavator был реализован в виде APU серии «Carrizo», APU серии «Bristol Ridge» и процессоров Athlon x4. [56]
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )