Ампер (микроархитектура)

Микроархитектура графического процессора от Nvidia

Ампер
Запущен14 мая 2020 г. ; 4 года назад ( 2020-05-14 )
РазработаноНвидиа
Изготовлено
Процесс изготовленияTSMC N7 (профессиональный)
Samsung 8N (потребительский)
Кодовое имя(я)GA10x
Серия продуктов
Рабочий стол
Профессионал/рабочая станция
  • Серия RTX A
Сервер/центр обработки данных
  • А100
Технические характеристики
Кэш L1192  КБ на SM (профессиональный)
128  КБ на SM (потребительский)
кэш L22  МБ - 6  МБ
Поддержка памяти
поддержка PCIePCIe4.0
Поддерживаемые графические API
DirectXDirectX 12 Ultimate (уровень возможностей 12_2)
Direct3DDirect3D 12.0
Модель шейдераМодель шейдера 6.8
OpenCLOpenCL3.0
OpenGLOpenGL4.6
CUDAВычислительная мощность 8.6
ВулканВулкан 1.3
Медиа-движок
Кодировать кодеки
Декодировать кодеки
Глубина цвета в битах
  • 8-битный
  • 10-битный
Поддерживаемые кодировщикиНВЕНК
Выходы дисплея
История
ПредшественникTuring (потребительский)
Volta (профессиональный)
ПреемникЭйда Лавлейс (потребитель)
Хоппер (центр обработки данных)
Статус поддержки
Поддерживается

Ampere — кодовое название микроархитектуры графического процессора (GPU), разработанной Nvidia в качестве преемника архитектур Volta и Turing . Она была официально анонсирована 14 мая 2020 года и названа в честь французского математика и физика Андре-Мари Ампера . [1] [2]

Nvidia анонсировала потребительские графические процессоры GeForce 30-й серии с архитектурой Ampere на специальном мероприятии GeForce 1 сентября 2020 года. [3] [4] Nvidia анонсировала графический процессор A100 80 ГБ на SC20 16 ноября 2020 года. [5] Мобильные видеокарты RTX и RTX 3060 на базе архитектуры Ampere были представлены 12 января 2021 года. [6]

Nvidia анонсировала преемника Ampere, Hopper , на GTC 2022 и «Ampere Next Next» ( Blackwell ), выпуск которого запланирован на 2024 год, на конференции GPU Technology Conference 2021.

Подробности

Архитектурные усовершенствования архитектуры Ampere включают в себя следующее:

  • CUDA Compute Capability 8.0 для A100 и 8.6 для серии GeForce 30 [7]
  • 7 нм процесс FinFET от TSMC для A100
  • Специальная версия 8-нм техпроцесса Samsung (8N) для серии GeForce 30 [8]
  • Третье поколение тензорных ядер с поддержкой FP16, bfloat16 , TensorFloat-32 (TF32) и FP64 и ускорением разреженности. [9] Отдельные тензорные ядра имеют 256 операций FP16 FMA за такт, что в 4 раза больше вычислительной мощности (только GA100, в 2 раза больше на GA10x) по сравнению с предыдущими поколениями тензорных ядер; количество тензорных ядер уменьшено до одного на SM.
  • Ядра трассировки лучей второго поколения; одновременная трассировка лучей, затенение и вычисления для серии GeForce 30
  • Память с высокой пропускной способностью 2 (HBM2) на A100 40 ГБ и A100 80 ГБ
  • Память GDDR6X для GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti
  • Двойные ядра FP32 на SM на графических процессорах GA10x
  • NVLink 3.0 с пропускной способностью 50 Гбит/с на пару [9]
  • PCI Express 4.0 с поддержкой SR-IOV (SR-IOV зарезервирован только для A100)
  • Функция виртуализации нескольких экземпляров GPU (MIG) и разбиения GPU на разделы в A100 с поддержкой до семи экземпляров
  • Набор функций PureVideo K для аппаратного декодирования видео с аппаратным декодированием AV1 [10] для серии GeForce 30 и набор функций J для A100
  • 5 NVDEC для A100
  • Добавляет новый аппаратный 5-ядерный JPEG декодер ( NVJPG ) с YUV420, YUV422, YUV444, YUV400, RGBA. Не следует путать с Nvidia NVJPEG ( библиотека с ускорением на GPU для кодирования/декодирования JPEG)

Чипсы

  • ГА100 [11]
  • ГА102
  • ГА103
  • ГА104
  • GA106
  • ГА107
  • ГА10Б

Сравнение вычислительных возможностей: GP100 против GV100 против GA100 [12]

Возможности графического процессораNvidia Тесла P100Nvidia Тесла V100Nvidia А100
Кодовое имя графического процессораГП100ГВ100GA100
Архитектура графического процессораПаскальВольтаАмпер
Вычислительная мощность6.07.08.0
Нити / основа323232
Макс. варпы / SM646464
Макс. кол-во нитей/SM204820482048
Макс. кол-во блоков ниток / SM323232
Макс. 32-битные регистры/SM655366553665536
Макс. количество регистров/блок655366553665536
Макс. число регистров/поток255255255
Максимальный размер блока нити102410241024
Ядра FP32 / SM646464
Соотношение регистров SM и ядер FP32102410241024
Размер разделяемой памяти / SM64 КБВозможность настройки до 96 КБВозможность настройки до 164 КБ

Сравнение матрицы поддержки точности [13] [14]

Поддерживаемые точности ядра CUDAПоддерживаемые точности тензорных ядер
FP16ФП32ФП64ИНТ1ИНТ4ИНТ8ТФ32БФ16FP16ФП32ФП64ИНТ1ИНТ4ИНТ8ТФ32БФ16
Nvidia Тесла P4НетДаДаНетНетДаНетНетНетНетНетНетНетНетНетНет
Nvidia P100ДаДаДаНетНетНетНетНетНетНетНетНетНетНетНетНет
Nvidia ВольтаДаДаДаНетНетДаНетНетДаНетНетНетНетНетНетНет
Nvidia ТьюрингДаДаДаНетНетНетНетНетДаНетНетДаДаДаНетНет
Nvidia А100ДаДаДаНетНетДаНетДаДаНетДаДаДаДаДаДа

Легенда:

  • FPnn: число с плавающей точкой с nn битами
  • INTn: целое число с n битами
  • INT1: двоичный
  • TF32: TensorFloat32
  • BF16: bfloat16

Сравнение производительности декодирования

Одновременные потокиДекодирование H.264 (1080p30)Декодирование H.265 (HEVC) (1080p30)Декодирование VP9 (1080p30)
В100162222
А10075157108

Ампер умирает

УмеретьГА100 [15]ГА102 [16]ГА103 [17]ГА104 [18]ГА106 [19]ГА107 [20]ГА10Б [21]ГА10Ф
Размер матрицы826  мм 2628  мм 2496  мм 2392  мм 2276  мм 2200  мм 2448  мм 2?
Транзисторы54.2Б28.3Б22Б17.4Б12Б8.7Б21Б?
Плотность транзисторов65,6 МТр/мм 245,1 МТр/мм 244,4 МТр/мм 244,4 МТр/мм 243,5 МТр/мм 243,5 МТр/мм 246,9 МТр/мм 2?
Графические кластеры обработки87663221
Потоковые мультипроцессоры12884604830201612
Ядра CUDA1228810752768061443840256020481536
Модули текстурного наложения512336240192120806448
Единицы вывода рендеринга192112969648323216
Тензорные ядра512336240192120806448
Ядра RTН/Д8460483020812
Кэш L124  МБ10,5  МБ7,5  МБ6  МБ3  МБ2,5  МБ3  МБ1,5  МБ
192  КБ
на SM
128  КБ на SM192  КБ
на SM
128  КБ
на SM
кэш L240  МБ6  МБ4  МБ4  МБ3  МБ2  МБ4  МБ?

Ускоритель A100 и DGX A100

Ускоритель A100 на базе Ampere был анонсирован и выпущен 14 мая 2020 года. [9] A100 имеет производительность FP32 19,5 терафлопс, 6912 ядер CUDA FP32/INT32, 3456 ядер CUDA FP64, 40 ГБ графической памяти и пропускную способность графической памяти 1,6 ТБ/с. [22] Первоначально ускоритель A100 был доступен только в третьем поколении серверов DGX , включая 8 A100. [9] В DGX A100 также включены 15 ТБ хранилища PCIe gen 4 NVMe , [22] два 64-ядерных процессора AMD Rome 7742, 1 ТБ оперативной памяти и межсоединение HDR InfiniBand на базе Mellanox . Первоначальная цена DGX A100 составляла 199 000 долларов. [9]

Сравнение ускорителей, используемых в DGX: [23] [24] [25]

МодельАрхитектураГнездоЯдра FP32
CUDA
Ядра FP64
(без тензора)
Смешанные ядра
INT32/FP32

Ядра INT32
Увеличить
тактовую частоту

Часы памяти

Ширина шины памяти

Пропускная способность памяти
ВидеопамятьОдинарная
точность
(FP32)
Двойная
точность
(FP64)
INT8
(не тензорный)
INT8
плотный тензор
INT32
Плотный тензор FP4
FP16
Плотный тензор FP16
bfloat16
плотный тензор
TensorFloat-32
(TF32)
плотный тензор

Плотный тензор FP64
Межсоединение
(NVLink)
ГПУКэш L1Кэш L2ТДПРазмер матрицы
Количество транзисторов
ПроцессЗапущен
100р.ПаскальСХМ/СХМ2Н/Д17923584Н/Д1480 МГц1,4 Гбит/с HBM24096-бит720 ГБ/сек16 ГБ HBM210,6 терафлопс5.3 ТФЛОПСН/ДН/ДН/ДН/Д21,2 терафлопсН/ДН/ДН/ДН/Д160 ГБ/секГП1001344 КБ (24 КБ × 56)4096 КБ300 Вт610 мм 215.3 БTSMC 16FF+2 квартал 2016 г.
V100 16 ГБВольтаСХМ251202560Н/Д51201530 МГц1,75 Гбит/с HBM24096-бит900 ГБ/сек16 ГБ HBM215,7 терафлопс7,8 терафлопс62 ТОПН/Д15.7 ТОПОВН/Д31,4 терафлопс125 терафлопсН/ДН/ДН/Д300 ГБ/секГВ10010240 КБ (128 КБ × 80)6144 КБ300 Вт815 мм 221.1 БTSMC 12FFN3 квартал 2017 г.
V100 32 ГБВольтаSXM351202560Н/Д51201530 МГц1,75 Гбит/с HBM24096-бит900 ГБ/сек32 ГБ HBM215,7 терафлопс7,8 терафлопс62 ТОПН/Д15.7 ТОПОВН/Д31,4 терафлопс125 терафлопсН/ДН/ДН/Д300 ГБ/секГВ10010240 КБ (128 КБ × 80)6144 КБ350 Вт815 мм 221.1 БTSMC 12FFN
А100 40ГБАмперSXM4691234566912Н/Д1410 МГц2,4 Гбит/с HBM25120-бит1,52 ТБ/сек40 ГБ HBM219,5 терафлопс9,7 терафлопсН/Д624 ТОП19.5 ТОПОВН/Д78 терафлопс312 ТФЛОПС312 ТФЛОПС156 терафлопс19,5 терафлопс600 ГБ/секGA10020736 КБ (192 КБ × 108)40960 КБ400 Вт826 мм 254,2 БTSMC N71 квартал 2020 г.
А100 80ГБАмперSXM4691234566912Н/Д1410 МГц3,2 Гбит/с HBM2e5120-бит1,52 ТБ/сек80 ГБ HBM2e19,5 терафлопс9,7 терафлопсН/Д624 ТОП19.5 ТОПОВН/Д78 терафлопс312 ТФЛОПС312 ТФЛОПС156 терафлопс19,5 терафлопс600 ГБ/секGA10020736 КБ (192 КБ × 108)40960 КБ400 Вт826 мм 254,2 БTSMC N7
H100ХопперSXM516896460816896Н/Д1980 МГц5,2 Гбит/с HBM35120-бит3,35 ТБ/сек80 ГБ HBM367 терафлопс34 терафлопсН/Д1,98 ПОПСН/ДН/ДН/Д990 терафлопс990 терафлопс495 терафлопс67 терафлопс900 ГБ/секGH10025344 КБ (192 КБ × 132)51200 КБ700 Вт814 мм 280 БTSMC 4N3 квартал 2022 г.
H200ХопперSXM516896460816896Н/Д1980 МГц6,3 Гбит/с HBM3e6144-бит4,8 ТБ/сек141 ГБ HBM3e67 терафлопс34 терафлопсН/Д1,98 ПОПСН/ДН/ДН/Д990 терафлопс990 терафлопс495 терафлопс67 терафлопс900 ГБ/секGH10025344 КБ (192 КБ × 132)51200 КБ1000 Вт814 мм 280 БTSMC 4N3 квартал 2023 г.
Б100БлэквеллSXM6Н/ДН/ДН/ДН/ДН/Д8 Гбит/с HBM3e8192-бит8 ТБ/сек192 ГБ HBM3eН/ДН/ДН/Д3.5 ПОПСН/Д7 ПФЛОПСН/Д1,98 ПФЛОПС1,98 ПФЛОПС989 ТФЛОПС30 терафлопс1,8 ТБ/секГБ100Н/ДН/Д700 ВтН/Д208 БTSMC 4NP4 квартал 2024 г. (ожидается)
Б200БлэквеллSXM6Н/ДН/ДН/ДН/ДН/Д8 Гбит/с HBM3e8192-бит8 ТБ/сек192 ГБ HBM3eН/ДН/ДН/Д4.5 ПОПСН/Д9 ПФЛОПСН/Д2,25 ПФЛОПС2,25 ПФЛОПС1,2 ПФЛОПС40 терафлопс1,8 ТБ/секГБ100Н/ДН/Д1000 ВтН/Д208 БTSMC 4NP

Продукция с использованием Ampere

  • Серия GeForce MX
    • GeForce MX570 (мобильный) (GA107)
  • GeForce 20 серии
    • GeForce RTX 2050 (мобильная) (GA107)
  • GeForce 30 серии
    • Видеокарта GeForce RTX 3050 для ноутбука (GA107)
    • GeForce RTX 3050 (GA106 или GA107) [26]
    • Видеокарта GeForce RTX 3050 Ti для ноутбука (GA107)
    • Видеокарта GeForce RTX 3060 для ноутбука (GA106)
    • GeForce RTX 3060 (GA106 или GA104) [27]
    • GeForce RTX 3060 Ti (GA104 или GA103) [28]
    • Видеокарта GeForce RTX 3070 для ноутбука (GA104)
    • GeForce RTX 3070 (GA104)
    • Видеокарта GeForce RTX 3070 Ti для ноутбука (GA104)
    • GeForce RTX 3070 Ti (GA104 или GA102) [29]
    • Видеокарта GeForce RTX 3080 для ноутбука (GA104)
    • GeForce RTX 3080 (GA102)
    • GeForce RTX 3080 12 ГБ (GA102)
    • Видеокарта GeForce RTX 3080 Ti для ноутбука (GA103)
    • GeForce RTX 3080 Ti (GA102)
    • GeForce RTX 3090 (GA102)
    • GeForce RTX 3090 Ti (GA102)
  • Графические процессоры Nvidia Workstation (ранее Quadro )
    • RTX A1000 (мобильный) (GA107)
    • RTX A2000 (мобильный) (GA106)
    • RTX A2000 (GA106)
    • RTX A3000 (мобильный) (GA104)
    • RTX A4000 (мобильный) (GA104)
    • RTX A4000 (GA104)
    • RTX A5000 (мобильный) (GA104)
    • RTX A5500 (мобильный) (GA103)
    • RTX A4500 (GA102)
    • RTX A5000 (GA102)
    • RTX A5500 (GA102)
    • RTX A6000 (GA102)
    • А800 Активный
  • Tegra SoC
    • AGX Орин (GA10B)
    • Орин NX (GA10B)
    • Орин Нано (GA10B)
Изделия с использованием Ampere (на чип)
ТипГА10БГА107GA106ГА104ГА103ГА102GA100
Серия GeForce MXGeForce MX570 (мобильный)
GeForce 20 серииGeForce RTX 2050 (мобильная)
GeForce 30 серииНоутбук GeForce RTX 3050
GeForce RTX 3050
Ноутбук GeForce RTX 3050 Ti
GeForce RTX 3050
GeForce RTX 3060 Ноутбук
GeForce RTX 3060
GeForce RTX 3060
GeForce RTX 3060 Ti
GeForce RTX 3070 Ноутбук
GeForce RTX 3070
GeForce RTX 3070 Ti Ноутбук
GeForce RTX 3070 Ti
GeForce RTX 3080 Ноутбук
GeForce RTX 3060 Ti
GeForce RTX 3080 Ti Ноутбук
GeForce RTX 3070 Ti
GeForce RTX 3080
GeForce RTX 3080 Ti
GeForce RTX 3090
GeForce RTX 3090 Ti
Графические процессоры Nvidia для рабочих станцийRTX A1000 (мобильный)RTX A2000 (мобильный)
RTX A2000
RTX A3000 (мобильный)
RTX A4000 (мобильный)
RTX A4000
RTX A5000 (мобильный)
RTX A5500 (мобильный)RTX A4500
RTX A5000
RTX A5500
RTX A6000
Графические процессоры Nvidia Data CenterНвидиа А2
Нвидиа А16
Нвидиа А10
Нвидиа А40
Nvidia A30
Nvidia A100
Tegra SoCAGX Орин
Орин NX
Орин Нано

Смотрите также

Ссылки

  1. ^ "Новый графический процессор NVIDIA Ampere Data Center запущен в серийное производство". Новости NVIDIA . 14 мая 2020 г.
  2. ^ Крашинский, Ронни; Жиру, Оливье; Джонс, Стивен; Стэм, Ник; Рамасвами, Шридхар (14 мая 2020 г.). «Подробнее об архитектуре NVIDIA Ampere». Блог разработчиков NVIDIA .
  3. ^ "NVIDIA обеспечивает величайший скачок в истории поколения с графическими процессорами GeForce RTX 30-й серии". Nvidia Newsroom . 1 сентября 2020 г. Получено 9 апреля 2023 г.
  4. ^ "Обратный отсчет NVIDIA GeForce Ultimate". Nvidia .
  5. ^ "NVIDIA удваивает ставку: анонсирует графический процессор A100 80 ГБ, ускоряющий самый мощный в мире графический процессор для супервычислений с использованием искусственного интеллекта". Nvidia Newsroom . 16 ноября 2020 г. Получено 9 апреля 2023 г.
  6. ^ "NVIDIA GeForce Beyond на выставке CES 2023". NVIDIA .
  7. ^ "I.7. Compute Capability 8.x". Nvidia . Получено 23 сентября 2020 г. .
  8. ^ Bosnjak, Dominik (1 сентября 2020 г.). «Старая 8-нм технология Samsung в основе чудовищных карт NVIDIA Ampere». SamMobile . Получено 19 сентября 2020 г.
  9. ^ abcde Смит, Райан (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
  10. ^ Дельгадо, Херардо (1 сентября 2020 г.). «GeForce RTX 30 Series GPUs: Ushering In A New Era of Video Content With AV1 Decode». Nvidia . Получено 9 апреля 2023 г. .
  11. ^ Морган, Тимоти Прикетт (29 мая 2020 г.). «Глубокое погружение в архитектуру графического процессора Nvidia Ampere». Следующая платформа . Получено 24 марта 2022 г.
  12. ^ "Архитектура графического процессора NVIDIA A100 Tensor Core: беспрецедентное ускорение в любом масштабе" (PDF) . Nvidia . Получено 18 сентября 2020 г. .
  13. ^ "NVIDIA Tensor Cores: Универсальность для HPC и ИИ". NVIDIA .
  14. ^ "Аннотация". docs.nvidia.com .
  15. ^ "Архитектура графического процессора NVIDIA A100 Tensor Core" (PDF) . NVIDIA Corporation . Получено 29 апреля 2024 г. .
  16. ^ "NVIDIA GA102 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
  17. ^ "NVIDIA GA103 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
  18. ^ "NVIDIA GA104 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
  19. ^ "Спецификации графического процессора NVIDIA GA106". TechPowerUp . Получено 29 апреля 2024 г. .
  20. ^ "NVIDIA GA107 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
  21. ^ «Технический обзор NVIDIA AGX серии Orin, версия 1.2» (PDF) . Корпорация NVIDIA . Проверено 29 апреля 2024 г.
  22. ^ Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК». The Verge.
  23. ^ Смит, Райан (22 марта 2022 г.). «Анонсирована архитектура графического процессора NVIDIA Hopper и ускоритель H100: работа умнее и сложнее». AnandTech.
  24. ^ Смит, Райан (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
  25. ^ "Протестирована NVIDIA Tesla V100: почти невероятная мощность графического процессора". TweakTown . 17 сентября 2017 г.
  26. ^ Игорь, Валлоссек (13 февраля 2022 г.). «Два лица GeForce RTX 3050 8 ГБ». Igor's Lab . Получено 23 февраля 2022 г.
  27. ^ Шилов, Антон (25 сентября 2021 г.). "Gainward и Galax перечисляют карты GeForce RTX 3060 с графическим процессором GA104". Tom's Hardware . Получено 23 сентября 2022 г. .
  28. ^ Тайсон, Марк (23 февраля 2022 г.). «Zotac представляет первые настольные видеокарты RTX 3060 Ti с графическим процессором GA103». Tom's Hardware . Получено 23 сентября 2022 г.
  29. WhyCry (26 октября 2022 г.). «ZOTAC выпускает GeForce RTX 3070 Ti с графическим процессором GA102-150» . ВидеоКардз . Проверено 21 мая 2023 г.
  • Технический документ по архитектуре графического процессора Nvidia A100 Tensor Core
  • Архитектура графического процессора Nvidia Ampere GA102: техническая документация
  • Архитектура Nvidia Ampere
  • Графический процессор Nvidia A100 Tensor Core
  • Подробное описание архитектуры Nvidia Ampere
Взято с "https://en.wikipedia.org/w/index.php?title=Ampere_(микроархитектура)&oldid=1272909803"