Тип интернет-СМИ | видео/AV1, видео/webm |
---|---|
Разработано | Альянс за открытые медиа |
Первоначальный выпуск | 28 марта 2018 г. ( 2018-03-28 ) |
Последний релиз | 1.0.0 Errata 1 [1] 8 января 2019 г. ( 2019-01-08 ) |
Тип формата | Формат кодирования видео |
Содержится в | |
Расширенный от | |
Стандарт | АОМ АВ1 |
Открытый формат ? | Да |
Свободный формат ? | См. § Патентные притязания |
Веб-сайт | aomedia.org/av1-features/ |
AOMedia Video 1 ( AV1 ) — открытый , бесплатный формат видеокодирования , изначально разработанный для передачи видео через Интернет. Он был разработан в качестве преемника VP9 Альянсом за открытые медиа (AOMedia) [2] , консорциумом, основанным в 2015 году, в который входят фирмы-производители полупроводников , поставщики видео по запросу , производители видеоконтента, компании по разработке программного обеспечения и поставщики веб-браузеров. Спецификация битового потока AV1 включает в себя эталонный видеокодек [1] . В 2018 году Facebook провел тестирование, которое приближено к реальным условиям, и эталонный кодер AV1 достиг на 34%, 46,2% и 50,3% более высокого сжатия данных , чем libvpx-vp9, x264 High profile и x264 Main profile соответственно. [3]
Подобно VP9, но в отличие от H.264 (AVC) и H.265 (HEVC), AV1 имеет модель лицензирования без уплаты роялти, которая не препятствует внедрению в проекты с открытым исходным кодом . [4] [5] [6] [7] [2] [8]
AVIF — это формат файла изображения , использующий алгоритмы сжатия AV1.
Мотивациями Альянса для создания AV1 были высокая стоимость и неопределенность, связанные с патентным лицензированием HEVC , кодека, разработанного MPEG, который, как ожидается, придет на смену AVC . [9] [7] Кроме того, семь членов-основателей Альянса — Amazon , Cisco , Google , Intel , Microsoft , Mozilla и Netflix — объявили, что изначально основное внимание в видеоформате будет уделяться доставке высококачественного веб-видео. [10] Официальное объявление об AV1 последовало вместе с пресс-релизом о формировании Альянса за открытые медиа 1 сентября 2015 года. Всего за 42 дня до этого, 21 июля 2015 года, было объявлено, что первоначальное лицензионное предложение HEVC Advance будет превышать лицензионные сборы его предшественника, AVC. [11] Помимо возросшей стоимости, сложность процесса лицензирования возросла с появлением HEVC. В отличие от предыдущих стандартов MPEG, где технология в стандарте могла быть лицензирована у одного субъекта, MPEG LA , когда стандарт HEVC был завершен, были сформированы два патентных пула , а третий пул на горизонте. Кроме того, различные держатели патентов отказывались лицензировать патенты через любой из пулов, увеличивая неопределенность относительно лицензирования HEVC. По словам Яна ЛеГроу из Microsoft, технология с открытым исходным кодом, не требующая роялти, рассматривалась как самый простой способ устранить эту неопределенность относительно лицензирования. [9]
Негативный эффект патентного лицензирования на свободное и открытое программное обеспечение также был назван в качестве причины создания AV1. [7] Например, встраивание реализации H.264 в Firefox помешало бы его бесплатному распространению, поскольку лицензионные сборы должны были бы выплачиваться MPEG-LA. [12] Free Software Foundation Europe утверждает, что практика патентного лицензирования FRAND делает реализацию стандартов свободным программным обеспечением невозможной из-за различных несовместимостей с лицензиями свободного программного обеспечения . [8]
Многие компоненты проекта AV1 были получены из предыдущих исследовательских работ членов Альянса. Отдельные участники начали экспериментальные технологические платформы за несколько лет до этого: Daala от Xiph/Mozilla опубликовала код в 2010 году, экспериментальный проект эволюции VP9 VP10 от Google был анонсирован 12 сентября 2014 года, [13] а Thor от Cisco был опубликован 11 августа 2015 года. Основываясь на кодовой базе VP9, AV1 включает в себя дополнительные методы, некоторые из которых были разработаны в этих экспериментальных форматах. [14]
Многие компании являются частью Alliance for Open Media, включая Samsung , Vimeo , Microsoft, Netflix , Mozilla , AMD , Nvidia , Intel, ARM , Google, Facebook, Cisco, Amazon, Hulu , VideoLAN , Adobe и Apple . Apple является руководящим членом AOMedia, хотя она присоединилась после формирования. Управление потоками AV1 было официально включено в число типологических видео, управляемых Coremedia. [15]
Первая версия 0.1.0 эталонного кодека AV1 была опубликована 7 апреля 2016 года. Хотя мягкая заморозка функций вступила в силу в конце октября 2017 года, разработка нескольких важных функций продолжалась. Формат битового потока , как предполагалось, был заморожен в январе 2018 года, но был отложен из-за нерешенных критических ошибок, а также дальнейших изменений в преобразованиях, синтаксисе, прогнозировании векторов движения и завершении юридического анализа. [ необходима цитата ]
Альянс объявил о выпуске спецификации битового потока AV1 28 марта 2018 года вместе с эталонным программным кодером и декодером. [16] 25 июня 2018 года была выпущена проверенная версия 1.0.0 спецификации. [17]
8 января 2019 года была выпущена проверенная версия 1.0.0 с Errata 1 спецификации. Мартин Смоул из члена AOM Bitmovin сказал, что вычислительная эффективность была самой большой оставшейся проблемой после завершения заморозки формата битового потока. [18] Во время работы над форматом кодер не был нацелен на использование в производстве, а оптимизация скорости не была приоритетной. Следовательно, ранняя версия AV1 была на порядки медленнее существующих кодеров HEVC. Следовательно, большая часть усилий по разработке была перенесена на совершенствование эталонного кодера. В марте 2019 года было сообщено, что скорость эталонного кодировщика значительно улучшилась и находится в том же порядке, что и у кодировщиков для других распространенных форматов. [19]
21 января 2021 года тип MIME AV1 был определен как video/AV1
. Использование AV1 с использованием этого типа MIME ограничено только целями протокола Real-time Transport Protocol . [20]
AV1 стремится стать видеоформатом для сети, который является одновременно современным и бесплатным . [2] По словам Мэтта Фроста, руководителя отдела стратегии и партнерства в команде Chrome Media компании Google, «миссия Alliance for Open Media остается той же, что и у проекта WebM ». [21] Постоянной проблемой при разработке стандартов, не в последнюю очередь для бесплатных мультимедийных форматов, является опасность случайного нарушения патентов, о которых их создатели и пользователи не знали. Эта проблема была поднята в отношении AV1, [22] и ранее VP8 , [23] VP9, [24] Theora [25] и IVC . [26] Проблема не уникальна для бесплатных форматов, но она однозначно угрожает их статусу как бесплатных.
Патентное лицензирование | Базовый профиль AV1, VP9 , Theora , MPEG-5 | VVC , HEVC , AVC , MPEG-5 Основной профиль | GIF , MP3 , MPEG-1 , MPEG-2 , MPEG-4 Часть 2 |
---|---|---|---|
Известные владельцы патентов | Безвозмездный | Роялти, приносящий | Срок действия патентов истек |
Неизвестные владельцы патентов | Невозможно определить, пока формат не станет достаточно старым и не истечет срок действия любых патентов (по крайней мере 20 лет в странах ВТО ). |
Чтобы достичь цели быть свободным от уплаты роялти, процесс разработки требует, чтобы ни одна функция не могла быть принята до того, как она будет независимо подтверждена двумя отдельными сторонами, чтобы не нарушать патенты конкурирующих компаний. В случаях, когда альтернатива запатентованной технологии недоступна, владельцы соответствующих патентов были приглашены присоединиться к Альянсу (даже если они уже были членами другого патентного пула). Например, члены Альянса Apple, Cisco, Google и Microsoft также являются лицензиарами в патентном пуле MPEG-LA для H.264. [22] В качестве дополнительной защиты статуса AV1 без уплаты роялти Альянс имеет фонд правовой защиты для оказания помощи более мелким членам Альянса или лицензиатам AV1 в случае, если им предъявлен иск за предполагаемое нарушение патента. [22] [6] [27]
Согласно патентным правилам, принятым Консорциумом Всемирной паутины (W3C), разработчики технологий лицензируют свои патенты, связанные с AV1, кому угодно, где угодно и когда угодно на основе взаимности (т. е. до тех пор, пока пользователь не участвует в патентном разбирательстве). [28] В качестве защитного условия любой, кто участвует в патентном разбирательстве, теряет право на патенты всех владельцев патентов. [ необходима цитата ] [29]
Такое отношение к правам интеллектуальной собственности (ПИС) и его абсолютный приоритет во время разработки противоречат существующим форматам MPEG, таким как AVC и HEVC. Они были разработаны в соответствии с политикой невмешательства в ПИС их организациями по стандартизации, как предусмотрено в определении открытого стандарта ITU-T . Однако председатель MPEG утверждает, что эта практика должна измениться, [30] что и происходит: [ требуется цитата ] EVC также должен иметь подмножество без уплаты роялти, [31] [32] и будет иметь переключаемые функции в своем битовом потоке для защиты от будущих угроз ПИС. [ требуется цитата ]
Создание бесплатных веб-стандартов давно является целью отрасли. В 2007 году предложение по HTML-видео определило Theora как обязательное для внедрения. Причина заключалась в том, что общедоступный контент должен быть закодирован в свободно реализуемых форматах, хотя бы в качестве «базового формата», и что изменение такого базового формата впоследствии будет затруднено из-за сетевых эффектов. [33]
Alliance for Open Media является продолжением усилий Google с проектом WebM, который возобновил бесплатную конкуренцию после того, как Theora была превзойдена AVC. Для таких компаний, как Mozilla, которые распространяют бесплатное программное обеспечение, поддержка AVC может быть затруднена, поскольку роялти за копию несостоятельны, учитывая отсутствие потока доходов для поддержки этих платежей в свободном программном обеспечении (см. FRAND § Исключение бесплатного распространения ). [4] Аналогичным образом, HEVC не удалось убедить всех лицензиаров разрешить исключение для свободно распространяемого программного обеспечения (см. HEVC § Положение о бесплатном программном обеспечении ).
Цели производительности включают «шаг вперед по сравнению с VP9 и HEVC» в эффективности при небольшом увеличении сложности . Цель эффективности NETVC — улучшение на 25% по сравнению с HEVC. [ 34] Основная проблема сложности касается программного декодирования, поскольку для поддержки оборудования потребуется время, чтобы охватить пользователей. Однако для WebRTC также важна производительность кодирования в реальном времени, что является повесткой дня Cisco: Cisco является производителем оборудования для видеоконференций , и их вклад в Thor направлен на «разумное сжатие при умеренной сложности». [35]
С точки зрения функций AV1 специально разработан для приложений реального времени (особенно WebRTC) и более высоких разрешений (более широкие цветовые гаммы , более высокая частота кадров , UHD ), чем типичные сценарии использования текущего поколения (H.264) видеоформатов, где, как ожидается, он достигнет наибольшего прироста эффективности. Поэтому планируется поддерживать цветовое пространство из Рекомендации ITU-R BT.2020 и до 12 бит точности на цветовой компонент. [36] AV1 в первую очередь предназначен для кодирования с потерями , хотя сжатие без потерь также поддерживается. [37]
AV1 — это традиционный формат преобразования частоты на основе блоков с новыми методами. Основанный на VP9 от Google, [38] AV1 включает дополнительные методы, которые в основном предоставляют кодерам больше возможностей кодирования для лучшей адаптации к различным типам входных данных.
Разработчик(и) | Альянс за открытые медиа |
---|---|
Стабильный релиз | 3.9.1 [39] / 5 июня 2024 г. ( 2024-06-05 ) |
Написано в | С , сборка |
Лицензия | Лицензия BSD 2-Clause ( свободное программное обеспечение ) |
Веб-сайт | aomedia.googlesource.com/aom |
Альянс опубликовал эталонную реализацию, написанную на языке C и ассемблере ( aomenc
, aomdec
) как свободное программное обеспечение в соответствии с условиями лицензии BSD 2-Clause License . [40] Разработка происходит публично и открыта для вкладов, независимо от членства в AOM. Процесс разработки был таким, что инструменты кодирования были добавлены в эталонную кодовую базу в качестве экспериментов , контролируемых флагами, которые включают или отключают их во время сборки, для проверки другими членами группы, а также специализированными командами, которые помогали и обеспечивали удобство использования оборудования и соответствие правам интеллектуальной собственности (TAPAS). Когда функция получила некоторую поддержку в сообществе, эксперимент был включен по умолчанию, и в конечном итоге его флаг был удален, когда все проверки были пройдены. [41] Имена экспериментов были написаны строчными буквами в скрипте конфигурации и заглавными буквами во флагах условной компиляции . [ необходима цитата ]
Для лучшей и более надежной поддержки HDR и цветовых пространств соответствующие метаданные теперь могут быть интегрированы в видеопоток вместо того, чтобы сигнализироваться в контейнере.
Содержимое кадра разделяется на смежные блоки одинакового размера, называемые суперблоками. Подобно концепции макроблока , суперблоки имеют квадратную форму и могут иметь размер 128×128 или 64×64 пикселя. Суперблоки могут быть разделены на более мелкие блоки в соответствии с различными шаблонами разбиения. Шаблон четырехстороннего разбиения — единственный шаблон, разделы которого могут быть рекурсивно подразделены. Это позволяет делить суперблоки на разделы размером до 4×4 пикселя.
Введены шаблоны разбиения "T-образной" формы, разработанные для VP10, а также горизонтальные или вертикальные разбиения на четыре полосы с соотношением сторон 4:1 и 1:4. Доступные шаблоны разбиения различаются в зависимости от размера блока, блоки 128×128 и 8×8 не могут использовать разбиения 4:1 и 1:4. Более того, блоки 8×8 не могут использовать разбиения в форме T.
Теперь можно использовать два отдельных прогноза для пространственно различных частей блока, используя плавную наклонную линию перехода ( прогноз с клиновидным разделением ). [ требуется ссылка ] Это позволяет более точно разделять объекты без традиционных ступенчатых линий вдоль границ квадратных блоков.
Больший параллелизм кодировщика возможен благодаря настраиваемой зависимости предсказания между строками плитки ( ext_tile
). [42]
AV1 выполняет внутреннюю обработку с более высокой точностью (10 или 12 бит на выборку), что приводит к улучшению качества за счет уменьшения ошибок округления.
Предсказания могут быть объединены более продвинутыми способами (чем равномерное среднее) в блоке ( составное предсказание ), включая плавные и резкие градиенты перехода в разных направлениях ( клиновидное предсказание ), а также неявные маски, основанные на разнице между двумя предикторами. Это позволяет использовать комбинацию либо двух интер-предсказаний, либо интер- и интра-предсказания в одном и том же блоке. [43] [ необходима цитата ]
Кадр может ссылаться на 6 вместо 3 из 8 доступных буферов кадров для временного (межкадрового) предсказания, обеспечивая при этом большую гибкость при би-предсказании [44] ( ext_refs
[ требуется ссылка ] ).
Инструменты Warped Motion ( warped_motion
) [42] и Global Motion ( global_motion
[ требуется ссылка ] ) в AV1 направлены на сокращение избыточной информации в векторах движения путем распознавания шаблонов, возникающих из-за движения камеры. [42] Они реализуют идеи, которые были опробованы в предыдущих форматах, таких как, например, MPEG-4 ASP, хотя и с новым подходом, который работает в трех измерениях. Может быть набор параметров деформации для всего кадра, предлагаемых в битовом потоке, или блоки могут использовать набор неявных локальных параметров, которые вычисляются на основе окружающих блоков.
Кадры переключения (S-кадр) — это новый тип межкадрового обмена, который можно предсказать с помощью уже декодированных опорных кадров из версии того же видео с более высоким разрешением, чтобы обеспечить переключение на более низкое разрешение без необходимости использования полного ключевого кадра в начале видеосегмента в случае использования потоковой передачи с адаптивным битрейтом . [45]
Внутрикадровое предсказание заключается в предсказании пикселей заданных блоков только с использованием информации, доступной в текущем кадре. Чаще всего внутрикадровые предсказания строятся из соседних пикселей выше и слева от предсказанного блока. DC-предсказатель строит предсказание, усредняя пиксели выше и слева от блока.
Направленные предикторы экстраполируют эти соседние пиксели в соответствии с указанным углом. В AV1 можно выбрать 8 основных направленных режимов. Эти режимы начинаются с угла 45 градусов и увеличиваются на шаг 22,5 градуса до 203 градусов. Кроме того, для каждого направленного режима можно сигнализировать о шести смещениях по 3 градуса для больших блоков, три выше основного угла и три ниже него, что в итоге дает 56 углов ( ext_intra
).
Предсказатель "TrueMotion" был заменен предсказателем Paeth , который смотрит на разницу между известным пикселем в верхнем левом углу и пикселем, расположенным непосредственно над и непосредственно слева от нового, а затем выбирает тот, который лежит в направлении меньшего градиента, в качестве предиктора. Предсказатель палитры доступен для блоков с до 8 доминирующими цветами, например, для некоторого содержимого экрана компьютера. Корреляции между яркостью и цветовой информацией теперь можно использовать с предсказателем для блоков цветности, который основан на образцах из плоскости яркости ( cfl
). [42] Чтобы уменьшить видимые границы вдоль границ интерпредсказываемых блоков, можно использовать технику, называемую компенсацией движения перекрывающихся блоков (OBMC). Она включает в себя расширение размера блока таким образом, чтобы он перекрывался с соседними блоками на 2–32 пикселя, и смешивание перекрывающихся частей вместе. [46]
Для преобразования ошибки, оставшейся после предсказания, в частотную область кодеры AV1 могут использовать квадратное, 2:1/1:2 и прямоугольное 4:1/1:4 DCT ( rect_tx
), [44] , а также асимметричное DST [47] [48] [49] для блоков, где верхний и/или левый край, как ожидается, будет иметь меньшую ошибку благодаря предсказанию из соседних пикселей, или выбрать не выполнять преобразование (тождественное преобразование).
Он может комбинировать два одномерных преобразования, чтобы использовать разные преобразования для горизонтального и вертикального измерения ( ext_tx
). [42] [44]
AV1 имеет новые оптимизированные матрицы квантования ( aom_qm
). [50] Восемь наборов параметров квантования, которые могут быть выбраны и переданы для каждого кадра, теперь имеют индивидуальные параметры для двух плоскостей цветности и могут использовать пространственное предсказание. На каждом новом суперблоке параметры квантования могут быть скорректированы путем передачи смещения.
Фильтрация в контуре объединяет ограниченный фильтр нижних частот Thor и направленный фильтр подавления звона Daala в ограниченный направленный фильтр улучшения . cdef
Это фильтр условной замены, направленный по краю, который сглаживает блоки примерно вдоль направления доминирующего края, чтобы устранить артефакты звона . [51]
Также имеется фильтр циклического восстановления ( loop_restoration
), основанный на фильтре Винера , и фильтры самоуправляемого восстановления для удаления артефактов размытия, вызванных блочной обработкой. [42]
Синтез зерна пленки (film_grain
) улучшает кодирование шумных сигналов с использованием параметрического подхода к кодированию видео. Из-за случайности, присущей шуму зерна пленки, этот компонент сигнала традиционно либо очень дорог для кодирования, либо склонен к повреждению или потере, что может оставить серьезные артефакты кодирования в качестве остатка. Этот инструмент обходит эти проблемы с помощью анализа и синтеза, заменяя части сигнала визуально похожей синтетической текстурой, основанной исключительно на субъективном визуальном впечатлении, а не на объективном сходстве. Он удаляет компонент зерна из сигнала, анализирует его неслучайные характеристики и вместо этого передает только описательные параметры декодеру, который добавляет обратно синтетический псевдослучайный шумовой сигнал, сформированный после исходного компонента. Это визуальный эквивалент метода замены воспринимаемого шума, используемого в аудиокодеках AC3, AAC, Vorbis и Opus.
Энтропийный кодер Daala ( daala_ec
[ необходима цитата ] ), недвоичный арифметический кодер , был выбран для замены двоичного энтропийного кодера VP9. Использование недвоичного арифметического кодирования помогает обойти патенты, но также добавляет параллелизм на уровне битов к последовательному процессу, снижая требования к тактовой частоте для аппаратных реализаций. [ необходима цитата ] Это означает, что эффективность современного двоичного арифметического кодирования, такого как CABAC, достигается с использованием большего алфавита, чем двоичный, следовательно, большей скорости, как в коде Хаффмана (но не таком простом и быстром, как код Хаффмана). AV1 также получил возможность адаптировать вероятности символов в арифметическом кодере на закодированный символ, а не на кадр ( ec_adapt
). [42]
AV1 имеет возможности для временной и пространственной масштабируемости. [52]
Первое сравнение, проведенное в начале июня 2016 года [53], показало, что AV1 примерно на одном уровне с HEVC, как и сравнение с кодом конца января 2017 года. [54]
В апреле 2017 года, используя 8 активированных на тот момент экспериментальных функций (из 77 в общей сложности), Bitmovin смог продемонстрировать благоприятные объективные метрики , а также визуальные результаты по сравнению с HEVC в короткометражных фильмах Sintel и Tears of Steel . [55] Последующее сравнение Яна Озера из Streaming Media Magazine подтвердило это и пришло к выводу, что «AV1 сейчас как минимум так же хорош, как HEVC». [56] Озер отметил, что его и Bitmovin результаты противоречат сравнению Института телекоммуникаций Фраунгофера от конца 2016 года [57] , который обнаружил, что AV1 на 65,7% менее эффективен, чем HEVC, уступая даже H.264/AVC, который, по их заключению, на 10,5% эффективнее. Озер обосновал это несоответствие тем, что использовал параметры кодирования, одобренные каждым поставщиком кодировщика, а также тем, что в новом кодировщике AV1 больше функций. [57] Производительность декодирования была примерно в два раза ниже, чем у VP9, согласно внутренним измерениям 2017 года. [45]
Тесты Netflix в 2017 году, основанные на измерениях с PSNR и VMAF при 720p, показали, что AV1 был примерно на 25% эффективнее VP9 (libvpx). [58] Тесты Facebook , проведенные в 2018 году на основе PSNR , показали, что эталонный кодер AV1 смог достичь на 34%, 46,2% и 50,3% более высокого сжатия данных , чем libvpx-vp9, x264 High profile и x264 Main profile соответственно. [59] [3]
Тесты Московского государственного университета в 2017 году показали, что VP9 требовал на 31%, а HEVC на 22% больше битрейта, чем AV1, для достижения аналогичного уровня качества. [60] Кодер AV1 работал со скоростью «в 2500–3500 раз ниже, чем у конкурентов» из-за отсутствия оптимизации (которая в то время не была доступна). [61] Тесты Университета Ватерлоо в 2020 году показали, что при использовании средней оценки мнения (MOS) для видео 2160p (4K) AV1 имел экономию битрейта на 9,5% по сравнению с HEVC и на 16,4% по сравнению с VP9. Они также пришли к выводу, что на момент исследования при 2160p кодирование видео AV1 в среднем занимало в 590 раз больше времени по сравнению с кодированием с помощью AVC; в то время как HEVC занимал в среднем в 4,2 раза больше времени, а VP9 занимал в среднем в 5,2 раза больше времени, чем AVC соответственно. [62] [63]
Последнее сравнение кодировщиков, проведенное журналом Streaming Media Magazine в сентябре 2020 года, в котором использовались умеренные скорости кодирования, VMAF и разнообразный набор коротких клипов, показало, что кодировщики с открытым исходным кодом libaom и SVT-AV1 потратили примерно в два раза больше времени на кодирование, чем x265 в его «очень медленной» предустановке, при этом используя на 15–20 % меньший битрейт или примерно на 45 % меньший битрейт, чем x264 veryslow . Лучший в тесте кодировщик AV1, Visionular's Aurora1, в его «более медленной» предустановке, был таким же быстрым, как x265 veryslow, при этом сэкономив 50 % битрейта по сравнению с x264 veryslow . [64]
CapFrameX протестировал производительность графических процессоров с декодированием AV1. [65] 5 октября 2022 года Cloudflare объявила о выпуске бета-версии плеера. [66]
AV1 определяет три профиля для декодеров: Main, High и Professional. Основной профиль допускает битовую глубину 8 или 10 бит на образец с 4:0:0 (оттенки серого) и 4:2:0 (четверть) цветной выборкой . Высокий профиль дополнительно добавляет поддержку цветной выборки 4:4:4 (без субдискретизации). Профессиональный профиль расширяет возможности до полной поддержки цветной субдискретизации 4:0:0, 4:2:0, 4:2:2 (половина) и 4:4:4 с глубиной цвета 8, 10 и 12 бит. [67]
Главное (0) | Высокий (1) | Профессионал (2) | ||
---|---|---|---|---|
Глубина цвета | 8 или 10 | 8 или 10 | 8, 10 и 12 | |
Субдискретизация цветности | 4:0:0 | Да | Да | Да |
4:2:0 | Да | Да | Да | |
4:2:2 | Нет | Нет | Да | |
4:4:4 | Нет | Да | Да |
Этот раздел может быть слишком техническим для понимания большинства читателей . ( Сентябрь 2023 ) |
AV1 определяет уровни для декодеров с максимальными переменными для уровней в диапазоне от 2,0 до 6,3. [68] Уровни, которые могут быть реализованы, зависят от возможностей оборудования.
Примеры разрешений: 426×240@30 кадров в секунду для уровня 2.0, 854×480@30 кадров в секунду для уровня 3.0, 1920×1080@30 кадров в секунду для уровня 4.0, 3840×2160@60 кадров в секунду для уровня 5.1, 3840×2160@120 кадров в секунду для уровня 5.2 и 7680×4320@120 кадров в секунду для уровня 6.2. Уровень 7 пока не определен. [69]
seq_level_idx | Уровень | MaxPicSize (Образцы) | MaxHSize (Образцы) | MaxVSize (Образцы) | Макс. частота отображения (Гц) | Макс.скорость декодирования (Гц) | Максимальная скорость заголовка (Гц) | MainMbps (Мбит/с) | ВысокийМбит/ с (Мбит/с) | Минимальная основа компенсации | Макс. плитка | Макс. кол-во плитки | Пример |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 2.0 | 147456 | 2048 | 1152 | 4,423,680 | 5,529,600 | 150 | 1.5 | - | 2 | 8 | 4 | 426×240@30 кадров в секунду |
1 | 2.1 | 278784 | 2816 | 1584 | 8,363,520 | 10,454,400 | 150 | 3.0 | - | 2 | 8 | 4 | 640×360@30 кадров в секунду |
4 | 3.0 | 665856 | 4352 | 2448 | 19,975,680 | 24,969,600 | 150 | 6.0 | - | 2 | 16 | 6 | 854×480@30 кадров в секунду |
5 | 3.1 | 1065024 | 5504 | 3096 | 31,950,720 | 39,938,400 | 150 | 10.0 | - | 2 | 16 | 6 | 1280×720@30 кадров в секунду |
8 | 4.0 | 2359296 | 6144 | 3456 | 70,778,880 | 77,856,768 | 300 | 12.0 | 30.0 | 4 | 32 | 8 | 1920×1080@30 кадров в секунду |
9 | 4.1 | 2359296 | 6144 | 3456 | 141,557,760 | 155,713,536 | 300 | 20.0 | 50.0 | 4 | 32 | 8 | 1920×1080@60 кадров в секунду |
12 | 5.0 | 8912896 | 8192 | 4352 | 267,386,880 | 273,715,200 | 300 | 30.0 | 100.0 | 6 | 64 | 8 | 3840×2160@30 кадров в секунду |
13 | 5.1 | 8912896 | 8192 | 4352 | 534,773,760 | 547,430,400 | 300 | 40.0 | 160.0 | 8 | 64 | 8 | 3840×2160@60 кадров в секунду |
14 | 5.2 | 8912896 | 8192 | 4352 | 1,069,547,520 | 1,094,860,800 | 300 | 60.0 | 240.0 | 8 | 64 | 8 | 3840×2160@120 кадров в секунду |
15 | 5.3 | 8912896 | 8192 | 4352 | 1,069,547,520 | 1,176,502,272 | 300 | 60.0 | 240.0 | 8 | 64 | 8 | 3840×2160@120 кадров в секунду |
16 | 6.0 | 35651584 | 16384 | 8704 | 1,069,547,520 | 1,176,502,272 | 300 | 60.0 | 240.0 | 8 | 128 | 16 | 7680×4320@30 кадров в секунду |
17 | 6.1 | 35651584 | 16384 | 8704 | 2,139,095,040 | 2,189,721,600 | 300 | 100.0 | 480.0 | 8 | 128 | 16 | 7680×4320@60 кадров в секунду |
18 | 6.2 | 35651584 | 16384 | 8704 | 4,278,190,080 | 4,379,443,200 | 300 | 160.0 | 800.0 | 8 | 128 | 16 | 7680×4320@120 кадров в секунду |
19 | 6.3 | 35651584 | 16384 | 8704 | 4,278,190,080 | 4,706,009,088 | 300 | 160.0 | 800.0 | 8 | 128 | 16 | 7680×4320@120 кадров в секунду |
Стандартизировано:
Незаконченные стандарты:
Не стандартизировано:
Видео AV1 обычно сопровождается аудио AAC или Opus в контейнере базового формата медиафайла ISO ( MP4 ).
В октябре 2016 года Netflix заявила, что они ожидают стать одними из первых, кто примет AV1. [80] 5 февраля 2020 года Netflix начала использовать AV1 для потоковой передачи избранных произведений на Android , обеспечивая на 20% более высокую эффективность сжатия по сравнению с потоками VP9. [81] 9 ноября 2021 года Netflix объявила, что начала потоковую передачу контента AV1 на ряд телевизоров с декодерами AV1, а также на PlayStation 4 Pro . [82]
В 2018 году YouTube начал развертывание AV1, начав со своего плейлиста AV1 Beta Launch. Согласно описанию, видео (для начала) кодируются с высоким битрейтом для проверки производительности декодирования, и у YouTube есть «амбициозные цели» по развертыванию AV1. YouTube для Android TV поддерживает воспроизведение видео, закодированных в AV1, на совместимых платформах, начиная с версии 2.10.13, выпущенной в начале 2020 года. [83] В 2020 году YouTube начал обслуживать видео с разрешением 8K в AV1. [84]
В феврале 2019 года Facebook последовала собственным положительным результатам тестирования, заявив, что будет постепенно развертывать кодек AV1, как только появится поддержка браузера, начиная с самых популярных видео. [59] Также в 2022 году ее материнская компания Meta выразила интерес к SVT-AV1, в то время как в то же время инженер Google Мэтт Фрост говорил в конце на канале Intel на YouTube, что намерение состояло в том, чтобы провести первое тестирование в 2023 году, [85] когда аппаратное ускорение будет внедрено и широко распространено, но в последнем майском видео Streaming Media статус был неизвестен, и никаких заявлений от AOMedia не было сделано. [86] Было объявлено о MSVP (Meta Scalable Video Processor) [87] , и симпозиум был опубликован на популярном научно-исследовательском сайте 15 октября 2022 года.
4 ноября 2022 года кодек AV1 был анонсирован в статье блога Meta technology и с Марком Цукербергом в Instagram Reels , где показан кодек AV1 в сравнении с H.264/MPEG-4 AVC. Ссылаясь на «Наша команда инженеров Instagram разработала способ значительно улучшить качество видео. Мы сделали базовую обработку видео на 94% быстрее». [88] [89] Android имеет предварительное собственное воспроизведение AV1. [90] [91]
В июне 2019 года видео Vimeo на канале «Staff picks» были доступны в форматах AV1 и Opus. [92] Vimeo использует и вносит свой вклад в кодировщик Rav1e от Mozilla и рассчитывает, что с дальнейшими улучшениями кодировщика в конечном итоге обеспечит поддержку AV1 для всех видео, загруженных на Vimeo, а также для предложения компании «Live». [92]
30 апреля 2020 года iQIYI объявил о поддержке AV1 для пользователей веб-браузеров на ПК и устройств Android, став первым китайским сайтом потокового видео, принявшим этот кодек. [93]
Twitch развернул AV1 для своего самого популярного контента в 2022 или 2023 году [94] , а всеобщая поддержка, как ожидается, появится в 2024 или 2025 году. [95] [96]
В апреле 2021 года Roku удалила приложение YouTube TV с потоковой платформы Roku после истечения срока действия контракта. Позже сообщалось, что потоковые устройства Roku не используют процессоры, поддерживающие кодек AV1. В декабре 2021 года YouTube и Roku договорились о многолетнем соглашении о сохранении как приложения YouTube TV, так и приложения YouTube на потоковой платформе Roku. Roku утверждала, что использование процессоров в их потоковых устройствах, поддерживающих бесплатный кодек AV1, увеличит расходы для потребителей. [97] [98]
В январе 2022 года Bilibili развернула кодирование H.265 HEVC и AV1 для видео с большим количеством просмотров, в то время как видео с меньшим количеством просмотров доступны только в формате H.264 AVC. [99]
В июле 2024 года DMM.com развернула AV1 на своем сервисе DMM.TV, став первой японской компанией, сделавшей это. [100]
Другие поставщики анонсировали кодировщики, включая EVE для AV1, [114] NGCodec, [115] Socionext, [116] Aurora [117] и MilliCast. [118]
Этот раздел читается как каталог . ( Январь 2024 г. ) |
Веб-браузеры:
Видеоплееры:
Интерфейсы кодировщика:
Видеоредакторы:
Другие:
Майкрософт Виндоус | macOS | BSD / Linux | ChromeOS | андроид | iOS | |
---|---|---|---|---|---|---|
Поддержка кодеков | Да | Частичный | Да | Да | Да | Частичный |
Поддержка контейнеров |
|
|
|
|
| |
Примечания |
| Встроенная поддержка воспроизведения только на устройствах с процессором Apple Silicon M3 и выше, которые имеют аппаратные декодеры AV1. [148] [131] [132] Firefox 67 и выше, а также Chrome 70 и выше поддерживают воспроизведение на всех устройствах. [149] [150] | Поддерживает декодирование, начиная с ChromeOS 70 | Поддерживается с Android 10 [151] [152] [153] | Поддержка воспроизведения только на устройствах с процессором Apple Silicon A17 и выше, которые имеют аппаратные декодеры AV1. [148] [130] |
This section reads like a directory. (January 2024) |
Компания | Продукт | Расшифровать | Кодировать | Профиль | Пропускная способность (одно ядро) [ требуется разъяснение ] | Пропускная способность (макс.) [ требуется уточнение ] | Ссылка |
---|---|---|---|---|---|---|---|
АМД | RDNA 2 (исключая Navi 24) | Главное (0) | 8K30 10-бит | [154] [155] [156] [157] | |||
РДНК 3 | 8K60 (10-битное кодирование, 12-битное декодирование) | [158] [159] | |||||
РДНК 3.5 | 4К60 | ||||||
Альвео МА35Д | [160] [161] | ||||||
Амлогик | S905X4 | 4К120 | 8К | [162] | |||
S908X | 8К60 | ||||||
S805X2 | 1080p | ||||||
Яблоко | А17 Про | 4К60 | [163] | ||||
А18 / А18 Про | |||||||
Серия М3 | |||||||
Серия М4 | |||||||
Бродком | BCM7218X | 4К | [164] | ||||
Чипсы и Медиа | ВОЛНА510А ВОЛНА627 [165] | Главное (0) | 4К60 | 4К120 | [166] | ||
Тензор Оригинал / G2 | 4К60 | [167] | |||||
Тензор G3 | 4К60 | [168] | |||||
Интел | Хе | Главное (0) | 8К 10-бит [169] | [170] [171] [155] [172] | |||
Хе 2 | 8К 10-бит | 8К 10-бит | |||||
Дуга | 8К60 | [173] [174] | |||||
Серия Flex для ЦОД GPU | [175] [176] | ||||||
МедиаТек | Серия Dimensity 1000 | 4К60 | 4К60 | [177] [178] [179] [180] | |||
Серия Dimensity 8000 | [181] | ||||||
Серия Dimensity 9000 | 8К30 | [182] [183] | |||||
Серия MT96XX | 4K60 10-бит | 4K60 10-бит | [184] | ||||
МТ9950 | 8К30 | [185] | |||||
Серия Пентоник | |||||||
NETINT | Quadra T1 (1x Codensity G5 ASIC) | 4x 4K60 10-битных потока | 4x 4K60 10-битных потока | [186] [187] | |||
Quadra T2 (2x Codensity G5 ASIC) | 4x 4K60 10-битных потока | 8x 4K60 10-битных потоков | [186] [187] | ||||
Quadra T4 (4x Codensity G5 ASIC) | 4x 4K60 10-битных потока | 16x 4K60 10-битных потоков | [186] [187] | ||||
Нвидиа | GeForce30 | Главное (0) | 8K60 10-бит | [188] [155] [189] | |||
GeForce 40 | Главное (0) | 8K60 10-бит | 2x 8K60 10-бит | [190] [191] [192] [193] | |||
Qualcomm | Snapdragon 8 2-го поколения | 8К60 | [194] | ||||
Snapdragon 8/8s 3-го поколения | |||||||
Snapdragon X Plus/Элитный | Главное (0) | 4K120 10-бит | [195] | ||||
Реалтек | RTD1311 | 4К | [196] | ||||
RTD2893 | 8К | [197] [198] | |||||
Рокчип | РК3588 | 4K60 10-бит | [199] | ||||
Samsung | Exynos 2000 серии | 8К30 | [200] [201] |
В начале 2019 года компания Sisvel, базирующаяся в Люксембурге, заявила о формировании патентного пула патентов, необходимых для AV1. [202] Это развитие событий не заставило Google пересмотреть свое запланированное использование AV1 [203] , а Alliance for Open Media заявили, что они по-прежнему уверены в том, что AV1 по-прежнему преодолевает среду «высоких требований к патентным отчислениям и неопределенности лицензирования». [204] Sisvel начала продавать лицензии пулу, который содержит патенты от Philips , GE , NTT , Ericsson , Dolby и Toshiba, в 2020 году. [205] Unified Patents отслеживает проблемы с различными патентами в пуле. [206]
7 июля 2022 года стало известно, что антимонопольные регуляторы Европейского союза начали расследование в отношении AOM и его политики лицензирования. В нем говорилось, что это действие может ограничить способность новаторов конкурировать с технической спецификацией AV1, а также устранить стимулы для них к инновациям. [207]
Комиссия располагает информацией о том, что AOM и ее члены могут навязывать условия лицензирования (обязательное перекрестное лицензирование без уплаты роялти) новаторам, которые не были частью AOM на момент создания технического стандарта AV1, но чьи патенты считаются существенными для (его) технических спецификаций.
23 мая 2023 года Европейская комиссия приняла решение закрыть расследование, не предпринимая никаких дальнейших действий. Однако в электронном письме они повторили, что закрытие не является выводом о соблюдении или несоблюдении антимонопольного законодательства ЕС. [208]
В октябре 2023 года оператор патентного пула Avanci объявил о начале новой программы лицензирования, нацеленной на операторов потокового видео, которые используют AV1 в дополнение к H.265, H.266, VP9 и т. д. [209]
Формат файла изображения AV1 (AVIF) — это спецификация формата файла изображения для хранения неподвижных изображений или последовательностей изображений, сжатых с помощью AV1 в формате файла HEIF . [210] Он конкурирует с HEIC, который использует тот же формат контейнера , созданный на основе ISOBMFF , но HEVC для сжатия.
Mozilla использует OpenH264 от Cisco в Firefox. Если бы не щедрость Cisco, Mozilla платила бы предполагаемые лицензионные сборы в размере 9,75 млн долларов в год.
Поскольку свободное ПО дает каждому пользователю свободу распространять само программное обеспечение, отслеживание и сбор роялти на основе распространенных копий также на практике невозможны.
Поскольку реализации H.264 подлежат патентной лицензии с отчислениями, а Mozilla является проектом с открытым исходным кодом, мы не можем напрямую поставлять H.264 в Firefox. Мы хотим, чтобы любой мог распространять Firefox без уплаты MPEG LA.
два трека в MPEG: один трек, создающий стандарты без уплаты роялти (вариант 1, на языке ISO), а другой — традиционные стандарты Fair Reasonable and Non Discriminatory (FRAND) (вариант 2, на языке ISO). (…) Стандарт кодирования видео в Интернете (IVC) был успешной реализацией идеи (…). К сожалению, 3 компании сделали пустые заявления по варианту 2 (типа «У меня могут быть патенты, и я готов лицензировать их на условиях FRAND»), возможность, которую ISO допускает. У MPEG не было средств для удаления заявленных нарушающих права технологий, если таковые имелись, и IVC практически мертв.
MPEG смогла этого добиться? Благодаря своей «бизнес-модели», которую можно просто описать как: разрабатывать стандарты, имеющие наилучшую производительность в качестве цели, независимо от вовлеченных прав интеллектуальной собственности.
сегодня является базовым форматом в Интернете. Проблема Flash в том, что это не открытый стандарт. Это проприетарный формат, он не был задокументирован, и, вероятно, требует оплаты лицензий, если вы собираетесь (…) писать для него программное обеспечение (…) Веб-сообщество всегда основывалось на открытых стандартах. Это было то, на чем был основан Интернет, где начинался HTML. Вот почему мы разработали формат изображения PNG — мы хотели свободно реализуемый открытый стандарт для хранения контента, который мы там размещаем. Наш контент слишком ценен, чтобы помещать его в какой-то закрытый формат. Это восходит к SGML, в котором мантрой было «владей своими данными». (…) Если мы посмотрим на открытые стандарты видео сегодня (…), то есть один, который, по моему мнению, является правильным, и он называется Ogg Theora.
Что Thor может добавить к VP9/AV1? Поскольку Thor стремится к разумному сжатию при умеренной сложности, мы рассмотрели функции Thor, которые могли бы повысить эффективность сжатия VP9 и/или снизить вычислительную сложность.
После того, как он станет доступен, YouTube рассчитывает перейти на AV1 как можно быстрее, особенно для таких видеоконфигураций, как UHD, HDR и видео с высокой частотой кадров ... Основываясь на своем опыте внедрения VP9, YouTube оценивает, что они могут начать поставлять потоки AV1 в течение шести месяцев после завершения работы над битовым потоком. ...
{{cite web}}
: CS1 maint: numeric names: authors list (link)интригующий результат, полученный после анализа данных, заключается в том, что разработанный кодек AV1 в настоящее время равен по производительности HEVC. Приведенные потоки закодированы с помощью обновления AV1 от 2017.01.31
Хотя 2018 год стал годом, когда AV1 стал известен, 2020 год станет годом, когда AV1 станет интересным, в первую очередь из-за трех событий. Во-первых, в начале 2020 года на рынок вышли смарт-телевизоры с поддержкой AV1, как раз по двухлетнему графику, объявленному еще в 2018 году Альянсом за открытые медиа (AOMedia). Во-вторых, за последние два года время кодирования для кодека AOMedia AV1 сократилось с примерно 2500 раз в реальном времени до примерно 2 раз медленнее, чем HEVC. Наконец, появление сторонних кодеков AV1 повысило как качество, так и скорость кодирования кодека AV1.
IVF, как правило, не будут использоваться вашим приложением.
того, мы взаимодействуем с AOM в плане предоставления тестовых векторов, предоставления требований, мы с нетерпением ждем возможности протестировать AV1 в нашем рабочем процессе на большом каталоге и предоставить там результаты. И мы также рассчитываем стать одними из первых, кто примет AV1.
но мы надеемся, что к 2024–2025 гг. экосистема AV1 будет готова, мы хотим перейти на AV1 на 100%. … это наш прогноз прямо сейчас. Но с другой стороны, как я уже сказал, наш релиз AV1 будет, для контента head будет намного раньше. Мы надеемся, что в 2022–2023 гг. мы выпустим AV1 для контента head.
сосредоточились на заморозке потока битов и получении качества, не обязательно делая все быстро. Это график скорости [кодирования] AV1 в процессе его разработки. Вы можете видеть, что по мере приближения к концу этого процесса мы снова начали делать все быстрее, и теперь он на два порядка быстрее, чем был в самой медленной точке. Так что это улучшится. А это соответствующий график качества. (…) Таким образом, вы можете видеть, что даже несмотря на то, что он продолжает становиться намного быстрее, качество на самом деле не упало. (…) Мы хотели подойти к этому с другой стороны, поэтому мы создали собственный кодировщик под названием rav1e, и идея заключается в том, что мы начнем с того, что всегда будем работать быстро, а затем постараемся со временем улучшить его.
Safari 17.0 добавляет поддержку видео AV1 на устройствах с поддержкой аппаратного декодирования, таких как iPhone 15 Pro и iPhone 15 Pro Max.
также впервые поставляет декодер AV1 со своим семейством чипов M3, поэтому владельцы получат выгоду от более энергоэффективного воспроизведения контента AV1.
начинает продавать лицензии на более чем 1050 патентов на AV1, видеотехнологию, которая должна быть бесплатной.