Перцептивная оценка качества речи ( PESQ ) — это семейство стандартов, включающее в себя методологию тестирования для автоматизированной оценки качества речи, воспринимаемой пользователем телефонной системы. Она была стандартизирована как Рекомендация ITU-T P.862 [1] в 2001 году. PESQ используется для объективного тестирования качества голоса производителями телефонов, поставщиками сетевого оборудования и операторами связи. Для ее использования требуется лицензия. Первое издание преемника PESQ POLQA (Рекомендация ITU-T P.863 [2] ) вступило в силу в 2011 году.
Область измерения
PESQ был разработан для моделирования субъективных тестов, обычно используемых в телекоммуникациях (например, Рекомендация МСЭ-Т P.800) для оценки качества голоса, воспринимаемого людьми. Следовательно, он использует истинные образцы голоса в качестве тестовых сигналов. Для того чтобы охарактеризовать качество прослушивания, воспринимаемое пользователями, крайне важно загружать современное телекоммуникационное оборудование сигналами, подобными речи. Многие системы оптимизированы для речи и будут реагировать непредсказуемым образом на неречевые сигналы (например, тоны, шум). Руководящие принципы для правильного применения тестовых образцов голоса определены в руководстве по применению PESQ, содержащемся в Рекомендации МСЭ-Т P.862.3. [3]
Генеалогия родственных стандартов
Семейство полнофункциональных эталонных объективных измерений качества голоса ITU-T началось в 1997 году с Рекомендации ITU-T P.861 (PSQM), которая была заменена ITU-T P.862 (PESQ) [1] в 2001 году. P.862 была позже дополнена Рекомендациями ITU-T P.862.1 [4] (сопоставление оценок PESQ со шкалой MOS), ITU-T P.862.2 [5] (широкополосные измерения) и ITU-T P.862.3 [3] (руководство по применению). Первое издание ITU-T P.863 ( POLQA ) [2] вступило в силу в 2011 году. Руководство по применению Рекомендации ITU-T P.863 было утверждено в 2019 году и опубликовано как ITU-T P.863.1. [6]
Помимо перечисленных выше полных эталонных методов, список объективных стандартов измерения качества голоса ITU-T также включает ITU-T P.563 [7] (алгоритм без эталона).
Типология тестирования
В зависимости от информации, которая предоставляется алгоритму, алгоритмы проверки качества голоса можно разделить на две основные категории:
Алгоритм «полного эталона» (FR) имеет доступ к исходному эталонному сигналу и использует его для сравнения (т. е. анализа различий). Он может сравнивать каждый образец эталонного сигнала (сторона говорящего) с каждым соответствующим образцом ухудшенного сигнала (сторона слушателя). Измерения FR обеспечивают наивысшую точность и повторяемость, но могут применяться только для специальных тестов в реальных сетях (например, инструменты для драйв-тестов для бенчмарков мобильных сетей).
Алгоритм «без ссылки» (NR) использует только ухудшенный сигнал для оценки качества и не имеет информации об исходном опорном сигнале. Алгоритмы NR (например, Рекомендация ITU-T P.563 [7] ) являются только оценками с низкой точностью, поскольку исходные голосовые характеристики (например, мужской или женский голос, фоновый шум, неголос) исходного опорного сигнала полностью неизвестны. Распространенный вариант алгоритмов NR даже не анализирует декодированный аудиосигнал, а работает над анализом цифрового битового потока на уровне IP-пакетов. Следовательно, измерение ограничивается анализом транспортного потока.
PESQ — это полноценный алгоритм сравнения, который анализирует речевой сигнал по образцам после временного выравнивания соответствующих фрагментов эталонного и тестового сигнала. PESQ может применяться для обеспечения сквозной (E2E) оценки качества сети или для характеристики отдельных сетевых компонентов.
Результаты PESQ в основном моделируют средние оценки мнений (MOS), которые охватывают шкалу от 1 (плохо) до 5 (отлично). Функция отображения в MOS-LQO описана в Рекомендации МСЭ-Т P.862.1. [4]
^ ab "P.862: Перцептивная оценка качества речи (PESQ): объективный метод сквозной оценки качества речи узкополосных телефонных сетей и речевых кодеков". www.itu.int . Получено 20 апреля 2021 г.
^ ab "P.863: Прогнозирование качества восприятия объективного слушания". www.itu.int . Получено 11.04.2021 .
^ ab "P.862.3: Руководство по применению объективного измерения качества на основе Рекомендаций P.862, P.862.1 и P.862.2". www.itu.int . Получено 20 апреля 2021 г.
^ ab "P.862.1: Функция отображения для преобразования необработанных результатов P.862 в MOS-LQO". www.itu.int . Получено 11.04.2021 .
^ "P.862.2: Широкополосное расширение Рекомендации P.862 для оценки широкополосных телефонных сетей и речевых кодеков". www.itu.int . Получено 2021-04-11 .
^ "P.863.1: Руководство по применению Рекомендации МСЭ-Т P.863". www.itu.int . Получено 11 апреля 2021 г.
^ ab "P.563: Односторонний метод объективной оценки качества речи в узкополосных телефонных приложениях". www.itu.int . Получено 11 апреля 2021 г.
Рикс, Энтони В.; Холлиер, Майкл П.; Хекстра, Андрис П.; Бирендс, Джон Г. (15.10.2002). «Перцептивная оценка качества речи (PESQ). Новый стандарт МСЭ для сквозной оценки качества речи, часть I — компенсация задержки по времени». Журнал Audio Engineering Society . 50 (10): 755–764.
Бирендс, Джон Г.; Хекстра, Андрис П.; Рикс, Энтони В.; Холлиер, Майкл П. (15.10.2002). «Перцептивная оценка качества речи (PESQ). Новый стандарт МСЭ для сквозной оценки качества речи, часть II: психоакустическая модель». Журнал Audio Engineering Society . 50 (10): 765–778.
Внешние ссылки
Примечание по применению 1GA49: Психоакустические измерения качества звука с использованием аудиоанализатора R&S UPV
Примечание по применению 1MA119: Измерение PESQ для GSM с помощью R&SCMUgo
Примечание по применению 1MA136: Измерение PESQ для CDMA2000 с помощью R&SCMUgo
Примечание по применению 1MA137: Измерение PESQ для WCDMA с помощью R&SCMUgo
Примечание по применению 1MA149: Измерения VoIP для WiMAX