Скорость перехода через ноль

Скорость пересечения нуля (ZCR) — это скорость, с которой сигнал изменяется с положительного на нулевой и на отрицательный или с отрицательного на нулевой и на положительный. [1] Ее значение широко используется как в распознавании речи , так и в поиске музыкальной информации , являясь ключевым признаком для классификации ударных звуков. [2]

ZCR формально определяется как

з с г = 1 Т 1 т = 1 Т 1 1 Р < 0 ( с т с т 1 ) {\displaystyle zcr={\frac {1}{T-1}}\sum _{t=1}^{T-1}\mathbb {1} _{\mathbb {R} _{<0}}(s_{t}s_{t-1})}

где — сигнал длины , а — индикаторная функция . с {\displaystyle с} Т {\displaystyle Т} 1 Р < 0 {\displaystyle \mathbb {1} _{\mathbb {R} _{<0}}}

В некоторых случаях учитываются только «положительные» или «отрицательные» пересечения, а не все пересечения, поскольку между парой соседних положительных нулевых пересечений должно быть одно отрицательное нулевое пересечение.

Для монофонических тональных сигналов скорость пересечения нуля может использоваться как примитивный алгоритм обнаружения высоты тона . Скорость пересечения нуля также используется для обнаружения голосовой активности (VAD), которая определяет, присутствует ли человеческая речь в аудиосегменте или нет.

Смотрите также

Ссылки

  1. ^ * Чен, Ч. Х., Справочник по обработке сигналов, Деккер, Нью-Йорк, 1988
  2. ^ Gouyon F., Pachet F., Delerue O. (2000), Об использовании скорости пересечения нуля для применения классификации ударных звуков, в Трудах конференции COST G-6 по цифровым аудиоэффектам (DAFX-00 - DAFX-06), Верона, Италия, 7–9 декабря 2000 г. Доступ 26 апреля 2011 г.


Взято с "https://en.wikipedia.org/w/index.php?title=Скорость_пересечения_нулевого_перехода&oldid=1020703960"