Кепстр

Концепция анализа Фурье

В Фурье - анализе кепстр ( / ˈk ɛ p s t r ʌ m , ˈs ɛ p -, - s t r ə m / ; множественное число кепстра , прилагательное кепстральный ) является результатом вычисления обратного преобразования Фурье (ОПФ) логарифма оценочного спектра сигнала . Метод является инструментом для исследования периодических структур в частотных спектрах. Мощностной кепстр имеет применение в анализе человеческой речи .

Термин cepstrum был получен путем перестановки первых четырех букв в слове spectrum . Операции с cepstra обозначаются как quefrency analysis (или quefrency alanysis [1] ), liftering или cepstral analysis . Его можно произносить двумя приведенными способами, причем второй вариант имеет преимущество, поскольку его не путают с kepstrum .

Этапы формирования кепстра из истории времени

Источник

Концепция кепстра была введена в 1963 году BP Bogert, MJ Healy и JW Tukey . [1] Он служит инструментом для исследования периодических структур в частотных спектрах. [2] Такие эффекты связаны с заметными эхами или отражениями в сигнале или с возникновением гармонических частот ( частичных , обертонов ). Математически он имеет дело с проблемой деконволюции сигналов в частотном пространстве. [3]

Ссылки на статью Богерта в библиографии часто редактируются неправильно. [ необходима цитата ] Термины "quefrency", "alanysis", "cepstrum" и "saphe" были изобретены авторами путем перестановки букв в словах frequency, analysis, spectrum и phase. Изобретенные термины определяются по аналогии со старыми терминами.

Общее определение

Кепстр является результатом следующей последовательности математических операций:

  • преобразование сигнала из временной области в частотную область
  • вычисление логарифма спектральной амплитуды
  • преобразование в частотную область, где конечная независимая переменная, частота, имеет временную шкалу. [1] [2] [3]

Типы

Кепстр используется во многих вариантах. Наиболее важными являются:

  • Кепстр мощности: Логарифм берется из «спектра мощности»
  • комплексный кепстр: логарифм берется из спектра, который вычисляется с помощью анализа Фурье

В формулах для пояснения кепстра используются следующие сокращения:

АббревиатураОбъяснение
ф ( т ) {\displaystyle f(t)} Сигнал, являющийся функцией времени
С {\displaystyle С} Кепстр
Ф {\displaystyle {\mathcal {F}}} Преобразование Фурье : аббревиатура может обозначать непрерывное преобразование Фурье , дискретное преобразование Фурье (ДПФ) или даже z-преобразование , поскольку z-преобразование является обобщением ДПФ. [3]
Ф 1 {\displaystyle {\mathcal {F}}^{-1}} Обратное преобразование Фурье
бревно ( х ) {\displaystyle \log(x)} Логарифм x . Выбор основания b зависит от пользователя. В некоторых статьях основание не указывается, в других предпочитают основание 10 или  e . Выбор основания не влияет на основные правила вычислений, но иногда основание e приводит к упрощениям (см. «комплексный кепстр»).
| х | {\displaystyle \left|x\right|} Абсолютное значение , или величина комплексной величины , которая вычисляется из действительной и мнимой части с использованием теоремы Пифагора .
| х | 2 {\displaystyle \left|x\right|^{2}} Абсолютный квадрат
φ {\displaystyle \varphi} Фазовый угол комплексной величины

Мощность кепстра

«Кепстр» изначально определялся как энергетический кепстр по следующему соотношению: [1] [3]

С п = | Ф 1 { бревно ( | Ф { ф ( т ) } | 2 ) } | 2 {\displaystyle C_{p}=\left|{\mathcal {F}}^{-1}\left\{\log \left(\left|{\mathcal {F}}\{f(t)\}\right|^{2}\right)\right\}\right|^{2}}

Мощностной кепстр имеет основные приложения в анализе звуковых и вибрационных сигналов. Он является дополнительным инструментом к спектральному анализу. [2]

Иногда его также определяют как: [2]

С п = | Ф { бревно ( | Ф { ф ( т ) } | 2 ) } | 2 {\displaystyle C_{p}=\left|{\mathcal {F}}\left\{\log \left(\left|{\mathcal {F}}\{f(t)\}\right|^{2}\right)\right\}\right|^{2}}

Из-за этой формулы кепстр иногда называют спектром спектра . Можно показать, что обе формулы согласуются друг с другом, поскольку спектральное распределение частот остается тем же самым, единственное отличие — масштабный коэффициент [2] , который можно применить впоследствии. В некоторых статьях предпочитают вторую формулу. [2] [4]

Возможны и другие обозначения, поскольку логарифм спектра мощности равен логарифму спектра, если применить масштабный коэффициент 2: [5]

бревно | Ф | 2 = 2 бревно | Ф | {\displaystyle \log |{\mathcal {F}}|^{2}=2\log |{\mathcal {F}}|}

и поэтому:

С п = | Ф 1 { 2 бревно | Ф | } | 2 ,  или {\displaystyle C_{p}=\left|{\mathcal {F}}^{-1}\left\{2\log |{\mathcal {F}}|\right\}\right|^{2},{\text{ или}}}
С п = 4 | Ф 1 { бревно | Ф | } | 2 , {\displaystyle C_{p}=4\cdot \left|{\mathcal {F}}^{-1}\left\{\log |{\mathcal {F}}|\right\}\right|^{2},}

что обеспечивает связь с реальным кепстром (см. ниже).

Далее следует отметить, что окончательная операция возведения в квадрат в формуле для спектра мощности иногда называется ненужной [3] и поэтому иногда опускается. [4] [2] С п {\displaystyle C_{p}}

Реальный кепстр напрямую связан с силовым кепстром:

С п = 4 С г 2 {\displaystyle C_{p}=4\cdot C_{r}^{2}}

Он выводится из комплексного кепстра (определенного ниже) путем отбрасывания фазовой информации (содержащейся в мнимой части комплексного логарифма ). [4] Он фокусируется на периодических эффектах в амплитудах спектра: [6]

С г = Ф 1 { бревно ( | Ф { ф ( т ) } | ) } {\displaystyle C_{r}={\mathcal {F}}^{-1}\left\{\log({\mathcal {|{\mathcal {F}}\{f(t)\}|}})\right\}}

Комплексный кепстр

Комплексный кепстр был определен Оппенгеймом при разработке им теории гомоморфных систем. [7] [8] Формула также приводится в другой литературе. [2]

С с = Ф 1 { бревно ( Ф { ф ( т ) } ) } {\displaystyle C_{c}={\mathcal {F}}^{-1}\left\{\log({\mathcal {F}}\{f(t)\})\right\}}

Поскольку является комплексным, логарифмический член может быть также записан как произведение величины и фазы, а затем как сумма. Дальнейшее упрощение очевидно, если log является натуральным логарифмом с основанием  e : Ф {\displaystyle {\mathcal {F}}} Ф {\displaystyle {\mathcal {F}}}

бревно ( Ф ) = бревно ( | Ф | е я φ ) {\displaystyle \log({\mathcal {F}})=\log({\mathcal {|F|\cdot e^{i\varphi }}})}
бревно е ( Ф ) = бревно е ( | Ф | ) + бревно е ( е я φ ) = бревно е ( | Ф | ) + я φ {\displaystyle \log _{e}({\mathcal {F}})=\log _{e}({\mathcal {|F|}})+\log _{e}(e^{i\varphi })=\log _{e}({\mathcal {|F|}})+i\varphi }

Следовательно: Комплексный кепстр можно также записать как: [9]

С с = Ф 1 { бревно е ( | Ф | ) + я φ } {\displaystyle C_{c}={\mathcal {F}}^{-1}\left\{\log _{e}({\mathcal {|F|}})+i\varphi \right\}}

Комплексный кепстр сохраняет информацию о фазе. Таким образом, всегда возможно вернуться из области квантования во временную область с помощью обратной операции: [2] [3]

ф ( т ) = Ф 1 { б ( Ф { С с } ) } , {\displaystyle f(t)={\mathcal {F}}^{-1}\left\{b^{\left({\mathcal {F}}\{C_{c}\}\right)}\right\},}

где b — основание используемого логарифма.

Основное применение — модификация сигнала в области частот (лифтеринг) как аналог фильтрации в области спектральных частот. [2] [3] Примером может служить подавление эффектов эха путем подавления определенных частот. [2]

Фазовый кепстр (после фазового спектра ) связан с комплексным кепстром следующим образом:

фазовый спектр = (комплексный кепстр − временное обращение комплексного кепстра) 2 .

Независимая переменная кепстрального графика называется квефренцией . [10] Квефренция является мерой времени, хотя и не в смысле сигнала во временной области . Например, если частота дискретизации аудиосигнала составляет 44100 Гц, а в кепстре есть большой пик, квефренция которого составляет 100 отсчетов, пик указывает на наличие основной частоты, которая составляет 44100/100 = 441 Гц. Этот пик возникает в кепстре, потому что гармоники в спектре являются периодическими, а период соответствует основной частоте, поскольку гармоники являются целыми кратными основной частоты. [11]

Кепстр , что означает «временной отклик степенного ряда уравнения Колмогорова», похож на кепстр и имеет к нему такое же отношение, как ожидаемое значение к статистическому среднему, т. е. кепстр — это эмпирически измеренная величина, в то время как кепстр — это теоретическая величина. Он использовался до кепстра. [12] [13]

Автокепстр определяется как кепстр автокорреляции . Автокепстр точнее кепстра при анализе данных с эхо-сигналами.

Продолжая тему анаграмм, фильтр, работающий на кепстре, можно назвать подъемником . Подъемник нижних частот похож на фильтр нижних частот в частотной области . Его можно реализовать путем умножения на окно в частотной области и последующего преобразования обратно в частотную область, что приведет к измененному сигналу, т. е. с уменьшенным эхом сигнала.

Интерпретация

Кепстр можно рассматривать как информацию о скорости изменения в различных спектральных диапазонах. Первоначально он был изобретен для характеристики сейсмических эхо, возникающих в результате землетрясений и взрывов бомб . Он также использовался для определения основной частоты человеческой речи и анализа отраженных сигналов радаров . Определение высоты тона с помощью кепстра особенно эффективно, поскольку эффекты голосового возбуждения (высота тона) и голосового тракта (форманты) являются аддитивными в логарифме спектра мощности и, таким образом, четко разделены. [14]

Кепстр — это представление, используемое в гомоморфной обработке сигналов , для преобразования сигналов, объединенных сверткой (например, источника и фильтра), в суммы их кепстров для линейного разделения. В частности, кепстр мощности часто используется в качестве вектора признаков для представления человеческого голоса и музыкальных сигналов. Для этих приложений спектр обычно сначала преобразуется с использованием шкалы мел . Результат называется мел-частотным кепстром или MFC (его коэффициенты называются мел-частотными кепстральными коэффициентами, или MFCC). Он используется для идентификации голоса, определения высоты тона и многого другого. Кепстр полезен в этих приложениях, поскольку низкочастотное периодическое возбуждение от голосовых связок и формантная фильтрация речевого тракта , которые свертываются во временной области и умножаются в частотной области , являются аддитивными и находятся в разных областях в области квэфрентности.

Обратите внимание, что чистая синусоида не может использоваться для проверки кепстра на определение высоты тона из квефренции, поскольку чистая синусоида не содержит никаких гармоник и не приводит к пикам квефренции. Вместо этого следует использовать тестовый сигнал, содержащий гармоники (например, сумму как минимум двух синусов, где второй синус является некоторой гармоникой (кратной) первого синуса, или, лучше, сигнал с квадратной или треугольной формой волны, поскольку такие сигналы обеспечивают много обертонов в спектре.).

Важным свойством кепстральной области является то, что свертку двух сигналов можно выразить как сложение их комплексных кепстров:

х 1 х 2 х 1 + х 2 . {\displaystyle x_{1}*x_{2}\mapsto x'_{1}+x'_{2}.}

Приложения

Концепция кепстра нашла многочисленные применения: [2] [3]

  • работа с выводом отражения (применение радаров, сонаров, сейсмология Земли)
  • оценка основной частоты (высоты) диктора
  • анализ и распознавание речи
  • медицинские применения в анализе электроэнцефалограммы (ЭЭГ) и мозговых волн
  • Анализ вибрации машины на основе гармонических моделей (неисправности коробки передач, поломки лопаток турбины, ...) [2] [4] [5]

Недавно деконволюция на основе кепстра была использована для сигналов поверхностной электромиографии, чтобы удалить эффект стохастической импульсной последовательности, которая порождает сигнал sEMG , из спектра мощности самого сигнала sEMG. Таким образом, сохранялась только информация о форме и амплитуде потенциала действия двигательной единицы (MUAP), которая затем использовалась для оценки параметров модели временной области самого MUAP. [15]

Кратковременный кепстральный анализ был предложен Шредером и Ноллом в 1960-х годах для применения в определении высоты тона человеческой речи. [16] [17] [14]

Ссылки

  1. ^ abcd BP Bogert, MJR Healy и JW Tukey, The Quefrency Alanysis [ sic ] of Time Series for Echoes: Cepstrum, Pseudo Autocovariance, Cross-Cepstrum and Saphe Cracking , Труды симпозиума по анализу временных рядов (ред. M. Rosenblatt), глава 15, 209-243. Нью-Йорк: Wiley, 1963.
  2. ^ abcdefghijklm Нортон, Майкл Питер; Карчуб, Денис (17 ноября 2003 г.). Основы анализа шума и вибрации для инженеров. Cambridge University Press. ISBN 0-521-49913-5.
  3. ^ abcdefgh DG Childers, DP Skinner, RC Kemerait, «Кепстр: руководство по обработке», Труды IEEE , том 65, № 10, октябрь 1977 г., стр. 1428–1443.
  4. ^ abcd RB Randall: Анализ кепстра и диагностика неисправностей коробки передач, Brüel&Kjaer Application Notes 233-80, издание 2. (PDF)
  5. ^ ab Информационная система Beckhoff: Мониторинг состояния TF3600 TC3: Мониторинг редуктора (онлайн, 4.4.2020).
  6. ^ "Реальный кепстр и минимально-фазовая реконструкция - MATLAB rceps".
  7. ^ А. В. Оппенгейм, «Суперпозиция в классе нелинейных систем», докторская диссертация, Лаборатория электроники, Массачусетский технологический институт, 1965.
  8. ^ А. В. Оппенгейм, Р. В. Шефер, «Цифровая обработка сигналов», 1975 (Prentice Hall).
  9. ^ Р. Б. Рэндалл: «История анализа кепстра и его применение к механическим проблемам», (PDF) в: Механические системы и обработка сигналов, том 97, декабрь 2017 г. (Elsevier).
  10. ^ Штайнбух, Карл В .; Вебер, Вольфганг; Хайнеманн, Трауте, ред. (1974) [1967]. Taschenbuch der Informatik – Band III – Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (на немецком языке). Том. 3 (3-е изд.). Берлин, Германия: Springer Verlag . стр. 272–274. ISBN 3-540-06242-4. LCCN  73-80607. {{cite book}}: |work=проигнорировано ( помощь )
  11. ^ "Введение - Дискретный кепстр". Support.ircam.fr. 1 января 1990 г. Получено 16 сентября 2022 г.
  12. ^ «Прогностическое разложение временных рядов с применением в сейсмической разведке», EA Robinson MIT report 1954; Geophysics 1967 vol. 32, pp. 418–484;
    «Использование кепструма в анализе сигналов», MT Silvia и EA Robinson, Geoexploration, vol. 16, Issues 1–2, April 1978, pages 55–73.
  13. ^ «Подход к фильтрации, сглаживанию и прогнозированию с применением к улучшению речи», TJ Moir и JF Barrett, Proc. Королевского общества A, т. 459, 2003, стр. 2957–2976.
  14. ^ ab A. Michael Noll (1967), «Определение высоты тона кепстра», Журнал акустического общества Америки, т. 41, № 2, стр. 293–309.
  15. ^ G. Biagetti, P. Crippa, S. Orcioni и C. Turchetti, «Гомоморфная деконволюция для оценки muap из сигналов поверхностной ЭМГ», IEEE Journal of Biomedical and Health Informatics, т. 21, № 2, стр. 328–338, март 2017 г.
  16. ^ А. Майкл Нолл и Манфред Р. Шредер , «Кратковременное обнаружение высоты тона с помощью кепстра», (аннотация) Журнал акустического общества Америки, том 36, № 5, стр. 1030
  17. ^ А. Майкл Нолл (1964), «Кратковременные спектральные и кепстральные методы обнаружения высоты голоса», Журнал акустического общества Америки, т. 36, № 2, стр. 296–302.

Дальнейшее чтение

  • Чайлдерс, Д.Г.; Скиннер, Д.П.; Кемерайт, Р.К. (1977). «Кепстр: руководство по обработке». Труды IEEE . 65 (10). Институт инженеров по электротехнике и электронике (IEEE): 1428–1443. Bibcode : 1977IEEEP..65.1428C. doi : 10.1109/proc.1977.10747. ISSN  0018-9219. S2CID  6108941.
  • Оппенгейм, А. В.; Шефер, Р. В. (2004). «История ЦСП — от частоты к частоте: история кепстра». Журнал обработки сигналов IEEE . 21 (5). Институт инженеров по электротехнике и электронике (IEEE): 95–106. Bibcode : 2004ISPM...21...95O. doi : 10.1109/msp.2004.1328092. ISSN  1053-5888. S2CID  1162306.
  • «Анализ речевого сигнала»
  • «Анализ речи: кепстральный анализ против LPC», www.advsolned.com
  • «Учебное пособие по Cepstrum и LPCC»
Взято с "https://en.wikipedia.org/w/index.php?title=Cepstrum&oldid=1237704300"