Многомерная эмпирическая модовая декомпозиция

В обработке сигналов многомерная эмпирическая модовая декомпозиция ( многомерная EMD ) является расширением одномерного (1-D) алгоритма EMD на сигнал, охватывающий несколько измерений. Процесс эмпирической модовой декомпозиции Гильберта–Хуанга (EMD) разлагает сигнал на внутренние модовые функции, объединенные со спектральным анализом Гильберта , известным как преобразование Гильберта–Хуанга (HHT). Многомерная EMD расширяет алгоритм 1-D EMD на многомерные сигналы. Это разложение может применяться для обработки изображений , обработки аудиосигналов и различных других многомерных сигналов.

Мотивация

Многомерная эмпирическая модовая декомпозиция является популярным методом из-за его применения во многих областях, таких как текстурный анализ, финансовые приложения, обработка изображений , океаническая инженерия , сейсмические исследования и т. д. Для анализа характеристик многомерных сигналов использовалось несколько методов эмпирической модовой декомпозиции.

Введение в эмпирическую модовую декомпозицию (EMD)

Блок-схема базового алгоритма EMD [1] [ хищный издатель ]

Метод эмпирической модовой декомпозиции (EMD) позволяет извлекать глобальную структуру и работать с фракталоподобными сигналами.

Метод EMD был разработан для того, чтобы данные можно было исследовать в адаптивном пространстве времени-частоты-амплитуды для нелинейных и нестационарных сигналов.

Метод EMD разлагает входной сигнал на несколько внутренних модовых функций (IMF) и остаток. Данное уравнение будет иметь следующий вид:

я ( н ) = м = 1 М МВФ м ( н ) + Рез М ( н ) {\displaystyle I(n)=\sum _{m=1}^{M}\operatorname {IMF} _{m}(n)+\operatorname {Res} _{M}(n)}

где — многокомпонентный сигнал. — функция собственной моды, а представляет собой остаток, соответствующий собственным модам. я ( н ) {\displaystyle I(н)} МВФ м ( н ) {\displaystyle \operatorname {IMF} _{m}(n)} M th {\displaystyle M^{\text{th}}} Res M ( n ) {\displaystyle \operatorname {Res} _{M}(n)} M {\displaystyle M}

Разложение эмпирического модового ансамбля

Среднее по ансамблю — это подход к повышению точности измерений. Данные собираются с помощью отдельных наблюдений, каждое из которых содержит различный шум по ансамблю вселенных. Чтобы обобщить эту идею ансамбля, шум вводится в единый набор данных, , как если бы отдельные наблюдения действительно проводились как аналог физического эксперимента, который может быть повторен много раз. Добавленный белый шум рассматривается как возможный случайный шум, который может встретиться в процессе измерения. При таких условиях искусственное «наблюдение» будет . x ( t ) {\displaystyle x(t)} x i ( t ) = x ( t ) + w i ( t ) {\displaystyle x_{i}(t)=x(t)+w_{i}(t)}

В случае только одного наблюдения один из ансамблей множественных наблюдений имитируется путем добавления различных копий белого шума, , к этому единственному наблюдению, как указано в уравнении. Хотя добавление шума может привести к меньшему отношению сигнал/шум, добавленный белый шум обеспечит равномерное распределение эталонной шкалы для облегчения EMD; следовательно, низкое отношение сигнал/шум не повлияет на метод разложения, но фактически улучшит его, избегая смешивания мод. Основываясь на этом аргументе, делается дополнительный шаг, утверждая, что добавление белого шума может помочь извлечь истинные сигналы из данных, метод, который называется разложением эмпирических мод ансамбля (EEMD). w i ( t ) {\displaystyle w_{i}(t)}

EEMD состоит из следующих этапов:

  1. Добавление серии белого шума к исходным данным.
  2. Разложение данных с добавлением белого шума на колебательные компоненты.
  3. Повторяем шаг 1 и шаг 2 снова и снова, но каждый раз добавляя другую серию белого шума.
  4. Получение среднего значения по ансамблю соответствующих внутренних модовых функций разложения в качестве конечного результата.

На этих этапах EEMD использует два свойства белого шума:

  1. Добавленный белый шум приводит к относительно равномерному распределению экстремумов во всех временных масштабах.
  2. Свойство банка диадических фильтров обеспечивает контроль над периодами колебаний, содержащихся в колебательном компоненте, значительно снижая вероятность смешивания масштабов в компоненте. Благодаря усреднению по ансамблю добавленный шум усредняется. [2]

Псевдодвумерная эмпирическая модовая декомпозиция[3]

Метод «псевдо-BEMD» не ограничивается одним пространственным измерением; скорее, он может быть применен к данным с любым количеством пространственно-временных измерений. Поскольку пространственная структура по существу определяется временными масштабами изменчивости физической величины в каждом месте, а разложение полностью основано на характеристиках отдельных временных рядов в каждом пространственном месте, нет никаких предположений о пространственно-когерентных структурах этой физической величины. Когда возникает когерентная пространственная структура, она лучше отражает физические процессы, которые управляют эволюцией физической величины в масштабе времени каждого компонента. Поэтому мы ожидаем, что этот метод будет иметь значительные приложения в анализе пространственно-временных данных.

Для разработки псевдо-BEMD алгоритма ключевым шагом является перевод алгоритма 1D EMD в двумерную эмпирическую модовую декомпозицию (BEMD) и дальнейшее расширение алгоритма до трех или более измерений, что аналогично BEMD путем расширения процедуры на последовательные измерения. Для трехмерного куба данных элементов псевдо-BEMD даст подробные трехмерные компоненты, где , и являются числом IMF, разложенных из каждого измерения, имеющего , , и элементы соответственно. i × j × k {\displaystyle i\times j\times k} m × n × q {\displaystyle m\times n\times q} m {\displaystyle m} n {\displaystyle n} q {\displaystyle q} i {\displaystyle i} j {\displaystyle j} k {\displaystyle k}

Математически представим двумерный сигнал в виде матрицы с конечным числом элементов. i × j {\displaystyle i\times j}

X ( i , j ) = [ x ( 1 , 1 ) x ( 1 , 2 ) x ( 1 , j ) x ( 2 , 1 ) x ( 2 , 2 ) x ( 1 , j ) x ( i , 1 ) x ( i , 2 ) x ( i , j ) ] {\displaystyle X(i,j)={\begin{bmatrix}x(1,1)&x(1,2)&\cdots &x(1,j)\\x(2,1)&x(2,2)&\cdots &x(1,j)\\\vdots &\vdots &&\vdots \\x(i,1)&x(i,2)&\cdots &x(i,j)\end{bmatrix}}} [3]

Сначала мы выполняем EMD в одном направлении X ( i , j ), например, построчно, чтобы разложить данные каждой строки на m компонентов, затем собрать компоненты того же уровня m из результата разложения каждой строки, чтобы создать двумерный разложенный сигнал на этом уровне m. Таким образом, получается m наборов двумерных пространственных данных

R X ( 1 , i , j ) = [ x ( 1 , 1 , 1 ) x ( 1 , 1 , 2 ) x ( 1 , 1 , j ) x ( 1 , 2 , 1 ) x ( 1 , 2 , 2 ) x ( 1 , 2 , j ) x ( 1 , i , 1 ) x ( 1 , i , 2 ) x ( 1 , i , j ) ] R X ( 2 , i , j ) = [ x ( 2 , 1 , 1 ) x ( 2 , 1 , 2 ) x ( 2 , 1 , j ) x ( 2 , 2 , 1 ) x ( 2 , 2 , 2 ) x ( 2 , 2 , j ) x ( 2 , i , 1 ) x ( 2 , i , 2 ) x ( 2 , i , j ) ] R X ( m , i , j ) = [ x ( m , 1 , 1 ) x ( m , 1 , 2 ) x ( m , 1 , j ) x ( m , 2 , 1 ) x ( m , 2 , 2 ) x ( m , 2 , j ) x ( m , i , 1 ) x ( m , i , 2 ) x ( m , i , j ) ] {\displaystyle {\begin{aligned}RX(1,i,j)&={\begin{bmatrix}x(1,1,1)&x(1,1,2)&\cdots &x(1,1,j)\\x(1,2,1)&x(1,2,2)&\cdots &x(1,2,j)\\\vdots &\vdots &&\vdots \\x(1,i,1)&x(1,i,2)&\cdots &x(1,i,j)\end{bmatrix}}\\[6pt]RX(2,i,j)&={\begin{bmatrix}x(2,1,1)&x(2,1,2)&\cdots &x(2,1,j)\\x(2,2,1)&x(2,2,2)&\cdots &x(2,2,j)\\\vdots &\vdots &&\vdots \\x(2,i,1)&x(2,i,2)&\cdots &x(2,i,j)\end{bmatrix}}\\\vdots \qquad &\,\,\,\vdots \qquad \vdots \\[6pt]RX(m,i,j)&={\begin{bmatrix}x(m,1,1)&x(m,1,2)&\cdots &x(m,1,j)\\x(m,2,1)&x(m,2,2)&\cdots &x(m,2,j)\\\vdots &\vdots &&\vdots \\x(m,i,1)&x(m,i,2)&\cdots &x(m,i,j)\end{bmatrix}}\end{aligned}}} [3]

где RX (1, ​​i, j), RX (2, i, j) и RX (m, i, j) — это m наборов сигнала, как указано (здесь мы также используем R для обозначения разложения строк). Связь между этими m двумерными разложенными сигналами и исходным сигналом задается как . [3] X ( i , j ) = k = 1 m R X ( k , i , j ) {\displaystyle X(i,j)=\sum _{k\mathop {=} 1}^{m}RX(k,i,j)}

Первая строка матрицы RX (m, i, j) — это m-й компонент EMD, разложенный из первой строки матрицы X (i, j). Вторая строка матрицы RX (m, i, j) — это m-й компонент EMD, разложенный из второй строки матрицы X (i, j), и т. д.

Предположим, что предыдущее разложение было по горизонтальному направлению, следующим шагом будет разложение каждого из ранее разложенных по строкам компонентов RX(m, i, j) в вертикальном направлении на n компонентов. Этот шаг сгенерирует n компонентов из каждого компонента RX.

Например, компонент

  1. RX(1,i,j) будет разложен на CRX(1,1,i,j), CRX(1,2,i,j),...,CRX(1,n,i,j)
  2. RX(2,i,j) будет разложен на CRX(2,1,i,j), CRX(2,2,i,j),..., CRX(2,n,i,j)
  3. RX(m,i,j) будет разложен на CRX(m,1,i,j), CRX(m,2,i,j),..., CRX(m,n,i,j)

где C означает разложение столбцов. Наконец, двумерное разложение приведет к матрицам m× n, которые являются двумерными компонентами EMD исходных данных X(i,j). Матричное выражение для результата двумерного разложения:

C R X ( m , n , i , j ) = [ c r x ( 1 , 1 , i , j ) c r x ( 2 , 1 , i , j ) c r x ( m , 1 , i , j ) c r x ( 1 , 2 , i , j ) c r x ( 2 , 2 , i , j ) c r x ( m , 2 , i , j ) c r x ( 1 , n , i , j ) c r x ( 2 , n , i , j ) c r x ( m , n , i , j ) ] {\displaystyle CRX(m,n,i,j)={\begin{bmatrix}crx(1,1,i,j)&crx(2,1,i,j)&\cdots &crx(m,1,i,j)\\crx(1,2,i,j)&crx(2,2,i,j)&\cdots &crx(m,2,i,j)\\\vdots &\vdots &&\vdots \\crx(1,n,i,j)&crx(2,n,i,j)&\cdots &crx(m,n,i,j)\end{bmatrix}}} [3]

где каждый элемент в матрице CRX является подматрицей i × j, представляющей компонент, разложенный на 2D EMD. Мы используем аргументы (или суффиксы) m и n для представления номера компонента разложения по строке и разложения по столбцу, соответственно, а не индексы, указывающие строку и столбец матрицы. Обратите внимание, что m и n указывают количество компонентов, полученных в результате разложения по строке (горизонтальному), а затем разложения по столбцу (вертикальному) соответственно.

Объединение компонентов одного и того же масштаба или сопоставимых масштабов с минимальной разницей даст двумерную функцию с наилучшей физической значимостью. Компоненты первой строки и первого столбца имеют приблизительно одинаковый или сопоставимый масштаб, хотя их масштабы постепенно увеличиваются вдоль строки или столбца. Поэтому объединение компонентов первой строки и первого столбца позволит получить первый полный двумерный компонент (C2D1). Последующий процесс заключается в применении той же техники комбинирования к остальным компонентам, вклад шумов распределяется по отдельным компонентам в соответствии с их масштабами. В результате возникают когерентные структуры компонентов. Таким образом, метод псевдо-BEMD может быть применен для выявления эволюции пространственных структур данных.

C 2 D L = k = 1 m c r x k , l + k = l + 1 n c r x l , k {\displaystyle C2D_{L}=\sum _{k=1}^{m}crx_{k,l}+\sum _{k=l+1}^{n}crx_{l,k}} [3]

Следуя соглашению об одномерном EMD, последний компонент полных двумерных компонентов называется остатком.

Предложенная здесь схема декомпозиции может быть распространена на данные любых размерностей, например, на данные о твердом теле с различной плотностью или другими измеримыми свойствами.

дано как I = f ( x 1 , x 2 , x 3 , x 4 , , x n ) {\displaystyle I=f(x_{1},x_{2},x_{3},x_{4},\ldots ,x_{n})}

В котором подписка n указывает на количество измерений. Процедура идентична изложенной выше: разложение начинается с первого измерения и продолжается до второго и третьего, пока все измерения не будут исчерпаны. Разложение по-прежнему осуществляется срезами. Этот новый подход основан на разделении исходных данных на одномерные срезы, а затем применении ансамблевого EMD к каждому одномерному срезу. Ключевая часть метода заключается в построении IMF в соответствии с принципом объединения сопоставимых компонентов минимального масштаба.

Например, матричное выражение для результата 3D-разложения — TCRX(m,n,q,i,j,k), где T обозначает глубину (или время) разложения. На основе принципа сопоставимой минимальной шкалы, применяемого в 2D-случае, число полных 3D-компонентов будет наименьшим значением m , n и q . Общее уравнение для вывода 3D-компонентов —

C 3 D L = m = l m n = n t c r x m , n , + m = + 1 m q = + 1 n t c r x m , , q + n = + 1 m q = + 1 m t c r x , n , q {\displaystyle C3D_{L}=\sum _{m=l}^{m}\sum _{n=\ell }^{n}tcrx_{m,n,\ell }+\sum _{m=\ell +1}^{m}\sum _{q=\ell +1}^{n}tcrx_{m,\ell ,q}+\sum _{n=\ell +1}^{m}\sum _{q=\ell +1}^{m}tcrx_{\ell ,n,q}}   [3]

где ℓ обозначает уровень C3D, т.е.

{ = m = n if  m = n ; = m if  m < n ; = n if  m > n . {\displaystyle {\begin{cases}\ell =m=n&{\text{if }}m=n;\\\ell =m&{\text{if }}m<n;\\\ell =n&{\text{if }}m>n.\end{cases}}}

Метод псевдо-BEMD имеет несколько преимуществ. Например, процедура просеивания псевдо-BEMD представляет собой комбинацию одномерного просеивания. Он использует подгонку одномерной кривой в процессе просеивания каждого измерения и не имеет трудностей, с которыми сталкиваются алгоритмы двумерного EMD, использующие подгонку поверхности, в которых есть проблема определения седловой точки как локального максимума или минимума. Просеивание — это процесс, который разделяет IMF и повторяет процесс до тех пор, пока не будет получен остаток. Первым шагом выполнения просеивания является определение верхней и нижней огибающих, охватывающих все данные, с помощью метода сплайнов. Схема просеивания для псевдо-BEMD похожа на одномерное просеивание, где локальное среднее стандартного EMD заменяется средним значением многомерных огибающих кривых.

Основным недостатком этого метода является то, что хотя мы могли бы расширить этот алгоритм на любые размерные данные, мы используем его только для двумерных приложений. Поскольку время вычисления данных большего размера будет пропорционально количеству IMF последующих измерений. Следовательно, это может превысить вычислительную мощность для системы обработки геофизических данных, когда количество EMD в алгоритме велико. Поэтому ниже мы упомянули более быстрые и лучшие методы для устранения этого недостатка.

Многомерная ансамблевая эмпирическая модовая декомпозиция.[4]

Быстрый и эффективный анализ данных очень важен для больших последовательностей, поэтому MDEEMD фокусируется на двух важных вещах

  1. Сжатие данных, которое подразумевает разложение данных на более простые формы.
  2. EEMD на сжатых данных; это самый сложный метод, поскольку при разложении сжатых данных существует высокая вероятность потери ключевой информации. Для сжатия данных используется метод сжатия данных, который использует анализ главных компонент (PCA)/анализ эмпирической ортогональной функции (EOF) или анализ основных моделей колебаний.

Анализ главных компонент (PCA) или эмпирический ортогональный функциональный анализ (EOF)

Анализ главных компонент / эмпирический ортогональный функциональный анализ (PCA/EOF) широко используется в анализе данных и сжатии изображений, его главная цель - сократить набор данных, содержащий большое количество переменных, до набора данных, содержащего меньше переменных, но который все еще представляет большую долю изменчивости, содержащейся в исходном наборе данных. В климатических исследованиях анализ EOF часто используется для изучения возможных пространственных режимов (т. е. моделей) изменчивости и того, как они меняются со временем. В статистике анализ EOF известен как анализ главных компонент (PCA).

Обычно EOF находятся путем вычисления собственных значений и собственных векторов пространственно взвешенной матрицы ковариации аномалий поля. Чаще всего пространственные веса представляют собой cos(широта) или, что лучше для анализа EOF, sqrt(cos(широта)). Полученные собственные значения дают меру процентной дисперсии, объясняемой каждой модой. К сожалению, собственные значения не обязательно различимы из-за проблем с выборкой. Норт и др. (Mon. Wea. Rev., 1982, уравнения 24–26) предлагают «правило большого пальца» для определения того, отличается ли конкретное собственное значение (мода) от своего ближайшего соседа.

Атмосферные и океанографические процессы обычно «красные», что означает, что большая часть дисперсии (мощности) содержится в первых нескольких модах. Временные ряды каждой моды (они же главные компоненты) определяются путем проецирования полученных собственных векторов на пространственно взвешенные аномалии. Это приведет к амплитуде каждой моды за период записи.

По конструкции шаблоны EOF и главные компоненты независимы. Два фактора препятствуют физической интерпретации EOF: (i) ограничение ортогональности и (ii) полученные шаблоны могут зависеть от домена. Физические системы не обязательно ортогональны, и если шаблоны зависят от используемого региона, они могут не существовать, если домен изменяется.

Пространственно-временной сигнал с использованием многомерного ансамблевого эмпирического модового разложения

Предположим, у нас есть пространственно-временные данные , где — пространственные местоположения (изначально не обязательно одномерные, но их необходимо преобразовать в одно пространственное измерение) от 1 до и временные местоположения от 1 до . T ( s , t ) {\displaystyle T(s,t)} s {\displaystyle s} N {\displaystyle N} t {\displaystyle t} M {\displaystyle M}

Используя PCA/EOF, можно выразить в [4] T ( s , t ) {\displaystyle T(s,t)} T ( s , t ) = i = 1 K Y i ( t ) V i ( t ) {\displaystyle T(s,t)=\sum _{i=1}^{K}Y_{i}(t)V_{i}(t)}

где - это th главный компонент и th шаблон эмпирической ортогональной функции (EOF), а K - это меньшее из M и N. PC и EOF часто получаются путем решения проблемы собственных значений/собственных векторов либо временной ковариационной матрицы, либо пространственной ковариационной матрицы, в зависимости от того, какая размерность меньше. Дисперсия, объясняемая одной парой PCA/EOF, - это ее соответствующее собственное значение, деленное на сумму всех собственных значений ковариационной матрицы. Y i ( t ) {\displaystyle Y_{i}(t)} i {\displaystyle i} Y i ( t ) {\displaystyle Y_{i}(t)} i {\displaystyle i}

Если данные, подвергнутые анализу PCA/EOF, представляют собой белый шум, все собственные значения теоретически равны, и нет предпочтительного направления вектора для главного компонента в пространстве PCA/EOF. Чтобы сохранить большую часть информации данных, необходимо сохранить почти все PC и EOF, что делает размер выражения PCA/EOF даже больше, чем у оригинала, но если исходные данные содержат только одну пространственную структуру и колеблются со временем, то исходные данные могут быть выражены как произведение одного PC и одного EOF, подразумевая, что исходные данные большого размера могут быть выражены данными малого размера без потери информации, т. е. высокосжимаемыми.

Изменчивость меньшей области имеет тенденцию быть более пространственно-временно когерентной, чем у большей области, содержащей эту меньшую область, и, следовательно, ожидается, что для учета порогового уровня дисперсии потребуется меньше компонентов PC/EOF, следовательно, один из способов повышения эффективности представления данных с точки зрения компонента PC/EOF — это разделить глобальную пространственную область на набор подобластей. Если мы разделим исходную глобальную пространственную область на n подобластей, содержащих N1, N2, . . . , Nn пространственных сеток соответственно, со всеми Ni, где i=1, . . . , n, большими, чем M, где M обозначает количество временных местоположений, мы ожидаем, что количество сохраненных пар PC/EOF для всех подобластей K1, K2, . . . , Kn все меньше K, общее количество значений данных в представлении PCA/EOF исходных данных глобальной пространственной области по данному уравнению равно K×(N+M). Для нового подхода с использованием пространственного разделения общее количество значений в представлении PCA/EOF равно

i = 1 n K i ( M + N i ) = K i N + M i = 1 n K i {\displaystyle \sum _{i=1}^{n}K_{i}(M+N_{i})=K'_{i}N+M\sum _{i=1}^{n}K_{i}}

где

K i = i = 1 n K i N i N . {\displaystyle K'_{i}={\frac {\sum _{i=1}^{n}K_{i}N_{i}}{N}}.}  [4]

Таким образом, степень сжатия пространственной области следующая:

Compression rate = N M N K i + M i = 1 n K i {\displaystyle {\text{Compression rate}}={\frac {NM}{NK'_{i}+M\sum _{i=1}^{n}K_{i}}}} [4]

Преимущество этого алгоритма заключается в том, что оптимизированное деление и оптимизированный выбор пар PC/EOF для каждой области приведут к более высокой скорости сжатия и значительному снижению объема вычислений по сравнению с псевдо-BEMD, расширенным до более высоких размерностей.

Быстрое многомерное ансамблевое эмпирическое модовое разложение[4]

Для временного сигнала длиной M сложность кубического сплайнового просеивания через его локальные экстремумы составляет порядка M, как и сложность EEMD, поскольку он только повторяет операцию подгонки сплайна с числом, которое не зависит от M. Однако, поскольку число просеивания (часто выбирается равным 10) и число ансамбля (часто несколько сотен) умножаются на операции просеивания сплайна, следовательно, EEMD требует больше времени по сравнению со многими другими методами анализа временных рядов, такими как преобразования Фурье и вейвлет-преобразования. MEEMD использует EEMD-разложение временного ряда на каждой сетке деления исходного временного сигнала, операция EEMD повторяется по числу общих точек сетки домена. Идея быстрого MEEMD очень проста. Поскольку сжатие на основе PCA/EOF выражает исходные данные в виде пар PC и EOF посредством разложения PC, а не временных рядов каждой сетки, и используя соответствующую пространственную структуру, изображаемую соответствующими EOF, вычислительная нагрузка может быть значительно снижена.

Быстрый MEEMD включает в себя следующие этапы:

  1. Вычисляются все пары EOF, V i , и соответствующие им PC, Y i , пространственно-временных данных в сжатом поддомене.
  2. Количество пар PC/EOF, сохраняемых в сжатых данных, определяется путем расчета накопленной общей дисперсии ведущих пар EOF/PC.
  3. Каждый ПК Y i разлагается с использованием EEMD, т.е.
Y i = j = 1 n c j , i + r n , i {\displaystyle Y_{i}=\sum _{j=1}^{n}c_{j,i}+r_{n,i}} [4]
где c j , i представляет простые колебательные режимы определенных частот, а r n , i является остатком данных Y i . Результат i- го компонента MEEMD C j получается как
C j = j = 1 40 c j , i V i . {\displaystyle C_{j}=\sum _{j=1}^{40}c_{j,i}V_{i}.}  [4]

В этом сжатом вычислении мы использовали приближенные свойства диадического банка фильтров EMD/EEMD.

Обратите внимание, что детальное знание внутренних модовых функций искаженного шумом сигнала может помочь в оценке значимости этого режима. Обычно предполагается, что первый IMF захватывает большую часть шума, и, следовательно, из этого IMF мы можем оценить уровень шума и оценить искаженный шумом сигнал, приблизительно устраняя эффекты шума. Этот метод известен как шумоподавление и детрендирование. Еще одним преимуществом использования MEEMD является то, что смешивание мод значительно уменьшается из-за функции EEMD.
Стратегия шумоподавления и детрендирования может использоваться для обработки изображений для улучшения изображения, и аналогичным образом ее можно применять к аудиосигналам для удаления искаженных данных в речи. MDEEMD может использоваться для разложения изображений и аудиосигналов на IMF и на основе знания IMF выполнять необходимые операции. Разложение изображения очень выгодно для приложений на основе радаров, разложение изображения может обнаруживать наземные мины и т. д.

Параллельная реализация многомерной ансамблевой эмпирической модовой декомпозиции.

В MEEMD, хотя потенциально существует достаточный параллелизм в ансамблевых измерениях и/или нерабочих измерениях, при реализации высокопроизводительной MEEMD по-прежнему возникает ряд проблем. [5]

Двумерный EMD, поврежденный шумом
  1. Динамические изменения данных: в EEMD белые шумы изменяют количество экстремумов, вызывая некоторую нерегулярность и дисбаланс нагрузки и, таким образом, замедляя параллельное выполнение.
  2. Доступ к памяти с шагом для многомерных данных: данные с большим количеством измерений хранятся в ненепрерывных ячейках памяти. Доступы по большим измерениям, таким образом, являются шаговыми и необъединенными, что расходует доступную полосу пропускания памяти.
  3. Ограниченные ресурсы для использования параллелизма: в то время как независимые EMD и/или EEMD, составляющие MEEMD, обеспечивают высокий параллелизм, вычислительные мощности многоядерных и многоядерных процессоров могут быть недостаточными для полного использования присущего MEEMD параллелизма. Более того, повышенный параллелизм может увеличить требования к памяти за пределами возможностей памяти этих процессоров.
Функция внутреннего режима двумерного ЭМД вместе с остатком устраняет уровень шума.

В MEEMD, когда высокая степень параллелизма задается размерностью ансамбля и/или нерабочими размерностями, преимущества использования параллельного алгоритма на уровне потоков являются тройными. [5]

  1. Он может использовать больший параллелизм, чем параллельный алгоритм на уровне блоков.
  2. Никакой коммуникации или синхронизации между потоками не происходит до тех пор, пока результаты не будут объединены, поскольку выполнение каждого EMD или EEMD является независимым.
  3. Его реализация похожа на последовательную, что делает его более простым.

Реализация OpenMP[5]

EEMD, входящие в состав MEEMD, назначаются независимым потокам для параллельного выполнения, полагаясь на среду выполнения OpenMP для решения любых проблем с дисбалансом нагрузки. Доступ к памяти Stride для высокоразмерных данных устраняется путем транспонирования этих данных в более низкие измерения, что приводит к лучшему использованию строк кэша. Частичные результаты каждого EEMD делаются потоко-приватными для корректной работы. Требования к памяти зависят от количества потоков OpenMP и управляются средой выполнения OpenMP.

Реализация CUDA[5]

В реализации GPU CUDA каждый EMD отображается в поток. Макет памяти, особенно высокоразмерных данных, перестраивается для соответствия требованиям объединения памяти и вписывается в 128-байтовые строки кэша. Сначала данные загружаются по самому низкому измерению, а затем потребляются по более высокому измерению. Этот шаг выполняется, когда добавляется гауссовский шум для формирования ансамблевых данных. В новом макете памяти ансамблевое измерение добавляется к самому низкому измерению для уменьшения возможного расхождения ветвей. Влияние неизбежного расхождения ветвей от нерегулярности данных, вызванного шумом, минимизируется с помощью метода регуляризации с использованием встроенной памяти. Более того, кэш-память используется для амортизации неизбежных необъединенных обращений к памяти. [5]

Быстрая и адаптивная многомерная эмпирическая модовая декомпозиция

Концепция

Быстрая и адаптивная двумерная эмпирическая модовая декомпозиция (FABEMD) является улучшенной версией традиционной BEMD. [6] FABEMD может использоваться во многих областях, включая анализ медицинских изображений, анализ текстур и т. д. Фильтр порядковой статистики может помочь в решении проблем эффективности и ограничения размера в BEMD.

Метод реализации FABEMD, основанный на алгоритме BEMD, действительно похож на BEMD, но подход FABEMD просто изменяет шаг интерполяции на метод прямой оценки огибающей и ограничивает количество итераций для каждого BIMF до одной. В результате для аппроксимации верхней и нижней огибающей будут использоваться две порядковые статистики, включая MAX и MIN. Размер фильтра будет зависеть от карт максимумов и минимумов, полученных из входных данных. Шаги алгоритма FABEMD перечислены ниже.

Алгоритм FABEMD[6]

Шаг 1 – Определить и обнаружить локальный максимум и минимум

В традиционном подходе BEMD мы можем найти j-й ITS-BIMF любого источника ввода методом соседнего окна. Для подхода FABEMD мы выбираем другой подход к реализации. F T j {\displaystyle F_{Tj}} S i {\displaystyle S_{i}}

Из входных данных мы можем получить двумерную матрицу, представляющую

A = ( a 11 a 1 N a M 1 a M N ) {\displaystyle A=\left({\begin{array}{*{20}{c}}a_{11}&\cdots &a_{1N}\\\vdots &\ddots &\vdots \\a_{M1}&\cdots &a_{MN}\end{array}}\right)} [6]

где — местоположение элемента в матрице A, и мы можем определить размер окна как . Таким образом, мы можем получить максимальное и минимальное значение из матрицы следующим образом: a M N {\displaystyle a_{MN}} w e x × w e x {\displaystyle w_{ex}\times w_{ex}}

a m n { local max if  a m n > a k , local min if  a m n < a k , {\displaystyle a_{mn}\triangleq {\begin{cases}{\text{local max}}&{\text{if }}a_{mn}>a_{k\ell },\\{\text{local min}}&{\text{if }}a_{mn}<a_{k\ell },\end{cases}}} [6]

где

k = m w e x 1 2 : m + w e x 1 2 , ( k m ) {\displaystyle k=m-{\frac {w_{ex}-1}{2}}:m+{\frac {w_{ex}-1}{2}},(k\neq m)} [6]
= n w e x 1 2 : n + w e x 1 2 , ( n ) {\displaystyle \ell =n-{\frac {w_{ex}-1}{2}}:n+{\frac {w_{ex}-1}{2}},(\ell \neq n)} [6]
Блок-схема алгоритма FABEMD [7]
Шаг 2 – Получите размер окна для фильтра статистики порядка

Сначала мы определяем и как максимальное и минимальное расстояние в массиве, которое вычисляется от каждой локальной точки максимума или минимума до ближайшего ненулевого элемента. Кроме того, и будут отсортированы в массиве по убыванию в соответствии с удобным выбором. В противном случае мы будем рассматривать только квадратное окно. Таким образом, общая ширина окна будет следующей: d a d j max {\displaystyle d_{\mathrm {adj} -\max }} d a d j min {\displaystyle d_{\mathrm {adj} -\min }} d a d j max {\displaystyle d_{\mathrm {adj} -\max }} d a d j min {\displaystyle d_{\mathrm {adj} -\min }}

w max _ e n g = minimum { d a d j max } {\displaystyle w_{\max {\rm {\_en-g}}}=\operatorname {minimum} \{d_{\mathrm {adj} -\max }\}} [6]
w max _ e n g = maximum { d a d j max } {\displaystyle w_{\max {\rm {\_en-g}}}=\operatorname {maximum} \{d_{\mathrm {adj} -\max }\}} [6]
w min _ e n g = minimum { d a d j min } {\displaystyle w_{\min {\rm {\_en-g}}}=\operatorname {minimum} \{d_{\mathrm {adj} -\min }\}} [6]
w min _ e n g = maximum { d a d j min } {\displaystyle w_{\min {\rm {\_en-g}}}=\operatorname {maximum} \{d_{\mathrm {adj-\min } }\}} [6]
Шаг 3 – Примените статистику порядка и сглаживающие фильтры для получения выходных данных фильтра MAX и MIN

Для получения верхней и нижней огибающих необходимо определить два параметра и , а уравнение будет иметь следующий вид: U E j ( x , y ) {\displaystyle U_{Ej}(x,y)} L E j ( x , y ) {\displaystyle L_{Ej}(x,y)}

U E j ( x , y ) = max { F T j ( s , t ) } = 1 w s m × w s m ( s , t ) Z x y U E j ( s , t ) {\displaystyle U_{Ej}(x,y)=\max\{F_{Tj}(s,t)\}={\frac {1}{w_{sm}\times w_{sm}}}\sum _{(s,t)\in Z_{xy}}{U_{Ej}}(s,t)} [6]
L E j ( x , y ) = min { F T j ( s , t ) } = 1 w s m × w s m ( s , t ) Z x y L E j ( s , t ) {\displaystyle L_{Ej}(x,y)=\min\{F_{Tj}(s,t)\}={\frac {1}{w_{sm}\times w_{sm}}}\sum _{(s,t)\in Z_{xy}}L_{Ej}(s,t)} [6]

где определяется как квадратная область размера окна, а - ширина окна сглаживающего фильтра, которая равна . Таким образом, фильтр MAX и MIN сформирует новую двумерную матрицу для огибающей поверхности, которая не изменит исходные двумерные входные данные. [8] Z x y {\displaystyle Z_{xy}} w s m {\displaystyle w_{sm}} w s m {\displaystyle w_{sm}} w e n {\displaystyle w_{en}}

Шаг 4 – Настройте оценку по верхнему и нижнему конвертам

Этот шаг заключается в том, чтобы убедиться, что оценка огибающей в FABEMD почти близка к результату BEMD с помощью интерполяции. Чтобы сделать сравнение, нам нужно сформировать соответствующие матрицы для верхней огибающей, нижней огибающей и средней огибающей, используя интерполяцию поверхности тонкого сплайна к максимальным и минимальным картам.

Преимущества

Этот метод (FABEMD) позволяет использовать меньше вычислений для быстрого получения результата, и он позволяет нам гарантировать более точную оценку BIMF. Более того, FABEMD более адаптивен для обработки больших входных данных, чем традиционный BEMD. В противном случае FABEMD является эффективным методом, в котором нам не нужно учитывать граничные эффекты и проблемы перелета-недолета.

Ограничения

В этом методе мы столкнемся с одной конкретной проблемой. Иногда во входных данных будет только один элемент локального максимума или минимума, поэтому это приведет к тому, что массив расстояний будет пустым.

Многомерная эмпирическая модовая декомпозиция на основе дифференциального уравнения в частных производных

Концепция

Подход к многомерной эмпирической модовой декомпозиции на основе частных дифференциальных уравнений (MEMD на основе PDE) — это способ улучшить и преодолеть трудности оценки средней огибающей сигнала из традиционного EMD. MEMD на основе PDE фокусируется на модификации исходного алгоритма для MEMD. Таким образом, результат предоставит аналитическую формулировку, которая может облегчить теоретический анализ и наблюдение за производительностью. Для выполнения многомерного EMD нам необходимо расширить процесс просеивания на основе 1-D PDE [9] до 2-D пространства, как показано в шагах ниже.

Здесь в качестве примера мы возьмем двумерную модель ЭМД на основе PDE.

Алгоритм BEMD на основе PDE[9]

Шаг 1 – Расширить модель супердиффузии с 1D до 2D

Рассматривается супердиффузионная матричная функция

G q ( x ) = ( g q , 1 ( x ) 0 0 g q , 2 ( x ) ) {\displaystyle G_{q}(x)=\left({\begin{array}{*{20}{c}}g_{q,1}(x)&0\\0&g_{q,2}(x)\end{array}}\right)} [9]

где представляют собой функцию останова q-го порядка в направлении i. g q , i ( x ) {\displaystyle {g_{q,i}}(x)}

Тогда, исходя из уравнений Навье–Стокса , уравнение диффузии будет иметь вид:

u t ( x , t ) = div ( α G 1 u ( x , t ) ( 1 α ) G 2 Δ u ( x , t ) ) {\displaystyle u_{t}(x,t)=\operatorname {div} (\alpha {G_{1}}\nabla u(x,t)-(1-\alpha ){G_{2}}\nabla \Delta u(x,t))} [9]

где — параметр натяжения, и мы предположили, что . α {\displaystyle \alpha } q = 2 {\displaystyle q=2}

Шаг 2 – Установите связь между моделью диффузии и уравнениями в частных производных на неявной поверхности

Для того чтобы соотнести это с уравнениями в частных производных, данное уравнение будет иметь вид

u t ( x , t ) = ( 1 ) q S 2 q u ( x , t ) {\displaystyle u_{t}(x,t)=-(-1)^{q}\nabla _{S}^{2q}u(x,t)}   [9]

где — дифференциальный оператор 2q-го порядка по u, присущий поверхности S, а начальное условие для уравнения будет для любого y на поверхности S. S 2 q {\displaystyle \nabla _{S}^{2q}} u ( y , t ) = f {\displaystyle u(y,t)=f}

Шаг 3 – Рассмотрите все числовые решения.

Чтобы получить теоретический и аналитический результат из предыдущего уравнения, нам необходимо сделать предположение.

Предположение:

Предполагается, что численные схемы разрешения представляют собой уравнения в частных производных 4-го порядка без натяжения, а уравнение для уравнения в частных производных 4-го порядка будет иметь вид

u t = i , j = 1 2 x i 1 ( g i x i 1 x j 2 u ) {\displaystyle u_{t}=-\sum _{i,j=1}^{2}\partial _{x_{i}}^{1}(g_{i}\partial _{x_{i}}^{1}\partial _{x_{j}}^{2}u)}   [9]

Прежде всего, мы явим схему, аппроксимировав процесс просеивания на основе PDE.

U k + 1 = ( I Δ t i , j = 1 2 L i j ) U k {\displaystyle U^{k+1}=\left(I-\Delta t\sum _{i,j=1}^{2}L_{ij}\right)U^{k}}   [9]

где — вектор, состоящий из значений каждого пикселя, — матрица, являющаяся разностным приближением оператора, — малый временной шаг. U {\displaystyle U} L i j {\displaystyle L_{ij}} Δ t {\displaystyle \Delta t}

Во-вторых, мы можем использовать схему аддитивного операторного расщепления (AOS) [10] для улучшения свойства устойчивости, поскольку малый временной шаг будет нестабилен, когда речь идет о большом временном шаге. Δ t {\displaystyle \Delta t}

Наконец, мы можем использовать схему переменного направления неявного (ADI). При использовании схем типа ADI предлагается смешивать производный член, чтобы преодолеть проблему, заключающуюся в том, что схемы типа ADI могут использоваться только в уравнении диффузии второго порядка. Численно решенное уравнение будет иметь вид:

U k + 1 = ( n = 1 2 ( I Δ t A n n ) ) 1 ( I + Δ t i = 1 2 j i A i j ) U k {\displaystyle U^{k+1}=\left(\prod _{n=1}^{2}(I-\Delta tA_{nn})\right)^{-1}(I+\Delta t\sum _{i=1}^{2}\sum _{j\neq i}A_{ij})U^{k}} [9]

где — матрица, которая является центральным разностным приближением к оператору A i j {\displaystyle A_{ij}} a i j x i 1 x j 2 {\displaystyle a_{ij}\partial _{x_{i}}^{1}\partial _{x_{j}}^{2}}

Преимущества

Основанный непосредственно на уравнениях Навье–Стокса , этот подход обеспечивает хороший способ получения и разработки теоретических и численных результатов. В частности, BEMD на основе PDE может хорошо работать для полей разложения изображения. Этот подход может быть применен для извлечения переходного сигнала и избежания характеристики неопределенности в некоторых сигналах.

Обработка границ в двумерной эмпирической декомпозиции

Концепция

Существуют некоторые проблемы в реализации BEMD и расширения границ в процессе итеративного просеивания, включая затраты времени, форму и непрерывность краев, сравнение результатов разложения и т. д. Для устранения этих проблем был создан метод обработки границ в двумерной эмпирической декомпозиции (BPBEMD) . Далее будут описаны основные моменты алгоритма нового метода.

Алгоритм BPBEMD[11]

Несколько основных шагов алгоритма BPBEMD:

Шаг 1

Предполагая, что размер исходных входных данных и результирующих данных равен и , соответственно, мы также можем определить, что исходная матрица входных данных находится в середине результирующей матрицы данных. N × N {\displaystyle N\times N} ( N + 2 M ) × ( N + 2 M ) {\displaystyle (N+2M)\times (N+2M)}

Шаг 2

Разделите исходную матрицу входных данных и результирующую матрицу данных на блоки размером. M × M {\displaystyle M\times M}

Шаг 3

Найдите блок, который наиболее похож на соседний блок в исходной матрице входных данных, и поместите его в соответствующую результирующую матрицу данных.

Шаг 4

Сформируйте матрицу расстояний, элементы которой взвешены по разным расстояниям между каждым блоком от этих границ.

Шаг 5

Реализуем итеративное расширение, когда результирующая матрица данных сталкивается с огромным граничным расширением; мы можем увидеть, что блок в исходной матрице входных данных соответствует блоку в результирующей матрице данных.

Преимущества

Этот метод может обрабатывать большее количество элементов, чем традиционный метод BEMD. Кроме того, он может сократить время, необходимое для процесса. В зависимости от использования непараметрического синтеза текстур на основе выборки, BPBEMD может получить лучший результат после разложения и извлечения.

Ограничения

Поскольку большинство входных изображений нестационарны и не имеют проблем с границами, метод BPBEMD все еще не имеет достаточных доказательств того, что он адаптивен ко всем видам входных данных. Кроме того, этот метод узко ограничен для использования при анализе текстур и обработке изображений.

Приложения

В первой части эти методы MEEMD могут быть использованы на наборах геофизических данных, таких как климатические, магнитные, сейсмические данные об изменчивости, которые используют преимущества быстрого алгоритма MEEMD. MEEMD часто используется для нелинейной фильтрации геофизических данных из-за его быстрых алгоритмов и его способности обрабатывать большие объемы наборов данных с использованием сжатия без потери ключевой информации. IMF также может быть использован в качестве усиления сигнала георадара для нелинейной обработки данных; он очень эффективен для обнаружения геологических границ из анализа аномалий поля. [12]

Во второй части основанные на PDE MEMD и FAMEMD могут быть реализованы для обработки звука, обработки изображений и анализа текстур. Благодаря нескольким своим свойствам, включая стабильность, меньшую трудоемкость и т. д., основанный на PDE метод MEMD хорошо подходит для адаптивной декомпозиции, шумоподавления данных и анализа текстур. Кроме того, FAMEMD является отличным методом для сокращения времени вычислений и получения точной оценки в процессе. Наконец, метод BPBEMD имеет хорошую производительность для обработки изображений и анализа текстур благодаря своему свойству решать проблемы расширения границ в последних методах.

Ссылки

  1. ^ Сонам ​​Махешвари; Анкур Кумар (2014). «Эмпирическая модовая декомпозиция: теория и приложения» (PDF) . Международный журнал по электронике и электротехнике . 7 (8): 873– 878. ISSN  0974-2174.
  2. ^ NE Huang, Z. Shen и др., «Эмпирическое модовое разложение и спектр Гильберта для анализа нелинейных и нестационарных временных рядов», Труды: Математические, физические и инженерные науки, т. 454, стр. 903–995, 1998.
  3. ^ abcdefg Чи-Сун Чен, Йи Дженг, «Двумерная нелинейная геофизическая фильтрация данных с использованием многомерного метода EEMD», Кафедра наук о Земле, Национальный педагогический университет Тайваня, 88, секция 4, дорога Тин-Чжоу, Тайбэй, 116, Тайвань, Китайская Республика
  4. ^ abcdefg Wu Z, Feng J, Qiao F, Tan ZM, "2016 Быстрое многомерное ансамблевое эмпирическое модовое разложение для анализа больших пространственно-временных наборов данных", Phil. Trans. R. Soc. A 374: 20150197.
  5. ^ abcde Ли-Вэнь Чан, Мэн-Цунг Ло, Нассер Анссари, Ке-Синь Сюй, Норден Э. Хуан, Вэнь-мэй В. Хву. «Параллельная реализация многомерной ансамблевой модовой декомпозиции».
  6. ^ abcdefghijkl Шариф М. А. Бхуйян, Реза Р. Адхами, Джесмин Ф. Хан, «Новый подход к быстрой и адаптивной двумерной эмпирической модовой декомпозиции», Международная конференция IEEE по акустике, речи и обработке сигналов , 2008.
  7. ^ Bhuiyan, Sharif MA; Adhami, Reza R.; Khan, Jesmin F. (2008). "Новый подход к быстрой и адаптивной двумерной эмпирической модовой декомпозиции". Международная конференция IEEE по акустике, речи и обработке сигналов 2008 г. стр.  1313– 1316. doi :10.1109/ICASSP.2008.4517859. ISBN 978-1-4244-1483-3. S2CID  18226941.
  8. ^ Дэвид Луни и Данило П. Мандич, «Многомасштабное слияние изображений с использованием сложных расширений EMD», Труды IEEE по обработке сигналов , том 57, № 4, апрель 2009 г.
  9. ^ abcdefgh Умар Нианг, Абдулай Тиун, Мухамед Шейх Эль-Гейреа, Эрик Делешель и Жак Лемуан, «Подход на основе дифференциальных уравнений в частных производных для эмпирической модовой декомпозиции: применение в анализе изображений», IEEE Transactions on Image Processing , том 21, № 9, сентябрь 2012 г.
  10. ^ «Эмануэле Галлигани, «Методы аддитивного операторного разделения для решения систем нелинейных конечных разностей», Quaderni del Dipartimento di Matematica, Università di Modena e Reggio Emilia, № 61, март 2005 г.» (PDF) .
  11. ^ Чжунсюань Лю и Силонг ​​Пэн, «Обработка границ двумерного EMD с использованием синтеза текстур», IEEE Signal Processing Letters, том 12, № 1, январь 2005 г.
  12. ^ Бхуян, СМА, Атто-Окин, Н.О., Барнер, К.Е., Айену, А.Ю., Адхами, Р.Р., 2009. «Двумерная декомпозиция эмпирических мод с использованием различных методов интерполяции»., Adv. Адаптируйтесь. Анал данных. 1, 309–338.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Multidimensional_empirical_mode_decomposition&oldid=1144214297"