Проекционные фильтры

Геометрические алгоритмы обработки сигналов

Фильтры проекции представляют собой набор алгоритмов, основанных на стохастическом анализе и информационной геометрии , или дифференциально-геометрическом подходе к статистике, используемых для поиска приближенных решений задач фильтрации для нелинейных систем в пространстве состояний. [1] [2] [3] Задача фильтрации состоит в оценке ненаблюдаемого сигнала случайной динамической системы из частичных зашумленных наблюдений сигнала. Целью является вычисление распределения вероятностей сигнала, обусловленного историей наблюдений, возмущенных шумом. Это распределение позволяет вычислять все статистики сигнала, учитывая историю наблюдений. Если это распределение имеет плотность, то эта плотность удовлетворяет определенным стохастическим уравнениям в частных производных (SPDE), называемым уравнением Кушнера-Стратоновича или уравнением Закаи. Известно, что плотность нелинейного фильтра развивается в бесконечномерном функциональном пространстве. [4] [5]

Можно выбрать конечномерное семейство плотностей вероятности, например, гауссовские плотности , гауссовские смеси или экспоненциальные семейства , на которых можно аппроксимировать бесконечномерную плотность фильтра. Основная идея проекционного фильтра заключается в использовании геометрической структуры в выбранных пространствах плотностей для проецирования бесконечномерного SPDE оптимального фильтра на выбранное конечномерное семейство, получая конечномерное стохастическое дифференциальное уравнение (SDE) для параметра плотности в конечномерном семействе, которое аппроксимирует полную эволюцию фильтра. [3] Для этого выбранное конечномерное семейство оснащается многообразной структурой, как в информационной геометрии . Проекционный фильтр был протестирован против оптимального фильтра для кубической задачи датчика. Проекционный фильтр мог эффективно отслеживать бимодальные плотности оптимального фильтра, которые было бы трудно аппроксимировать с помощью стандартных алгоритмов, таких как расширенный фильтр Калмана . [2] [6] Проекционные фильтры идеально подходят для линейной оценки, поскольку они быстро реализуются и эффективно работают со временем, предоставляя конечномерное SDE для параметра, которое может быть эффективно реализовано. [2] Проекционные фильтры также являются гибкими, поскольку они позволяют точно настраивать точность аппроксимации, выбирая более богатые аппроксимирующие семейства, а некоторые экспоненциальные семейства делают шаг коррекции в алгоритме проекционной фильтрации точным. [3] Некоторые формулировки совпадают с эвристическими фильтрами предполагаемой плотности [3] или с методами Галеркина . [6] Проекционные фильтры также могут аппроксимировать полный бесконечномерный фильтр оптимальным образом, помимо оптимального приближения только коэффициентов SPDE, в соответствии с точными критериями, такими как минимизация среднего квадрата. [7] Проекционные фильтры изучались Шведским агентством оборонных исследований [1] и также успешно применялись в различных областях, включая навигацию , динамику океана , квантовую оптику и квантовые системы , оценку диаметров волокон , оценку хаотических временных рядов , обнаружение точек изменения и другие области. [8]

История и развитие

Термин «проекционный фильтр» был впервые введен в 1987 году Бернардом Ханзоном [9] , а соответствующая теория и численные примеры были полностью разработаны, расширены и сделаны строгими во время докторской работы Дамиано Бриго в сотрудничестве с Бернардом Ханзоном и Франсуа ЛеГландом. [10] [2] [3] Эти работы касались проекционных фильтров в расстоянии Хеллингера и информационной метрике Фишера , которые использовались для проецирования оптимального фильтра бесконечномерного SPDE на выбранное экспоненциальное семейство. Экспоненциальное семейство может быть выбрано таким образом, чтобы сделать шаг прогнозирования алгоритма фильтрации точным. [2] Другой тип проекционных фильтров, основанный на альтернативной проекционной метрике, прямой метрике, был введен в Армстронге и Бриго (2016). [6] С этой метрикой проекционные фильтры на семействах распределений смесей совпадают с фильтрами, основанными на методах Галеркина . Позже Армстронг, Бриго и Росси Ферруччи (2021) [7] выводят оптимальные проекционные фильтры, которые удовлетворяют определенным критериям оптимальности при аппроксимации бесконечномерного оптимального фильтра. Действительно, проекционные фильтры на основе Стратоновича оптимизировали аппроксимации отдельных коэффициентов SPDE на выбранном многообразии, но не решение SPDE в целом. Это было решено путем введения оптимальных проекционных фильтров. Инновация здесь заключается в работе напрямую с исчислением Ито, вместо того чтобы прибегать к версии исчисления Стратоновича уравнения фильтра. Это основано на исследовании геометрии стохастических дифференциальных уравнений Ито на многообразиях, основанных на струйном пучке , так называемой 2-струйной интерпретации стохастических дифференциальных уравнений Ито на многообразиях. [11] Л 2 {\displaystyle L^{2}}

Вывод проекционных фильтров

Здесь вкратце описывается вывод различных проекционных фильтров.

Проекционные фильтры на основе Стратоновича

Это вывод как первоначального фильтра в метрике Хеллингера/Фишера, набросанного Ханзоном [9] и полностью разработанного Бриго, Ханзоном и ЛеГландом, [10] [2] , так и более позднего проекционного фильтра в прямой метрике L2 Армстронга и Бриго (2016). [6]

Предполагается, что ненаблюдаемый случайный сигнал моделируется стохастическим дифференциальным уравнением Ито : Х т Р м {\displaystyle X_{t}\in \mathbb {R} ^{m}}

г Х т = ф ( Х т , т ) г т + σ ( Х т , т ) г Вт т {\displaystyle dX_{t}=f(X_{t},t)\,dt+\sigma (X_{t},t)\,dW_{t}}

где f и оцениваются и является броуновским движением . Будет предполагаться справедливость всех условий регулярности, необходимых для сохранения результатов, с подробностями, приведенными в ссылках. Сопутствующий шумовой процесс наблюдения моделируется σ г Вт {\displaystyle \сигма \,dW} Р м {\displaystyle \mathbb {R} ^{м}} Вт т {\displaystyle W_{т}} И т Р г {\displaystyle Y_{t}\in \mathbb {R} ^{d}}

г И т = б ( Х т , т ) г т + г В т {\displaystyle dY_{t}=b(X_{t},t)\,dt+dV_{t}}

где оценивается и является броуновским движением, независимым от . Как было указано выше, полный фильтр является условным распределением заданного априорного значения для и истории до времени . Если это распределение имеет плотность, неформально описываемую как б {\displaystyle б} Р г {\displaystyle \mathbb {R} ^{d}} В т {\displaystyle V_{т}} Вт т {\displaystyle W_{т}} Х т {\displaystyle X_{т}} Х 0 {\displaystyle X_{0}} И {\displaystyle Y} т {\displaystyle т}

п т ( х ) г х = П г о б { Х т г х | σ ( И с , с т ) } {\displaystyle p_{t}(x)dx=Prob\{X_{t}\in dx|\sigma (Y_{s},s\leq t)\}}

где — сигма-поле, сформированное историей зашумленных наблюдений до времени , при подходящих технических условиях плотность удовлетворяет SPDE Кушнера—Стратоновича: σ ( И с , с т ) {\displaystyle \sigma (Y_{s},s\leq t)} И {\displaystyle Y} т {\displaystyle т} п т {\displaystyle p_{t}}

г п т = Л т п т   г т + п т [ б ( , т ) Э п т ( б ( , т ) ) ] Т [ г И т Э п т ( б ( , т ) ) г т ] {\displaystyle dp_{t}={\cal {L}}_{t}^{*}p_{t}\ dt+p_{t}[b(\cdot ,t)-E_{p_{t}}(b(\cdot ,t))]^{T}[dY_{t}-E_{p_{t}}(b(\cdot ,t))dt]}

где — ожидание , а оператор прямой диффузии — Э п {\displaystyle E_{p}} Э п [ час ] = час ( х ) п ( х ) г х , {\displaystyle E_{p}[h]=\int h(x)p(x)dx,} Л т {\displaystyle {\cal {L}}_{t}^{*}}

Л т п = я = 1 м х я [ ф я ( х , т ) п т ( х ) ] + 1 2 я , дж = 1 м 2 х я х дж [ а я дж ( х , т ) п т ( х ) ] {\displaystyle {\cal {L}}_{t}^{*}p=-\sum _{i=1}^{m}{\frac {\partial }{\partial x_{i}}}[f_{i}(x,t)p_{t}(x)]+{\frac {1}{2}}\sum _{i,j=1}^{m}{\frac {\partial ^{2}}{\partial x_{i}\partial x_{j}}}[a_{ij}(x,t)p_{t}(x)]}

где и обозначает транспонирование. Для получения первой версии проекционных фильтров необходимо привести SPDE к форме Стратоновича. Получается а = σ σ Т {\displaystyle a=\сигма \сигма ^{T}} Т {\displaystyle Т} п т {\displaystyle p_{t}}

г п т = Л т п т г т 1 2 п т [ | б ( , т ) | 2 Э п т { | б ( , т ) | 2 } ] г т + п т [ б ( , т ) Э п т { б ( , т ) } ] Т г И т   . {\displaystyle dp_{t}={\cal {L}}_{t}^{\ast }\,p_{t}\,dt-{\frac {1}{2}}\,p_{t}\,[\vert b(\cdot ,t)\vert ^{2}-E_{p_{t}}\{\vert b(\cdot ,t)\vert ^{2}\}]\,dt+p_{t}\,[b(\cdot ,t)-E_{p_{t}}\{b(\cdot ,t)\}]^{T}\circ dY_{t}\ .}

С помощью цепного правила можно немедленно вывести SPDE для . Чтобы сократить запись, можно переписать это последнее SPDE как г п т {\displaystyle d{\sqrt {p_{t}}}} г п = Ф ( п ) г т + Г Т ( п ) г И   , {\displaystyle dp=F(p)\,dt+G^{T}(p)\circ dY\ ,}

где операторы и определяются как Ф ( п ) {\displaystyle F(п)} Г Т ( п ) {\displaystyle G^{T}(p)}

Ф ( п ) = Л т п 1 2 п [ | б ( , т ) | 2 Э п { | б ( , т ) | 2 } ] , {\displaystyle F(p)={\cal {L}}_{t}^{\ast }\,p\,-{\frac {1}{2}}\,p\,[\vert b(\cdot ,t)\vert ^{2}-E_{p}\{\vert b(\cdot ,t)\vert ^{2}\}],}
Г Т ( п ) = п [ б ( , т ) Э п { б ( , т ) } ] Т . {\displaystyle G^{T}(p)=p\,[b(\cdot ,t)-E_{p}\{b(\cdot ,t)\}]^{T}.}

Версия квадратного корня: г п = 1 2 п [ Ф ( п ) г т + Г Т ( п ) г И ]   . {\displaystyle d{\sqrt {p}}={\frac {1}{2{\sqrt {p}}}}[F(p)\,dt+G^{T}(p)\circ dY]\ .}

Это SPDE Стратоновича, решения которых развиваются в бесконечномерных функциональных пространствах. Например, могут развиваться в (прямой метрике ) п т {\displaystyle p_{t}} Л 2 {\displaystyle L^{2}} г 2 {\displaystyle d_{2}}

г 2 ( п 1 , п 2 ) = п 1 п 2   ,     п 1 , 2 Л 2 {\displaystyle d_{2}(p_{1},p_{2})=\Верт p_{1}-p_{2}\Верт \ ,\ \ p_{1,2}\in L^{2}}

или может эволюционировать в (метрика Хеллингера ) п т {\displaystyle {\sqrt {p_{t}}}} Л 2 {\displaystyle L^{2}} г ЧАС {\displaystyle d_{H}}

г ЧАС ( п 1 , п 2 ) = п 1 п 2 ,       п 1 , 2 Л 1 {\displaystyle d_{H}({\sqrt {p_{1}}},{\sqrt {p_{2}}})=\Vert {\sqrt {p_{1}}}-{\sqrt {p_{2}}}\Vert ,\ \ \ p_{1,2}\in L^{1}}

где - норма гильбертова пространства . В любом случае, (или ) не будет развиваться внутри любого конечномерного семейства плотностей, {\displaystyle \Vert \cdot \Vert } L 2 {\displaystyle L^{2}} p t {\displaystyle p_{t}} p t {\displaystyle {\sqrt {p_{t}}}}

S Θ = { p ( , θ ) ,   θ Θ R n }   ( o r   S Θ 1 / 2 = { p ( , θ ) ,   θ Θ R n } ) . {\displaystyle S_{\Theta }=\{p(\cdot ,\theta ),\ \theta \in \Theta \subset \mathbb {R} ^{n}\}\ (or\ S_{\Theta }^{1/2}=\{{\sqrt {p(\cdot ,\theta )}},\ \theta \in \Theta \subset \mathbb {R} ^{n}\}).}

Идея проекционного фильтра заключается в аппроксимации (или ) посредством конечномерной плотности (или ). p t ( x ) {\displaystyle p_{t}(x)} p t ( x ) {\displaystyle {\sqrt {p_{t}(x)}}} p ( x , θ t ) {\displaystyle p(x,\theta _{t})} p ( x , θ t ) {\displaystyle {\sqrt {p(x,\theta _{t})}}}

Тот факт, что фильтр SPDE находится в форме Стратоновича, позволяет следующее. Поскольку SPDE Стратоновича удовлетворяют правилу цепочки и ведут себя как векторные поля. Таким образом, уравнение характеризуется векторным полем и векторным полем . Для этой версии проекционного фильтра достаточно иметь дело с двумя векторными полями по отдельности. Можно проецировать и на касательное пространство плотностей в (прямая метрика) или их квадратных корней (метрика Хеллингера). Случай прямой метрики дает F {\displaystyle F} G {\displaystyle G} d t {\displaystyle dt} F {\displaystyle F} d Y t {\displaystyle dY_{t}} G {\displaystyle G} F {\displaystyle F} G {\displaystyle G} S Θ {\displaystyle S_{\Theta }}

d p ( , θ t ) = Π p ( , θ t ) [ F ( p ( , θ t ) ) ] d t + Π p ( , θ t ) [ G T ( p ( , θ t ) ) ] d Y t   {\displaystyle dp(\cdot ,\theta _{t})=\Pi _{p(\cdot ,\theta _{t})}[F(p(\cdot ,\theta _{t}))]\,dt+\Pi _{p(\cdot ,\theta _{t})}[G^{T}(p(\cdot ,\theta _{t}))]\circ dY_{t}\ }

где — проекция касательного пространства в точке для многообразия , и где, когда применяется к вектору, такому как , предполагается, что он действует покомпонентно, проецируя каждый из компонентов . В качестве основы этого касательного пространства выступает Π p ( , θ ) {\displaystyle \Pi _{p(\cdot ,\theta )}} p ( , θ ) {\displaystyle p(\cdot ,\theta )} S Θ {\displaystyle S_{\Theta }} G T {\displaystyle G^{T}} G T {\displaystyle G^{T}}

{ p ( , θ ) θ 1 , , p ( , θ ) θ n } , {\displaystyle \left\{{\frac {\partial p(\cdot ,\theta )}{\partial \theta _{1}}},\cdots ,{\frac {\partial p(\cdot ,\theta )}{\partial \theta _{n}}}\right\},}

обозначая внутреннее произведение с , можно определить метрику L 2 {\displaystyle L^{2}} , {\displaystyle \langle \cdot ,\cdot \rangle }

γ i j ( θ ) = p ( , θ ) θ i , p ( , θ ) θ j = p ( x , θ ) θ i p ( x , θ ) θ j d x {\displaystyle \gamma _{ij}(\theta )=\left\langle {\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}\,,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle =\int {\frac {\partial p(x,\theta )}{\partial \theta _{i}}}\,{\frac {\partial p(x,\theta )}{\partial \theta _{j}}}\,dx}

и проекция, таким образом,

Π p ( , θ ) γ [ v ] = i = 1 n [ j = 1 n γ i j ( θ ) v , p ( , θ ) θ j ] p ( , θ ) θ i {\displaystyle \Pi _{p(\cdot ,\theta )}^{\gamma }[v]=\sum _{i=1}^{n}\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta )\;\left\langle v,\,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle \right]\;{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}}

где — обратная величина . Таким образом, проецируемое уравнение имеет вид γ i j {\displaystyle \gamma ^{ij}} γ i j {\displaystyle \gamma _{ij}}

d p ( , θ t ) = Π p ( , θ ) [ F ( p ( , θ t ) ) ] d t + Π p ( , θ ) [ G T ( p ( , θ t ) ) ] d Y t {\displaystyle dp(\cdot ,\theta _{t})=\Pi _{p(\cdot ,\theta )}[F(p(\cdot ,\theta _{t}))]dt+\Pi _{p(\cdot ,\theta )}[G^{T}(p(\cdot ,\theta _{t}))]\circ dY_{t}}

что можно записать как

i = 1 n p ( , θ t ) θ i d θ i = i = 1 n [ j = 1 n γ i j ( θ ) F ( p ( , θ t ) ) , p ( , θ ) θ j ] p ( , θ ) θ i d t + i = 1 n [ j = 1 n γ i j ( θ ) G T ( p ( , θ t ) ) , p ( , θ ) θ j ] p ( , θ ) θ i d Y t , {\displaystyle \sum _{i=1}^{n}{\frac {\partial p(\cdot ,\theta _{t})}{\theta _{i}}}\circ d\theta _{i}=\sum _{i=1}^{n}\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta )\;\left\langle F(p(\cdot ,\theta _{t})),\,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle \right]\;{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}dt+\sum _{i=1}^{n}\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta )\;\left\langle G^{T}(p(\cdot ,\theta _{t})),\,{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{j}}}\right\rangle \right]\;{\frac {\partial {p(\cdot ,\theta )}}{\partial \theta _{i}}}\circ dY_{t},}

где было важно, чтобы исчисление Стратоновича подчинялось правилу цепи. Из приведенного выше уравнения окончательный проекционный фильтр SDE равен d θ i = [ j = 1 n γ i j ( θ t ) F ( p ( x , θ t ) ) p ( x , θ t ) θ j d x ] d t + k = 1 d [ j = 1 n γ i j ( θ t ) G k ( p ( x , θ t ) ) p ( x , θ t ) θ j d x ] d Y k {\displaystyle d\theta _{i}=\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta _{t})\;\int F(p(x,\theta _{t}))\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}dx\right]dt+\sum _{k=1}^{d}\;\left[\sum _{j=1}^{n}\gamma ^{ij}(\theta _{t})\;\int G_{k}(p(x,\theta _{t}))\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{k}}

с выбранным начальным условием . θ 0 {\displaystyle \theta _{0}}

Подставляя определения операторов F и G, получаем полностью явное уравнение проекционного фильтра в прямой метрике:

d θ i ( t ) = [ j = 1 m γ i j ( θ t ) L t p ( x , θ t ) p ( x , θ t ) θ j d x j = 1 m γ i j ( θ t ) 1 2 [ | b ( x , t ) | 2 | b ( z , t ) | 2 p ( z , θ t ) d z ] p ( x , θ t ) p ( x , θ t ) θ j d x ] d t {\displaystyle d\theta _{i}(t)=\left[\sum _{j=1}^{m}\gamma ^{ij}(\theta _{t})\;\int {{\cal {L}}_{t}^{\ast }\,p(x,\theta _{t})}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}dx-\sum _{j=1}^{m}\gamma ^{ij}(\theta _{t})\;\int {\frac {1}{2}}\left[\vert b(x,t)\vert ^{2}-\int \vert b(z,t)\vert ^{2}p(z,\theta _{t})dz\right]\;p(x,\theta _{t})\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]dt}

+ k = 1 d [ j = 1 m γ i j ( θ t ) [ b k ( x , t ) b k ( z , t ) p ( z , θ t ) d z ] p ( x , θ t ) p ( x , θ t ) θ j d x ] d Y t k   . {\displaystyle +\sum _{k=1}^{d}\;\left[\sum _{j=1}^{m}\gamma ^{ij}(\theta _{t})\;\int \left[b_{k}(x,t)-\int b_{k}(z,t)p(z,\theta _{t})dz\right]\;p(x,\theta _{t})\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{t}^{k}\ .}

Если вместо этого использовать расстояние Хеллингера, нужны квадратные корни плотностей. Базис касательного пространства тогда

{ p ( , θ ) θ 1 , , p ( , θ ) θ n } , {\displaystyle \left\{{\frac {\partial {\sqrt {p(\cdot ,\theta )}}}{\partial \theta _{1}}},\cdots ,{\frac {\partial {\sqrt {p(\cdot ,\theta )}}}{\partial \theta _{n}}}\right\},}

и один определяет метрику

1 4 g i j ( θ ) = p θ i , p θ j = 1 4 1 p ( x , θ ) p ( x , θ ) θ i p ( x , θ ) θ j d x . {\displaystyle {\frac {1}{4}}g_{ij}(\theta )=\left\langle {\frac {\partial {\sqrt {p}}}{\partial \theta _{i}}}\,,{\frac {\partial {\sqrt {p}}}{\partial \theta _{j}}}\right\rangle ={\frac {1}{4}}\int {\frac {1}{p(x,\theta )}}\,{\frac {\partial p(x,\theta )}{\partial \theta _{i}}}\,{\frac {\partial p(x,\theta )}{\partial \theta _{j}}}\,dx.}

Метрика — это информационная метрика Фишера. Проделываем шаги, полностью аналогичные случаю прямой метрики, и уравнение фильтра в метрике Хеллингера/Фишера выглядит так: g {\displaystyle g}

d θ i = [ j = 1 n g i j ( θ t ) F ( p ( x , θ t ) ) p ( x , θ t ) p ( x , θ t ) θ j d x ] d t + k = 1 d [ j = 1 m g i j ( θ t ) G k ( p ( x , θ t ) ) p ( x , θ t ) p ( x , θ t ) θ j d x ] d Y t k   , {\displaystyle d\theta _{i}=\left[\sum _{j=1}^{n}g^{ij}(\theta _{t})\;\int {\frac {F(p(x,\theta _{t}))}{p(x,\theta _{t})}}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]dt+\sum _{k=1}^{d}\;\left[\sum _{j=1}^{m}g^{ij}(\theta _{t})\;\int {\frac {G_{k}(p(x,\theta _{t}))}{p(x,\theta _{t})}}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{t}^{k}\ ,}

снова с выбранным начальным условием . θ 0 {\displaystyle \theta _{0}}

Подставляя F и G, получаем d θ i ( t ) = [ j = 1 m g i j ( θ t ) L t p ( x , θ t ) p ( x , θ t ) p ( x , θ t ) θ j d x j = 1 m g i j ( θ t ) 1 2 | b t ( x ) | 2 p ( x , θ t ) θ j d x ] d t {\displaystyle d\theta _{i}(t)=\left[\sum _{j=1}^{m}g^{ij}(\theta _{t})\;\int {\frac {{\cal {L}}_{t}^{\ast }\,p(x,\theta _{t})}{p(x,\theta _{t})}}\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx-\sum _{j=1}^{m}g^{ij}(\theta _{t})\int {\frac {1}{2}}\vert b_{t}(x)\vert ^{2}{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}dx\right]dt}

+ k = 1 d [ j = 1 m g i j ( θ t ) b k ( x , t ) p ( x , θ t ) θ j d x ] d Y t k   . {\displaystyle +\sum _{k=1}^{d}\;\left[\sum _{j=1}^{m}g^{ij}(\theta _{t})\;\int b_{k}(x,t)\;{\frac {\partial p(x,\theta _{t})}{\partial \theta _{j}}}\;dx\right]\circ dY_{t}^{k}\ .}

Проекционный фильтр в прямой метрике, реализованный на многообразии семейств смесей, приводит к эквивалентности с методом Галеркина. [6] S Θ {\displaystyle S_{\Theta }}

Проекционный фильтр в метрике Хеллингера/Фишера, реализованный на многообразии квадратных корней экспоненциального семейства плотностей, эквивалентен предполагаемым фильтрам плотности. [3] S Θ 1 / 2 {\displaystyle S_{\Theta }^{1/2}}

Следует отметить, что также возможно спроецировать более простое уравнение Закаи для ненормализованной версии плотности p. Это приведет к тому же самому фильтру проекции Хеллингера, но к другому фильтру прямой метрической проекции. [6]

Наконец, если в случае экспоненциального семейства включить в достаточную статистику экспоненциального семейства функцию наблюдения в , а именно компоненты и , то можно увидеть, что шаг коррекции в алгоритме фильтрации становится точным. Другими словами, проекция векторного поля точна, что приводит к самому себе. Записывая алгоритм фильтрации в условиях непрерывного состояния и дискретных временных наблюдений , можно увидеть, что шаг коррекции при каждом новом наблюдении является точным, поскольку соответствующая формула Байеса не влечет за собой приближения. [3] d Y t {\displaystyle dY_{t}} b ( x ) {\displaystyle b(x)} | b ( x ) | 2 {\displaystyle |b(x)|^{2}} G {\displaystyle G} G {\displaystyle G} X {\displaystyle X} Y {\displaystyle Y}

Оптимальные проекционные фильтры на основе проекций вектора Ито и струи Ито

Теперь вместо того, чтобы рассматривать точный фильтр SPDE в форме исчисления Стратоновича, мы сохраняем его в форме исчисления Ито

d p t = L t p t   d t + p t [ b ( , t ) E p t ( b ( , t ) ) ] T [ d Y t E p t ( b ( , t ) ) d t ] . {\displaystyle dp_{t}={\cal {L}}_{t}^{*}p_{t}\ dt+p_{t}[b(\cdot ,t)-E_{p_{t}}(b(\cdot ,t))]^{T}[dY_{t}-E_{p_{t}}(b(\cdot ,t))dt].}

В фильтрах проекций Стратоновича выше векторные поля и проектировались отдельно. По определению проекция является оптимальным приближением для и отдельно, хотя это не означает, что она обеспечивает наилучшее приближение для решения SPDE фильтра в целом. Действительно, проекция Стратоновича, действующая на два члена и отдельно, не гарантирует оптимальности решения как приближения точного для, скажем, малого . Можно искать норму , которая будет применена к решению, для которого F {\displaystyle F} G {\displaystyle G} F {\displaystyle F} G {\displaystyle G} F {\displaystyle F} G {\displaystyle G} p ( , θ 0 + δ t ) {\displaystyle p(\cdot ,\theta _{0+\delta t})} p 0 + δ t {\displaystyle p_{0+\delta t}} δ t {\displaystyle \delta t} {\displaystyle \|\cdot \|}

θ 0 + δ t argmin θ   p 0 + δ t p ( , θ ) . {\displaystyle \theta _{0+\delta t}\approx {\mbox{argmin}}_{\theta }\ \|p_{0+\delta t}-p(\cdot ,\theta )\|.}

Проекция вектора Ито получается следующим образом. Выберем норму для пространства плотностей, , которая может быть связана с прямой метрикой или метрикой Хеллингера. {\displaystyle \|\cdot \|}

Выбираем член диффузии в аппроксимирующем уравнении Ито для минимизируя (но не обнуляя) член разложения Тейлора для среднеквадратической ошибки θ t {\displaystyle \theta _{t}} δ t {\displaystyle \delta t}

E t [ p 0 + δ t p ( , θ 0 + δ t ) 2 ] {\displaystyle E_{t}[\|p_{0+\delta t}-p(\cdot ,\theta _{0+\delta t})\|^{2}]} ,

нахождение дрейфового члена в аппроксимирующем уравнении Ито, который минимизирует член той же разности. Здесь член порядка минимизируется, а не обнуляется, и никогда не достигается сходимость, только сходимость. ( δ t ) 2 {\displaystyle (\delta t)^{2}} δ t {\displaystyle \delta t} ( δ t ) 2 {\displaystyle (\delta t)^{2}} δ t {\displaystyle \delta t}

Еще одним преимуществом векторной проекции Ито является то, что она минимизирует разложение Тейлора порядка 1 δ t {\displaystyle \delta t}

E [ p 0 + δ t p ( , θ 0 + δ t ) ] . {\displaystyle \|E[p_{0+\delta t}-p(\cdot ,\theta _{0+\delta t})]\|.}

Для достижения сходимости, а не конвергенции, вводится проекция Ито-струи, основанная на понятии метрической проекции. ( δ t ) 2 {\displaystyle (\delta t)^{2}} δ t {\displaystyle \delta t}

Метрическая проекция плотности (или ) на многообразие (или ) является ближайшей точкой на (или ) к (или ). Обозначим ее как . Метрическая проекция, по определению, в соответствии с выбранной метрикой, является наилучшим возможным приближением в . Таким образом, идея заключается в нахождении фильтра проекции, который подходит как можно ближе к метрической проекции. Другими словами, рассматривается критерий p L 2 {\displaystyle p\in L^{2}} p L 2 {\displaystyle {\sqrt {p}}\in L^{2}} S Θ {\displaystyle S_{\Theta }} S Θ 1 / 2 {\displaystyle S_{\Theta }^{1/2}} S Θ {\displaystyle S_{\Theta }} S Θ 1 / 2 {\displaystyle S_{\Theta }^{1/2}} p {\displaystyle p} p {\displaystyle {\sqrt {p}}} π ( p ) {\displaystyle \pi (p)} p {\displaystyle p} S Θ {\displaystyle S_{\Theta }} θ 0 + δ t argmin θ   π ( p 0 + δ t ) p ( , θ ) . {\displaystyle \theta _{0+\delta t}\approx {\mbox{argmin}}_{\theta }\ \|\pi (p_{0+\delta t})-p(\cdot ,\theta )\|.}

Подробные вычисления длительны и трудоемки, [7], но полученное приближение достигает сходимости. Действительно, проекция струи Ито достигает следующего критерия оптимальности. Она обнуляет член порядка и минимизирует член порядка разложения Тейлора среднеквадратичного расстояния между и . ( δ t ) 2 {\displaystyle (\delta t)^{2}} δ t {\displaystyle \delta t} ( δ t ) 2 {\displaystyle (\delta t)^{2}} L 2 {\displaystyle L^{2}} π ( p 0 + δ t ) {\displaystyle \pi (p_{0+\delta t})} p ( , θ 0 + δ t ) {\displaystyle p(\cdot ,\theta _{0+\delta t})}

Как вектор Ито, так и проекция струи Ито приводят к окончательным SDE, определяемым наблюдениями , для параметра , который наилучшим образом аппроксимирует точную эволюцию фильтра для малых времен. [7] d Y {\displaystyle dY} θ t {\displaystyle \theta _{t}}

Приложения

Jones и Soatto (2011) упоминают проекционные фильтры как возможные алгоритмы для онлайн-оценки в визуально-инерциальной навигации , [12] картировании и локализации, в то время как Azimi-Sadjadi и Krishnaprasad (2005) [13] снова в навигации используют алгоритмы проекционных фильтров. Проекционный фильтр также рассматривался для приложений в динамике океана Lermusiaux 2006. [14] Kutschireiter, Rast и Drugowitsch (2022) [15] ссылаются на проекционный фильтр в контексте непрерывной временной круговой фильтрации. Для приложений квантовых систем см., например, van Handel и Mabuchi (2005), [16], которые применили квантовый проекционный фильтр к квантовой оптике , изучая квантовую модель оптической фазовой бистабильности сильно связанного двухуровневого атома в оптической полости. Дополнительные приложения к квантовым системам рассматриваются в Gao, Zhang и Petersen (2019). [17] Ma, Zhao, Chen и Chang (2015) ссылаются на проекционные фильтры в контексте оценки положения опасности, в то время как Vellekoop и Clark (2006) [18] обобщают теорию проекционных фильтров для работы с обнаружением точек изменения . Harel, Meir и Opper (2015) [19] применяют проекционные фильтры в предполагаемой форме плотности для фильтрации оптимальных точечных процессов с приложениями к нейронному кодированию . Broecker и Parlitz (2000) [20] изучают методы проекционных фильтров для снижения шума в хаотических временных рядах . Zhang, Wang, Wu и Xu (2014) [21] применяют гауссовский проекционный фильтр как часть своей методики оценки для работы с измерениями диаметров волокон в нетканых материалах, полученных методом выдувания из расплава.

Смотрите также

Ссылки

  1. ^ ab "Научный отчет Шведского агентства оборонных исследований" (PDF) . foi.se . Архивировано из оригинала (PDF) 2016-03-03.
  2. ^ abcdef Бриго, Дамиано ; Ханзон, Бернар; ЛеГланд, Франсуа (1998). «Дифференциально-геометрический подход к нелинейной фильтрации: проекционный фильтр» (PDF) . IEEE Transactions on Automatic Control . 43 (2): 247– 252. doi :10.1109/9.661075.
  3. ^ abcdefg Бриго, Дамиано; Ханзон, Бернар; ЛеГланд, Франсуа (1999). «Приближенная нелинейная фильтрация с помощью проекции на экспоненциальные многообразия плотностей». Бернулли . 5 (3): 407– 430. doi :10.2307/3318714. JSTOR  3318714.
  4. ^ Шалея-Морель, Мирей и Доминик Мишель (1984), Результаты несуществования фильтра конечного измерения. Стохастика, том 13, выпуск 1+2, страницы 83–102.
  5. ^ М. Хазевинкель, СИ Маркус, Х. Дж. Сассманн (1983). Несуществование конечномерных фильтров для условных статистик кубической проблемы датчика. Systems & Control Letters 3(6), страницы 331-340, https://doi.org/10.1016/0167-6911(83)90074-9.
  6. ^ abcdef Армстронг, Джон; Бриго, Дамиано (2016). «Нелинейная фильтрация с помощью стохастической проекции PDE на смешанных многообразиях в прямой метрике L2». Математика управления, сигналов и систем . 28 (1): 1– 33. arXiv : 1303.6236 . Bibcode :2016MCSS...28....5A. doi :10.1007/s00498-015-0154-1.
  7. ^ abcd Армстронг, Джон; Бриго, Дамиано; Росси Ферруччи, Эмилио (2019). «Оптимальная аппроксимация {SDE} на подмногообразиях: проекции вектора Ито и струи Ито». Труды Лондонского математического общества . 119 (1): 176– 213. arXiv : 1610.03887 . doi :10.1112/plms.12226.
  8. ^ Армстронг, Дж., Бриго, Д. и Ханзон, Б. (2023). Оптимальные проекционные фильтры с информационной геометрией. Info. Geo. (2023). https://doi.org/10.1007/s41884-023-00108-x
  9. ^ ab Бернард Ханзон (1987). Дифференциально-геометрический подход к приближенной нелинейной фильтрации. В: CTJ Dodson, редактор, Geometrization of Statistical Theory, страницы 219–223. ULMD Publications, Университет Ланкастера
  10. ^ ab Brigo, D. (1996). Фильтрация проекцией на многообразии экспоненциальных плотностей. Кандидатская диссертация, Свободный университет Амстердама
  11. ^ Джон Армстронг и Дамиано Бриго (2018). Внутренние стохастические дифференциальные уравнения как струи. Труды Королевского общества A - Математические, физические и инженерные науки, 474(2210), 28 страниц. doi: 10.1098/rspa.2017.0559.
  12. ^ Джонс, Игл С.; Соатто, Массимо (2011). «Визуально-инерциальная навигация, картографирование и локализация: масштабируемый причинный подход в реальном времени». Международный журнал исследований робототехники . 30 (4): 407– 430. doi :10.1177/0278364910388963.
  13. ^ Азими-Саджади, Бабак; Кришнапрасад, П.С. (2005). «Приближенная нелинейная фильтрация и ее применение в навигации». Автоматика . 41 (6): 945–956 . doi :10.1016/j.automatica.2004.12.013.
  14. ^ Лермюзио, Пьер Ф. Дж. (2006). «Оценка неопределенности и прогнозирование для междисциплинарной динамики океана». Журнал вычислительной физики . 217 (1): 176– 199. Bibcode : 2006JCoPh.217..176L. doi : 10.1016/j.jcp.2006.02.010.
  15. ^ Kutschireiter, Anna; Rast, Luke; Drugowitsch, Jan (2022). «Проекционная фильтрация с наблюдаемыми приращениями состояния с приложениями в непрерывной круговой фильтрации». IEEE Transactions on Signal Processing . 70 : 686–700 . arXiv : 2102.09650 . Bibcode : 2022ITSP ...70..686K. doi : 10.1109/TSP.2022.3143471. PMC 9634992. PMID  36338544. 
  16. ^ Ван Хэндел, Рамон; Мабучи, Хидео (2005). «Квантовый проекционный фильтр для высоконелинейной модели в резонаторной квантовой электродинамике». Журнал оптики B: Квантовая и полуклассическая оптика . 7 (10): S226 – S236 . arXiv : quant-ph/0503222 . Bibcode : 2005JOptB...7S.226V. doi : 10.1088/1464-4266/7/10/005.
  17. ^ Гао, Цин; Чжан, Гофэн; Петерсен, Ян Р. (2019). «Экспоненциальный квантовый проекционный фильтр для открытых квантовых систем». Automatica . 99 : 59–68 . arXiv : 1705.09114 . doi : 10.1016/j.automatica.2018.10.014.
  18. ^ Vellekoop, MH; Clark, JMC (2006). «Подход нелинейной фильтрации к проблемам обнаружения точек изменения: прямые и дифференциально-геометрические методы». Обзор SIAM . 48 (2): 329– 356. Bibcode : 2006SIAMR..48..329V. doi : 10.1137/050647438.
  19. ^ Харель, Ювал; Меир, Рон; Оппер, Манфред (2015). «Удобное приближение к оптимальной фильтрации точечных процессов: применение к нейронному кодированию». Достижения в области нейронных систем обработки информации . 28 .
  20. ^ Брокер, Йохен; Парлиц, Ульрих (2000). «Подавление шума и фильтрация хаотических временных рядов». Proc. NOLTA 2000 .
  21. ^ Чжан, Сянь Мяо; У Ван, Ронг; Сюй, Бугау (2014). «Автоматизированные измерения диаметров волокон в нетканых материалах, полученных методом выдува расплава». Журнал промышленного текстиля . 43 (4): 593– 605. doi :10.1177/1528083712471696.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Projection_filters&oldid=1255813487"