Поля играют важную роль в науке, технике и экономике. Они описывают пространственные изменения величины, например температуры воздуха, как функцию положения. Знание конфигурации поля может иметь большое значение. Однако измерения полей никогда не могут с уверенностью предоставить точную конфигурацию поля. Физические поля имеют бесконечное число степеней свободы, но данные, генерируемые любым измерительным устройством, всегда конечны, обеспечивая только конечное число ограничений для поля. Таким образом, однозначный вывод такого поля только из данных измерений невозможен, и только вероятностный вывод остается средством для утверждения о поле. К счастью, физические поля демонстрируют корреляции и часто следуют известным физическим законам. Такая информация лучше всего объединяется с выводом поля, чтобы преодолеть несоответствие степеней свободы поля точкам измерения. Чтобы справиться с этим, необходима информационная теория для полей, и это то, чем является теория информационного поля.
Концепции
Байесовский вывод
это значение поля в определенном месте в пространстве . Априорные знания о неизвестном поле сигнала закодированы в распределении вероятностей . Данные предоставляют дополнительную информацию о с помощью вероятности , которая включается в апостериорную вероятность согласно теореме Байеса .
В IFT теорема Байеса обычно переписывается на языке статистической теории поля, при этом информационный гамильтониан определяется как отрицательный логарифм совместной вероятности данных и сигнала, а функция распределения имеет вид Эта переформулировка теоремы Байеса позволяет использовать методы математической физики, разработанные для обработки статистических теорий поля и квантовых теорий поля .
Поля
Поскольку поля имеют бесконечное число степеней свободы, определение вероятностей над пространствами конфигураций полей имеет тонкости. Определение физических полей как элементов функциональных пространств создает проблему, заключающуюся в том, что над последними не определена мера Лебега , и, следовательно, плотности вероятностей там не могут быть определены. Однако физические поля имеют гораздо большую регулярность, чем большинство элементов функциональных пространств, поскольку они непрерывны и гладки в большинстве своих местоположений. Поэтому для обработки бесконечного числа степеней свободы поля можно использовать менее общие, но достаточно гибкие конструкции.
Прагматичный подход заключается в том, чтобы считать поле дискретизированным в терминах пикселей. Каждый пиксель несет одно значение поля, которое предполагается постоянным в пределах объема пикселя. Все утверждения о непрерывном поле затем должны быть приведены к его пиксельному представлению. Таким образом, мы имеем дело с конечномерными полевыми пространствами, по которым плотности вероятности хорошо определяются.
Для того чтобы это описание было правильной теорией поля, необходимо также, чтобы разрешение пикселей всегда можно было уточнить, а ожидаемые значения дискретизированного поля сходились к конечным значениям:
Интегралы по траектории
Если этот предел существует, можно говорить об интеграле пространства конфигурации поля или интеграле по траектории, независимо от разрешения, с которым он может быть оценен численно.
Гауссово априорное распределение
Простейшим априорным распределением для поля является распределение вероятностей Гаусса с нулевым средним . Определитель в знаменателе может быть плохо определен в пределе континуума , однако все, что необходимо для согласованности IFT, — это то, что этот определитель можно оценить для любого представления поля с конечным разрешением с помощью и что это позволяет вычислять сходящиеся значения ожиданий.
Гауссовское распределение вероятностей требует спецификации двухточечной корреляционной функции поля с коэффициентами и скалярным произведением для непрерывных полей, относительно которых строится обратная ковариация поля сигнала, т.е.
Соответствующий гамильтониан априорной информации имеет вид
Уравнение измерения
Данные измерений были получены с вероятностью . В случае, если прибор был линейным, можно задать уравнение измерения в форме , в которой есть отклик прибора, который описывает, как данные в среднем реагируют на сигнал, а есть шум, просто разница между данными и линейным откликом сигнала . Отклик переводит бесконечномерный вектор сигнала в конечномерное пространство данных. В компонентах это читается как
где также была введена векторная компонентная нотация для векторов сигналов и данных.
Если шум следует независимой от сигнала гауссовой статистике с нулевым средним и ковариацией , то правдоподобие также является гауссовым, а гамильтониан информации о правдоподобии равен Линейное измерение гауссовского сигнала, подверженного гауссовскому и независимому от сигнала шуму, приводит к свободному IFT.
Свободная теория
Свободный гамильтониан
Совместный информационный гамильтониан гауссовского сценария, описанного выше, имеет вид , где обозначает равенство с точностью до несущественных констант, что в данном случае означает выражения, не зависящие от . Из этого ясно, что апостериорная функция должна быть гауссовой со средним значением и дисперсией , где равенство между правой и левой частями выполняется, поскольку оба распределения нормализованы, .
Обобщенный фильтр Винера
Апостериорное среднее также известно как обобщенное решение фильтра Винера , а ковариация неопределенности — как дисперсия Винера.
В IFT называется источником информации, поскольку он действует как исходный термин для возбуждения поля (знания), и распространителем информации, поскольку он распространяет информацию из одного места в другое в
Теория взаимодействия
Взаимодействующий гамильтониан
Если любое из предположений, которые ведут к свободной теории, нарушается, IFT становится взаимодействующей теорией с членами, которые имеют порядок выше квадратичного в поле сигнала. Это происходит, когда сигнал или шум не следуют гауссовой статистике, когда отклик нелинейный, когда шум зависит от сигнала или когда отклик или ковариации неопределенны.
В этом случае информационный гамильтониан может быть разложен в ряд Тейлора - Фреше ,
где — свободный гамильтониан, который сам по себе привел бы к гауссовой апостериорной функции, а — взаимодействующий гамильтониан, который кодирует негауссовские поправки. Коэффициенты Тейлора первого и второго порядка часто отождествляются с (отрицательным) источником информации и пропагатором информации соответственно. Более высокие коэффициенты связаны с нелинейными самовзаимодействиями.
Классическое поле
Классическое поле минимизирует информационный гамильтониан и, следовательно, максимизирует апостериорную оценку: Таким образом, классическое поле является максимальной апостериорной оценкой задачи вывода поля.
Критический фильтр
Проблема фильтра Винера требует, чтобы была известна двухточечная корреляция поля. Если она неизвестна, ее нужно вывести вместе с самим полем. Для этого требуется спецификация гиперприора . Часто можно предположить статистическую однородность (трансляционную инвариантность), подразумевая, что является диагональным в пространстве Фурье (для того, чтобы быть размерным декартовым пространством ). В этом случае нужно вывести только спектр мощности пространства Фурье. Учитывая дальнейшее предположение о статистической изотропии, этот спектр зависит только от длины вектора Фурье , и нужно определить только одномерный спектр . Тогда априорная ковариация поля читается в координатах пространства Фурье .
Если априорное значение является плоским, совместная вероятность данных и спектра равна , где снова использовалась нотация информационного пропагатора и источника проблемы фильтра Винера. Соответствующий информационный гамильтониан равен , где обозначает равенство с точностью до нерелевантных констант (здесь: константа относительно ). Минимизация этого значения относительно , чтобы получить его максимальную апостериорную оценку спектра мощности, дает , где были введены среднее значение фильтра Винера и проектор спектральной полосы . Последний коммутирует с , поскольку является диагональным в пространстве Фурье. Максимальная апостериорная оценка для спектра мощности равна , следовательно, Его необходимо вычислять итеративно, так как и зависят оба от себя. В эмпирическом байесовском подходе оценка будет приниматься как заданная. Как следствие, апостериорная средняя оценка для поля сигнала является соответствующей , а ее неопределенность соответствующей в эмпирическом байесовском приближении.
Полученный нелинейный фильтр называется критическим фильтром . [4] Обобщение формулы оценки спектра мощности как показывает пороги восприятия для , что означает, что дисперсия данных в полосе Фурье должна превысить ожидаемый уровень шума на определенный порог, прежде чем реконструкция сигнала станет ненулевой для этой полосы. Всякий раз, когда дисперсия данных немного превышает этот порог, реконструкция сигнала переходит на конечный уровень возбуждения, аналогично фазовому переходу первого рода в термодинамических системах. Для фильтра с восприятием сигнала начинается непрерывно, как только дисперсия данных превысит уровень шума. Исчезновение прерывистого восприятия при аналогично прохождению термодинамической системой критической точки . Отсюда и название критический фильтр.
Критический фильтр, его расширения для нелинейных измерений и включение априорных значений неплоского спектра позволили применить IFT к реальным задачам вывода сигналов, для которых ковариация сигнала обычно неизвестна априори.
Примеры применения IFT
Обобщенный фильтр Винера, возникающий в свободном IFT, широко используется в обработке сигналов. Для ряда приложений были получены алгоритмы, явно основанные на IFT. Многие из них реализованы с использованием библиотеки Numerical Information Field Theory (NIFTy).
D³PO — это код для Denoising, Deconvolution, and Decomposing Photon Observations . Он реконструирует изображения из отдельных событий подсчета фотонов с учетом статистики Пуассона подсчетов и функции отклика прибора. Он разделяет излучение неба на изображение диффузного излучения и одно из точечных источников, используя различную корреляционную структуру и статистику двух компонентов для их разделения. D³PO был применен к данным спутников Fermi и RXTE .
RESOLVE — это байесовский алгоритм для визуализации синтеза апертуры в радиоастрономии. RESOLVE похож на D³PO, но предполагает гауссово правдоподобие и функцию отклика пространства Фурье. Он был применен к данным Very Large Array .
PySESA — это фреймворк Python для пространственно-явного спектрального анализа, предназначенный для пространственно-явного спектрального анализа облаков точек и геопространственных данных.
Продвинутая теория
Для решения задач IFT можно использовать многие методы квантовой теории поля, такие как диаграммы Фейнмана, эффективные действия и формализм полевых операторов.
Диаграммы Фейнмана
В случае, если коэффициенты взаимодействия в разложении Тейлора - Фреше информационного гамильтониана малы, логарифмическая статсумма или свободная энергия Гельмгольца может быть асимптотически разложена по этим коэффициентам. Свободный гамильтониан определяет среднее значение и дисперсию гауссовского распределения , по которому интегрируется разложение. Это приводит к сумме по множеству всех связанных диаграмм Фейнмана . Из свободной энергии Гельмгольца любой связанный момент поля может быть вычислен с помощью Ситуации, в которых существуют малые параметры разложения, необходимые для сходимости такого диаграммного разложения, задаются почти гауссовыми сигнальными полями, где негауссовость статистики поля приводит к малым коэффициентам взаимодействия . Например, статистика реликтового космического излучения почти гауссова, с небольшим количеством негауссовостей, которые, как полагают, были засеяны во время инфляционной эпохи в ранней Вселенной .
Эффективное действие
Для того чтобы иметь стабильные числовые данные для задач IFT, необходим функционал поля, который при минимизации обеспечивает апостериорное среднее поле. Оно задается эффективным действием или свободной энергией Гиббса поля. Свободная энергия Гиббса может быть построена из свободной энергии Гельмгольца с помощью преобразования Лежандра . В IFT она задается разностью внутренней информационной энергии и энтропии Шеннона для температуры , где используется гауссовское апостериорное приближение с приближенными данными, содержащими среднее значение и дисперсию поля. [5]
Свободная энергия Гиббса тогда равна расхождению Кульбака-Лейблера между приближенным и точным апостериорным распределением плюс свободная энергия Гельмгольца. Поскольку последнее не зависит от приближенных данных , минимизация свободной энергии Гиббса эквивалентна минимизации расхождения Кульбака-Лейблера между приближенным и точным апостериорным распределением. Таким образом, эффективный подход IFT эквивалентен вариационным байесовским методам , которые также минимизируют расхождение Кульбака-Лейблера между приближенным и точным апостериорным распределением.
Минимизация свободной энергии Гиббса обеспечивает аппроксимацию апостериорного среднего поля , тогда как минимизация информационного гамильтониана обеспечивает максимальное апостериорное поле. Поскольку последний, как известно, переобучает шум, первый обычно является лучшей оценкой поля.
Операторный формализм
Расчет свободной энергии Гиббса требует вычисления гауссовых интегралов по информационному гамильтониану, поскольку внутренняя информационная энергия равна Такие интегралы можно вычислить с помощью формализма оператора поля, [6] в котором есть оператор поля. Это генерирует выражение поля внутри интеграла, если применяется к гауссовой функции распределения, и любую более высокую степень поля, если применяется несколько раз, Если информационный гамильтониан является аналитическим, все его члены могут быть сгенерированы с помощью оператора поля Поскольку оператор поля не зависит от самого поля, его можно вытащить из интеграла по траектории конструкции внутренней информационной энергии, где следует рассматривать как функционал, который всегда возвращает значение независимо от значения его входа . Результирующее выражение можно вычислить, коммутируя аннигилятор среднего поля справа от выражения, где они исчезают, поскольку . Аннигилятор среднего поля коммутирует со средним полем как
Используя формализм оператора поля, можно рассчитать свободную энергию Гиббса, что позволяет сделать (приближенный) вывод апостериорного среднего поля посредством численной надежной минимизации функционала.
История
Книгу Норберта Винера [7] можно считать одной из первых работ по полевым выводам. Использование интегралов по траектории для полевых выводов было предложено рядом авторов, например, Эдмундом Берчингером [8] или Уильямом Биалеком и А. Зее. [9] Связь теории поля и байесовских рассуждений была явно выражена Йоргом Леммом. [10] Термин «теория информационного поля» был придуман Торстеном Энслином. [11] См. последнюю ссылку для получения дополнительной информации об истории IFT.
^ Энслин, Торстен (2013). «Теория информационного поля». Труды конференции AIP . 1553 (1): 184–191. arXiv : 1301.2556 . Bibcode : 2013AIPC.1553..184E. doi : 10.1063/1.4819999.
^ Энслин, Торстен А. (2019). «Теория информации для полей». Аннален дер Физик . 531 (3): 1800127. arXiv : 1804.03350 . Бибкод : 2019АнП...53100127E. дои : 10.1002/andp.201800127.
^ "Теория информационного поля". Общество Макса Планка . Получено 13 ноября 2014 г.
^ Энслин, Торстен А.; Фроммерт, Мона (2011-05-19). "Реконструкция сигналов с неизвестными спектрами в теории информационного поля с неопределенностью параметров". Physical Review D. 83 ( 10): 105014. arXiv : 1002.2928 . Bibcode : 2011PhRvD..83j5014E. doi : 10.1103/PhysRevD.83.105014.
^ Энслин, Торстен А. (2010). «Вывод с минимальной свободной энергией Гиббса в теории информационного поля». Physical Review E. 82 ( 5): 051112. arXiv : 1004.2868 . Bibcode : 2010PhRvE..82e1112E. doi : 10.1103/physreve.82.051112. PMID 21230442.
^ Лейке, Реймар Х.; Энслин, Торстен А. (16.11.2016). «Операторное исчисление для теории информационного поля». Physical Review E. 94 ( 5): 053306. arXiv : 1605.00660 . Bibcode : 2016PhRvE..94e3306L. doi : 10.1103/PhysRevE.94.053306. PMID 27967173.
^ Винер, Норберт (1964). Экстраполяция, интерполяция и сглаживание стационарных временных рядов с инженерными приложениями (Пятое издание). Кембридж, Массачусетс: Technology Press Массачусетского технологического института. ISBN0262730057. OCLC 489911338.
^ Берчингер, Эдмунд (декабрь 1987 г.). «Методы интегралов по путям для первичных возмущений плотности — выборка ограниченных гауссовых случайных полей». The Astrophysical Journal . 323 : L103–L106. Bibcode :1987ApJ...323L.103B. doi : 10.1086/185066 . ISSN 0004-637X.
^ Биалек, Уильям; Зи, А. (1988-09-26). «Понимание эффективности человеческого восприятия». Physical Review Letters . 61 (13): 1512–1515. Bibcode : 1988PhRvL..61.1512B. doi : 10.1103/PhysRevLett.61.1512. PMID 10038817.
^ Лемм, Йорг К. (2003). Байесовская теория поля . Балтимор, Мэриленд: Johns Hopkins University Press. ISBN9780801872204. OCLC 52762436.
^ Энслин, Торстен А.; Фроммерт, Мона; Китаура, Франциско С. (2009-11-09). "Теория информационного поля для реконструкции космологических возмущений и нелинейного анализа сигналов". Physical Review D. 80 ( 10): 105005. arXiv : 0806.3474 . Bibcode : 2009PhRvD..80j5005E. doi : 10.1103/PhysRevD.80.105005.