преобразование Энскомба

Статистическая концепция
Стандартное отклонение преобразованной пуассоновской случайной величины как функция среднего значения . м {\displaystyle м}

В статистике преобразование Анскомба , названное в честь Фрэнсиса Анскомба , представляет собой стабилизирующее дисперсию преобразование , которое преобразует случайную величину с распределением Пуассона в величину с приблизительно стандартным гауссовым распределением . Преобразование Анскомба широко используется в ограниченных фотонами изображениях (астрономия, рентген), где изображения естественным образом следуют закону Пуассона. Преобразование Анскомба обычно используется для предварительной обработки данных, чтобы сделать стандартное отклонение приблизительно постоянным. Затем используются алгоритмы шумоподавления, разработанные для структуры аддитивного белого гауссовского шума ; окончательная оценка затем получается путем применения обратного преобразования Анскомба к очищенным от шумов данным.

Анимированное преобразование Анскомба. Вот среднее значение распределения Пуассона, преобразованного Анскомбом, нормализованное путем вычитания на , а — его стандартное отклонение (оцененное эмпирически). Мы замечаем, что и остается примерно в диапазоне в течение периода, что дает эмпирическую поддержку μ {\displaystyle \мю} 2 м + 3 8 1 4 м 1 / 2 {\displaystyle 2{\sqrt {м+{\tfrac {3}{8}}}}-{\tfrac {1}{4\,м^{1/2}}}} σ {\displaystyle \сигма} м 3 / 2 μ {\displaystyle м^{3/2}\мю } м 2 ( σ 1 ) {\displaystyle m^{2}(\сигма -1)} [ 0 , 10 ] {\displaystyle [0,10]} μ = О ( м 3 / 2 ) , σ = 1 + О ( м 2 ) {\displaystyle \mu =O(m^{-3/2}),\sigma =1+O(m^{-2})}

Определение

Для распределения Пуассона среднее значение и дисперсия не являются независимыми: Преобразование Анскомба [1] м {\displaystyle м} в {\displaystyle v} м = в {\displaystyle m=v}

А : х 2 х + 3 8 {\displaystyle A:x\mapsto 2{\sqrt {x+{\tfrac {3}{8}}}}\,}

направлен на преобразование данных таким образом, чтобы дисперсия была установлена ​​приблизительно равной 1 для достаточно большого среднего значения; при нулевом среднем значении дисперсия по-прежнему равна нулю.

Он преобразует пуассоновские данные (со средним значением ) в приблизительно гауссовские данные со средним значением и стандартным отклонением . Это приближение становится более точным для больших , [2] как также можно увидеть на рисунке. х {\displaystyle x} м {\displaystyle м} 2 м + 3 8 1 4 м 1 / 2 + О ( 1 м 3 / 2 ) {\displaystyle 2{\sqrt {m+{\tfrac {3}{8}}}}-{\tfrac {1}{4\,m^{1/2}}}+O\left({\tfrac {1}{m^{3/2}}}\right)} 1 + О ( 1 м 2 ) {\displaystyle 1+O\left({\tfrac {1}{m^{2}}}\right)} m {\displaystyle m}

Для преобразованной переменной вида выражение для дисперсии имеет дополнительный член ; он сводится к нулю при , что и является причиной выбора этого значения. 2 x + c {\displaystyle 2{\sqrt {x+c}}} 3 8 c m {\displaystyle {\frac {{\tfrac {3}{8}}-c}{m}}} c = 3 8 {\displaystyle c={\tfrac {3}{8}}}

Инверсия

Когда преобразование Анскомба используется для шумоподавления (т.е. когда цель состоит в том, чтобы получить из оценки ), его обратное преобразование также необходимо для того, чтобы вернуть стабилизированные по дисперсии и шумоподавленные данные в исходный диапазон. Применение алгебраического обратного x {\displaystyle x} m {\displaystyle m} y {\displaystyle y}

A 1 : y ( y 2 ) 2 3 8 {\displaystyle A^{-1}:y\mapsto \left({\frac {y}{2}}\right)^{2}-{\frac {3}{8}}}

обычно вносит нежелательное смещение в оценку среднего значения , поскольку прямое квадратно-корневое преобразование не является линейным . Иногда используют асимптотически несмещенное обратное [1] m {\displaystyle m}

y ( y 2 ) 2 1 8 {\displaystyle y\mapsto \left({\frac {y}{2}}\right)^{2}-{\frac {1}{8}}}

смягчает проблему смещения, но это не относится к изображениям, ограниченным фотонами, для которых точное несмещенное обратное значение задается неявным отображением [3]

E [ 2 x + 3 8 m ] = 2 x = 0 + ( x + 3 8 m x e m x ! ) m {\displaystyle \operatorname {E} \left[2{\sqrt {x+{\tfrac {3}{8}}}}\mid m\right]=2\sum _{x=0}^{+\infty }\left({\sqrt {x+{\tfrac {3}{8}}}}\cdot {\frac {m^{x}e^{-m}}{x!}}\right)\mapsto m}

следует использовать. Замкнутая форма приближения этой точной несмещенной обратной величины [4]

y 1 4 y 2 1 8 + 1 4 3 2 y 1 11 8 y 2 + 5 8 3 2 y 3 . {\displaystyle y\mapsto {\frac {1}{4}}y^{2}-{\frac {1}{8}}+{\frac {1}{4}}{\sqrt {\frac {3}{2}}}y^{-1}-{\frac {11}{8}}y^{-2}+{\frac {5}{8}}{\sqrt {\frac {3}{2}}}y^{-3}.}

Альтернативы

Существует много других возможных преобразований, стабилизирующих дисперсию для распределения Пуассона. Бар-Лев и Энис сообщают [2] о семействе таких преобразований, которое включает преобразование Анскомба. Другим членом семейства является преобразование Фримена-Тьюки [5]

A : x x + 1 + x . {\displaystyle A:x\mapsto {\sqrt {x+1}}+{\sqrt {x}}.\,}

Упрощенное преобразование, полученное как примитив обратной величины стандартного отклонения данных , имеет вид

A : x 2 x {\displaystyle A:x\mapsto 2{\sqrt {x}}\,}

который, хотя и не так хорош в стабилизации дисперсии, имеет преимущество в том, что его легче понять. Действительно, из метода дельта ,

V [ 2 x ] ( d ( 2 m ) d m ) 2 V [ x ] = ( 1 m ) 2 m = 1 {\displaystyle V[2{\sqrt {x}}]\approx \left({\frac {d(2{\sqrt {m}})}{dm}}\right)^{2}V[x]=\left({\frac {1}{\sqrt {m}}}\right)^{2}m=1} .

Обобщение

Хотя преобразование Анскомба подходит для чистых данных Пуассона, во многих приложениях данные также представляют собой аддитивную гауссовскую компоненту. Эти случаи обрабатываются обобщенным преобразованием Анскомба [6] и его асимптотически несмещенными или точными несмещенными обратными. [7]

Смотрите также

Ссылки

  1. ^ ab Anscombe, FJ (1948), "Преобразование пуассоновских, биномиальных и отрицательно-биномиальных данных", Biometrika , т. 35, № 3–4, [Oxford University Press, Biometrika Trust], стр. 246–254, doi :10.1093/biomet/35.3-4.246, JSTOR  2332343
  2. ^ ab Бар-Лев, SK; Энис, П. (1988), "О классическом выборе преобразований, стабилизирующих дисперсию, и применении для переменной Пуассона", Biometrika , т. 75, № 4, стр. 803–804, doi :10.1093/biomet/75.4.803
  3. ^ Mäkitalo, M.; Foi, A. (2011), "Оптимальная инверсия преобразования Анскомба при низкочастотном подавлении шума Пуассона на изображениях", IEEE Transactions on Image Processing , т. 20, № 1, стр. 99–109, Bibcode : 2011ITIP...20...99M, CiteSeerX 10.1.1.219.6735 , doi : 10.1109/TIP.2010.2056693, PMID  20615809, S2CID  10229455 
  4. ^ Mäkitalo, M.; Foi, A. (2011), «Аппроксимация в замкнутой форме точной несмещенной обратной функции преобразования Anscombe, стабилизирующего дисперсию», IEEE Transactions on Image Processing , т. 20, № 9, стр. 2697–2698, Bibcode : 2011ITIP...20.2697M, doi : 10.1109/TIP.2011.2121085, PMID  21356615, S2CID  7937596
  5. ^ Freeman, MF; Tukey, JW (1950), «Преобразования, связанные с угловым и квадратным корнем», The Annals of Mathematical Statistics , т. 21, № 4, стр. 607–611, doi : 10.1214/aoms/1177729756 , JSTOR  2236611
  6. ^ Старк, Дж. Л.; Муртаг, Ф.; Бижауи, А. (1998). Обработка изображений и анализ данных . Cambridge University Press. ISBN 9780521599146.
  7. ^ Mäkitalo, M.; Foi, A. (2013), "Оптимальная инверсия обобщенного преобразования Анскомба для шума Пуассона-Гаусса", IEEE Transactions on Image Processing , т. 22, № 1, стр. 91–103, Bibcode : 2013ITIP...22...91M, doi : 10.1109/TIP.2012.2202675, PMID  22692910, S2CID  206724566

Дальнейшее чтение

  • Старк, Дж.-Л.; Муртаг, Ф. (2001), «Астрономические изображения и обработка сигналов: взгляд на шум, информацию и масштаб», журнал Signal Processing Magazine, IEEE , т. 18, № 2, стр. 30–40, Bibcode : 2001ISPM...18...30S, doi : 10.1109/79.916319, S2CID  13210703
Retrieved from "https://en.wikipedia.org/w/index.php?title=Anscombe_transform&oldid=1241965893"