Распределение в упакованном виде

В теории вероятностей и направленной статистике обернутое распределение вероятностей — это непрерывное распределение вероятностей , которое описывает точки данных, лежащие на единичной n -сфере . В одном измерении обернутое распределение состоит из точек на единичной окружности . Если — случайная величина в интервале с функцией плотности вероятности (PDF) , то — круговая переменная, распределенная в соответствии с обернутым распределением , а — угловая переменная в интервале, распределенная в соответствии с обернутым распределением . ϕ {\displaystyle \фи} ( , ) {\displaystyle (-\infty,\infty)} п ( ϕ ) {\displaystyle p(\фи)} з = е я ϕ {\displaystyle z=e^{i\phi}} п ж з ( θ ) {\displaystyle p_{wz}(\theta)} θ = арг ( з ) {\displaystyle \theta =\arg (z)} ( π , π ] {\displaystyle (-\пи ,\пи ]} п ж ( θ ) {\displaystyle p_ {w}(\theta)}

Любая функция плотности вероятности на линии может быть «обернута» вокруг окружности единичного радиуса. [1] То есть, PDF обернутой переменной п ( ϕ ) {\displaystyle p(\фи)}

θ = ϕ мод 2 π {\displaystyle \theta =\phi \mod 2\pi} в некотором интервале длины 2 π {\displaystyle 2\пи}

является

п ж ( θ ) = к = п ( θ + 2 π к ) {\displaystyle p_{w}(\theta)=\sum _{k=-\infty }^{\infty }{p(\theta +2\pi k)}}

который является периодической суммой периода . Предпочтительный интервал обычно для которого . 2 π {\displaystyle 2\пи} ( π < θ π ) {\displaystyle (-\pi <\theta \leq \pi)} вн ( е я θ ) = арг ( е я θ ) = θ {\ displaystyle \ ln (e ^ {i \ theta}) = \ arg (e ^ {i \ theta}) = \ theta }

Теория

В большинстве ситуаций процесс, включающий круговую статистику, производит углы ( ), которые лежат в интервале , и описываются "развернутой" функцией плотности вероятности . Однако измерение даст угол , который лежит в некотором интервале длины (например, от 0 до ). Другими словами, измерение не может сказать , был ли измерен истинный угол или свернутый угол , где - некоторое неизвестное целое число. ϕ {\displaystyle \фи} ( , ) {\displaystyle (-\infty,\infty)} п ( ϕ ) {\displaystyle p(\фи)} θ {\displaystyle \тета} 2 π {\displaystyle 2\пи} 2 π {\displaystyle 2\пи} ϕ {\displaystyle \фи} θ = ϕ + 2 π а {\displaystyle \theta =\phi +2\pi a} а {\displaystyle а}

Если мы хотим вычислить ожидаемое значение некоторой функции измеренного угла, то оно будет:

ф ( θ ) = п ( ϕ ) ф ( ϕ + 2 π а ) г ϕ {\displaystyle \langle f(\theta)\rangle =\int _{-\infty }^{\infty }p(\phi)f(\phi +2\pi a)d\phi } .

Мы можем выразить интеграл как сумму интегралов по периодам : 2 π {\displaystyle 2\пи}

ф ( θ ) = к = 2 π к 2 π ( к + 1 ) п ( ϕ ) ф ( ϕ + 2 π а ) г ϕ {\displaystyle \langle f(\theta )\rangle =\sum _{k=-\infty }^{\infty }\int _{2\pi k}^{2\pi (k+1)}p(\phi )f(\phi +2\pi a)d\phi } .

Меняя переменную интегрирования на и меняя порядок интегрирования и суммирования, имеем θ = ϕ 2 π k {\displaystyle \theta '=\phi -2\pi k}

f ( θ ) = 0 2 π p w ( θ ) f ( θ + 2 π a ) d θ {\displaystyle \langle f(\theta )\rangle =\int _{0}^{2\pi }p_{w}(\theta ')f(\theta '+2\pi a')d\theta '}

где — PDF обернутого распределения, а — еще одно неизвестное целое число . Неизвестное целое число вносит неоднозначность в ожидаемое значение , аналогично проблеме вычисления углового среднего . Это можно решить, введя параметр , поскольку имеет однозначную связь с истинным углом : p w ( θ ) {\displaystyle p_{w}(\theta ')} a {\displaystyle a'} ( a = a + k ) {\displaystyle (a'=a+k)} a {\displaystyle a'} f ( θ ) {\displaystyle f(\theta )} z = e i θ {\displaystyle z=e^{i\theta }} z {\displaystyle z} ϕ {\displaystyle \phi }

z = e i θ = e i ϕ {\displaystyle z=e^{i\theta }=e^{i\phi }} .

Вычисление ожидаемого значения функции даст однозначные ответы: z {\displaystyle z}

f ( z ) = 0 2 π p w ( θ ) f ( e i θ ) d θ {\displaystyle \langle f(z)\rangle =\int _{0}^{2\pi }p_{w}(\theta ')f(e^{i\theta '})d\theta '} .

По этой причине параметр предпочтительнее измеренных углов в круговом статистическом анализе. Это предполагает, что обернутая функция распределения сама по себе может быть выражена как функция от такой, что: z {\displaystyle z} θ {\displaystyle \theta } z {\displaystyle z}

f ( z ) = p w z ( z ) f ( z ) d z {\displaystyle \langle f(z)\rangle =\oint p_{wz}(z)f(z)\,dz}

где определяется таким образом , что . Эту концепцию можно распространить на многомерный контекст путем расширения простой суммы до ряда сумм, которые охватывают все измерения в пространстве признаков: p w ( z ) {\displaystyle p_{w}(z)} p w ( θ ) | d θ | = p w z ( z ) | d z | {\displaystyle p_{w}(\theta )\,|d\theta |=p_{wz}(z)\,|dz|} F {\displaystyle F}

p w ( θ ) = k 1 , . . . , k F = p ( θ + 2 π k 1 e 1 + + 2 π k F e F ) {\displaystyle p_{w}({\vec {\theta }})=\sum _{k_{1},...,k_{F}=-\infty }^{\infty }{p({\vec {\theta }}+2\pi k_{1}\mathbf {e} _{1}+\dots +2\pi k_{F}\mathbf {e} _{F})}}

где - -й евклидов базисный вектор. e k = ( 0 , , 0 , 1 , 0 , , 0 ) T {\displaystyle \mathbf {e} _{k}=(0,\dots ,0,1,0,\dots ,0)^{\mathsf {T}}} k {\displaystyle k}

Выражение через характеристические функции

Фундаментальным обернутым распределением является гребень Дирака , который представляет собой обернутую дельта-функцию Дирака :

Δ 2 π ( θ ) = k = δ ( θ + 2 π k ) {\displaystyle \Delta _{2\pi }(\theta )=\sum _{k=-\infty }^{\infty }{\delta (\theta +2\pi k)}} .

Используя дельта-функцию, можно записать общее обернутое распределение

p w ( θ ) = k = p ( θ ) δ ( θ θ + 2 π k ) d θ {\displaystyle p_{w}(\theta )=\sum _{k=-\infty }^{\infty }\int _{-\infty }^{\infty }p(\theta ')\delta (\theta -\theta '+2\pi k)\,d\theta '} .

Меняя порядок суммирования и интегрирования, любое свернутое распределение можно записать в виде свертки развернутого распределения и гребня Дирака:

p w ( θ ) = p ( θ ) Δ 2 π ( θ θ ) d θ {\displaystyle p_{w}(\theta )=\int _{-\infty }^{\infty }p(\theta ')\Delta _{2\pi }(\theta -\theta ')\,d\theta '} .

Гребень Дирака также можно выразить как сумму экспонент, поэтому мы можем записать:

p w ( θ ) = 1 2 π p ( θ ) n = e i n ( θ θ ) d θ {\displaystyle p_{w}(\theta )={\frac {1}{2\pi }}\,\int _{-\infty }^{\infty }p(\theta ')\sum _{n=-\infty }^{\infty }e^{in(\theta -\theta ')}\,d\theta '} .

Снова меняем порядок суммирования и интегрирования:

p w ( θ ) = 1 2 π n = p ( θ ) e i n ( θ θ ) d θ {\displaystyle p_{w}(\theta )={\frac {1}{2\pi }}\,\sum _{n=-\infty }^{\infty }\int _{-\infty }^{\infty }p(\theta ')e^{in(\theta -\theta ')}\,d\theta '} .

Используя определение , характеристическая функция дает ряд Лорана около нуля для обернутого распределения в терминах характеристической функции развернутого распределения: ϕ ( s ) {\displaystyle \phi (s)} p ( θ ) {\displaystyle p(\theta )}

p w ( θ ) = 1 2 π n = ϕ ( n ) e i n θ {\displaystyle p_{w}(\theta )={\frac {1}{2\pi }}\,\sum _{n=-\infty }^{\infty }\phi (n)\,e^{-in\theta }}

или

p w z ( z ) = 1 2 π n = ϕ ( n ) z n {\displaystyle p_{wz}(z)={\frac {1}{2\pi }}\,\sum _{n=-\infty }^{\infty }\phi (n)\,z^{-n}}

Аналогично линейным распределениям, называется характеристической функцией обернутого распределения (или, точнее, характеристической последовательностью ). [2] Это пример формулы суммирования Пуассона , и можно видеть, что коэффициенты ряда Фурье для обернутого распределения являются просто коэффициентами преобразования Фурье развернутого распределения при целочисленных значениях. ϕ ( m ) {\displaystyle \phi (m)}

Моменты

Моменты обернутого распределения определяются как: p w ( z ) {\displaystyle p_{w}(z)}

z m = p w z ( z ) z m d z {\displaystyle \langle z^{m}\rangle =\oint p_{wz}(z)z^{m}\,dz} .

Выражая через характеристическую функцию и меняя порядок интегрирования и суммирования, получаем: p w ( z ) {\displaystyle p_{w}(z)}

z m = 1 2 π n = ϕ ( n ) z m n d z {\displaystyle \langle z^{m}\rangle ={\frac {1}{2\pi }}\sum _{n=-\infty }^{\infty }\phi (n)\oint z^{m-n}\,dz} .

Из теоремы о вычетах имеем

z m n d z = 2 π δ m n {\displaystyle \oint z^{m-n}\,dz=2\pi \delta _{m-n}}

где — дельта-функция Кронекера . Отсюда следует, что моменты просто равны характеристической функции развернутого распределения для целочисленных аргументов: δ k {\displaystyle \delta _{k}}

z m = ϕ ( m ) {\displaystyle \langle z^{m}\rangle =\phi (m)} .

Генерация случайных величин

Если — случайная величина, полученная из линейного распределения вероятностей , то — круговая величина, распределенная в соответствии с обернутым распределением, а — угловая величина, распределенная в соответствии с обернутым распределением, причем . X {\displaystyle X} P {\displaystyle P} Z = e i X {\displaystyle Z=e^{iX}} P {\displaystyle P} θ = arg ( Z ) {\displaystyle \theta =\arg(Z)} P {\displaystyle P} π < θ π {\displaystyle -\pi <\theta \leq \pi }

Энтропия

Информационная энтропия кругового распределения с плотностью вероятности определяется как: p w ( θ ) {\displaystyle p_{w}(\theta )}

H = Γ p w ( θ ) ln ( p w ( θ ) ) d θ {\displaystyle H=-\int _{\Gamma }p_{w}(\theta )\,\ln(p_{w}(\theta ))\,d\theta }

где — любой интервал длины . [1] Если и плотность вероятности, и ее логарифм можно выразить в виде ряда Фурье (или, в более общем случае, любого интегрального преобразования на окружности), то ортогональный базис ряда можно использовать для получения замкнутого выражения для энтропии. Γ {\displaystyle \Gamma } 2 π {\displaystyle 2\pi }

Моменты распределения являются коэффициентами Фурье для разложения плотности вероятности в ряд Фурье: ϕ ( n ) {\displaystyle \phi (n)}

p w ( θ ) = 1 2 π n = ϕ n e i n θ {\displaystyle p_{w}(\theta )={\frac {1}{2\pi }}\sum _{n=-\infty }^{\infty }\phi _{n}e^{-in\theta }} .

Если логарифм плотности вероятности также можно выразить в виде ряда Фурье:

ln ( p w ( θ ) ) = m = c m e i m θ {\displaystyle \ln(p_{w}(\theta ))=\sum _{m=-\infty }^{\infty }c_{m}e^{im\theta }}

где

c m = 1 2 π Γ ln ( p w ( θ ) ) e i m θ d θ {\displaystyle c_{m}={\frac {1}{2\pi }}\int _{\Gamma }\ln(p_{w}(\theta ))e^{-im\theta }\,d\theta } .

Тогда, поменяв порядок интегрирования и суммирования, энтропию можно записать в виде:

H = 1 2 π m = n = c m ϕ n Γ e i ( m n ) θ d θ {\displaystyle H=-{\frac {1}{2\pi }}\sum _{m=-\infty }^{\infty }\sum _{n=-\infty }^{\infty }c_{m}\phi _{n}\int _{\Gamma }e^{i(m-n)\theta }\,d\theta } .

Используя ортогональность базиса Фурье, интеграл можно свести к:

H = n = c n ϕ n {\displaystyle H=-\sum _{n=-\infty }^{\infty }c_{n}\phi _{n}} .

Для частного случая, когда плотность вероятности симметрична относительно среднего значения, а логарифм можно записать: c m = c m {\displaystyle c_{-m}=c_{m}}

ln ( p w ( θ ) ) = c 0 + 2 m = 1 c m cos ( m θ ) {\displaystyle \ln(p_{w}(\theta ))=c_{0}+2\sum _{m=1}^{\infty }c_{m}\cos(m\theta )}

и

c m = 1 2 π Γ ln ( p w ( θ ) ) cos ( m θ ) d θ {\displaystyle c_{m}={\frac {1}{2\pi }}\int _{\Gamma }\ln(p_{w}(\theta ))\cos(m\theta )\,d\theta }

и, поскольку нормализация требует, чтобы , энтропия может быть записана: ϕ 0 = 1 {\displaystyle \phi _{0}=1}

H = c 0 2 n = 1 c n ϕ n {\displaystyle H=-c_{0}-2\sum _{n=1}^{\infty }c_{n}\phi _{n}} .

Смотрите также

Ссылки

  1. ^ аб Мардия, Кантилал ; Юпп, Питер Э. (1999). Направленная статистика . Уайли. ISBN 978-0-471-95333-3.
  2. ^ Мардиа, К. (1972). Статистика направленных данных. Нью-Йорк: Academic Press. ISBN 978-1-4832-1866-3.
  • Боррадейл, Грэм (2003). Статистика данных наук о Земле. Спрингер. ISBN 978-3-540-43603-4.
  • Фишер, NI (1996). Статистический анализ круговых данных. Cambridge University Press. ISBN 978-0-521-56890-6.
  • Круговые значения Математика и статистика с C++11, инфраструктура C++11 для круговых значений (углы, время суток и т. д.) Математика и статистика

Retrieved from "https://en.wikipedia.org/w/index.php?title=Wrapped_distribution&oldid=1222700345"