Распределение Скеллама

Скеллам
Функция массы вероятности
Примеры функции массы вероятности для распределения Скеллама.
Примеры функции массы вероятности для распределения Скеллама. Горизонтальная ось — индекс k . (Функция определена только при целых значениях k . Соединительные линии не указывают на непрерывность.)
Параметры μ 1 0 ,     μ 2 0 {\displaystyle \mu _{1}\geq 0,~~\mu _{2}\geq 0}
Поддерживать к { , 2 , 1 , 0 , 1 , 2 , } {\displaystyle k\in \{\ldots ,-2,-1,0,1,2,\ldots \}}
ПМФ е ( μ 1 + μ 2 ) ( μ 1 μ 2 ) к / 2 я к ( 2 μ 1 μ 2 ) {\displaystyle e^{-(\mu _{1}\!+\!\mu _{2})}\left({\frac {\mu _{1}}{\mu _{2}}}\right)^{k/2}\!\!I_{k}(2{\sqrt {\mu _{1}\mu _{2}}})}
Иметь в виду μ 1 μ 2 {\displaystyle \mu _{1}-\mu _{2}\,}
МедианаН/Д
Дисперсия μ 1 + μ 2 {\displaystyle \mu _{1}+\mu _{2}\,}
Асимметрия μ 1 μ 2 ( μ 1 + μ 2 ) 3 / 2 {\displaystyle {\frac {\mu _{1}-\mu _{2}}{(\mu _{1}+\mu _{2})^{3/2}}}}
Избыточный эксцесс 1 μ 1 + μ 2 {\displaystyle {\frac {1}{\mu _{1}+\mu _{2}}}}
МГФ е ( μ 1 + μ 2 ) + μ 1 е т + μ 2 е т {\displaystyle е^{-(\mu _{1}+\mu _{2})+\mu _{1}e^{t}+\mu _{2}e^{-t}}}
CF е ( μ 1 + μ 2 ) + μ 1 е я т + μ 2 е я т {\displaystyle e^{-(\mu _{1}+\mu _{2})+\mu _{1}e^{it}+\mu _{2}e^{-it}}}

Распределение Скеллама — это дискретное распределение вероятностей разности двух статистически независимых случайных величин , каждая из которых распределена по закону Пуассона с соответствующими ожидаемыми значениями и . Оно полезно при описании статистики разности двух изображений с простым фотонным шумом , а также при описании распределения разброса точек в видах спорта, где все набранные очки равны, например, в бейсболе , хоккее и футболе . Н 1 Н 2 {\displaystyle N_{1}-N_{2}} Н 1 {\displaystyle N_{1}} Н 2 , {\displaystyle N_{2},} μ 1 {\displaystyle \mu _{1}} μ 2 {\displaystyle \mu _{2}}

Распределение также применимо к частному случаю разности зависимых случайных величин Пуассона, но только к очевидному случаю, когда две переменные имеют общий аддитивный случайный вклад, который отменяется разностью: см. Karlis & Ntzoufras (2003) для получения подробной информации и применения.

Функция массы вероятности для распределения Скеллама для разности двух независимых случайных величин, распределенных по закону Пуассона, со средними значениями и определяется по формуле: К = Н 1 Н 2 {\displaystyle K=N_{1}-N_{2}} μ 1 {\displaystyle \mu _{1}} μ 2 {\displaystyle \mu _{2}}

п ( к ; μ 1 , μ 2 ) = Пр { К = к } = е ( μ 1 + μ 2 ) ( μ 1 μ 2 ) к / 2 я к ( 2 μ 1 μ 2 ) {\displaystyle p(k;\mu _{1},\mu _{2})=\Pr\{K=k\}=e^{-(\mu _{1}+\mu _{2})}\left({\mu _{1} \over \mu _{2}}\right)^{k/2}I_{k}(2{\sqrt {\mu _{1}\mu _{2}}})}

где I k ( z ) — модифицированная функция Бесселя первого рода. Поскольку k — целое число, то I k ( z )= I |k| ( z ).

Вывод

Функция массы вероятности случайной величины , распределенной по закону Пуассона со средним значением μ, определяется выражением

п ( к ; μ ) = μ к к ! е μ . {\displaystyle p(k;\mu)={\mu ^{k} \over k!}e^{-\mu }.\,}

для (и ноль в противном случае). Вероятностная массовая функция Скеллама для разности двух независимых отсчетов представляет собой свертку двух распределений Пуассона: ( Скеллам , 1946) к 0 {\displaystyle k\geq 0} К = Н 1 Н 2 {\displaystyle K=N_{1}-N_{2}}

п ( к ; μ 1 , μ 2 ) = н = п ( к + н ; μ 1 ) п ( н ; μ 2 ) = е ( μ 1 + μ 2 ) н = макс ( 0 , к ) μ 1 к + н μ 2 н н ! ( к + н ) ! {\displaystyle {\begin{aligned}p(k;\mu _{1},\mu _{2}) &=\sum _{n=-\infty }^{\infty }p(k+n; \mu _{1})p(n;\mu _{2})\\&=e^{-(\mu _{1}+\mu _{2})}\sum _{n=\max (0,-k)}^{\infty }{{\mu _{1}^{k+n}\mu _{2}^{n}} \over {n!(k+n)!}} \end{выровнено}}}

Поскольку распределение Пуассона равно нулю для отрицательных значений счетчика , вторая сумма берется только для тех членов, где и . Можно показать, что приведенная выше сумма подразумевает, что ( п ( Н < 0 ; μ ) = 0 ) {\displaystyle (p(N<0;\mu)=0)} н 0 {\displaystyle n\geq 0} н + к 0 {\displaystyle n+k\geq 0}

п ( к ; μ 1 , μ 2 ) п ( к ; μ 1 , μ 2 ) = ( μ 1 μ 2 ) к {\displaystyle {\frac {p(k;\mu _{1},\mu _{2})}{p(-k;\mu _{1},\mu _{2})}}=\left({\frac {\mu _{1}}{\mu _{2}}}\right)^{k}}

так что:

п ( к ; μ 1 , μ 2 ) = е ( μ 1 + μ 2 ) ( μ 1 μ 2 ) к / 2 я | к | ( 2 μ 1 μ 2 ) {\displaystyle p(k;\mu _{1},\mu _{2})=e^{-(\mu _{1}+\mu _{2})}\left({\mu _{1} \over \mu _{2}}\right)^{k/2}I_{|k|}(2{\sqrt {\mu _{1}\mu _{2}}})}

где I  k (z) — модифицированная функция Бесселя первого рода. Частный случай для дан Ирвином (1937): μ 1 = μ 2 ( = μ ) {\displaystyle \mu _{1} =\mu _{2}(=\mu)}

п ( к ; μ , μ ) = е 2 μ я | к | ( 2 μ ) . {\displaystyle p\left(k;\mu ,\mu \right)=e^{-2\mu }I_{|k|}(2\mu ).}

Используя предельные значения модифицированной функции Бесселя для малых аргументов, мы можем восстановить распределение Пуассона как частный случай распределения Скеллама для . μ 2 = 0 {\displaystyle \mu _{2}=0}

Характеристики

Поскольку это дискретная функция вероятности, функция массы вероятности Скеллама нормализована:

к = п ( к ; μ 1 , μ 2 ) = 1. {\displaystyle \sum _{k=-\infty }^{\infty }p(k;\mu _{1},\mu _{2})=1.}

Мы знаем, что функция генерации вероятности (pgf) для распределения Пуассона имеет вид:

Г ( т ; μ ) = е μ ( т 1 ) . {\displaystyle G\left(t;\mu \right)=e^{\mu (t-1)}.}

Отсюда следует, что pgf, для функции массы вероятности Скеллама будет: Г ( т ; μ 1 , μ 2 ) {\displaystyle G(t;\mu _{1},\mu _{2})}

Г ( т ; μ 1 , μ 2 ) = к = п ( к ; μ 1 , μ 2 ) т к = Г ( т ; μ 1 ) Г ( 1 / т ; μ 2 ) = е ( μ 1 + μ 2 ) + μ 1 т + μ 2 / т . {\displaystyle {\begin{align}G(t;\mu _{1},\mu _{2})&=\sum _{k=-\infty }^{\infty }p(k;\mu _{1},\mu _{2})t^{k}\\[4pt]&=G\left(t;\mu _{1}\right)G\left(1/t;\mu _{2}\right)\\[4pt]&=e^{-(\mu _{1}+\mu _{2})+\mu _{1}t+\mu _{2}/t}.\end{align}}}

Обратите внимание, что форма функции генерации вероятности подразумевает, что распределение сумм или разностей любого числа независимых переменных, распределенных по Скелламу, снова распределено по Скелламу. Иногда утверждается, что любая линейная комбинация двух переменных, распределенных по Скелламу, снова распределена по Скелламу, но это явно неверно, поскольку любой множитель, отличный от , изменил бы поддержку распределения и изменил бы структуру моментов таким образом, что никакое распределение Скеллама не может этого удовлетворить. ± 1 {\displaystyle \pm 1}

Функция , генерирующая момент, определяется выражением:

М ( т ; μ 1 , μ 2 ) = Г ( е т ; μ 1 , μ 2 ) = к = 0 т к к ! м к {\displaystyle M\left(t;\mu _{1},\mu _{2}\right)=G(e^{t};\mu _{1},\mu _{2})=\sum _{k=0}^{\infty }{t^{k} \over k!}\,m_{k}}

что дает сырые моменты m k  . Определить:

Δ   = г е ф   μ 1 μ 2 {\displaystyle \Delta \ {\stackrel {\mathrm {def} }{=}}\ \mu _{1}-\mu _{2}\,}
μ   = г е ф   ( μ 1 + μ 2 ) / 2. {\displaystyle \mu \ {\stackrel {\mathrm {def} }{=}} \ (\mu _{1}+\mu _{2})/2.\,}

Тогда исходные моменты m k равны

м 1 = Δ {\displaystyle m_{1}=\left.\Delta \right.\,}
м 2 = 2 μ + Δ 2 {\displaystyle m_{2}=\left.2\mu +\Delta ^{2}\right.\,}
м 3 = Δ ( 1 + 6 μ + Δ 2 ) {\displaystyle m_{3}=\left.\Delta (1+6\mu +\Delta ^{2})\right.\,}

Центральные моменты M k равны

М 2 = 2 μ , {\displaystyle M_{2}=\left.2\mu \right.,\,}
М 3 = Δ , {\displaystyle M_{3}=\left.\Delta \right.,\,}
M 4 = 2 μ + 12 μ 2 . {\displaystyle M_{4}=\left.2\mu +12\mu ^{2}\right..\,}

Среднее значение , дисперсия , асимметрия и эксцесс соответственно равны:

E ( n ) = Δ , σ 2 = 2 μ , γ 1 = Δ / ( 2 μ ) 3 / 2 , γ 2 = 1 / 2. {\displaystyle {\begin{aligned}\operatorname {E} (n)&=\Delta ,\\[4pt]\sigma ^{2}&=2\mu ,\\[4pt]\gamma _{1}&=\Delta /(2\mu )^{3/2},\\[4pt]\gamma _{2}&=1/2.\end{aligned}}}

Функция , генерирующая кумулянт, определяется по формуле:

K ( t ; μ 1 , μ 2 )   = d e f   ln ( M ( t ; μ 1 , μ 2 ) ) = k = 0 t k k ! κ k {\displaystyle K(t;\mu _{1},\mu _{2})\ {\stackrel {\mathrm {def} }{=}}\ \ln(M(t;\mu _{1},\mu _{2}))=\sum _{k=0}^{\infty }{t^{k} \over k!}\,\kappa _{k}}

что дает кумулянты :

κ 2 k = 2 μ {\displaystyle \kappa _{2k}=\left.2\mu \right.}
κ 2 k + 1 = Δ . {\displaystyle \kappa _{2k+1}=\left.\Delta \right..}

Для частного случая, когда μ 1 = μ 2 , асимптотическое разложение модифицированной функции Бесселя первого рода дает при больших μ:

p ( k ; μ , μ ) 1 4 π μ [ 1 + n = 1 ( 1 ) n { 4 k 2 1 2 } { 4 k 2 3 2 } { 4 k 2 ( 2 n 1 ) 2 } n ! 2 3 n ( 2 μ ) n ] . {\displaystyle p(k;\mu ,\mu )\sim {1 \over {\sqrt {4\pi \mu }}}\left[1+\sum _{n=1}^{\infty }(-1)^{n}{\{4k^{2}-1^{2}\}\{4k^{2}-3^{2}\}\cdots \{4k^{2}-(2n-1)^{2}\} \over n!\,2^{3n}\,(2\mu )^{n}}\right].}

(Абрамовиц и Стеган, 1972, стр. 377). Кроме того, для этого особого случая, когда k также велико и имеет порядок квадратного корня из 2μ, распределение стремится к нормальному распределению :

p ( k ; μ , μ ) e k 2 / 4 μ 4 π μ . {\displaystyle p(k;\mu ,\mu )\sim {e^{-k^{2}/4\mu } \over {\sqrt {4\pi \mu }}}.}

Эти частные результаты можно легко распространить на более общий случай различных средств.

Пределы веса выше нуля

Если , с , то X Skellam ( μ 1 , μ 2 ) {\displaystyle X\sim \operatorname {Skellam} (\mu _{1},\mu _{2})} μ 1 < μ 2 {\displaystyle \mu _{1}<\mu _{2}}

exp ( ( μ 1 μ 2 ) 2 ) ( μ 1 + μ 2 ) 2 e ( μ 1 + μ 2 ) 2 μ 1 μ 2 e ( μ 1 + μ 2 ) 4 μ 1 μ 2 Pr { X 0 } exp ( ( μ 1 μ 2 ) 2 ) {\displaystyle {\frac {\exp(-({\sqrt {\mu _{1}}}-{\sqrt {\mu _{2}}})^{2})}{(\mu _{1}+\mu _{2})^{2}}}-{\frac {e^{-(\mu _{1}+\mu _{2})}}{2{\sqrt {\mu _{1}\mu _{2}}}}}-{\frac {e^{-(\mu _{1}+\mu _{2})}}{4\mu _{1}\mu _{2}}}\leq \Pr\{X\geq 0\}\leq \exp(-({\sqrt {\mu _{1}}}-{\sqrt {\mu _{2}}})^{2})}

Подробности можно найти в разделе Распределение Пуассона#Распределение Пуассона

Ссылки

  • Абрамовиц, Милтон; Стиган, Ирен А., ред. (июнь 1965 г.). Справочник математических функций с формулами, графиками и математическими таблицами (Несокращенная и неизмененная републ. [der Ausg.] 1964, 5. Издательство Dover). Dover Publications. стр. 374–378. ISBN 0486612724. Получено 27 сентября 2012 г.
  • Ирвин, Дж. О. (1937) «Частотное распределение разности между двумя независимыми переменными, следующее одному и тому же распределению Пуассона». Журнал Королевского статистического общества : Серия A , 100 (3), 415–416. JSTOR  2980526
  • Карлис, Д. и Нтзуфрас, И. (2003) «Анализ спортивных данных с использованием двумерных моделей Пуассона». Журнал Королевского статистического общества, Серия D , 52 (3), 381–393. doi :10.1111/1467-9884.00366
  • Карлис Д. и Нтзуфрас И. (2006). Байесовский анализ различий в данных подсчета. Статистика в медицине , 25, 1885–1905. [1]
  • Скеллам, Дж. Г. (1946) «Частотное распределение разницы между двумя переменными Пуассона, принадлежащими к разным популяциям». Журнал Королевского статистического общества, Серия A , 109 (3), 296. JSTOR  2981372

Смотрите также


Retrieved from "https://en.wikipedia.org/w/index.php?title=Skellam_distribution&oldid=1161277886"