Обобщенное логистическое распределение

Название для нескольких различных семейств распределений вероятностей

Термин обобщенное логистическое распределение используется как название для нескольких различных семейств распределений вероятностей . Например, Джонсон и др. [1] перечисляют четыре формы, которые перечислены ниже.

Тип I также называется косо-логистическим распределением . Тип IV включает в себя другие типы и получается при применении логит- преобразования к бета- случайным переменным. Следуя той же конвенции, что и для логарифмически нормального распределения , тип IV может называться логистическо-бета-распределением со ссылкой на стандартную логистическую функцию , которая является обратной логит-преобразованию.

Для других семейств распределений, которые также называются обобщенными логистическими распределениями, см. смещенное логарифмически-логистическое распределение , которое является обобщением логарифмически -логистического распределения ; и металогическое («металогистическое») распределение , которое обладает высокой гибкостью формы и границ и может быть подогнано к данным с помощью линейного метода наименьших квадратов.

Определения

Следующие определения предназначены для стандартизированных версий семейств, которые могут быть расширены до полной формы как семейство масштаба местоположения . Каждое из них определяется с использованием либо кумулятивной функции распределения ( F ), либо функции плотности вероятности ( ƒ ), и определяется на (-∞,∞).

Тип I

Ф ( х ; α ) = 1 ( 1 + е х ) α ( 1 + е х ) α , α > 0. {\displaystyle F(x;\alpha)={\frac {1}{(1+e^{-x})^{\alpha }}}\equiv (1+e^{-x})^{- \alpha },\quad \alpha >0.}

Соответствующая функция плотности вероятности имеет вид:

ф ( х ; α ) = α е х ( 1 + е х ) α + 1 , α > 0. {\displaystyle f(x;\alpha )={\frac {\alpha e^{-x}}{\left(1+e^{-x}\right)^{\alpha +1}}},\quad \alpha >0.}

Этот тип распределения также называют «косо-логистическим».

Тип II

Ф ( х ; α ) = 1 е α х ( 1 + е х ) α , α > 0. {\displaystyle F(x;\alpha)=1- {\frac {e^{-\alpha x}}{(1+e^{-x})^{\alpha }}},\quad \alpha > 0.}

Соответствующая функция плотности вероятности имеет вид:

ф ( х ; α ) = α е α х ( 1 + е х ) α + 1 , α > 0. {\displaystyle f(x;\alpha)={\frac {\alpha e^{-\alpha x}}{(1+e^{-x})^{\alpha +1}}},\quad \ альфа >0.}

Тип III

ф ( х ; α ) = 1 Б ( α , α ) е α х ( 1 + е х ) 2 α , α > 0. {\displaystyle f(x;\alpha)={\frac {1}{B(\alpha,\alpha)}}{\frac {e^{-\alpha x}}{(1+e^{-x })^{2\alpha }}},\quad \alpha >0.}

Здесь Bбета-функция . Функция генерации моментов для этого типа:

М ( т ) = Г ( α т ) Г ( α + т ) ( Г ( α ) ) 2 , α < т < α . {\displaystyle M(t)={\frac {\Gamma (\alpha -t)\Gamma (\alpha +t)}{(\Gamma (\alpha ))^{2}}},\quad -\alpha <t<\alpha .}

Соответствующая кумулятивная функция распределения имеет вид:

Ф ( х ; α ) = ( е х + 1 ) Г ( α ) е α ( х ) ( е х + 1 ) 2 α 2 Ф ~ 1 ( 1 , 1 α ; α + 1 ; е х ) Б ( α , α ) , α > 0. {\displaystyle F(x;\alpha)={\frac {\left(e^{x}+1\right)\Gamma (\alpha)e^{\alpha (-x)}\left(e^{-x}+1\right)^{-2\alpha}\,_{2}{\tilde {F}}_{1}\left(1,1-\alpha;\alpha +1;-e^{x}\right)}{B(\alpha,\alpha)}},\quad \alpha >0.}

Тип IV

ф ( х ; α , β ) = 1 Б ( α , β ) е β х ( 1 + е х ) α + β , α , β > 0 = σ ( х ) α σ ( х ) β Б ( α , β ) . {\displaystyle {\begin{align}f(x;\alpha,\beta)&={\frac {1}{B(\alpha,\beta)}}{\frac {e^{-\beta x}}{(1+e^{-x})^{\alpha +\beta}}},\quad \alpha,\beta >0\\[4pt]&={\frac {\sigma (x)^{\alpha}\sigma (-x)^{\beta}}{B(\alpha,\beta)}}.\end{align}}}

Где, Bбета-функция , а — стандартная логистическая функция . Функция генерации моментов для этого типа — σ ( х ) = 1 / ( 1 + е х ) {\displaystyle \сигма (x)=1/(1+e^{-x})}

М ( т ) = Г ( β т ) Г ( α + т ) Г ( α ) Г ( β ) , α < т < β . {\displaystyle M(t)={\frac {\Gamma (\beta -t)\Gamma (\alpha +t)}{\Gamma (\alpha )\Gamma (\beta )}},\quad -\alpha <t<\beta .}

Этот тип также называют «экспоненциальной обобщенной бетой второго типа». [1]

Соответствующая кумулятивная функция распределения имеет вид:

Ф ( х ; α , β ) = ( е х + 1 ) Г ( α ) е β ( х ) ( е х + 1 ) α β 2 Ф ~ 1 ( 1 , 1 β ; α + 1 ; е х ) Б ( α , β ) , α , β > 0. {\displaystyle F(x;\alpha,\beta)={\frac {\left(e^{x}+1\right)\Gamma (\alpha)e^{\beta (-x)}\left(e^{-x}+1\right)^{-\alpha -\beta}\,_{2}{\tilde {F}}_{1}\left(1,1-\beta;\alpha +1;-e^{x}\right)}{B(\alpha,\beta)}},\quad \alpha,\beta >0.}

Связь между типами

Тип IV — наиболее общая форма распределения. Распределение типа III можно получить из типа IV, зафиксировав . Распределение типа II можно получить из типа IV, зафиксировав (и переименовав в ). Распределение типа I можно получить из типа IV, зафиксировав . Зафиксировав , получаем стандартное логистическое распределение . β = α {\displaystyle \beta =\alpha } α = 1 {\displaystyle \альфа =1} β {\displaystyle \бета} α {\displaystyle \альфа} β = 1 {\displaystyle \бета =1} α = β = 1 {\displaystyle \альфа =\бета =1}

Свойства типа IV (логистическо-бета)

Средние значения и дисперсии были стандартизированы до 0,1 для лучшего сравнения форм.
Плотность распределения вероятностей типа IV (среднее значение=0, дисперсия=1)

Обобщенное логистическое распределение типа IV или логистическое бета- распределение с параметрами поддержки и формы имеет (как показано выше) функцию плотности вероятности (pdf): х Р {\displaystyle x\in \mathbb {R} } α , β > 0 {\displaystyle \альфа,\бета >0}

ф ( х ; α , β ) = 1 Б ( α , β ) е β х ( 1 + е х ) α + β = σ ( х ) α σ ( х ) β Б ( α , β ) , {\displaystyle f(x;\alpha,\beta)={\frac {1}{B(\alpha,\beta)}}{\frac {e^{-\beta x}}{(1+e^{-x})^{\alpha +\beta}}}={\frac {\sigma (x)^{\alpha}\sigma (-x)^{\beta}}{B(\alpha,\beta)}},}

где — стандартная логистическая функция . Функции плотности вероятности для трех различных наборов параметров формы показаны на графике, где распределения были масштабированы и смещены, чтобы дать нулевые средние значения и единичные дисперсии, чтобы облегчить сравнение форм. σ ( х ) = 1 / ( 1 + е х ) {\displaystyle \сигма (x)=1/(1+e^{-x})}

В дальнейшем обозначение будет использоваться для обозначения распределения типа IV. Б σ ( α , β ) {\displaystyle B_{\сигма}(\альфа,\бета)}

Связь с гамма-распределением

Это распределение можно получить в терминах гамма-распределения следующим образом. Пусть и независимо , и пусть . Тогда . [2] у Гамма ( α , γ ) {\displaystyle y\sim {\text{Гамма}}(\альфа ,\гамма )} з Гамма ( β , γ ) {\displaystyle z\sim {\text{Gamma}}(\beta,\gamma)} х = вн у вн з {\displaystyle x=\ln y-\ln z} х Б σ ( α , β ) {\displaystyle x\sim B_{\sigma }(\alpha ,\beta )}

Симметрия

Если , то . х Б σ ( α , β ) {\displaystyle x\sim B_{\sigma }(\alpha ,\beta )} х Б σ ( β , α ) {\displaystyle -x\sim B_{\sigma }(\beta ,\alpha )}

Среднее значение и дисперсия

Используя логарифмические ожидания гамма-распределения, среднее значение и дисперсию можно вывести следующим образом:

Э [ х ] = ψ ( α ) ψ ( β ) вар [ х ] = ψ ( α ) + ψ ( β ) {\displaystyle {\begin{aligned}{\text{E}}[x]&=\psi (\alpha )-\psi (\beta )\\{\text{var}}[x]&=\psi '(\alpha )+\psi '(\beta )\\\end{aligned}}}

где — дигамма-функция , а — ее первая производная, также известная как тригамма-функция или первая полигамма-функция . Поскольку строго возрастает , знак среднего значения совпадает со знаком . Поскольку строго убывает, параметры формы также можно интерпретировать как параметры концентрации. Действительно, как показано ниже, левый и правый хвосты соответственно становятся тоньше по мере увеличения или . Два члена дисперсии представляют вклады в дисперсию левой и правой частей распределения. ψ {\displaystyle \пси} ψ = ψ ( 1 ) {\displaystyle \psi '=\psi ^{(1)}} ψ {\displaystyle \пси} α β {\displaystyle \альфа -\бета} ψ {\displaystyle \пси '} α {\displaystyle \альфа} β {\displaystyle \бета}

Кумулянты и асимметрия

Функция генерации кумулянта равна , где функция генерации момента приведена выше. Кумулянты , , являются -ыми производными , оцененными при : К ( т ) = вн М ( т ) {\displaystyle K(t)=\ln M(t)} М ( т ) {\displaystyle М(т)} к н {\displaystyle \каппа _{н}} н {\displaystyle n} К ( т ) {\displaystyle К(т)} т = 0 {\displaystyle т=0}

к н = К ( н ) ( 0 ) = ψ ( н 1 ) ( α ) + ( 1 ) н ψ ( н 1 ) ( β ) {\displaystyle \kappa _{n}=K^{(n)}(0)=\psi ^{(n-1)}(\alpha )+(-1)^{n}\psi ^{(n-1)}(\beta )}

где и — дигамма- и полигамма-функции. В соответствии с выводом выше, первый кумулянт, , — это среднее значение, а второй, , — это дисперсия. ψ ( 0 ) = ψ {\displaystyle \psi ^{(0)}=\psi } ψ ( n 1 ) {\displaystyle \psi ^{(n-1)}} κ 1 {\displaystyle \kappa _{1}} κ 2 {\displaystyle \kappa _{2}}

Третий кумулянт, , является третьим центральным моментом , который при масштабировании по третьей степени стандартного отклонения дает асимметрию : κ 3 {\displaystyle \kappa _{3}} E [ ( x E [ x ] ) 3 ] {\displaystyle E[(x-E[x])^{3}]}

skew [ x ] = ψ ( 2 ) ( α ) ψ ( 2 ) ( β ) var [ x ] 3 {\displaystyle {\text{skew}}[x]={\frac {\psi ^{(2)}(\alpha )-\psi ^{(2)}(\beta )}{{\sqrt {{\text{var}}[x]}}^{3}}}}

Знак (и, следовательно, направленность ) асимметрии такой же, как и знак . α β {\displaystyle \alpha -\beta }

Режим

Моду (максимум плотности вероятности) можно вывести, определив, где производная логарифмической функции вероятности равна нулю: x {\displaystyle x}

d d x ln f ( x ; α , β ) = α σ ( x ) β σ ( x ) = 0 {\displaystyle {\frac {d}{dx}}\ln f(x;\alpha ,\beta )=\alpha \sigma (-x)-\beta \sigma (x)=0}

Это упрощается до , так что: [2] α / β = e x {\displaystyle \alpha /\beta =e^{x}}

mode [ x ] = ln α β {\displaystyle {\text{mode}}[x]=\ln {\frac {\alpha }{\beta }}}

Поведение хвоста

Распределения типа IV те же, что и на графиках PDF. За исключением Коши, средние значения и дисперсии были стандартизированы.
Сравнение хвостов: тип IV (среднее = 0, дисперсия = 1) против стандартного нормального распределения , против стандартного распределения Коши

В каждом из левого и правого хвостов один из сигмоид в pdf насыщается до единицы, так что хвост формируется другим сигмоидом. Для больших отрицательных левый хвост pdf пропорционален , в то время как правый хвост (большой положительный ) пропорционален . Это означает, что хвосты независимо контролируются и . Хотя хвосты типа IV тяжелее , чем у нормального распределения ( , для дисперсии ), средние значения типа IV и дисперсии остаются конечными для всех . Это контрастирует с распределением Коши , для которого среднее значение и дисперсия не существуют. На показанных здесь графиках логарифмической pdf хвосты типа IV линейны, хвосты нормального распределения квадратичны, а хвосты Коши логарифмичны. x {\displaystyle x} σ ( x ) α e α x {\displaystyle \sigma (x)^{\alpha }\approx e^{\alpha x}} x {\displaystyle x} σ ( x ) β e β x {\displaystyle \sigma (-x)^{\beta }\approx e^{-\beta x}} α {\displaystyle \alpha } β {\displaystyle \beta } e x 2 2 v {\displaystyle e^{-{\frac {x^{2}}{2v}}}} v {\displaystyle v} α , β > 0 {\displaystyle \alpha ,\beta >0}

Экспоненциальные свойства семейства

B σ ( α , β ) {\displaystyle B_{\sigma }(\alpha ,\beta )} образует экспоненциальное семейство с натуральными параметрами и и достаточной статистикой и . Ожидаемые значения достаточной статистики можно найти путем дифференцирования логарифмического нормализатора: [3] α {\displaystyle \alpha } β {\displaystyle \beta } log σ ( x ) {\displaystyle \log \sigma (x)} log σ ( x ) {\displaystyle \log \sigma (-x)}

E [ log σ ( x ) ] = log B ( α , β ) α = ψ ( α ) ψ ( α + β ) E [ log σ ( x ) ] = log B ( α , β ) β = ψ ( β ) ψ ( α + β ) {\displaystyle {\begin{aligned}E[\log \sigma (x)]&={\frac {\partial \log B(\alpha ,\beta )}{\partial \alpha }}=\psi (\alpha )-\psi (\alpha +\beta )\\E[\log \sigma (-x)]&={\frac {\partial \log B(\alpha ,\beta )}{\partial \beta }}=\psi (\beta )-\psi (\alpha +\beta )\\\end{aligned}}}

Учитывая, что набор данных предположительно был сгенерирован с помощью IID , оценка параметра максимального правдоподобия имеет вид: x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} B σ ( α , β ) {\displaystyle B_{\sigma }(\alpha ,\beta )}

α ^ , β ^ = arg max α , β 1 n i = 1 n log f ( x i ; α , β ) = arg max α , β α ( 1 n i log σ ( x i ) ) + β ( 1 n i log σ ( x i ) ) log B ( α , β ) = arg max α , β α log σ ( x ) ¯ + β log σ ( x ) ¯ log B ( α , β ) {\displaystyle {\begin{aligned}{\hat {\alpha }},{\hat {\beta }}=\arg \max _{\alpha ,\beta }&\;{\frac {1}{n}}\sum _{i=1}^{n}\log f(x_{i};\alpha ,\beta )\\=\arg \max _{\alpha ,\beta }&\;\alpha {\Bigl (}{\frac {1}{n}}\sum _{i}\log \sigma (x_{i}){\Bigr )}+\beta {\Bigl (}{\frac {1}{n}}\sum _{i}\log \sigma (-x_{i}){\Bigr )}-\log B(\alpha ,\beta )\\=\arg \max _{\alpha ,\beta }&\;\alpha \,{\overline {\log \sigma (x)}}+\beta \,{\overline {\log \sigma (-x)}}-\log B(\alpha ,\beta )\end{aligned}}}

где линии сверху обозначают средние значения достаточной статистики. Оценка максимального правдоподобия зависит от данных только через эти средние статистики. Действительно, при оценке максимального правдоподобия ожидаемые значения и средние значения совпадают:

ψ ( α ^ ) ψ ( α ^ + β ^ ) = log σ ( x ) ¯ ψ ( β ^ ) ψ ( α ^ + β ^ ) = log σ ( x ) ¯ {\displaystyle {\begin{aligned}\psi ({\hat {\alpha }})-\psi ({\hat {\alpha }}+{\hat {\beta }})&={\overline {\log \sigma (x)}}\\\psi ({\hat {\beta }})-\psi ({\hat {\alpha }}+{\hat {\beta }})&={\overline {\log \sigma (-x)}}\\\end{aligned}}}

где также исчезают частные производные вышеуказанного максимизируемого выражения.

Отношения с другими дистрибутивами

Взаимоотношения с другими дистрибутивами включают:

  • Логарифмическое отношение гамма-переменных относится к типу IV, как подробно описано выше.
  • Если , то имеет распределение типа IV с параметрами и . См. бета-простое распределение . y BetaPrime ( α , β ) {\displaystyle y\sim {\text{BetaPrime}}(\alpha ,\beta )} x = ln y {\displaystyle x=\ln y} α {\displaystyle \alpha } β {\displaystyle \beta }
  • Если и , где используется в качестве параметра скорости второго гамма-распределения, то имеет составное гамма-распределение , которое совпадает с , так что имеет распределение типа IV . z Gamma ( β , 1 ) {\displaystyle z\sim {\text{Gamma}}(\beta ,1)} y z Gamma ( α , z ) {\displaystyle y\mid z\sim {\text{Gamma}}(\alpha ,z)} z {\displaystyle z} y {\displaystyle y} BetaPrime ( α , β ) {\displaystyle {\text{BetaPrime}}(\alpha ,\beta )} x = ln y {\displaystyle x=\ln y}
  • Если , то имеет распределение типа IV с параметрами и . Смотрите бета-распределение . Функция логита , является обратной логистической функции . Это соотношение объясняет название логистическо-бета для этого распределения: если логистическая функция применяется к логистическо-бета-вариантам, преобразованное распределение является бета. p Beta ( α , β ) {\displaystyle p\sim {\text{Beta}}(\alpha ,\beta )} x = logit p {\displaystyle x={\text{logit}}\,p} α {\displaystyle \alpha } β {\displaystyle \beta } l o g i t ( p ) = log p 1 p {\displaystyle \mathrm {logit} (p)=\log {\frac {p}{1-p}}}

Большие параметры формы

Тип IV против нормального распределения с согласованным средним и дисперсией. Для больших значений pdf очень похожи, за исключением очень редких значений . α , β {\displaystyle \alpha ,\beta } x {\displaystyle x}

При больших значениях параметров формы распределение становится более гауссовым , при этом: α , β 1 {\displaystyle \alpha ,\beta \gg 1}

E [ x ] ln α β var [ x ] α + β α β {\displaystyle {\begin{aligned}E[x]&\approx \ln {\frac {\alpha }{\beta }}\\{\text{var}}[x]&\approx {\frac {\alpha +\beta }{\alpha \beta }}\end{aligned}}}

Это продемонстрировано на графиках PDF и log PDF здесь.

Генерация случайных величин

Поскольку случайная выборка из гамма- и бета- распределений легко доступна на многих программных платформах, приведенные выше соотношения с этими распределениями можно использовать для генерации переменных из распределения типа IV.

Обобщение с параметрами местоположения и масштаба

Гибкое семейство из четырех параметров может быть получено путем добавления параметров местоположения и масштаба . Один из способов сделать это — если , то пусть , где — параметр масштаба, а — параметр местоположения. Полученное таким образом семейство из четырех параметров обладает желаемой дополнительной гибкостью, но новые параметры может быть трудно интерпретировать, поскольку и . Более того, оценка максимального правдоподобия с этой параметризацией сложна. Эти проблемы можно решить следующим образом. x B σ ( α , β ) {\displaystyle x\sim B_{\sigma }(\alpha ,\beta )} y = k x + δ {\displaystyle y=kx+\delta } k > 0 {\displaystyle k>0} δ R {\displaystyle \delta \in \mathbb {R} } δ E [ y ] {\displaystyle \delta \neq E[y]} k 2 var [ y ] {\displaystyle k^{2}\neq {\text{var}}[y]}

Напомним, что среднее значение и дисперсия равны: x {\displaystyle x}

μ ~ = ψ ( α ) ψ ( β ) , s ~ 2 = ψ ( α ) + ψ ( β ) {\displaystyle {\begin{aligned}{\tilde {\mu }}&=\psi (\alpha )-\psi (\beta ),&{\tilde {s}}^{2}&=\psi '(\alpha )+\psi '(\beta )\end{aligned}}}

Теперь расширьте семейство с помощью параметра местоположения и параметра масштаба с помощью преобразования: μ R {\displaystyle \mu \in \mathbb {R} } s > 0 {\displaystyle s>0}

y = μ + s s ~ ( x μ ~ ) x = μ ~ + s ~ s ( y μ ) {\displaystyle {\begin{aligned}y&=\mu +{\frac {s}{\tilde {s}}}(x-{\tilde {\mu }})\iff x={\tilde {\mu }}+{\frac {\tilde {s}}{s}}(y-\mu )\end{aligned}}}

так что и теперь интерпретируемы. Можно отметить, что разрешение быть как положительными, так и отрицательными не обобщает это семейство из-за отмеченного выше свойства симметрии. Мы принимаем обозначения для этого семейства. μ = E [ y ] {\displaystyle \mu =E[y]} s 2 = var [ y ] {\displaystyle s^{2}={\text{var}}[y]} s {\displaystyle s} y B ¯ σ ( α , β , μ , s 2 ) {\displaystyle y\sim {\bar {B}}_{\sigma }(\alpha ,\beta ,\mu ,s^{2})}

Если pdf для равен , то pdf для равен: x B σ ( α , β ) {\displaystyle x\sim B_{\sigma }(\alpha ,\beta )} f ( x ; α , β ) {\displaystyle f(x;\alpha ,\beta )} y B ¯ σ ( α , β , μ , s 2 ) {\displaystyle y\sim {\bar {B}}_{\sigma }(\alpha ,\beta ,\mu ,s^{2})}

f ¯ ( y ; α , β , μ , s 2 ) = s ~ s f ( x ; α , β ) {\displaystyle {\bar {f}}(y;\alpha ,\beta ,\mu ,s^{2})={\frac {\tilde {s}}{s}}\,f(x;\alpha ,\beta )}

где подразумевается, что вычисляется, как подробно описано выше, как функция . Графики pdf и log-pdf выше, где подписи содержат (среднее = 0, дисперсия = 1), предназначены для . x {\displaystyle x} y , α , β , μ , s {\displaystyle y,\alpha ,\beta ,\mu ,s} B ¯ σ ( α , β , 0 , 1 ) {\displaystyle {\bar {B}}_{\sigma }(\alpha ,\beta ,0,1)}

Оценка параметра максимального правдоподобия

В этом разделе поочередно обсуждается оценка максимального правдоподобия параметров распределения для заданного набора данных для семейств и . x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} B σ ( α , β ) {\displaystyle B_{\sigma }(\alpha ,\beta )} B ¯ σ ( α , β , μ , s 2 ) {\displaystyle {\bar {B}}_{\sigma }(\alpha ,\beta ,\mu ,s^{2})}

Максимальная вероятность для стандартного типа IV

Как отмечено выше, представляет собой экспоненциальное семейство с естественными параметрами , оценки максимального правдоподобия которого зависят только от усредненных достаточных статистик: B σ ( α , β ) {\displaystyle B_{\sigma }(\alpha ,\beta )} α , β {\displaystyle \alpha ,\beta }

log σ ( x ) ¯ = 1 n i log σ ( x i ) and log σ ( x ) ¯ = 1 n i log σ ( x i ) {\displaystyle {\begin{aligned}{\overline {\log \sigma (x)}}&={\frac {1}{n}}\sum _{i}\log \sigma (x_{i})&&{\text{and}}&{\overline {\log \sigma (-x)}}&={\frac {1}{n}}\sum _{i}\log \sigma (-x_{i})\end{aligned}}}

После накопления этой статистики оценка максимального правдоподобия определяется по формуле:

α ^ , β ^ = arg max α , β > 0 α log σ ( x ) ¯ + β log σ ( x ) ¯ log B ( α , β ) {\displaystyle {\begin{aligned}{\hat {\alpha }},{\hat {\beta }}=\arg \max _{\alpha ,\beta >0}&\;\alpha \,{\overline {\log \sigma (x)}}+\beta \,{\overline {\log \sigma (-x)}}-\log B(\alpha ,\beta )\end{aligned}}}

Используя параметризацию и неограниченный числовой алгоритм оптимизации, такой как BFGS, можно использовать. Итерации оптимизации быстры, поскольку они не зависят от размера набора данных. θ 1 = log α {\displaystyle \theta _{1}=\log \alpha } θ 2 = log β {\displaystyle \theta _{2}=\log \beta }

Альтернативой является использование EM-алгоритма, основанного на композиции: если и . Из-за самосопряженности гамма - распределения апостериорные ожидания и , которые требуются для E-шага, могут быть вычислены в замкнутой форме. Обновление параметра M-шага может быть решено аналогично максимальному правдоподобию для гамма-распределения . x log ( γ δ ) B σ ( α , β ) {\displaystyle x-\log(\gamma \delta )\sim B_{\sigma }(\alpha ,\beta )} z Gamma ( β , γ ) {\displaystyle z\sim {\text{Gamma}}(\beta ,\gamma )} e x z Gamma ( α , z / δ ) {\displaystyle e^{x}\mid z\sim {\text{Gamma}}(\alpha ,z/\delta )} z P ( z x ) {\displaystyle \left\langle z\right\rangle _{P(z\mid x)}} log z P ( z x ) {\displaystyle \left\langle \log z\right\rangle _{P(z\mid x)}}

Максимальное правдоподобие для четырехпараметрического семейства

Задача максимального правдоподобия для , имеющего pdf, выглядит следующим образом: B ¯ σ ( α , β , μ , s 2 ) {\displaystyle {\bar {B}}_{\sigma }(\alpha ,\beta ,\mu ,s^{2})} f ¯ {\displaystyle {\bar {f}}}

α ^ , β ^ , μ ^ , s ^ = arg max α , β , μ , s log 1 n i f ¯ ( x i ; α , β , μ , s 2 ) {\displaystyle {\hat {\alpha }},{\hat {\beta }},{\hat {\mu }},{\hat {s}}=\arg \max _{\alpha ,\beta ,\mu ,s}\log {\frac {1}{n}}\sum _{i}{\bar {f}}(x_{i};\alpha ,\beta ,\mu ,s^{2})}

Это больше не экспоненциальное семейство, так что каждая итерация оптимизации должна проходить по всему набору данных. Более того, вычисление частных производных (как того требует, например, BFGS) значительно сложнее, чем для двухпараметрического случая выше. Однако все функции компонентов легко доступны в программных пакетах с автоматическим дифференцированием . Опять же, положительные параметры могут быть параметризованы в терминах их логарифмов для получения неограниченной числовой задачи оптимизации.

Для этой задачи численная оптимизация может потерпеть неудачу, если начальные параметры местоположения и масштаба не будут выбраны надлежащим образом. Однако вышеупомянутая интерпретируемость этих параметров в параметризации может быть использована для этого. В частности, начальные значения для и могут быть установлены на эмпирическое среднее и дисперсию данных. B ¯ σ {\displaystyle {\bar {B}}_{\sigma }} μ {\displaystyle \mu } s 2 {\displaystyle s^{2}}

Смотрите также

Ссылки

  1. ^ ab Джонсон, Н. Л., Коц, С., Балакришнан, Н. (1995) Непрерывные одномерные распределения, том 2 , Wiley. ISBN  0-471-58494-0 (страницы 140–142)
  2. ^ ab Leigh J. Halliwell (2018). «Лог-гамма-распределение и ненормальная ошибка». S2CID  173176687. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  3. ^ CMBishop, Распознавание образов и машинное обучение , Springer 2006.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Generalized_logistic_distribution&oldid=1263056611"