Название для нескольких различных семейств распределений вероятностей
Термин обобщенное логистическое распределение используется как название для нескольких различных семейств распределений вероятностей . Например, Джонсон и др. [1] перечисляют четыре формы, которые перечислены ниже.
Тип I также называется косо-логистическим распределением . Тип IV включает в себя другие типы и получается при применении логит- преобразования к бета- случайным переменным. Следуя той же конвенции, что и для логарифмически нормального распределения , тип IV может называться логистическо-бета-распределением со ссылкой на стандартную логистическую функцию , которая является обратной логит-преобразованию.
Этот тип также называют «экспоненциальной обобщенной бетой второго типа». [1]
Соответствующая кумулятивная функция распределения имеет вид:
Связь между типами
Тип IV — наиболее общая форма распределения. Распределение типа III можно получить из типа IV, зафиксировав . Распределение типа II можно получить из типа IV, зафиксировав (и переименовав в ). Распределение типа I можно получить из типа IV, зафиксировав . Зафиксировав , получаем стандартное логистическое распределение .
Свойства типа IV (логистическо-бета)
Обобщенное логистическое распределение типа IV или логистическое бета- распределение с параметрами поддержки и формы имеет (как показано выше) функцию плотности вероятности (pdf):
где — стандартная логистическая функция . Функции плотности вероятности для трех различных наборов параметров формы показаны на графике, где распределения были масштабированы и смещены, чтобы дать нулевые средние значения и единичные дисперсии, чтобы облегчить сравнение форм.
В дальнейшем обозначение будет использоваться для обозначения распределения типа IV.
Связь с гамма-распределением
Это распределение можно получить в терминах гамма-распределения следующим образом. Пусть и независимо , и пусть . Тогда . [2]
Симметрия
Если , то .
Среднее значение и дисперсия
Используя логарифмические ожидания гамма-распределения, среднее значение и дисперсию можно вывести следующим образом:
где — дигамма-функция , а — ее первая производная, также известная как тригамма-функция или первая полигамма-функция . Поскольку строго возрастает , знак среднего значения совпадает со знаком . Поскольку строго убывает, параметры формы также можно интерпретировать как параметры концентрации. Действительно, как показано ниже, левый и правый хвосты соответственно становятся тоньше по мере увеличения или . Два члена дисперсии представляют вклады в дисперсию левой и правой частей распределения.
Кумулянты и асимметрия
Функция генерации кумулянта равна , где функция генерации момента приведена выше. Кумулянты , , являются -ыми производными , оцененными при :
где и — дигамма- и полигамма-функции. В соответствии с выводом выше, первый кумулянт, , — это среднее значение, а второй, , — это дисперсия.
Третий кумулянт, , является третьим центральным моментом , который при масштабировании по третьей степени стандартного отклонения дает асимметрию :
Знак (и, следовательно, направленность ) асимметрии такой же, как и знак .
Режим
Моду (максимум плотности вероятности) можно вывести, определив, где производная логарифмической функции вероятности равна нулю:
Это упрощается до , так что: [2]
Поведение хвоста
В каждом из левого и правого хвостов один из сигмоид в pdf насыщается до единицы, так что хвост формируется другим сигмоидом. Для больших отрицательных левый хвост pdf пропорционален , в то время как правый хвост (большой положительный ) пропорционален . Это означает, что хвосты независимо контролируются и . Хотя хвосты типа IV тяжелее , чем у нормального распределения ( , для дисперсии ), средние значения типа IV и дисперсии остаются конечными для всех . Это контрастирует с распределением Коши , для которого среднее значение и дисперсия не существуют. На показанных здесь графиках логарифмической pdf хвосты типа IV линейны, хвосты нормального распределения квадратичны, а хвосты Коши логарифмичны.
Учитывая, что набор данных предположительно был сгенерирован с помощью IID , оценка параметра максимального правдоподобия имеет вид:
где линии сверху обозначают средние значения достаточной статистики. Оценка максимального правдоподобия зависит от данных только через эти средние статистики. Действительно, при оценке максимального правдоподобия ожидаемые значения и средние значения совпадают:
где также исчезают частные производные вышеуказанного максимизируемого выражения.
Отношения с другими дистрибутивами
Взаимоотношения с другими дистрибутивами включают:
Логарифмическое отношение гамма-переменных относится к типу IV, как подробно описано выше.
Если и , где используется в качестве параметра скорости второго гамма-распределения, то имеет составное гамма-распределение , которое совпадает с , так что имеет распределение типа IV .
Если , то имеет распределение типа IV с параметрами и . Смотрите бета-распределение . Функция логита , является обратной логистической функции . Это соотношение объясняет название логистическо-бета для этого распределения: если логистическая функция применяется к логистическо-бета-вариантам, преобразованное распределение является бета.
Большие параметры формы
При больших значениях параметров формы распределение становится более гауссовым , при этом:
Это продемонстрировано на графиках PDF и log PDF здесь.
Генерация случайных величин
Поскольку случайная выборка из гамма- и бета- распределений легко доступна на многих программных платформах, приведенные выше соотношения с этими распределениями можно использовать для генерации переменных из распределения типа IV.
Обобщение с параметрами местоположения и масштаба
Гибкое семейство из четырех параметров может быть получено путем добавления параметров местоположения и масштаба . Один из способов сделать это — если , то пусть , где — параметр масштаба, а — параметр местоположения. Полученное таким образом семейство из четырех параметров обладает желаемой дополнительной гибкостью, но новые параметры может быть трудно интерпретировать, поскольку и . Более того, оценка максимального правдоподобия с этой параметризацией сложна. Эти проблемы можно решить следующим образом.
Напомним, что среднее значение и дисперсия равны:
Теперь расширьте семейство с помощью параметра местоположения и параметра масштаба с помощью преобразования:
так что и теперь интерпретируемы. Можно отметить, что разрешение быть как положительными, так и отрицательными не обобщает это семейство из-за отмеченного выше свойства симметрии. Мы принимаем обозначения для этого семейства.
Если pdf для равен , то pdf для равен:
где подразумевается, что вычисляется, как подробно описано выше, как функция . Графики pdf и log-pdf выше, где подписи содержат (среднее = 0, дисперсия = 1), предназначены для .
Оценка параметра максимального правдоподобия
В этом разделе поочередно обсуждается оценка максимального правдоподобия параметров распределения для заданного набора данных для семейств и .
Максимальная вероятность для стандартного типа IV
Как отмечено выше, представляет собой экспоненциальное семейство с естественными параметрами , оценки максимального правдоподобия которого зависят только от усредненных достаточных статистик:
После накопления этой статистики оценка максимального правдоподобия определяется по формуле:
Используя параметризацию и неограниченный числовой алгоритм оптимизации, такой как BFGS, можно использовать. Итерации оптимизации быстры, поскольку они не зависят от размера набора данных.
Максимальное правдоподобие для четырехпараметрического семейства
Задача максимального правдоподобия для , имеющего pdf, выглядит следующим образом:
Это больше не экспоненциальное семейство, так что каждая итерация оптимизации должна проходить по всему набору данных. Более того, вычисление частных производных (как того требует, например, BFGS) значительно сложнее, чем для двухпараметрического случая выше. Однако все функции компонентов легко доступны в программных пакетах с автоматическим дифференцированием . Опять же, положительные параметры могут быть параметризованы в терминах их логарифмов для получения неограниченной числовой задачи оптимизации.
Для этой задачи численная оптимизация может потерпеть неудачу, если начальные параметры местоположения и масштаба не будут выбраны надлежащим образом. Однако вышеупомянутая интерпретируемость этих параметров в параметризации может быть использована для этого. В частности, начальные значения для и могут быть установлены на эмпирическое среднее и дисперсию данных.
^ ab Джонсон, Н. Л., Коц, С., Балакришнан, Н. (1995) Непрерывные одномерные распределения, том 2 , Wiley. ISBN 0-471-58494-0 (страницы 140–142)
^ ab Leigh J. Halliwell (2018). «Лог-гамма-распределение и ненормальная ошибка». S2CID 173176687.{{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ CMBishop, Распознавание образов и машинное обучение , Springer 2006.