Симметричное обобщенное нормальное распределение , также известное как экспоненциальное распределение мощности или обобщенное распределение ошибок , является параметрическим семейством симметричных распределений . Оно включает в себя все нормальные и лапласовские распределения, а в качестве предельных случаев оно включает в себя все непрерывные равномерные распределения на ограниченных интервалах действительной прямой.
Это семейство допускает хвосты, которые либо тяжелее нормы (когда ), либо легче нормы (когда ). Это полезный способ параметризации континуума симметричных платикуртических плотностей, простирающихся от нормальной ( ) до равномерной плотности ( ), и континуума симметричных лептокуртических плотностей, простирающихся от Лапласа ( ) до нормальной плотности ( ). Параметр формы также контролирует пиковость в дополнение к хвостам.
Оценка параметров
Изучена оценка параметров методом максимального правдоподобия и методом моментов . [3] Оценки не имеют замкнутой формы и должны быть получены численно. Также были предложены оценки, не требующие численного расчета. [4]
Обобщенная нормальная логарифмическая функция правдоподобия имеет бесконечно много непрерывных производных (т.е. принадлежит классу C ∞ гладких функций ) только если является положительным четным целым числом. В противном случае функция имеет непрерывные производные. В результате стандартные результаты для согласованности и асимптотической нормальности оценок максимального правдоподобия применяются только при .
Оценка максимального правдоподобия
Можно подогнать обобщенное нормальное распределение, приняв приближенный метод максимального правдоподобия . [5] [6] При изначальной установке на первый момент выборки , оценивается с помощью итеративной процедуры Ньютона-Рафсона , начиная с начального предположения ,
где
является первым статистическим моментом абсолютных значений и является вторым статистическим моментом . Итерация
При наличии значения можно оценить, найдя минимум:
Наконец, оценивается как
Для медиана является более подходящей оценкой . После того, как оценивается, и может быть оценена, как описано выше. [7]
Приложения
Симметричное обобщенное нормальное распределение использовалось в моделировании, когда особый интерес представляли концентрация значений вокруг среднего значения и поведение хвоста. [8] [9] Другие семейства распределений могут использоваться, если основное внимание уделяется другим отклонениям от нормальности. Если основным интересом является симметрия распределения, можно использовать перекошенное нормальное семейство или асимметричную версию обобщенного нормального семейства, обсуждаемую ниже. Если основным интересом является поведение хвоста, можно использовать семейство t-распределения студента , которое приближает нормальное распределение по мере того, как степени свободы растут до бесконечности. Распределение t, в отличие от этого обобщенного нормального распределения, получает более тяжелые, чем нормальные, хвосты, не приобретая точки возврата в начале координат. Оно находит применение в физике плазмы под названием распределения Лэнгдона, возникающего в результате обратного тормозного излучения. [10]
Пусть будет нулевым средним обобщенным гауссовым распределением формы и параметра масштабирования . Моменты существуют и конечны для любого k, большего, чем −1. Для любого неотрицательного целого числа k простые центральные моменты равны [2]
Многомерное обобщенное нормальное распределение, т.е. произведение экспоненциальных степенных распределений с теми же и параметрами, является единственной плотностью вероятности, которая может быть записана в форме и имеет независимые маргинальные значения. [13] Результаты для особого случая многомерного нормального распределения первоначально приписываются Максвеллу . [14]
Асимметричное обобщенное нормальное распределение — это семейство непрерывных распределений вероятностей, в которых параметр формы может использоваться для введения асимметрии или перекоса. [15] [16] Когда параметр формы равен нулю, получается нормальное распределение. Положительные значения параметра формы дают распределения с левой перекоской, ограниченные справа, а отрицательные значения параметра формы дают распределения с правой перекоской, ограниченные слева. Только когда параметр формы равен нулю, функция плотности для этого распределения положительна на всей действительной оси: в этом случае распределение является нормальным распределением , в противном случае распределения смещены и, возможно, являются обратными логнормальными распределениями .
Оценка параметров
Параметры можно оценить с помощью оценки максимального правдоподобия или метода моментов. Оценки параметров не имеют замкнутой формы, поэтому для вычисления оценок необходимо использовать численные вычисления. Поскольку выборочное пространство (набор действительных чисел, где плотность не равна нулю) зависит от истинного значения параметра, некоторые стандартные результаты о производительности оценок параметров не будут автоматически применяться при работе с этим семейством.
Приложения
Асимметричное обобщенное нормальное распределение может использоваться для моделирования значений, которые могут быть нормально распределены или которые могут быть либо скошены вправо, либо скошены влево относительно нормального распределения. Скошенное нормальное распределение — это еще одно распределение, которое полезно для моделирования отклонений от нормальности из-за скошенного распределения. Другие распределения, используемые для моделирования скошенных данных, включают гамма-распределение , логнормальное распределение и распределение Вейбулла , но они не включают нормальное распределение как особые случаи.
Расхождение Кульбака-Лейблера между двумя PDF
Дивергенция Кульбака-Лейблера (KLD) — это метод, используемый для вычисления дивергенции или подобия между двумя функциями плотности вероятности. [17]
Пусть и два обобщенных гауссовских распределения с параметрами и
с ограничением . [18] Тогда эта дивергенция определяется как:
Другие распределения, связанные с нормальным
Два обобщенных нормальных семейства, описанных здесь, как и перекошенное нормальное семейство, являются параметрическими семействами, которые расширяют нормальное распределение путем добавления параметра формы. В связи с центральной ролью нормального распределения в вероятности и статистике, многие распределения можно охарактеризовать с точки зрения их связи с нормальным распределением. Например, логнормальное , свернутое нормальное и обратное нормальное распределения определяются как преобразования нормально распределенного значения, но в отличие от обобщенных нормальных и перекошенных нормального семейств, они не включают нормальные распределения как особые случаи.
На самом деле все распределения с конечной дисперсией в пределе тесно связаны с нормальным распределением. Распределение Стьюдента-t, распределение Ирвина–Холла и распределение Бейтса также расширяют нормальное распределение и включают в предел нормальное распределение. Поэтому нет веских причин предпочитать «обобщенное» нормальное распределение типа 1, например, по сравнению с комбинацией Стьюдента-t и нормализованного расширенного Ирвина–Холла – это включало бы, например, треугольное распределение (которое не может быть смоделировано обобщенным гауссовым типом 1).
Симметричное распределение, которое может моделировать поведение как хвоста (длинного и короткого), так и центра (например, плоское, треугольное или гауссово) совершенно независимо, можно получить, например, с помощью X = IH/chi.
Распределение Тьюки g и h также допускает отклонение от нормальности, как через асимметрию, так и через толстые хвосты. [19]
^ Гриффин, Мэриклэр. «Работа с экспоненциальным распределением мощности с использованием gnorm». Github, пакет gnorm . Получено 26 июня 2020 г.
^ ab Nadarajah, Saralees (сентябрь 2005 г.). «Обобщенное нормальное распределение». Журнал прикладной статистики . 32 (7): 685– 694. Bibcode : 2005JApSt..32..685N. doi : 10.1080/02664760500079464. S2CID 121914682.
^ Варанаси, MK; Aazhang, B. (октябрь 1989). «Параметрическая обобщенная оценка плотности Гаусса». Журнал Акустического общества Америки . 86 (4): 1404– 1415. Bibcode : 1989ASAJ...86.1404V. doi : 10.1121/1.398700.
^ Домингес-Молина, Х. Армандо; Гонсалес-Фариас, Грасиела ; Родригес-Дагнино, Рамон М. «Практическая процедура оценки параметра формы в обобщенном распределении Гаусса» (PDF) . Архивировано из оригинала (PDF) 28 сентября 2007 г. Проверено 3 марта 2009 г.
^ Варанаси, MK; Aazhang B. (1989). «Параметрическая обобщенная оценка гауссовой плотности». J. Acoust. Soc. Am. 86 (4): 1404– 1415. Bibcode :1989ASAJ...86.1404V. doi :10.1121/1.398700.
^ До, МН; Веттерли, М. (февраль 2002 г.). «Извлечение текстур на основе вейвлетов с использованием обобщенной гауссовой плотности и расстояния Кульбака-Лейблера». Труды IEEE по обработке изображений . 11 (2): 146– 158. Bibcode : 2002ITIP...11..146D. doi : 10.1109/83.982822. PMID 18244620.
^ Варанаси, Махеш К.; Аажанг, Бехнаам (1989-10-01). «Параметрическая обобщенная оценка плотности Гаусса». Журнал Акустического общества Америки . 86 (4): 1404– 1415. Bibcode : 1989ASAJ...86.1404V. doi : 10.1121/1.398700. ISSN 0001-4966.
^ Milder, Avram L. (2021). Функции распределения скоростей электронов и томсоновское рассеяние (диссертация). Университет Рочестера. hdl : 1802/36536 .
^ ab Dytso, Alex; Bustin, Ronit; Poor, H. Vincent; Shamai, Shlomo (2018). "Аналитические свойства обобщенных гауссовых распределений". Journal of Statistical Distributions and Applications . 5 (1): 6. doi : 10.1186/s40488-018-0088-5 .
^ Бохнер, Саломон (1937). «Стабильные законы вероятности и полностью монотонные функции». Duke Mathematical Journal . 3 (4): 726– 728. doi :10.1215/s0012-7094-37-00360-0.
^ Синц, Фабиан; Гервинн, Себастьян; Бетге, Маттиас (май 2009 г.). «Характеристика p-обобщенного нормального распределения». Журнал многомерного анализа . 100 (5): 817– 820. doi : 10.1016/j.jmva.2008.07.006 .
^ Кац, М. (1939). «О характеристике нормального распределения». American Journal of Mathematics . 61 (3): 726– 728. doi :10.2307/2371328. JSTOR 2371328.
^ Хоскинг, Дж. Р. М., Уоллис, Дж. Р. (1997) Региональный частотный анализ: подход, основанный на L-моментах , Cambridge University Press. ISBN 0-521-43045-3 . Раздел A.8
^ Документация для пакета lmomco R
^ Кульбак, С.; Лейблер, Р. А. (1951). «Об информации и достаточности». Анналы математической статистики . 22 (1): 79– 86. doi : 10.1214/aoms/1177729694 .
^ Quintero-Rincón, A.; Pereyra, M.; D'Giano, C.; Batatia, H.; Risk, M. (2017). «Метод визуального обнаружения эпилепсии на ЭЭГ, основанный на статистическом представлении вейвлетов и расхождении Кульбака-Лейблера». Труды IFMBE . 60 : 13–16 . doi : 10.1007/978-981-10-4086-3_4 . hdl : 11336/77054 .
^ Распределение Тьюки g-and-h, Юань Янь, Марк Г. Гентон Значимость, Том 16, Выпуск 3, июнь 2019 г., Страницы 12–13, doi : 10.1111/j.1740-9713.2019.01273.x