Закон Ципфа-Мандельброта

Дискретное распределение вероятностей
Ципф–Мандельброт
Параметры Н { 1 , 2 , 3 } {\displaystyle N\in \{1,2,3\ldots \}} ( целое число ) ( действительное число ) ( действительное число )
д [ 0 ; ) {\displaystyle q\in [0;\infty )}
с > 0 {\displaystyle с>0}
Поддерживать к { 1 , 2 , , Н } {\displaystyle k\in \{1,2,\ldots ,N\}}
ПМФ 1 ЧАС Н , д , с 1 ( к + д ) с {\displaystyle {\frac {1}{H_{N,q,s}}}{\frac {1}{(k+q)^{s}}}}
СДФ ЧАС к , д , с ЧАС Н , д , с {\displaystyle {\frac {H_{k,q,s}}{H_{N,q,s}}}}
Иметь в виду ЧАС Н , д , с 1 ЧАС Н , д , с д {\displaystyle {\frac {H_{N,q,s-1}}{H_{N,q,s}}}-q}
Режим 1 {\displaystyle 1}
Энтропия с ЧАС Н , д , с к = 1 Н вн ( к + д ) ( к + д ) с + вн ( ЧАС Н , д , с ) {\displaystyle {\frac {s}{H_{N,q,s}}}\sum _{k=1}^{N}{\frac {\ln(k+q)}{(k+q)^{s}}}+\ln(H_{N,q,s})}

В теории вероятностей и статистике закон Ципфа–Мандельброта — это дискретное распределение вероятностей . Также известный как закон Парето –Ципфа, это степенное распределение ранжированных данных , названное в честь лингвиста Джорджа Кингсли Ципфа , который предложил более простое распределение, называемое законом Ципфа , и математика Бенуа Мандельброта , который впоследствии его обобщил.

Функция массы вероятности определяется выражением

ф ( к ; Н , д , с ) = 1 ЧАС Н , д , с 1 ( к + д ) с , {\displaystyle f(k;N,q,s)={\frac {1}{H_{N,q,s}}}{\frac {1}{(k+q)^{s}}},}

где дано ЧАС Н , д , с {\displaystyle H_{N,q,s}}

ЧАС Н , д , с = я = 1 Н 1 ( я + д ) с , {\displaystyle H_{N,q,s}=\sum _{i=1}^{N}{\frac {1}{(i+q)^{s}}},}

что можно рассматривать как обобщение гармонического числа . В формуле — ранг данных, а и — параметры распределения. В пределе, когда приближается к бесконечности, это становится дзета-функцией Гурвица . Для конечного и закон Ципфа–Мандельброта становится законом Ципфа . Для бесконечного и это становится дзета-распределением . к {\displaystyle к} д {\displaystyle д} с {\displaystyle с} Н {\displaystyle N} ζ ( с , д ) {\displaystyle \дзета (s,q)} Н {\displaystyle N} д = 0 {\displaystyle q=0} Н {\displaystyle N} д = 0 {\displaystyle q=0}

Приложения

Распределение слов, ранжированных по частоте их встречаемости в случайном текстовом корпусе, аппроксимируется степенным законом распределения, известным как закон Ципфа .

Если построить график частотного ранга слов, содержащихся в корпусе текстовых данных среднего размера, в зависимости от количества вхождений или фактических частот, то получится степенное распределение с показателем , близким к единице (но см. Powers, 1998 и Gelbukh & Sidorov, 2001). Закон Ципфа неявно предполагает фиксированный размер словаря, но гармонический ряд с s  = 1 не сходится, в то время как обобщение Ципфа–Мандельброта с s  > 1 сходится. Более того, есть доказательства того, что закрытый класс функциональных слов, определяющих язык, подчиняется распределению Ципфа–Мандельброта с параметрами, отличными от параметров открытых классов содержательных слов, которые различаются по теме, области и регистру. [1]

В экологических полевых исследованиях относительное распределение численности (т. е. график числа наблюдаемых видов в зависимости от их численности) часто оказывается соответствующим закону Ципфа-Мандельброта. [2]

В музыке многие показатели измерения «приятной» музыки соответствуют распределениям Ципфа–Мандельброта. [3]

Примечания

  1. ^ Powers, David MW (1998). "Применение и объяснение закона Ципфа". Новые методы в обработке языка и вычислительном изучении естественного языка . Совместная конференция по новым методам в обработке языка и вычислительном изучении естественного языка. Ассоциация компьютерной лингвистики. С. 151–160.
  2. ^ Mouillot, D.; Lepretre, A. (2000). «Введение индексов распределения относительного обилия (RAD), оцененных по диаграммам ранг-частота (RFD), для оценки изменений в разнообразии сообщества». Environmental Monitoring and Assessment . 63 (2). Springer: 279–295. doi :10.1023/A:1006297211561. S2CID  102285701 . Получено 24 декабря 2008 г. .
  3. ^ Манарис, Б.; Воган, Д.; Вагнер, К.С.; Ромеро, Дж.; Дэвис, Р.Б. «Эволюционная музыка и закон Ципфа–Мандельброта: разработка функций приспособленности для приятной музыки». Труды 1-го Европейского семинара по эволюционной музыке и искусству (EvoMUSART2003) . 611 .

Ссылки

  • Мандельброт, Бенуа (1965). «Теория информации и психолингвистика». В BB Wolman и E. Nagel (ред.). Научная психология . Основные книги.Перепечатано как
    • Мандельброт, Бенуа (1968) [1965]. «Теория информации и психолингвистика». В RC Oldfield и JC Marchall (ред.). Язык . Penguin Books.
  • Powers, David MW (1998). "Применение и объяснение закона Ципфа". Новые методы в обработке языка и вычислительном изучении естественного языка . Совместная конференция по новым методам в обработке языка и вычислительном изучении естественного языка. Ассоциация компьютерной лингвистики . С. 151–160.
  • Ципф, Джордж Кингсли (1932). Избранные исследования принципа относительной частоты в языке . Кембридж, Массачусетс: Издательство Гарвардского университета.
  • Van Droogenbroeck FJ (2019). «Необходимая перефразировка закона Ципфа–Мандельброта для решения задач атрибуции авторства с помощью гауссовой статистики».
  • З.К. Силагадзе: Цитаты и закон Ципфа–Мандельброта
  • NIST: Закон Ципфа
  • Ссылки В. Ли на закон Ципфа
  • Гельбух и Сидоров, 2001: Коэффициенты законов Ципфа и Хипса зависят от языка
  • Библиотека C++ для генерации случайных отклонений Ципфа–Мандельброта.
Взято с "https://en.wikipedia.org/w/index.php?title=Закон_Зипфа–Мандельброта&oldid=1234546953"