Теория экстремальных значений

Раздел статистики, посвященный большим отклонениям
Теория экстремальных значений используется для моделирования риска экстремальных, редких событий, таких как Лиссабонское землетрясение 1755 года .

Теория экстремальных значений или анализ экстремальных значений ( EVA ) — это изучение экстремальных значений в статистических распределениях.

Он широко используется во многих дисциплинах, таких как структурная инженерия , финансы , экономика , науки о Земле , прогнозирование дорожного движения и геологическая инженерия . Например, EVA может использоваться в области гидрологии для оценки вероятности необычно большого наводнения, такого как 100-летнее наводнение . Аналогично, для проектирования волнолома , инженер по береговой охране будет стремиться оценить 50-летнюю волну и спроектировать конструкцию соответствующим образом.

Анализ данных

Существуют два основных подхода к практическому анализу экстремальных значений.

Первый метод основан на получении серии блоковых максимумов (минимумов) в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), генерируя серию годовых максимумов (AMS).

Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом пика сверх порога (POT). [1]

Для данных AMS анализ может частично полагаться на результаты теоремы Фишера–Типпета–Гнеденко , что приводит к выбору обобщенного распределения экстремальных значений для подгонки. [2] [3] Однако на практике применяются различные процедуры для выбора между более широким диапазоном распределений. Теорема здесь относится к предельным распределениям для минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределений, отличных от обобщенного распределения экстремальных значений (GEVD). [4]

Для данных POT анализ может включать подгонку двух распределений: одно для количества событий за рассматриваемый период времени, а второе — для размера превышений.

Распространенным предположением для первого является распределение Пуассона , а обобщенное распределение Парето используется для превышений. Подгонка хвоста может быть основана на теореме Пикандса–Балкема–де Хаана . [5] [6]

Новак (2011) резервирует термин «метод POT» для случая, когда порог не является случайным, и отличает его от случая, когда речь идет о превышении случайного порога. [7]

Приложения

Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:

История

Область теории экстремальных значений была пионером Л. Типпетта (1902–1985). Типпетт работал в Британской ассоциации исследований хлопковой промышленности , где он работал над тем, чтобы сделать хлопковую нить более прочной. В своих исследованиях он понял, что прочность нити контролируется прочностью ее самых слабых волокон. С помощью RA Fisher Типпет получил три асимптотических предела, описывающих распределения экстремальных значений, предполагающих независимость переменных. EJ Gumbel (1958) [25] кодифицировал эту теорию. Эти результаты можно расширить, чтобы допустить слабые корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Один класс универсальности, представляющий особый интерес, — это класс логарифмически коррелированных полей, где корреляции логарифмически убывают с расстоянием.

Одномерная теория

Теория экстремальных значений одной переменной регулируется теоремой об экстремальных значениях , также называемой теоремой Фишера–Типпета–Гнеденко , которая описывает, какое из трех возможных распределений экстремальных значений применимо к конкретной статистической переменной , которая обобщена в этом разделе.   Х   , {\displaystyle \ X\ ,}

Многомерная теория

Теория экстремальных значений в более чем одной переменной вводит дополнительные вопросы, которые необходимо решить. Одна из возникающих проблем заключается в том, что необходимо указать, что представляет собой экстремальное событие. [26] Хотя это просто в одномерном случае, нет однозначного способа сделать это в многомерном случае. Основная проблема заключается в том, что хотя можно упорядочить набор действительных чисел, нет естественного способа упорядочить набор векторов.

Например, в одномерном случае, если задан набор наблюдений, легко найти самое экстремальное событие, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае, если задан набор наблюдений , не сразу понятно, как найти самое экстремальное событие. Предположим, что кто-то измерил значения в определенное время и значения в более позднее время. Какое из этих событий будет считаться более экстремальным? На этот вопрос нет универсального ответа.   х я   {\displaystyle \ x_{i}\ }   ( х я , у я )   {\displaystyle \ (x_{i},y_{i})\ }   ( 3 , 4 )   {\displaystyle \ (3,4)\ }   ( 5 , 2 )   {\displaystyle \ (5,2)\ }

Другая проблема в многомерном случае заключается в том, что ограничивающая модель не так полно предписана, как в одномерном случае. В одномерном случае модель ( распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точная форма которой не предписана теорией. Однако эта функция должна подчиняться определенным ограничениям. [27] [28] Непросто разработать оценщики, которые подчиняются таким ограничениям, хотя некоторые из них были недавно построены. [29] [30] [31]

В качестве примера применения двумерной теории экстремальных значений можно привести ее применение в исследовании океана. [26] [32]

Нестационарные экстремумы

Статистическое моделирование нестационарных временных рядов было разработано в 1990-х годах. [33] Методы для нестационарных многомерных экстремальных значений были введены позднее. [34] Последние могут быть использованы для отслеживания того, как зависимость между экстремальными значениями изменяется с течением времени или по другой ковариате. [35] [36] [37]

Смотрите также


Ссылки

  1. ^ Лидбеттер, М. Р. (1991). «На основе моделирования «пиков сверх порога». Statistics and Probability Letters . 12 (4): 357– 362. doi :10.1016/0167-7152(91)90107-3.
  2. Фишер и Типпетт (1928)
  3. ^ Гнеденко (1943)
  4. ^ Эмбрехтс, Клуппельберг и Микош (1997)
  5. ^ Пикандс (1975)
  6. ^ Балкема и де Хаан (1974)
  7. ^ Новак (2011)
  8. ^ Типпетт, Лепор и Коэн (2016)
  9. ^ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (март 2017 г.). «Экстремальные события во временном ряду экосистемы озера». Limnology and Oceanography Letters . 2 (3): 63. Bibcode : 2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
  10. ^ Альварадо, Сандберг и Пикфорд (1998), стр. 68
  11. ^ Макконен (2008)
  12. ^ Einmahl, JHJ; Smeets, SGWR (2009). Ultimate 100m world records through extreme-value theory (PDF) (Report). CentER Discussion Paper. Vol. 57. Tilburg University. Архивировано из оригинала (PDF) 2016-03-12 . Получено 2009-08-12 .
  13. ^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2002). «Тенденции и случайные колебания в легкой атлетике». Nature . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl :2003/25362. PMID  12037557. S2CID  13469470.
  14. ^ Gembris, D.; Taylor, J.; Suter, D. (2007). «Эволюция спортивных рекордов: статистические эффекты против реальных улучшений». Журнал прикладной статистики . 34 (5): 529– 545. Bibcode : 2007JApSt..34..529G. doi : 10.1080/02664760701234850. hdl : 2003/25404. PMC 11134017. S2CID 55378036  . 
  15. ^ Спиринг, Х.; Тон, Дж.; Айронс, Д.; Полден, Т.; Беннетт, Г. (2021). «Ранжирование и другие свойства элитных пловцов с использованием теории экстремальных значений». Журнал Королевского статистического общества . Серия A (Статистика в обществе). 184 (1): 368–395 . arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID  204823947.
  16. ^ Songchitruksa, P.; Tarko, AP (2006). «Подход теории экстремальных значений к оценке безопасности». Анализ и предотвращение аварий . 38 (4): 811– 822. doi :10.1016/j.aap.2006.02.003. PMID  16546103.
  17. ^ Орсини, Ф.; Геччеле, Г.; Гастальди, М.; Росси, Р. (2019). «Прогнозирование столкновений на кольцевых перекрестках: сравнительное исследование подходов теории экстремальных значений». Transportmetrica . Серия A: Транспортная наука. 15 (2): 556– 572. doi :10.1080/23249935.2018.1515271. S2CID  158343873.
  18. ^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (февраль 2018 г.). «О выборе канала для систем агрегации несущих». IEEE Transactions on Communications . 66 (2): 808– 818. doi :10.1109/TCOMM.2017.2757478. S2CID  3405114.
  19. ^ Вонг, Феликс; Коллинз, Джеймс Дж. (2 ноября 2020 г.). «Доказательства того, что суперраспространение коронавируса имеет толстый хвост». Труды Национальной академии наук США . 117 (47): 29416– 29418. Bibcode : 2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN  0027-8424. PMC 7703634. PMID 33139561  . 
  20. ^ Баснаяке, Канишка; Мазо, Дэвид; Бемельманс, Алексис; Руах, Натали; Коркотян, Эдуард; Холкман, Дэвид (4 июня 2019 г.). «Быстрые кальциевые переходы в дендритных шипиках, обусловленные экстремальной статистикой». PLOS Biology . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN  1545-7885. PMC 6548358. PMID 31163024  . 
  21. ^ Юнис, Абубакер; Абдельджалил, Анвар; Омер, Али (1 января 2023 г.). «Определение коэффициента генерации панели с использованием метода пиков сверх порогового значения и краткосрочных данных для автономной фотоэлектрической системы в Судане: случай города Хартум». Солнечная энергия . 249 : 242– 249. Bibcode : 2023SoEn..249..242Y. doi : 10.1016/j.solener.2022.11.039. ISSN  0038-092X. S2CID  254207549.
  22. ^ Фогг, Александра Рут (2023). "Анализ экстремальных значений наблюдений наземного магнитометра в обсерватории Валентия, Ирландия". Космическая погода . 21 (e2023SW003565). doi :10.1029/2023SW003565.
  23. ^ Элвидж, Шон (2020). «Оценка возникновения геомагнитной активности с использованием преобразования Гильберта-Хуанга и теории экстремальных значений». Космическая погода . 17 (e2020SW002513). doi : 10.1029/2020SW002513 .
  24. ^ Бергин, Эйслинг (2023). "Статистика экстремальных событий в геомагнитных индексах Dst, SYM-H и SMR". Космическая погода . 21 (e2022SW003304). doi :10.1029/2022SW003304. hdl : 10037/30641 .
  25. ^ Гамбел (2004)
  26. ^ ab Morton, ID; Bowers, J. (декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Applied Ocean Research . 18 (6): 303– 317. Bibcode : 1996AppOR..18..303M. doi : 10.1016/s0141-1187(97)00007-2. ISSN  0141-1187.
  27. ^ Бейрлант, Ян; Гёгебер, Юрий; Тейгельс, Йозеф; Сегерс, Йохан (27 августа 2004 г.). Статистика экстремальных значений: теория и приложения . Wiley Series in Probability and Statistics. Чичестер, Великобритания: John Wiley & Sons, Ltd. doi : 10.1002/0470012382. ISBN 978-0-470-01238-3.
  28. ^ Коулз, Стюарт (2001). Введение в статистическое моделирование экстремальных значений . Springer Series in Statistics. doi :10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN  0172-7397.
  29. ^ de Carvalho, M.; Davison, AC (2014). "Модели отношения спектральной плотности для многомерных экстремальных значений" (PDF) . Журнал Американской статистической ассоциации . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  30. ^ Хансон, Т.; де Карвальо, М.; Чен, Юхуэй (2017). «Полиномиальные угловые плотности Бернштейна многомерных распределений экстремальных значений» (PDF) . Statistics and Probability Letters . 128 : 60– 66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  31. ^ де Карвальо, М. (2013). "Оценка евклидового правдоподобия для двумерной хвостовой зависимости" (PDF) . Сообщения по статистике – Теория и методы . 42 (7): 1176– 1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID  42652601.
  32. ^ Захари, С.; Фельд, Г.; Уорд, Г.; Вольфрам, Дж. (октябрь 1998 г.). «Многомерная экстраполяция в условиях шельфа». Applied Ocean Research . 20 (5): 273– 295. Bibcode : 1998AppOR..20..273Z. doi : 10.1016/s0141-1187(98)00027-3. ISSN  0141-1187.
  33. ^ Дэвисон, А.С.; Смит, Ричард (1990). «Модели превышений высоких порогов». Журнал Королевского статистического общества . Серия B (Методологическая). 52 (3): 393– 425. doi :10.1111/j.2517-6161.1990.tb01796.x.
  34. ^ де Карвальо, М. (2016). «Статистика экстремальных ситуаций: проблемы и возможности». Справочник EVT и его применение в финансах и страховании (PDF) . Хобокен, Нью-Джерси: John Wiley's Sons. стр.  195–214 . ISBN 978-1-118-65019-6.
  35. ^ Кастро, Д.; де Карвальо, М.; Уодсворт, Дж. (2018). «Изменяющаяся во времени зависимость экстремальных значений с применением к ведущим европейским фондовым рынкам» (PDF) . Annals of Applied Statistics . 12 : 283–309 . doi :10.1214/17-AOAS1089. S2CID  33350408.
  36. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). «Модели регрессионного типа для экстремальной зависимости» (PDF) . Scandinavian Journal of Statistics . 46 (4): 1141– 1167. doi :10.1111/sjos.12388. S2CID  53570822.
  37. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). «Локальная надежная оценка функции зависимости Пиканда». Annals of Statistics . 46 (6A): 2806–2843 . doi : 10.1214/17-AOS1640 . S2CID  59467614.

Источники

  • Абарбанель, Х.; Кунин, С.; Левин, Х.; Макдональд, Г.; Ротхаус, О. (январь 1992 г.). "Статистика экстремальных событий в применении к климату" (PDF) . JASON . JSR-90-30S . Получено 03.03.2015 .
  • Альварадо, Эрнесто; Сандберг, Дэвид В.; Пикфорд, Стюарт Г. (1998). «Моделирование крупных лесных пожаров как экстремальных событий» (PDF) . Northwest Science . 72 : 66–75 . Архивировано из оригинала (PDF) 2009-02-26 . Получено 2009-02-06 .
  • Балкема, А.; де Хаан, Лоренс (1974). «Остаточная продолжительность жизни в преклонном возрасте». Annals of Probability . 2 (5): 792– 804. doi : 10.1214/aop/1176996548 . JSTOR  2959306.
  • Берри, К. В. (1975). Статистические методы в прикладной науке . Хобокен, Нью-Джерси: John Wiley & Sons.
  • Кастильо, Э. (1988). Теория экстремальных значений в инженерии . Нью-Йорк, Нью-Йорк: Academic Press. ISBN 0-12-163475-2.
  • Кастильо, Э.; Хади, А.С.; Балакришнан, Н.; Сарабия, Дж.М. (2005). Экстремальные значения и связанные с ними модели с приложениями в инженерии и науке . Серия Wiley по вероятности и статистике. Хобокен, Нью-Джерси: John Wiley's Sons. ISBN 0-471-67172-X.
  • Коулз, С. (2001). Введение в статистическое моделирование экстремальных значений . Лондон, Великобритания: Springer.
  • Эмбрехтс, П.; Клюппельберг, К .; Микош, Т. (1997). Моделирование экстремальных событий для страхования и финансов . Берлин, Германия: Springer Verlag.
  • Фишер, РА ; Типпетт, ЛХК (1928). «Ограничительные формы распределения частот самого большого и самого маленького члена выборки». Труды Кембриджского философского общества . 24 (2): 180– 190. Bibcode : 1928PCPS...24..180F. doi : 10.1017/s0305004100015681. S2CID  123125823.
  • Гнеденко, Б. В. (1943). «О предельном распределении максимального значения ряда ...». Анналы математики (на французском языке). 44 (3): 423– 453. doi :10.2307/1968974. JSTOR  1968974.
  • Гамбель, Э.Дж. , изд. (1935) [1933–1934]. «Les valeurs extrêmes des Distributions Statistiques» [Статистические распределения экстремальных значений] (pdf) . Annales de l'Institut Henri Poincaré (материалы конференции) (на французском языке). 5 (2). Франция : 115–158 . Проверено 1 апреля 2009 г. - через numdam.org.
  • Gumbel, EJ (2004) [1958]. Статистика экстремальных значений (переиздание). Минеола, Нью-Йорк: Довер. ISBN 978-0-486-43604-3.
  • Макконен, Л. (2008). «Проблемы анализа экстремальных значений». Structural Safety . 30 (5): 405– 419. doi :10.1016/j.strusafe.2006.12.001.
  • Лидбеттер, М. Р. (1991). «На основе моделирования «пиков сверх порога». Statistics & Probability Letters . 12 (4): 357– 362. doi :10.1016/0167-7152(91)90107-3.
  • Лидбеттер, М. Р.; Линдгрен, Г.; Рутцен, Х. (1982). Экстремумы и связанные с ними свойства случайных последовательностей и процессов . Нью-Йорк, Нью-Йорк: Springer-Verlag.
  • Линдгрен, Г.; Рутцен, Х. (1987). «Экстремальные значения: теория и технические приложения». Scandinavian Journal of Statistics, Theory and Applications . 14 : 241–279 .
  • Новак, SY (2011). Методы экстремальных значений с приложениями к финансам . Лондон, Великобритания / Бока-Ратон, Флорида: Chapman & Hall / CRC Press. ISBN 978-1-4398-3574-6.
  • Пикандс, Дж. (1975). «Статистический вывод с использованием статистик экстремального порядка». Annals of Statistics . 3 : 119–131 . doi : 10.1214/aos/1176343003 .
  • Типпетт, Майкл К.; Лепор, Кьяра; Коэн, Джоэл Э. (16 декабря 2016 г.). «Больше торнадо в самых экстремальных вспышках торнадо в США». Science . 354 (6318): 1419– 1423. Bibcode :2016Sci...354.1419T. doi : 10.1126/science.aah7393 . PMID  27934705.

Программное обеспечение

  • Belzile, LR; Dutang, C.; Northrop, PJ; Opitz, T. (2023). «Руководство для разработчиков моделей по программному обеспечению с экстремальными значениями». Extremes . 26 : 595– 638. arXiv : 2205.07714 . doi :10.1007/s10687-023-00475-9.
  • «Статистика экстремальных значений в R». cran.r-project.org (программное обеспечение). 4 ноября 2023 г.— Пакет для статистики экстремальных значений в R.
  • "Extremes.jl". github.com (программное обеспечение).— Пакет для экстремальной статистики значений в Julia .
  • «Исходный код для стационарного и нестационарного анализа экстремальных значений». amir.eng.uci.edu (программное обеспечение). Ирвайн, Калифорния: Калифорнийский университет в Ирвайне .
  • Чавес-Демулен, Валери; Рёрль, Армин (8 января 2004 г.). Теория экстремальных значений может спасти вашу шею (PDF) . risknet.de (Отчет). Германия.— Простое нематематическое введение.
  • Шаги по применению теории экстремальных значений к финансам: обзор (PDF) . bankofcanada.ca (Отчет). Банк Канады (опубликовано в январе 2010 г.). c. 2010.
  • Гамбель, Э.Дж. , изд. (1935) [1933–1934]. «Les valeurs extrêmes des Distributions Statistiques» [Статистические распределения экстремальных значений] (pdf) . Annales de l'Institut Henri Poincaré (материалы конференции) (на французском языке). 5 (2). Франция : 115–158 . Проверено 1 апреля 2009 г. - через numdam.org.— Полный доступ к конференциям, проведенным Э. Дж. Гамбелем в 1933–1934 годах.
Взято с "https://en.wikipedia.org/w/index.php?title=Теория_экстремальных_значений&oldid=1269861230"