Существуют два основных подхода к практическому анализу экстремальных значений.
Первый метод основан на получении серии блоковых максимумов (минимумов) в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), генерируя серию годовых максимумов (AMS).
Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом пика сверх порога (POT). [1]
Для данных AMS анализ может частично полагаться на результаты теоремы Фишера–Типпета–Гнеденко , что приводит к выбору обобщенного распределения экстремальных значений для подгонки. [2] [3] Однако на практике применяются различные процедуры для выбора между более широким диапазоном распределений. Теорема здесь относится к предельным распределениям для минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределений, отличных от обобщенного распределения экстремальных значений (GEVD). [4]
Для данных POT анализ может включать подгонку двух распределений: одно для количества событий за рассматриваемый период времени, а второе — для размера превышений.
Новак (2011) резервирует термин «метод POT» для случая, когда порог не является случайным, и отличает его от случая, когда речь идет о превышении случайного порога. [7]
Приложения
Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:
Область теории экстремальных значений была пионером Л. Типпетта (1902–1985). Типпетт работал в Британской ассоциации исследований хлопковой промышленности , где он работал над тем, чтобы сделать хлопковую нить более прочной. В своих исследованиях он понял, что прочность нити контролируется прочностью ее самых слабых волокон. С помощью RA Fisher Типпет получил три асимптотических предела, описывающих распределения экстремальных значений, предполагающих независимость переменных. EJ Gumbel (1958) [25] кодифицировал эту теорию. Эти результаты можно расширить, чтобы допустить слабые корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Один класс универсальности, представляющий особый интерес, — это класс логарифмически коррелированных полей, где корреляции логарифмически убывают с расстоянием.
Одномерная теория
Теория экстремальных значений одной переменной регулируется теоремой об экстремальных значениях , также называемой теоремой Фишера–Типпета–Гнеденко , которая описывает, какое из трех возможных распределений экстремальных значений применимо к конкретной статистической переменной , которая обобщена в этом разделе.
Многомерная теория
Теория экстремальных значений в более чем одной переменной вводит дополнительные вопросы, которые необходимо решить. Одна из возникающих проблем заключается в том, что необходимо указать, что представляет собой экстремальное событие. [26]
Хотя это просто в одномерном случае, нет однозначного способа сделать это в многомерном случае. Основная проблема заключается в том, что хотя можно упорядочить набор действительных чисел, нет естественного способа упорядочить набор векторов.
Например, в одномерном случае, если задан набор наблюдений, легко найти самое экстремальное событие, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае, если задан набор наблюдений , не сразу понятно, как найти самое экстремальное событие. Предположим, что кто-то измерил значения в определенное время и значения в более позднее время. Какое из этих событий будет считаться более экстремальным? На этот вопрос нет универсального ответа.
Другая проблема в многомерном случае заключается в том, что ограничивающая модель не так полно предписана, как в одномерном случае. В одномерном случае модель ( распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точная форма которой не предписана теорией. Однако эта функция должна подчиняться определенным ограничениям. [27] [28]
Непросто разработать оценщики, которые подчиняются таким ограничениям, хотя некоторые из них были недавно построены. [29] [30] [31]
В качестве примера применения двумерной теории экстремальных значений можно привести ее применение в исследовании океана. [26] [32]
Нестационарные экстремумы
Статистическое моделирование нестационарных временных рядов было разработано в 1990-х годах. [33] Методы для нестационарных многомерных экстремальных значений были введены позднее. [34]
Последние могут быть использованы для отслеживания того, как зависимость между экстремальными значениями изменяется с течением времени или по другой ковариате. [35] [36] [37]
^ Лидбеттер, М. Р. (1991). «На основе моделирования «пиков сверх порога». Statistics and Probability Letters . 12 (4): 357– 362. doi :10.1016/0167-7152(91)90107-3.
↑ Фишер и Типпетт (1928)
^ Гнеденко (1943)
^ Эмбрехтс, Клуппельберг и Микош (1997)
^ Пикандс (1975)
^ Балкема и де Хаан (1974)
^ Новак (2011)
^ Типпетт, Лепор и Коэн (2016)
^ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (март 2017 г.). «Экстремальные события во временном ряду экосистемы озера». Limnology and Oceanography Letters . 2 (3): 63. Bibcode : 2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
^ Альварадо, Сандберг и Пикфорд (1998), стр. 68
^ Макконен (2008)
^ Einmahl, JHJ; Smeets, SGWR (2009). Ultimate 100m world records through extreme-value theory (PDF) (Report). CentER Discussion Paper. Vol. 57. Tilburg University. Архивировано из оригинала (PDF) 2016-03-12 . Получено 2009-08-12 .
^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2002). «Тенденции и случайные колебания в легкой атлетике». Nature . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl :2003/25362. PMID 12037557. S2CID 13469470.
^ Gembris, D.; Taylor, J.; Suter, D. (2007). «Эволюция спортивных рекордов: статистические эффекты против реальных улучшений». Журнал прикладной статистики . 34 (5): 529– 545. Bibcode : 2007JApSt..34..529G. doi : 10.1080/02664760701234850. hdl : 2003/25404. PMC 11134017. S2CID 55378036 .
^ Спиринг, Х.; Тон, Дж.; Айронс, Д.; Полден, Т.; Беннетт, Г. (2021). «Ранжирование и другие свойства элитных пловцов с использованием теории экстремальных значений». Журнал Королевского статистического общества . Серия A (Статистика в обществе). 184 (1): 368–395 . arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID 204823947.
^ Songchitruksa, P.; Tarko, AP (2006). «Подход теории экстремальных значений к оценке безопасности». Анализ и предотвращение аварий . 38 (4): 811– 822. doi :10.1016/j.aap.2006.02.003. PMID 16546103.
^ Орсини, Ф.; Геччеле, Г.; Гастальди, М.; Росси, Р. (2019). «Прогнозирование столкновений на кольцевых перекрестках: сравнительное исследование подходов теории экстремальных значений». Transportmetrica . Серия A: Транспортная наука. 15 (2): 556– 572. doi :10.1080/23249935.2018.1515271. S2CID 158343873.
^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (февраль 2018 г.). «О выборе канала для систем агрегации несущих». IEEE Transactions on Communications . 66 (2): 808– 818. doi :10.1109/TCOMM.2017.2757478. S2CID 3405114.
^ Вонг, Феликс; Коллинз, Джеймс Дж. (2 ноября 2020 г.). «Доказательства того, что суперраспространение коронавируса имеет толстый хвост». Труды Национальной академии наук США . 117 (47): 29416– 29418. Bibcode : 2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN 0027-8424. PMC 7703634. PMID 33139561 .
^ Баснаяке, Канишка; Мазо, Дэвид; Бемельманс, Алексис; Руах, Натали; Коркотян, Эдуард; Холкман, Дэвид (4 июня 2019 г.). «Быстрые кальциевые переходы в дендритных шипиках, обусловленные экстремальной статистикой». PLOS Biology . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN 1545-7885. PMC 6548358. PMID 31163024 .
^ Юнис, Абубакер; Абдельджалил, Анвар; Омер, Али (1 января 2023 г.). «Определение коэффициента генерации панели с использованием метода пиков сверх порогового значения и краткосрочных данных для автономной фотоэлектрической системы в Судане: случай города Хартум». Солнечная энергия . 249 : 242– 249. Bibcode : 2023SoEn..249..242Y. doi : 10.1016/j.solener.2022.11.039. ISSN 0038-092X. S2CID 254207549.
^ Фогг, Александра Рут (2023). "Анализ экстремальных значений наблюдений наземного магнитометра в обсерватории Валентия, Ирландия". Космическая погода . 21 (e2023SW003565). doi :10.1029/2023SW003565.
^ Элвидж, Шон (2020). «Оценка возникновения геомагнитной активности с использованием преобразования Гильберта-Хуанга и теории экстремальных значений». Космическая погода . 17 (e2020SW002513). doi : 10.1029/2020SW002513 .
^ Бергин, Эйслинг (2023). "Статистика экстремальных событий в геомагнитных индексах Dst, SYM-H и SMR". Космическая погода . 21 (e2022SW003304). doi :10.1029/2022SW003304. hdl : 10037/30641 .
^ Гамбел (2004)
^ ab Morton, ID; Bowers, J. (декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Applied Ocean Research . 18 (6): 303– 317. Bibcode : 1996AppOR..18..303M. doi : 10.1016/s0141-1187(97)00007-2. ISSN 0141-1187.
^ Бейрлант, Ян; Гёгебер, Юрий; Тейгельс, Йозеф; Сегерс, Йохан (27 августа 2004 г.). Статистика экстремальных значений: теория и приложения . Wiley Series in Probability and Statistics. Чичестер, Великобритания: John Wiley & Sons, Ltd. doi : 10.1002/0470012382. ISBN978-0-470-01238-3.
^ Коулз, Стюарт (2001). Введение в статистическое моделирование экстремальных значений . Springer Series in Statistics. doi :10.1007/978-1-4471-3675-0. ISBN978-1-84996-874-4. ISSN 0172-7397.
^ de Carvalho, M.; Davison, AC (2014). "Модели отношения спектральной плотности для многомерных экстремальных значений" (PDF) . Журнал Американской статистической ассоциации . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID 53338058.
^ Хансон, Т.; де Карвальо, М.; Чен, Юхуэй (2017). «Полиномиальные угловые плотности Бернштейна многомерных распределений экстремальных значений» (PDF) . Statistics and Probability Letters . 128 : 60– 66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID 53338058.
^ де Карвальо, М. (2013). "Оценка евклидового правдоподобия для двумерной хвостовой зависимости" (PDF) . Сообщения по статистике – Теория и методы . 42 (7): 1176– 1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID 42652601.
^ Захари, С.; Фельд, Г.; Уорд, Г.; Вольфрам, Дж. (октябрь 1998 г.). «Многомерная экстраполяция в условиях шельфа». Applied Ocean Research . 20 (5): 273– 295. Bibcode : 1998AppOR..20..273Z. doi : 10.1016/s0141-1187(98)00027-3. ISSN 0141-1187.
^ Дэвисон, А.С.; Смит, Ричард (1990). «Модели превышений высоких порогов». Журнал Королевского статистического общества . Серия B (Методологическая). 52 (3): 393– 425. doi :10.1111/j.2517-6161.1990.tb01796.x.
^ де Карвальо, М. (2016). «Статистика экстремальных ситуаций: проблемы и возможности». Справочник EVT и его применение в финансах и страховании (PDF) . Хобокен, Нью-Джерси: John Wiley's Sons. стр. 195–214 . ISBN978-1-118-65019-6.
^ Кастро, Д.; де Карвальо, М.; Уодсворт, Дж. (2018). «Изменяющаяся во времени зависимость экстремальных значений с применением к ведущим европейским фондовым рынкам» (PDF) . Annals of Applied Statistics . 12 : 283–309 . doi :10.1214/17-AOAS1089. S2CID 33350408.
^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). «Модели регрессионного типа для экстремальной зависимости» (PDF) . Scandinavian Journal of Statistics . 46 (4): 1141– 1167. doi :10.1111/sjos.12388. S2CID 53570822.
^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). «Локальная надежная оценка функции зависимости Пиканда». Annals of Statistics . 46 (6A): 2806–2843 . doi : 10.1214/17-AOS1640 . S2CID 59467614.
Источники
Абарбанель, Х.; Кунин, С.; Левин, Х.; Макдональд, Г.; Ротхаус, О. (январь 1992 г.). "Статистика экстремальных событий в применении к климату" (PDF) . JASON . JSR-90-30S . Получено 03.03.2015 .
Альварадо, Эрнесто; Сандберг, Дэвид В.; Пикфорд, Стюарт Г. (1998). «Моделирование крупных лесных пожаров как экстремальных событий» (PDF) . Northwest Science . 72 : 66–75 . Архивировано из оригинала (PDF) 2009-02-26 . Получено 2009-02-06 .
Балкема, А.; де Хаан, Лоренс (1974). «Остаточная продолжительность жизни в преклонном возрасте». Annals of Probability . 2 (5): 792– 804. doi : 10.1214/aop/1176996548 . JSTOR 2959306.
Берри, К. В. (1975). Статистические методы в прикладной науке . Хобокен, Нью-Джерси: John Wiley & Sons.
Кастильо, Э. (1988). Теория экстремальных значений в инженерии . Нью-Йорк, Нью-Йорк: Academic Press. ISBN0-12-163475-2.
Кастильо, Э.; Хади, А.С.; Балакришнан, Н.; Сарабия, Дж.М. (2005). Экстремальные значения и связанные с ними модели с приложениями в инженерии и науке . Серия Wiley по вероятности и статистике. Хобокен, Нью-Джерси: John Wiley's Sons. ISBN0-471-67172-X.
Коулз, С. (2001). Введение в статистическое моделирование экстремальных значений . Лондон, Великобритания: Springer.
Эмбрехтс, П.; Клюппельберг, К .; Микош, Т. (1997). Моделирование экстремальных событий для страхования и финансов . Берлин, Германия: Springer Verlag.
Гнеденко, Б. В. (1943). «О предельном распределении максимального значения ряда ...». Анналы математики (на французском языке). 44 (3): 423– 453. doi :10.2307/1968974. JSTOR 1968974.
Гамбель, Э.Дж. , изд. (1935) [1933–1934]. «Les valeurs extrêmes des Distributions Statistiques» [Статистические распределения экстремальных значений] (pdf) . Annales de l'Institut Henri Poincaré (материалы конференции) (на французском языке). 5 (2). Франция : 115–158 . Проверено 1 апреля 2009 г. - через numdam.org.
Макконен, Л. (2008). «Проблемы анализа экстремальных значений». Structural Safety . 30 (5): 405– 419. doi :10.1016/j.strusafe.2006.12.001.
Лидбеттер, М. Р. (1991). «На основе моделирования «пиков сверх порога». Statistics & Probability Letters . 12 (4): 357– 362. doi :10.1016/0167-7152(91)90107-3.
Лидбеттер, М. Р.; Линдгрен, Г.; Рутцен, Х. (1982). Экстремумы и связанные с ними свойства случайных последовательностей и процессов . Нью-Йорк, Нью-Йорк: Springer-Verlag.
Линдгрен, Г.; Рутцен, Х. (1987). «Экстремальные значения: теория и технические приложения». Scandinavian Journal of Statistics, Theory and Applications . 14 : 241–279 .
Новак, SY (2011). Методы экстремальных значений с приложениями к финансам . Лондон, Великобритания / Бока-Ратон, Флорида: Chapman & Hall / CRC Press. ISBN978-1-4398-3574-6.
Пикандс, Дж. (1975). «Статистический вывод с использованием статистик экстремального порядка». Annals of Statistics . 3 : 119–131 . doi : 10.1214/aos/1176343003 .
Типпетт, Майкл К.; Лепор, Кьяра; Коэн, Джоэл Э. (16 декабря 2016 г.). «Больше торнадо в самых экстремальных вспышках торнадо в США». Science . 354 (6318): 1419– 1423. Bibcode :2016Sci...354.1419T. doi : 10.1126/science.aah7393 . PMID 27934705.
Программное обеспечение
Belzile, LR; Dutang, C.; Northrop, PJ; Opitz, T. (2023). «Руководство для разработчиков моделей по программному обеспечению с экстремальными значениями». Extremes . 26 : 595– 638. arXiv : 2205.07714 . doi :10.1007/s10687-023-00475-9.
«Статистика экстремальных значений в R». cran.r-project.org (программное обеспечение). 4 ноября 2023 г.— Пакет для статистики экстремальных значений в R.
"Extremes.jl". github.com (программное обеспечение).— Пакет для экстремальной статистики значений в Julia .
«Исходный код для стационарного и нестационарного анализа экстремальных значений». amir.eng.uci.edu (программное обеспечение). Ирвайн, Калифорния: Калифорнийский университет в Ирвайне .
Внешние ссылки
Чавес-Демулен, Валери; Рёрль, Армин (8 января 2004 г.). Теория экстремальных значений может спасти вашу шею (PDF) . risknet.de (Отчет). Германия.— Простое нематематическое введение.
Шаги по применению теории экстремальных значений к финансам: обзор (PDF) . bankofcanada.ca (Отчет). Банк Канады (опубликовано в январе 2010 г.). c. 2010.
Гамбель, Э.Дж. , изд. (1935) [1933–1934]. «Les valeurs extrêmes des Distributions Statistiques» [Статистические распределения экстремальных значений] (pdf) . Annales de l'Institut Henri Poincaré (материалы конференции) (на французском языке). 5 (2). Франция : 115–158 . Проверено 1 апреля 2009 г. - через numdam.org.— Полный доступ к конференциям, проведенным Э. Дж. Гамбелем в 1933–1934 годах.