Характеристика и снижение неопределенностей как в вычислительных, так и в реальных приложениях
Квантификация неопределенности ( UQ ) — это наука количественной характеристики и оценки неопределенностей как в вычислительных, так и в реальных приложениях. Она пытается определить, насколько вероятны определенные результаты, если некоторые аспекты системы не известны точно. Примером может служить прогнозирование ускорения человеческого тела при лобовом столкновении с другим автомобилем: даже если скорость была точно известна, небольшие различия в производстве отдельных автомобилей, в том, насколько сильно был затянут каждый болт и т. д., приведут к разным результатам, которые можно предсказать только в статистическом смысле.
Многие проблемы в естественных науках и инженерии также изобилуют источниками неопределенности. Компьютерные эксперименты на компьютерных симуляциях являются наиболее распространенным подходом к изучению проблем в количественной оценке неопределенности. [1] [2] [3] [4] [5] [6]
Источники
Неопределенность может входить в математические модели и экспериментальные измерения в различных контекстах. Один из способов классификации источников неопределенности — рассмотреть: [7]
Параметр
Это происходит из параметров модели, которые являются входными данными для компьютерной модели (математической модели), но чьи точные значения неизвестны экспериментаторам и не могут контролироваться в физических экспериментах, или чьи значения не могут быть точно выведены статистическими методами . Некоторые примеры этого - локальное ускорение свободного падения в эксперименте с падающим объектом, различные свойства материалов в конечно-элементном анализе для инженерии и неопределенность множителя в контексте оптимизации макроэкономической политики .
Параметрический
Это происходит из-за изменчивости входных переменных модели. Например, размеры заготовки в процессе производства могут не соответствовать точно разработанным и проинструктированным параметрам, что может привести к изменчивости ее производительности.
Структурная неопределенность
Также известное как неадекватность модели, смещение модели или несоответствие модели, это происходит из-за отсутствия знаний о физике, лежащей в основе проблемы. Это зависит от того, насколько точно математическая модель описывает истинную систему для реальной ситуации, учитывая тот факт, что модели почти всегда являются лишь приближениями к реальности. Одним из примеров является моделирование процесса падения объекта с использованием модели свободного падения; сама модель неточна, поскольку всегда существует трение воздуха. В этом случае, даже если в модели нет неизвестных параметров, все равно ожидается несоответствие между моделью и истинной физикой.
Алгоритмический
Также известна как численная неопределенность или дискретная неопределенность. Этот тип возникает из-за числовых ошибок и числовых приближений на реализацию компьютерной модели. Большинство моделей слишком сложны для точного решения. Например, метод конечных элементов или метод конечных разностей может использоваться для аппроксимации решения уравнения в частных производных (что вносит числовые ошибки). Другими примерами являются численное интегрирование и усечение бесконечной суммы, которые являются необходимыми приближениями в численной реализации.
Экспериментальный
Также известная как ошибка наблюдения, она возникает из-за изменчивости экспериментальных измерений. Экспериментальная неопределенность неизбежна и может быть замечена при многократном повторении измерения с использованием точно таких же настроек для всех входных данных/переменных.
Интерполяция
Это происходит из-за отсутствия доступных данных, собранных из компьютерных моделей моделирования и/или экспериментальных измерений. Для других входных настроек, которые не имеют данных моделирования или экспериментальных измерений, необходимо интерполировать или экстраполировать, чтобы предсказать соответствующие ответы.
Алеаторические и эпистемические
Неопределенность иногда подразделяют на две категории, [8] [9] наиболее заметно проявляющиеся в медицинских приложениях. [10]
Алеаторический
Алеаторическая неопределенность также известна как стохастическая неопределенность и является репрезентативной для неизвестных, которые различаются каждый раз, когда мы проводим один и тот же эксперимент. Например, одна стрела, выпущенная из механического лука, который точно повторяет каждый запуск (то же ускорение, высота, направление и конечная скорость), не попадет в одну и ту же точку на цели из-за случайных и сложных вибраций древка стрелы, знание которых не может быть достаточно определено, чтобы исключить результирующий разброс точек попадания. Аргумент здесь, очевидно, заключается в определении «не может». То, что мы не можем достаточно измерить с помощью наших имеющихся в настоящее время измерительных приборов, не обязательно исключает существование такой информации, которая переместила бы эту неопределенность в нижестоящую категорию. Алеаторика происходит от латинского alea или игральные кости, относящегося к азартной игре.
Эпистемическая неопределенность
Эпистемическая неопределенность также известна как систематическая неопределенность и возникает из-за вещей, которые в принципе можно знать, но не знать на практике. Это может быть связано с тем, что измерение неточно, модель не учитывает определенные эффекты или определенные данные были намеренно скрыты. Примером источника этой неопределенности может служить сопротивление в эксперименте, предназначенном для измерения ускорения свободного падения вблизи поверхности Земли. Обычно используемое ускорение свободного падения 9,8 м/с² игнорирует эффекты сопротивления воздуха, но сопротивление воздуха для объекта можно измерить и включить в эксперимент, чтобы уменьшить результирующую неопределенность в расчете ускорения свободного падения.
Совместное возникновение и взаимодействие алеаторической и эпистемической неопределенности
Алеаторическая и эпистемическая неопределенность также могут возникать одновременно в одном термине, например, когда экспериментальные параметры показывают алеаторическую неопределенность, и эти экспериментальные параметры вводятся в компьютерное моделирование. Если затем для количественной оценки неопределенности суррогатная модель , например, гауссовский процесс или полиномиальное расширение хаоса, изучается из компьютерных экспериментов, этот суррогат демонстрирует эпистемическую неопределенность, которая зависит от алеаторической неопределенности экспериментальных параметров или взаимодействует с ней. [4] Такая неопределенность больше не может быть классифицирована исключительно как алеаторическая или эпистемическая, но является более общей выводной неопределенностью.
В реальных приложениях присутствуют оба вида неопределенности. Квантификация неопределенности направлена на явное выражение обоих типов неопределенности по отдельности. Квантификация для алеаторических неопределенностей может быть относительно простой, где традиционная (частотная) вероятность является самой базовой формой. Часто используются такие методы, как метод Монте-Карло . Распределение вероятностей может быть представлено его моментами (в гауссовском случае достаточно среднего значения и ковариации , хотя, в общем, даже знание всех моментов до произвольно высокого порядка все еще не определяет функцию распределения однозначно), или, в последнее время, такими методами, как разложение Карунена-Лоэва и полиномиальное разложение хаоса . Чтобы оценить эпистемическую неопределенность, прилагаются усилия для понимания (отсутствия) знания системы, процесса или механизма. Эпистемическая неопределенность обычно понимается через призму байесовской вероятности , где вероятности интерпретируются как указание того, насколько уверенным может быть рациональный человек в отношении конкретного утверждения.
Математическая перспектива
В математике неопределенность часто характеризуется в терминах распределения вероятностей . С этой точки зрения эпистемическая неопределенность означает неуверенность в том, каково соответствующее распределение вероятностей, а алеаторическая неопределенность означает неуверенность в том, какова будет случайная выборка , взятая из распределения вероятностей.
Типы проблем
Существует два основных типа проблем в количественной оценке неопределенности: одна из них — прямое распространение неопределенности (где различные источники неопределенности распространяются через модель для прогнозирования общей неопределенности в реакции системы), а другая — обратная оценка неопределенности модели и неопределенности параметров (где параметры модели калибруются одновременно с использованием тестовых данных). Было проведено множество исследований по первой проблеме, и для нее было разработано большинство методов анализа неопределенности. С другой стороны, последняя проблема привлекает все большее внимание в сообществе инженерного проектирования, поскольку количественная оценка неопределенности модели и последующие прогнозы истинной реакции(й) системы представляют большой интерес для проектирования надежных систем.
Вперед
Распространение неопределенности — это количественная оценка неопределенностей в выходных данных системы, распространяемых неопределенными входными данными. Она фокусируется на влиянии на выходные данные параметрической изменчивости, перечисленной в источниках неопределенности. Целями анализа распространения неопределенности могут быть:
Для оценки надежности выходных данных. Это особенно полезно в инженерии надежности , где выходные данные системы обычно тесно связаны с производительностью системы.
Для оценки полного распределения вероятностей выходов. Это полезно в сценарии оптимизации полезности , где полное распределение используется для расчета полезности.
Обратный
Учитывая некоторые экспериментальные измерения системы и некоторые результаты компьютерного моделирования из ее математической модели, обратная количественная оценка неопределенности оценивает расхождение между экспериментом и математической моделью (что называется коррекцией смещения ), а также оценивает значения неизвестных параметров в модели, если таковые имеются (что называется калибровкой параметров или просто калибровкой ). Обычно это гораздо более сложная проблема, чем прямое распространение неопределенности; однако она имеет большое значение, поскольку обычно реализуется в процессе обновления модели. Существует несколько сценариев в обратной количественной оценке неопределенности:
Только коррекция смещения
Коррекция смещения количественно определяет неадекватность модели , т.е. расхождение между экспериментом и математической моделью. Общая формула обновления модели для коррекции смещения:
где обозначает экспериментальные измерения как функцию нескольких входных переменных , обозначает отклик компьютерной модели (математической модели), обозначает аддитивную функцию расхождения (она же функция смещения), а обозначает экспериментальную неопределенность. Цель состоит в том, чтобы оценить функцию расхождения , и в качестве побочного продукта полученная обновленная модель представляет собой . Доверительный интервал прогнозирования предоставляется с обновленной моделью в качестве количественной оценки неопределенности.
Только калибровка параметров
Калибровка параметров оценивает значения одного или нескольких неизвестных параметров в математической модели. Общая формула обновления модели для калибровки:
где обозначает отклик компьютерной модели, который зависит от нескольких неизвестных параметров модели , а обозначает истинные значения неизвестных параметров в ходе экспериментов. Цель состоит в том, чтобы либо оценить , либо придумать распределение вероятностей, которое охватывает наилучшие знания истинных значений параметров.
Коррекция смещения и калибровка параметров
Он рассматривает неточную модель с одним или несколькими неизвестными параметрами, а его формула обновления модели объединяет эти два параметра:
Это наиболее полная формулировка обновления модели, которая включает все возможные источники неопределенности, и ее решение требует наибольших усилий.
Избирательные методики
Было проведено много исследований для решения проблем количественной оценки неопределенности, хотя большинство из них имеют дело с распространением неопределенности. В течение последних одного-двух десятилетий также были разработаны несколько подходов для обратных проблем количественной оценки неопределенности, которые оказались полезными для большинства задач малого и среднего масштаба.
Прямое распространение
Существующие подходы к распространению неопределенности включают вероятностные подходы и невероятностные подходы. Существует в основном шесть категорий вероятностных подходов к распространению неопределенности: [11]
Общие методы на основе суррогатов: При неинтрузивном подходе суррогатная модель изучается для замены эксперимента или моделирования дешевым и быстрым приближением. Методы на основе суррогатов также могут использоваться в полностью байесовском стиле. [12] [4] [13] [14] Этот подход оказался особенно эффективным, когда стоимость выборки, например, вычислительно дорогостоящего моделирования, непомерно высока.
Методы, основанные на локальном расширении: ряд Тейлора , метод возмущения и т. д. Эти методы имеют преимущества при работе с относительно небольшой входной изменчивостью и выходами, которые не выражают высокой нелинейности. Эти линейные или линеаризованные методы подробно описаны в статье Распространение неопределенности .
Методы, основанные на функциональном разложении: разложение Неймана, ортогональное разложение или разложение Карунена–Лоэва (KLE), с разложением полиномиального хаоса (PCE) и вейвлет-разложением в качестве частных случаев.
Методы, основанные на наиболее вероятной точке (MPP): метод надежности первого порядка (FORM) и метод надежности второго порядка (SORM).
Методы, основанные на численном интегрировании: полное факторное численное интегрирование (FFNI) и уменьшение размерности (DR).
Вероятностный подход считается наиболее строгим подходом к анализу неопределенности в инженерном проектировании из-за его согласованности с теорией анализа решений. Его краеугольным камнем является расчет функций плотности вероятности для выборочной статистики. [16] Это может быть выполнено строго для случайных величин, которые могут быть получены как преобразования гауссовых величин, что приводит к точным доверительным интервалам.
В байесовской структуре существует несколько методологий для количественной оценки обратной неопределенности . Наиболее сложным направлением является решение проблем как с коррекцией смещения, так и с калибровкой параметров. Проблемы таких проблем включают не только влияние неадекватности модели и неопределенности параметров, но и отсутствие данных как из компьютерного моделирования, так и из экспериментов. Распространенной ситуацией является то, что входные настройки не одинаковы для экспериментов и моделирования. Другая распространенная ситуация заключается в том, что параметры, полученные из экспериментов, являются входными для моделирования. Для вычислительно затратных симуляций часто необходима суррогатная модель , например, гауссовский процесс или полиномиальное разложение хаоса , определяющая обратную задачу для нахождения суррогатной модели, которая наилучшим образом приближает моделирование. [4]
Модульный подход
Подход к обратной количественной оценке неопределенности — модульный байесовский подход. [7] [17] Модульный байесовский подход получил свое название от своей четырехмодульной процедуры. Помимо текущих доступных данных, должно быть назначено априорное распределение неизвестных параметров.
Модуль 1: Моделирование гауссовского процесса для компьютерной модели
Для решения проблемы отсутствия результатов моделирования компьютерная модель заменяется моделью гауссовского процесса (ГП).
где
— размерность входных переменных, а — размерность неизвестных параметров. В то время как — предопределено, , известные как гиперпараметры модели GP, необходимо оценить с помощью оценки максимального правдоподобия (MLE) . Этот модуль можно рассматривать как обобщенный метод кригинга .
Модуль 2: Моделирование гауссовского процесса для функции расхождения
Аналогично первому модулю функция расхождения заменяется моделью GP.
где
Вместе с априорным распределением неизвестных параметров и данными из компьютерных моделей и экспериментов можно вывести оценки максимального правдоподобия для . В то же время из Модуля 1 также обновляется.
где включает все фиксированные гиперпараметры из предыдущих модулей.
Модуль 4: Прогнозирование экспериментального отклика и функции расхождения
Полный подход
Полностью байесовский подход требует, чтобы были назначены не только априорные данные для неизвестных параметров , но и априорные данные для других гиперпараметров . Он следует следующим шагам: [18]
Вывести апостериорное распределение ;
Интегрируем и получаем . Этот единственный шаг завершает калибровку;
Прогнозирование экспериментального отклика и функции расхождения.
Однако этот подход имеет существенные недостатки:
Для большинства случаев является весьма неразрешимой функцией . Следовательно, интеграция становится очень проблематичной. Более того, если априорные данные для других гиперпараметров не выбраны тщательно, сложность численной интеграции возрастает еще больше.
На этапе прогнозирования, прогноз (который должен включать как минимум ожидаемое значение ответов системы) также требует численного интегрирования. Марковская цепь Монте-Карло (MCMC) часто используется для интегрирования; однако это вычислительно затратно.
Полностью байесовский подход требует огромного количества вычислений и пока может оказаться непрактичным для решения самых сложных ситуаций моделирования. [18]
Известные проблемы
Теории и методологии распространения неопределенности гораздо лучше разработаны по сравнению с обратной квантификацией неопределенности. Для последнего остаются нерешенными несколько трудностей:
Проблема размерности: Вычислительные затраты резко возрастают с ростом размерности задачи, т. е. числа входных переменных и/или числа неизвестных параметров.
Проблема идентифицируемости: [19] Несколько комбинаций неизвестных параметров и функции расхождения могут дать одно и то же экспериментальное предсказание. Следовательно, различные значения параметров не могут быть различены/идентифицированы. Эта проблема обходит байесовский подход, где такие комбинации усредняются. [4]
Неполный ответ модели: относится к модели, не имеющей решения для некоторых комбинаций входных переменных. [20] [21]
Количественная оценка неопределенности входных величин: критические события, отсутствующие в имеющихся данных, или критические величины, не идентифицированные аналитиками, например, из-за ограничений существующих моделей. [22]
Мало внимания уделяется влиянию выбора, сделанного аналитиками. [23]
^ Сакс, Джером; Уэлч, Уильям Дж.; Митчелл, Тоби Дж.; Уинн, Генри П. (1989). «Проектирование и анализ компьютерных экспериментов». Статистическая наука . 4 (4): 409–423 . doi : 10.1214/ss/1177012413 . JSTOR 2245858.
^ Иман, Рональд Л.; Хелтон, Джон К. (1988). «Исследование методов анализа неопределенности и чувствительности для компьютерных моделей». Анализ риска . 8 (1). Wiley: 71– 90. Bibcode : 1988RiskA...8...71I. doi : 10.1111/j.1539-6924.1988.tb01155.x. ISSN 0272-4332.
^ Уокер, МЫ; Харремоэс, П.; Ротманс, Дж.; ван дер Слейс, JP; ван Ассельт, MBA; Янссен, П.; Крайер фон Краусс, член парламента (2003 г.). «Определение неопределенности: концептуальная основа управления неопределенностью в поддержке принятия решений на основе моделей». Комплексная оценка . 4 (1). Издательство Swets & Zeitlinger: 5–17 . Бибкод : 2003IntAs...4....5W. дои : 10.1076/iaij.4.1.5.16466. hdl : 1874/386032 . ISSN 1389-5176.
^ abcde Ранфтль, Саша; фон дер Линден, Вольфганг (2021-11-13). "Байесовский суррогатный анализ и распространение неопределенности". Physical Sciences Forum . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN 2673-9984.
^ Ральф К. Смит (ред.): «Количественная оценка неопределенности: теория, реализация и приложения», 2-е изд., SIAM, ISBN 978-1-61197-783-7 (2024).
^ TJ Sullivan: «Введение в количественную оценку неопределенности», Springer, ISBN 978-3319233949 (21 декабря 2015 г.).
^ ab Kennedy, Marc C.; O'Hagan, Anthony (2001). «Байесовская калибровка компьютерных моделей». Журнал Королевского статистического общества, серия B (статистическая методология) . 63 (3): 425– 464. doi : 10.1111/1467-9868.00294 .
^ Дер Кюрегян, Армен; Дитлевсен, Ове (2009). «Алеаторный или эпистемический? Имеет ли это значение?». Structural Safety . 31 (2): 105– 112. doi :10.1016/j.strusafe.2008.06.020.
^ Matthies, Hermann G. (2007). "Количественная оценка неопределенности: современное вычислительное представление вероятности и ее применение". Extreme Man-Made and Natural Hazards in Dynamics of Structures . NATO Security through Science Series. стр. 105–135 . doi :10.1007/978-1-4020-5656-7_4. ISBN978-1-4020-5654-3.
^ Ли, Ш.; Чен, В. (2008-05-09). "Сравнительное исследование методов распространения неопределенности для задач типа "черный ящик"". Structural and Multidisciplinary Optimization . 37 (3). Springer Science and Business Media LLC: 239– 253. doi :10.1007/s00158-008-0234-7. ISSN 1615-147X. S2CID 119988015.
^ Карденас, IC (2019). «Об использовании байесовских сетей в качестве подхода к метамоделированию для анализа неопределенностей в анализе устойчивости склонов». Georisk: Оценка и управление рисками для инженерных систем и геологических опасностей . 13 (1): 53– 65. Bibcode : 2019GAMRE..13...53C. doi : 10.1080/17499518.2018.1498524. S2CID 216590427.
^ Ранфтл, Саша; Мелито, Джан Марко; Бадели, Вахид; Рейнбахер-Кёстингер, Элис; Эллерманн, Катрин; фон дер Линден, Вольфганг (2019-12-31). "Байесовская количественная оценка неопределенности с использованием данных с множественной точностью и гауссовых процессов для импедансной кардиографии расслоения аорты". Энтропия . 22 (1): 58. Bibcode : 2019Entrp..22...58R. doi : 10.3390/e22010058 . ISSN 1099-4300. PMC 7516489. PMID 33285833 .
^ Ранфтл, Саша; Мюллер, Томас Стефан; Виндбергер, Урсула; фон дер Линден, Вольфганг; Бренн, Гюнтер (2021-05-03), Данные и коды для «Байесовского подхода к неопределенностям реологии крови в аортальной гемодинамике», doi :10.5281/zenodo.5237189 , получено 12.01.2022
^ Жолен, Л.; Киффер, М.; Дидрит, О.; Уолтер, Э. (2001). Прикладной интервальный анализ . Спрингер. ISBN1-85233-219-0.
^ Арнаут, Л. Р. Неопределенность измерений в реверберационных камерах - I. Примеры статистики. Технический отчет TQE 2, 2-е изд., раздел 3.1, Национальная физическая лаборатория, 2008.
^ Марк С. Кеннеди, Энтони О'Хаган, Дополнительные сведения о байесовской калибровке компьютерных моделей , Шеффилд, Шеффилдский университет: 1–13, 2000
^ ab Bayarri, MJ ; Berger, JO; Liu, F. (2009-03-01). «Модуляция в байесовском анализе с упором на анализ компьютерных моделей». Байесовский анализ . 4 (1). Институт математической статистики: 119– 150. doi : 10.1214/09-ba404 . ISSN 1936-0975.
^ Арендт, Пол Д.; Эпли, Дэниел В.; Чен, Вэй ; Лэмб, Дэвид; Горсич, Дэвид (28.09.2012). «Улучшение идентифицируемости при калибровке моделей с использованием множественных ответов». Журнал механического проектирования . 134 (10). ASME International: 100909. doi : 10.1115/1.4007573. ISSN 1050-0472.
^ Карденас, IC (2019). «Об использовании байесовских сетей в качестве подхода к метамоделированию для анализа неопределенностей в анализе устойчивости склонов». Georisk: Оценка и управление рисками для инженерных систем и геологических опасностей . 13 (1): 53– 65. Bibcode : 2019GAMRE..13...53C. doi : 10.1080/17499518.2018.1498524. S2CID 216590427.
^ van den Eijnden, AP; Schweckendiek, T; Hicks, MA (2021). «Метамоделирование для анализа геотехнической надежности с зашумленными и неполными моделями». Georisk: Оценка и управление рисками для инженерных систем и геологических опасностей . 16 (3): 518– 535. doi : 10.1080/17499518.2021.1952611 . S2CID 238819106.
^ Карденас, И.; Авен, Т.; Флаге, Р. (2022). «Решение проблем в количественной оценке неопределенности. Случай оценок геологических опасностей». Geosci. Model Dev. Discuss . 16 (6): 1601– 1615. doi : 10.5194/gmd-16-1601-2023 . hdl : 11250/3105739 .
^ Карденас, И.; Авен, Т.; Флаге, Р. (2022). «Решение проблем в количественной оценке неопределенности. Случай оценок геологических опасностей». Geosci. Model Dev. Discuss . 16 (6): 1601– 1615. doi : 10.5194/gmd-16-1601-2023 . hdl : 11250/3105739 .