This article is an orphan, as no other articles link to it. Please introduce links to this page from related articles; try the Find link tool for suggestions. (September 2023)
SimDec , или имитационная декомпозиция , представляет собой гибридный метод анализа неопределенности и чувствительности , предназначенный для визуального изучения взаимосвязей между выходными и входными переменными вычислительной модели.
SimDec отображает многовариантные сценарии на распределение выходных данных модели. [1] Этот подход визуальной аналитики раскрывает базовую природу поведения модели, включая ее нелинейные и многовариантные эффекты взаимодействия . [2]
SimDec может использоваться в любой области науки, техники и социальных областях. Существующие приложения включают бизнес [3] и проблемы окружающей среды. [4] [5]
Метод
SimDec работает с данными моделирования Монте-Карло (или измерениями), где регистрируются как выходные, так и входные значения. Обычно рекомендуется не менее тысячи наблюдений (или имитированных итераций), чтобы сохранить читаемость полученных гистограмм. Схема алгоритма разложения, которая легко доступна на нескольких языках программирования, [6] выглядит следующим образом:
Выберите входные переменные для разложения . Можно использовать индексы чувствительности (см. анализ чувствительности на основе дисперсии ), чтобы определить наиболее влиятельные переменные для разложения, или выбрать их вручную в соответствии с контекстом проблемы принятия решения (например, только те входные переменные, на которые может воздействовать лицо, принимающее решение). Две-три входные переменные, упорядоченные по убыванию значения их индексов чувствительности, обычно обеспечивают наиболее значимые результаты разложения.
Разделите входы на состояния . Числовые диапазоны входов разделены на несколько интервалов с равным количеством наблюдений в каждом. Для категориальных переменных категории представляют состояния.
Сценарии форм . Все комбинации состояний выбранных входных переменных создают уникальные сценарии или подмножества данных. Например, если диапазон X2 разделен на низкий , средний и высокий , а X3 принимает значения 1 или 2, формируются шесть сценариев:
(i) X2 низкий и X3 = 1,
(ii) X2 низкий и X3 = 2,
(iii) X2 средний и X3 = 1,
(iv) X2 средний и X3 = 2,
(v) X2 высокий и X3 = 1, и
(vi) X2 высокий и X3 = 2.
Назначьте сценарии каждому выходному значению . Данные моделирования используются для определения индекса сценария для каждого запуска моделирования. Например, если значение X2 попадает в низкое состояние, а X3 равно 2, соответствующий сценарий, определенный на шаге 3, — (ii).
Цветовое кодирование выходного распределения . Когда всем выходным значениям назначаются индексы сценариев, они отображаются как ряды в составной гистограмме, визуально разделенные цветовым кодированием. Для удобства визуального восприятия состояниям наиболее влиятельной входной переменной назначаются различные цвета, а все остальные разделы принимают оттенки этих цветов (см. рисунок).
Все эти шаги можно выполнить автоматически на основе заданных данных с помощью пакетов SimDec с открытым исходным кодом, которые в настоящее время доступны в Python, R, Julia и Matlab. [6] Шаблон SimDec в Excel запускает моделирование Монте-Карло модели электронной таблицы, но имеет только ручную опцию для выбора входных данных.
Как читать SimDec
Гистограмма
Гистограмма — это приблизительное представление распределения числовых данных. Ее горизонтальная ось показывает диапазон интересующей переменной, а ее вертикальная ось обозначает количество , также называемое частотой , или, если разделить на общее количество точек данных, вероятность . [7]
Распределение само по себе может предоставить лишь ограниченную информацию о данных — их минимуме, максимуме и форме (где сосредоточено больше всего данных).
Оценка важности входных данных
Если входная переменная не влияет на выход, ее состояния (например, низкое и высокое) будут лежать друг над другом на гистограмме SimDec, занимая полностью перекрывающиеся диапазоны выходных данных. Если входная переменная оказывает сильное влияние и объясняет большую часть дисперсии выходных данных, граница между ее состояниями на гистограмме SimDec будет вертикальной. Такая визуализация имеет важное значение для принятия решений — например, если может быть достигнуто высокое состояние X , это гарантирует определенный диапазон Y. Все случаи между ними с низкими и сильными эффектами будут показывать диагональную границу между состояниями. Чем меньше они перекрываются, тем больше влияние X на Y. [1 ]
В то время как горизонтальное смещение подраспределений на гистограмме SimDec является ключом к интерпретации результатов, вертикальное расположение подраспределений — это всего лишь технический вопрос порядка построения рядов составной гистограммы.
Интерпретация важности входных переменных с помощью гистограммы SimDec
Сила эффекта
Визуальный
Последствия принятия решений
Никакого эффекта.
Подраспределения лежат друг над другом, занимая полностью перекрывающиеся диапазоны выходных данных.
Как бы мы ни толкали X , это не окажет существенного влияния на Y.
Умеренный эффект
Граница между подраспределениями диагональная, наблюдается частичное совпадение диапазона Y.
Высокое состояние X повышает наши шансы попасть в высокое Y , но не гарантирует результат. Того же результата (перекрывающейся области) можно достичь, имея более низкое X.
Сильный эффект
Граница между субраспределениями вертикальная, диапазон Y не перекрывается .
Если можно достичь высокого состояния X, это гарантирует высокое Y.
Изучение взаимодействия входов
Когда для разложения используются две или более входных переменных, становится возможным исследовать их совместные эффекты. Схематическая визуализация показывает, как различные типы совместных эффектов входных переменных на выходе появляются на визуализации SimDec.
Никакого взаимодействия . Подраспределения аддитивной модели с обеими входными переменными, которые одинаково важны, будут смещены равномерно. Эффект второго порядка таких входных переменных будет равен нулю.
Линейное взаимодействие является характеристикой мультипликативных моделей. В SimDec подраспределения будут смещены все больше и больше вдоль горизонтальной оси. Влияние одного входа на выход увеличивается с ростом значения другого входа. Индекс чувствительности, вычисленный для эффекта второго порядка таких двух входных переменных, не равен нулю.
Одна входная переменная переключает направление влияния на выход в разных состояниях другой входной переменной. Такой эффект может возникнуть при смене знака в модели. Эффект второго порядка не равен нулю.
В моделях могут возникать различные типы нелинейных взаимодействий . Например, одна входная переменная не влияет на выход в одном состоянии другой переменной (лежащие друг над другом красные подраспределения), но имеет сильный эффект в противном случае (смещенные синие подраспределения). Такой эффект также проявится в ненулевом индексе чувствительности второго порядка. [2]
Понимание природы эффектов взаимодействия в вычислительной модели и ее поведения в целом имеет решающее значение для эффективного принятия решений.
Ограничения
Метод SimDec имеет ряд ограничений:
Он основан на моделировании Монте-Карло и, таким образом, требует запуска вычислительной модели тысячу раз или больше. [1] Для моделей, оценка которых занимает часы, было бы невозможно использовать SimDec (если только не имеется суперкомпьютер и/или большое количество времени).
SimDec основан на гистограмме , поэтому для двоичных или категориальных выходных переменных визуализация будет весьма ограниченной (например, всего несколько ячеек).
Чем больше входных переменных выбирается для разложения, тем менее читаемой становится гистограмма. В [2] представлены только случаи с двумя и тремя входными переменными.
Ссылки
^ abc Козлова, М. и Йеоманс, Дж. С. (2022). Улучшение Монте-Карло с помощью декомпозиции моделирования: «обязательное» включение для многих дисциплин. Труды INFORMS по образованию, 22(3), 147-159.
^ abc Kozlova, M., Moss, RJ, Yeomans, JS, & Caers, J. (предстоящая публикация). Раскрытие гетерогенных эффектов в вычислительных моделях для устойчивого принятия решений. Доступно по адресу http://dx.doi.org/10.2139/ssrn.4550911
^ Козлова, М., Коллан, М. и Луукка, П. (2017). Разложение моделирования: новый подход к лучшему анализу моделирования многопараметрических инвестиционных проектов.
^ Девяткин, И., Козлова, М. и Йоманс, Дж. С. (2021). Разложение моделирования для обеспечения экологической устойчивости: улучшенное принятие решений при анализе углеродного следа. Науки о социально-экономическом планировании, 75, 100837.
^ Лю, YC, Лейфссон, Л., Петренко-Дабровска, А. и Козил, С. (2022). Анализ сельскохозяйственных и инженерных систем с использованием декомпозиции моделирования. На Международной конференции по вычислительной науке (стр. 435-444). Springer, Cham.
^ ab Моделирование Декомпозиции GitHub https://github.com/Simulation-Decomposition
^ Кенни, Дж. Ф.; Киппинг, Э. С. (1962). Математика статистики, часть 1 (3-е изд.). Принстон, Нью-Джерси: Van Nostrand Reinhold .