Кластерно-взвешенное моделирование

В интеллектуальном анализе данных кластерно-взвешенное моделирование (CWM) представляет собой алгоритмический подход к нелинейному прогнозированию выходов ( зависимых переменных ) из входов ( независимых переменных ) на основе оценки плотности с использованием набора моделей (кластеров), каждая из которых концептуально подходит для подрегиона входного пространства. Общий подход работает в совместном пространстве вход-выход, и начальная версия была предложена Нилом Гершенфельдом . ^[1]^[2]

Базовая форма модели

Процедуру кластерно-взвешенного моделирования проблемы ввода-вывода можно описать следующим образом. ^[2] Для того чтобы построить прогнозируемые значения для выходной переменной y из входной переменной x , процедура моделирования и калибровки приходит к совместной функции плотности вероятности , p ( y , x ). Здесь «переменные» могут быть одномерными, многомерными или временными рядами. Для удобства любые параметры модели не указаны в обозначениях здесь, и возможны несколько различных обработок для них, включая установку их на фиксированные значения в качестве шага калибровки или обработку их с использованием байесовского анализа . Требуемые прогнозируемые значения получаются путем построения условной плотности вероятности p ( y | x ), из которой может быть получен прогноз с использованием условного ожидаемого значения , при этом условная дисперсия обеспечивает указание на неопределенность.

Важным шагом моделирования является то, что предполагается, что p ( y | x ) принимает следующую форму в качестве смешанной модели :

p(y,x)=\sum _{j=1}^{n}w_{j}p_{j}(y,x),

где n — число кластеров, а { w _j } — веса, которые в сумме дают единицу. Функции p _j ( y , x ) — это совместные функции плотности вероятности, которые относятся к каждому из n кластеров. Эти функции моделируются с использованием разложения на условную и предельную плотность :

{\ displaystyle p_ {j} (y, x) = p_ {j} (y | x) p_ {j} (x),}

где:

p _j ( y | x ) — это модель для прогнозирования y при заданном x , и при условии, что пара вход-выход должна быть связана с кластером j на основе значения x . Эта модель может быть регрессионной моделью в простейших случаях.

p _j ( x ) формально является плотностью для значений x , учитывая, что пара вход-выход должна быть связана с кластером j . Относительные размеры этих функций между кластерами определяют, связано ли конкретное значение x с любым заданным кластерным центром. Эта плотность может быть гауссовой функцией, центрированной на параметре, представляющем кластерный центр.

Так же, как и в случае регрессионного анализа , важно учитывать предварительные преобразования данных как часть общей стратегии моделирования, если основными компонентами модели должны быть простые регрессионные модели для плотностей условий по кластерам и нормальные распределения для плотностей весов кластеров p _j ( x ).

Общие версии

Базовый алгоритм CWM дает один выходной кластер для каждого входного кластера. Однако CWM можно расширить до нескольких кластеров, которые по-прежнему связаны с одним и тем же входным кластером. ^[3] Каждый кластер в CWM локализован в гауссовой входной области, и это содержит собственную обучаемую локальную модель. ^[4] Он признан универсальным алгоритмом вывода, который обеспечивает простоту, общность и гибкость; даже когда предпочтительнее использовать сеть с прямым распространением, иногда ее используют как «второе мнение» о характере проблемы обучения. ^[5]

Первоначальная форма, предложенная Гершенфельдом, описывает два нововведения:

Предоставление CWM возможности работать с непрерывными потоками данных
Решение проблемы локальных минимумов, возникающих в процессе настройки параметров CWM ^[5]

CWM можно использовать для классификации носителей в приложениях принтера, используя по крайней мере два параметра для генерации выходных данных, которые имеют совместную зависимость от входных параметров. ^[6]

Ссылки

^ Гершенфельд, Н (1997). «Нелинейный вывод и кластерно-взвешенное моделирование». Анналы Нью-Йоркской академии наук . 808 : 18–24 . Bibcode : 1997NYASA.808...18G. doi : 10.1111/j.1749-6632.1997.tb51651.x. S2CID 85736539.
^ ab Gershenfeld, N.; Schoner; Metois, E. (1999). "Моделирование с взвешиванием кластеров для анализа временных рядов". Nature . 397 (6717): 329– 332. Bibcode :1999Natur.397..329G. doi :10.1038/16873. S2CID 204990873.
^ Фельдкамп, LA; Прохоров, DV; Фельдкамп, TM (2001). "Моделирование с использованием кластеров и мультикластеров". IJCNN'01. Международная объединенная конференция по нейронным сетям. Труды (Кат. № 01CH37222) . Том 3. С. 1710– 1714. doi :10.1109/IJCNN.2001.938419. ISBN 0-7803-7044-9. S2CID 60819260.
^ Бойден, Эдвард С. «Деревообразующее кластерное взвешенное моделирование: на пути к массовому параллельному цифровому Страдивариусу в реальном времени» (PDF) . Кембридж, Массачусетс: MIT Media Lab.
^ ab Прохоров, Новый подход к кластерно-взвешенному моделированию Данил В.; Ли А. Фельдкамп; Тимоти М. Фельдкамп. "Новый подход к кластерно-взвешенному моделированию" (PDF) . Дирборн, Мичиган: Исследовательская лаборатория Форда.
^ Гао, Цзюнь; Росс Р. Аллен (2003-07-24). "КЛАСТЕРНО-ВЗВЕШЕННОЕ МОДЕЛИРОВАНИЕ ДЛЯ КЛАССИФИКАЦИИ СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ". Пало-Альто, Калифорния: Всемирная организация интеллектуальной собственности. Архивировано из оригинала 2012-12-12.

[1] Гершенфельд, Н (1997). «Нелинейный вывод и кластерно-взвешенное моделирование». Анналы Нью-Йоркской академии наук . 808 : 18–24 . Bibcode : 1997NYASA.808...18G. doi : 10.1111/j.1749-6632.1997.tb51651.x. S2CID 85736539.

[nature-2] Gershenfeld, N.; Schoner; Metois, E. (1999). "Моделирование с взвешиванием кластеров для анализа временных рядов". Nature . 397 (6717): 329– 332. Bibcode :1999Natur.397..329G. doi :10.1038/16873. S2CID 204990873.

[feldkamp-3] Фельдкамп, LA; Прохоров, DV; Фельдкамп, TM (2001). "Моделирование с использованием кластеров и мультикластеров". IJCNN'01. Международная объединенная конференция по нейронным сетям. Труды (Кат. № 01CH37222) . Том 3. С. 1710– 1714. doi :10.1109/IJCNN.2001.938419. ISBN 0-7803-7044-9. S2CID 60819260.

[mit-4] Бойден, Эдвард С. «Деревообразующее кластерное взвешенное моделирование: на пути к массовому параллельному цифровому Страдивариусу в реальном времени» (PDF) . Кембридж, Массачусетс: MIT Media Lab.

[dearborn-5] Прохоров, Новый подход к кластерно-взвешенному моделированию Данил В.; Ли А. Фельдкамп; Тимоти М. Фельдкамп. "Новый подход к кластерно-взвешенному моделированию" (PDF) . Дирборн, Мичиган: Исследовательская лаборатория Форда.

[media-6] Гао, Цзюнь; Росс Р. Аллен (2003-07-24). "КЛАСТЕРНО-ВЗВЕШЕННОЕ МОДЕЛИРОВАНИЕ ДЛЯ КЛАССИФИКАЦИИ СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ". Пало-Альто, Калифорния: Всемирная организация интеллектуальной собственности. Архивировано из оригинала 2012-12-12.