Картографирование Сэммона

Алгоритм машинного обучения

Отображение Сэммона или проекция Сэммона — это алгоритм, который отображает многомерное пространство в пространство меньшей размерности (см. многомерное масштабирование ), пытаясь сохранить структуру межточечных расстояний в многомерном пространстве в проекции меньшей размерности. ^[1]

Он особенно подходит для использования в разведочном анализе данных .

Метод был предложен Джоном У. Сэммоном в 1969 году. ^[2]

Это считается нелинейным подходом, поскольку отображение не может быть представлено в виде линейной комбинации исходных переменных, как это возможно в таких методах, как анализ главных компонент , что также затрудняет его использование в приложениях классификации. ^[3]

Обозначим расстояние между i -м и j -м объектами в исходном пространстве через , а расстояние между их проекциями — через . $\scriptstyle d_{ij}^{*}$ $\scriptstyle d_{ij}^{}$

Картирование Сэммона направлено на минимизацию следующей функции ошибки, которую часто называют стрессом Сэммона или ошибкой Сэммона :

E={\frac {1}{\sum \limits _{i<j}d_{ij}^{*}}}\sum _{i<j}{\frac {(d_{ij}^{*}-d_{ij})^{2}}{d_{ij}^{*}}}.

Минимизация может быть выполнена либо методом градиентного спуска , как предлагалось изначально, либо другими способами, обычно включающими итерационные методы.

Количество итераций необходимо определять экспериментально, и сходящиеся решения не всегда гарантированы.

Во многих реализациях предпочитают использовать первые основные компоненты в качестве начальной конфигурации. ^[4]

Отображение Сэммона было одним из самых успешных методов нелинейного метрического многомерного шкалирования с момента его появления в 1969 году, но усилия были сосредоточены на совершенствовании алгоритма, а не на форме функции напряжения.

Эффективность отображения Сэммона была улучшена за счет расширения его функции напряжения с использованием левой дивергенции Брегмана ^{[5] и правой дивергенции Брегмана}^[6] .

Смотрите также

Ссылки

^ Дживанандам, Ниваш (13.09.2021). «Недооцененные, но увлекательные концепции машинного обучения № 5 – CST, PBWM, SARSA и картографирование Сэммона». Журнал Analytics India . Получено 05.12.2021 .
^ Сэммон Дж. У. (1969). «Нелинейное отображение для анализа структуры данных» (PDF) . IEEE Transactions on Computers . 18 (5): 401, 402 (отсутствует в PDF), 403– 409. doi :10.1109/tc.1969.222678. S2CID 43151050.
^ Лернер, Б.; Хьюго Гутерман, Майер Аладжем, Ицхак Динстейнт, Ицхак Ромем (1998). «О классификации образов с нелинейным отображением Сэммона — экспериментальное исследование». Распознавание образов . 31 (4): 371– 381. Bibcode : 1998PatRe..31..371L. doi : 10.1016/S0031-3203(97)00064-2.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Лернер, Б.; Х. Гутерман, М. Аладжем и И. Динштейн (2000). «О инициализации нелинейного отображения Сэммона». Pattern Analysis and Applications . 3 (2): 61– 68. CiteSeerX 10.1.1.579.8935 . doi :10.1007/s100440050006. S2CID 2055054. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ J. Sun, M. Crowe, C. Fyfe (май 2011 г.). «Расширение метрического многомерного шкалирования с помощью расхождений Брегмана». Pattern Recognition . 44 (5): 1137– 1154. Bibcode : 2011PatRe..44.1137S. doi : 10.1016/j.patcog.2010.11.013.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ J. Sun, C. Fyfe, M. Crowe (2011). «Расширение отображения Сэммона с помощью расхождений Брегмана». Information Sciences . 187 : 72–92 . doi :10.1016/j.ins.2011.10.013.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

Внешние ссылки

HiSee – визуализатор с открытым исходным кодом для многомерных данных
Программа на языке AC# с кодом на CodeProject.
Введение в код и метод Matlab

Эта статья, связанная со статистикой, является заглушкой . Вы можете помочь Википедии, расширив ее.

[1] Дживанандам, Ниваш (13.09.2021). «Недооцененные, но увлекательные концепции машинного обучения № 5 – CST, PBWM, SARSA и картографирование Сэммона». Журнал Analytics India . Получено 05.12.2021 .

[2] Сэммон Дж. У. (1969). «Нелинейное отображение для анализа структуры данных» (PDF) . IEEE Transactions on Computers . 18 (5): 401, 402 (отсутствует в PDF), 403– 409. doi :10.1109/tc.1969.222678. S2CID 43151050.

[3] Лернер, Б.; Хьюго Гутерман, Майер Аладжем, Ицхак Динстейнт, Ицхак Ромем (1998). «О классификации образов с нелинейным отображением Сэммона — экспериментальное исследование». Распознавание образов . 31 (4): 371– 381. Bibcode : 1998PatRe..31..371L. doi : 10.1016/S0031-3203(97)00064-2.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

[4] Лернер, Б.; Х. Гутерман, М. Аладжем и И. Динштейн (2000). «О инициализации нелинейного отображения Сэммона». Pattern Analysis and Applications . 3 (2): 61– 68. CiteSeerX 10.1.1.579.8935 . doi :10.1007/s100440050006. S2CID 2055054. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

[5] J. Sun, M. Crowe, C. Fyfe (май 2011 г.). «Расширение метрического многомерного шкалирования с помощью расхождений Брегмана». Pattern Recognition . 44 (5): 1137– 1154. Bibcode : 2011PatRe..44.1137S. doi : 10.1016/j.patcog.2010.11.013.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

[6] J. Sun, C. Fyfe, M. Crowe (2011). «Расширение отображения Сэммона с помощью расхождений Брегмана». Information Sciences . 187 : 72–92 . doi :10.1016/j.ins.2011.10.013.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )