Картографирование Сэммона

Алгоритм машинного обучения

Отображение Сэммона или проекция Сэммона — это алгоритм, который отображает многомерное пространство в пространство меньшей размерности (см. многомерное масштабирование ), пытаясь сохранить структуру межточечных расстояний в многомерном пространстве в проекции меньшей размерности. [1]

Он особенно подходит для использования в разведочном анализе данных .

Метод был предложен Джоном У. Сэммоном в 1969 году. [2]

Это считается нелинейным подходом, поскольку отображение не может быть представлено в виде линейной комбинации исходных переменных, как это возможно в таких методах, как анализ главных компонент , что также затрудняет его использование в приложениях классификации. [3]

Обозначим расстояние между i -м и j -м объектами в исходном пространстве через , а расстояние между их проекциями — через . г я дж {\displaystyle \scriptstyle d_{ij}^{*}} г я дж {\displaystyle \scriptstyle d_{ij}^{}}

Картирование Сэммона направлено на минимизацию следующей функции ошибки, которую часто называют стрессом Сэммона или ошибкой Сэммона :

Э = 1 я < дж г я дж я < дж ( г я дж г я дж ) 2 г я дж . {\displaystyle E={\frac {1}{\sum \limits _{i<j}d_{ij}^{*}}}\sum _{i<j}{\frac {(d_{ij}^{*}-d_{ij})^{2}}{d_{ij}^{*}}}.}

Минимизация может быть выполнена либо методом градиентного спуска , как предлагалось изначально, либо другими способами, обычно включающими итерационные методы.

Количество итераций необходимо определять экспериментально, и сходящиеся решения не всегда гарантированы.

Во многих реализациях предпочитают использовать первые основные компоненты в качестве начальной конфигурации. [4]

Отображение Сэммона было одним из самых успешных методов нелинейного метрического многомерного шкалирования с момента его появления в 1969 году, но усилия были сосредоточены на совершенствовании алгоритма, а не на форме функции напряжения.

Эффективность отображения Сэммона была улучшена за счет расширения его функции напряжения с использованием левой дивергенции Брегмана [5] и правой дивергенции Брегмана [6] .

Смотрите также

Ссылки

  1. ^ Дживанандам, Ниваш (13.09.2021). «Недооцененные, но увлекательные концепции машинного обучения № 5 – CST, PBWM, SARSA и картографирование Сэммона». Журнал Analytics India . Получено 05.12.2021 .
  2. ^ Сэммон Дж. У. (1969). «Нелинейное отображение для анализа структуры данных» (PDF) . IEEE Transactions on Computers . 18 (5): 401, 402 (отсутствует в PDF), 403– 409. doi :10.1109/tc.1969.222678. S2CID  43151050.
  3. ^ Лернер, Б.; Хьюго Гутерман, Майер Аладжем, Ицхак Динстейнт, Ицхак Ромем (1998). «О классификации образов с нелинейным отображением Сэммона — экспериментальное исследование». Распознавание образов . 31 (4): 371– 381. Bibcode : 1998PatRe..31..371L. doi : 10.1016/S0031-3203(97)00064-2.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Лернер, Б.; Х. Гутерман, М. Аладжем и И. Динштейн (2000). «О инициализации нелинейного отображения Сэммона». Pattern Analysis and Applications . 3 (2): 61– 68. CiteSeerX 10.1.1.579.8935 . doi :10.1007/s100440050006. S2CID  2055054. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ J. Sun, M. Crowe, C. Fyfe (май 2011 г.). «Расширение метрического многомерного шкалирования с помощью расхождений Брегмана». Pattern Recognition . 44 (5): 1137– 1154. Bibcode : 2011PatRe..44.1137S. doi : 10.1016/j.patcog.2010.11.013.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ J. Sun, C. Fyfe, M. Crowe (2011). «Расширение отображения Сэммона с помощью расхождений Брегмана». Information Sciences . 187 : 72–92 . doi :10.1016/j.ins.2011.10.013.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  • HiSee – визуализатор с открытым исходным кодом для многомерных данных
  • Программа на языке AC# с кодом на CodeProject.
  • Введение в код и метод Matlab


Взято с "https://en.wikipedia.org/w/index.php?title=Sammon_mapping&oldid=1235487456"