Отображение Сэммона или проекция Сэммона — это алгоритм, который отображает многомерное пространство в пространство меньшей размерности (см. многомерное масштабирование ), пытаясь сохранить структуру межточечных расстояний в многомерном пространстве в проекции меньшей размерности. [1]
Он особенно подходит для использования в разведочном анализе данных .
Метод был предложен Джоном У. Сэммоном в 1969 году. [2]
Это считается нелинейным подходом, поскольку отображение не может быть представлено в виде линейной комбинации исходных переменных, как это возможно в таких методах, как анализ главных компонент , что также затрудняет его использование в приложениях классификации. [3]
Обозначим расстояние между i -м и j -м объектами в исходном пространстве через , а расстояние между их проекциями — через .
Картирование Сэммона направлено на минимизацию следующей функции ошибки, которую часто называют стрессом Сэммона или ошибкой Сэммона :
Минимизация может быть выполнена либо методом градиентного спуска , как предлагалось изначально, либо другими способами, обычно включающими итерационные методы.
Количество итераций необходимо определять экспериментально, и сходящиеся решения не всегда гарантированы.
Во многих реализациях предпочитают использовать первые основные компоненты в качестве начальной конфигурации. [4]
Отображение Сэммона было одним из самых успешных методов нелинейного метрического многомерного шкалирования с момента его появления в 1969 году, но усилия были сосредоточены на совершенствовании алгоритма, а не на форме функции напряжения.
Эффективность отображения Сэммона была улучшена за счет расширения его функции напряжения с использованием левой дивергенции Брегмана [5] и правой дивергенции Брегмана [6] .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )