Случайное отображение

Для анализа данных , Случайное отображение (RM) является быстрым методом снижения размерности , классифицируемым как метод извлечения признаков . RM заключается в создании случайной матрицы, которая умножается на каждый исходный вектор и приводит к сокращенному вектору. Когда векторы данных имеют большую размерность, вычислительно невозможно использовать анализ данных или алгоритмы распознавания образов, которые многократно вычисляют сходства или расстояния в исходном пространстве данных. Поэтому необходимо уменьшить размерность, например, перед кластеризацией данных. В контексте интеллектуального анализа текста показано, что точность классификации документов, полученная после снижения размерности с использованием метода случайного отображения, будет почти такой же хорошей, как и исходная точность, если конечная размерность достаточно велика (около 100 из 6000). Фактически, можно показать, что внутреннее произведение (сходство) между сопоставленными векторами близко следует внутреннему произведению исходных векторов .

Смотрите также

Ссылки

  • Каски, С. Снижение размерности случайным отображением: быстрое вычисление сходства для кластеризации. Труды Международной объединенной конференции IEEE 1998 года по нейронным сетям, 1998. стр. 413–418. doi: 10.1109/IJCNN.1998.682302


Получено с "https://en.wikipedia.org/w/index.php?title=Случайное_отображение&oldid=1221297871"