Эта статья в значительной степени или полностью основана на одном источнике . ( апрель 2024 г. ) |
Для анализа данных , Случайное отображение (RM) является быстрым методом снижения размерности , классифицируемым как метод извлечения признаков . RM заключается в создании случайной матрицы, которая умножается на каждый исходный вектор и приводит к сокращенному вектору. Когда векторы данных имеют большую размерность, вычислительно невозможно использовать анализ данных или алгоритмы распознавания образов, которые многократно вычисляют сходства или расстояния в исходном пространстве данных. Поэтому необходимо уменьшить размерность, например, перед кластеризацией данных. В контексте интеллектуального анализа текста показано, что точность классификации документов, полученная после снижения размерности с использованием метода случайного отображения, будет почти такой же хорошей, как и исходная точность, если конечная размерность достаточно велика (около 100 из 6000). Фактически, можно показать, что внутреннее произведение (сходство) между сопоставленными векторами близко следует внутреннему произведению исходных векторов .