В статистике , ядерный дискриминантный анализ Фишера (KFD) [ 1], также известный как обобщенный дискриминантный анализ [2] и ядерный дискриминантный анализ [3] , является ядерной версией линейного дискриминантного анализа (LDA). Он назван в честь Рональда Фишера .
Линейный дискриминантный анализ
Интуитивно идея LDA заключается в поиске проекции, где разделение классов максимизировано. При наличии двух наборов помеченных данных и мы можем вычислить среднее значение каждого класса и , как
где — число примеров класса . Цель линейного дискриминантного анализа — обеспечить большое разделение средних значений класса, сохраняя при этом небольшую внутриклассовую дисперсию. [4] Это формулируется как максимизация, относительно , следующего отношения:
где — межклассовая ковариационная матрица, а — общая внутриклассовая ковариационная матрица:
Максимум указанного выше соотношения достигается при
как можно показать с помощью метода множителей Лагранжа (набросок доказательства):
Максимизация эквивалентна максимизации
при условии
Это, в свою очередь, эквивалентно максимизации , где — множитель Лагранжа.
Максимально производные по и должны быть равны нулю. Принимая доходность
который тривиально удовлетворяется и
Расширение LDA
Чтобы расширить LDA до нелинейных отображений, данные, заданные в виде точек , можно сопоставить с новым пространством признаков с помощью некоторой функции. В этом новом пространстве признаков функция, которую необходимо максимизировать, равна [1]
где
и
Далее, обратите внимание, что . Явное вычисление отображений и последующее выполнение LDA может быть вычислительно затратным, а во многих случаях и неразрешимым. Например, может быть бесконечномерным. Таким образом, вместо явного отображения данных в , данные могут быть неявно внедрены путем переписывания алгоритма в терминах скалярных произведений и использования функций ядра, в которых скалярное произведение в новом пространстве признаков заменяется функцией ядра, .
LDA можно переформулировать в терминах скалярных произведений, сначала заметив, что будет иметь расширение вида [5]
Тогда обратите внимание, что
где
Тогда числитель можно записать как:
Аналогично знаменатель можно записать как
с компонентом , определенным как , является единичная матрица, а матрица со всеми элементами равна . Это тождество может быть получено, начиная с выражения для и используя расширение и определения и
С этими уравнениями для числителя и знаменателя уравнение для можно переписать как
Тогда, дифференцируя и приравнивая к нулю, получаем
Поскольку имеет значение только направление , а значит и направление , то вышеприведенное уравнение можно решить как
Обратите внимание, что на практике обычно является единственным числом, поэтому к нему добавляется кратное тождества [1]
Учитывая решение для , проекция новой точки данных определяется выражением [1]
Мультиклассовый KFD
Расширение на случаи, когда имеется более двух классов, относительно просто. [2] [6] [7] Пусть будет числом классов. Тогда многоклассовый KFD включает проекцию данных в -мерное пространство с использованием дискриминантных функций.
Это можно записать в матричной записи
где являются столбцами . [6] Кроме того, матрица ковариации между классами теперь имеет вид
где — среднее значение всех данных в новом пространстве признаков. Внутриклассовая ковариационная матрица — это
Решение теперь получается путем максимизации
Снова можно использовать трюк с ядром, и цель многоклассового KFD становится [7]
где и
Они определены так же, как в предыдущем разделе, и определяются как
Затем можно вычислить, найдя ведущие собственные векторы . [7] Кроме того, проекция нового входа, , задается формулой [7]
где компонент задается выражением .
Классификация с использованием KFD
Как в двухклассовом, так и в многоклассовом KFD метка класса нового входа может быть назначена как [7]
где — прогнозируемое среднее значение для класса , а — функция расстояния.
Приложения
Анализ ядра дискриминанта использовался в различных приложениях. К ним относятся:
^ abcde Мика, С.; Рэтш, Г.; Уэстон, Дж.; Шёлькопф, Б.; Мюллер, К. Р. (1999). "Дискриминантный анализ Фишера с ядрами". Нейронные сети для обработки сигналов IX: Труды семинара IEEE Signal Processing Society 1999 года (Кат. № 98TH8468) . Том IX. С. 41–48 . CiteSeerX 10.1.1.35.9904 . doi :10.1109/NNSP.1999.788121. ISBN978-0-7803-5673-3. S2CID 8473401.
^ abc Baudat, G.; Anouar, F. (2000). «Обобщенный дискриминантный анализ с использованием подхода ядра». Neural Computation . 12 (10): 2385– 2404. CiteSeerX 10.1.1.412.760 . doi :10.1162/089976600300014980. PMID 11032039. S2CID 7036341.
^ ab Li, Y.; Gong, S.; Liddell, H. (2003). «Распознавание траекторий лицевых идентичностей с использованием дискриминантного анализа ядра». Image and Vision Computing . 21 ( 13– 14): 1077– 1086. CiteSeerX 10.1.1.2.6315 . doi :10.1016/j.imavis.2003.08.010.
^ Бишоп, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, Нью-Йорк: Springer.
^ Scholkopf, B; Herbrich, R.; Smola, A. (2001). "A Generalized Representer Theorem". Computational Learning Theory . Lecture Notes in Computer Science. Vol. 2111. pp. 416– 426. CiteSeerX 10.1.1.42.8617 . doi :10.1007/3-540-44581-1_27. ISBN978-3-540-42343-0.
^ ab Дуда, Р.; Харт, П.; Сторк, Д. (2001). Классификация узоров . Нью-Йорк, Нью-Йорк: Wiley.
^ abcde Чжан, Дж.; Ма, К.К. (2004). «Дискриминант ядра Фишера для классификации текстур».{{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Лю, Ц.; Лу, Х.; Ма, С. (2004). «Улучшение дискриминантного анализа ядра Фишера для распознавания лиц». Труды IEEE по схемам и системам для видеотехнологий . 14 (1): 42– 49. doi :10.1109/tcsvt.2003.818352. S2CID 39657721.
^ Лю, Ц.; Хуан, Р.; Лу, Х.; Ма, С. (2002). «Распознавание лиц с использованием дискриминантного анализа Фишера на основе ядра». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
^ Курита, Т.; Тагучи, Т. (2002). «Модификация дискриминантного анализа Фишера на основе ядра для обнаружения лиц». Труды Пятой международной конференции IEEE по автоматическому распознаванию жестов лица . С. 300–305 . CiteSeerX 10.1.1.100.3568 . doi :10.1109/AFGR.2002.1004170. ISBN978-0-7695-1602-8. S2CID 7581426.
^ Фэн, И.; Ши, П. (2004). «Распознавание лиц на основе дискриминантного анализа ядра Фишера». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
^ Yang, J.; Frangi, AF; Yang, JY; Zang, D., Jin, Z. (2005). «KPCA плюс LDA: полная структура ядра дискриминанта Фишера для извлечения и распознавания признаков». IEEE Transactions on Pattern Analysis and Machine Intelligence . 27 (2): 230– 244. CiteSeerX 10.1.1.330.1179 . doi :10.1109/tpami.2005.33. PMID 15688560. S2CID 9771368.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Ван, И.; Руан, К. (2006). «Дискриминантный анализ ядра Фишера для распознавания отпечатков ладоней». Международная конференция по распознаванию образов .
^ Вэй, Л.; Ян, И.; Нишикава, Р. М.; Цзян, И. (2005). «Исследование нескольких методов машинного обучения для классификации злокачественных и доброкачественных кластерных микрокальцификаций». IEEE Transactions on Medical Imaging . 24 (3): 371– 380. doi :10.1109/tmi.2004.842457. PMID 15754987. S2CID 36691320.
^ Malmgren, T. (1997). "Программа итерационного нелинейного дискриминантного анализа: IDA 1.0". Computer Physics Communications . 106 (3): 230– 236. Bibcode : 1997CoPhC.106..230M. doi : 10.1016/S0010-4655(97)00100-8.
Внешние ссылки
Дискриминантный анализ ядра в C# — код C# для выполнения KFD.
Matlab Toolbox для снижения размерности — включает метод выполнения KFD.
Распознавание рукописного ввода с использованием дискриминантного анализа ядра — код C#, демонстрирующий распознавание рукописных цифр с использованием KFD.