Дискриминантный анализ ядра Фишера

В статистике , ядерный дискриминантный анализ Фишера (KFD) [ ^1], также известный как обобщенный дискриминантный анализ ^[2] и ядерный дискриминантный анализ ^[3] , является ядерной версией линейного дискриминантного анализа (LDA). Он назван в честь Рональда Фишера .

Линейный дискриминантный анализ

Интуитивно идея LDA заключается в поиске проекции, где разделение классов максимизировано. При наличии двух наборов помеченных данных и мы можем вычислить среднее значение каждого класса и , как $\mathbf {C} _{1}$ $\mathbf {C} _{2}$ $\mathbf {м} _{1}$ $\mathbf {м} _{2}$

\mathbf {м} _{i}={\frac {1}{l_{i}}}\sum _{n=1}^{l_{i}}\mathbf {х} _{n}^{i},

где — число примеров класса . Цель линейного дискриминантного анализа — обеспечить большое разделение средних значений класса, сохраняя при этом небольшую внутриклассовую дисперсию. ^[4] Это формулируется как максимизация, относительно , следующего отношения: $l_{i}$ $\mathbf {C} _{i}$ $\mathbf {w}$

J(\mathbf {w} )={\frac {\mathbf {w} ^{\text{T}}\mathbf {S} _{B}\mathbf {w} }{\mathbf {w} ^{\text{T}}\mathbf {S} _{W}\mathbf {w} }},

где — межклассовая ковариационная матрица, а — общая внутриклассовая ковариационная матрица: $\mathbf {S} _{B}$ $\mathbf {S} _{W}$

{\begin{aligned}\mathbf {S} _{B}&=(\mathbf {m} _{2}-\mathbf {m} _{1})(\mathbf {m} _{2}-\mathbf {m} _{1})^{\text{T}} \\\mathbf {S} _{W} &=\sum _{i=1,2}\sum _{n=1}^{l_{i}}(\mathbf {x} _{n}^{i}-\mathbf {m} _{i})(\mathbf {x} _{n}^{i}-\mathbf {m} _{i})^{\text{T}}.\end{aligned}}

Максимум указанного выше соотношения достигается при

\mathbf {w} \propto \mathbf {S} _{W}^{-1}(\mathbf {m} _{2}-\mathbf {m} _{1}).

как можно показать с помощью метода множителей Лагранжа (набросок доказательства):

Максимизация эквивалентна максимизации $J(\mathbf {w} )={\frac {\mathbf {w} ^{\text{T}}\mathbf {S} _{B}\mathbf {w} }{\mathbf {w} ^{\text{T}}\mathbf {S} _{W}\mathbf {w} }}$

\mathbf {w} ^{\text{T}}\mathbf {S} _{B}\mathbf {w}

при условии

\mathbf {w} ^{\text{T}}\mathbf {S} _{W}\mathbf {w} =1.

Это, в свою очередь, эквивалентно максимизации , где — множитель Лагранжа. $I(\mathbf {w},\lambda)=\mathbf {w} ^{\text{T}} \mathbf {S} _{B} \mathbf {w} -\lambda (\mathbf {w} ^{\text{T}}\mathbf {S} _{W} \mathbf {w} -1)$ $\лямбда$

Максимально производные по и должны быть равны нулю. Принимая доходность $I(\mathbf {w},\lambda)$ $\mathbf {w}$ $\лямбда$ ${\frac {dI}{d\mathbf {w} }}=\mathbf {0}$

\mathbf {S} _{B}\mathbf {w} -\lambda \mathbf {S} _{W} \mathbf {w} =\mathbf {0},

который тривиально удовлетворяется и $\mathbf {w} =c\mathbf {S} _{W}^{-1}(\mathbf {m} _{2}-\mathbf {m} _{1})$ $\lambda =(\mathbf {m} _{2}-\mathbf {m} _{1})^{\text{T}}\mathbf {S} _{W}^{-1}(\mathbf {m} _{2}-\mathbf {m} _{1}).$

Расширение LDA

Чтобы расширить LDA до нелинейных отображений, данные, заданные в виде точек , можно сопоставить с новым пространством признаков с помощью некоторой функции. В этом новом пространстве признаков функция, которую необходимо максимизировать, равна ^[1] $\ell$ $\mathbf {x} _{i},$ $F,$ $\phi .$

J(\mathbf {w} )={\frac {\mathbf {w} ^{\text{T}}\mathbf {S} _{B}^{\phi }\mathbf {w} }{\mathbf {w} ^{\text{T}}\mathbf {S} _{W}^{\phi }\mathbf {w} }},

где

{\begin{aligned}\mathbf {S} _{B}^{\phi }&=\left(\mathbf {m} _{2}^{\phi }-\mathbf {m} _{1}^{\phi }\right)\left(\mathbf {m} _{2}^{\phi }-\mathbf {m} _{1}^{\phi }\right)^{\text{T}}\\\mathbf {S} _{W}^{\phi }&=\sum _{i=1,2}\sum _{n=1}^{l_{i}}\left(\phi (\mathbf {x} _{n}^{i})-\mathbf {m} _{i}^{\phi }\right)\left(\phi (\mathbf {x} _{n}^{i})-\mathbf {m} _{i}^{\phi }\right)^{\text{T}},\end{aligned}}

и

\mathbf {m} _{i}^{\phi }={\frac {1}{l_{i}}}\sum _{j=1}^{l_{i}}\phi (\mathbf {x} _{j}^{i}).

Далее, обратите внимание, что . Явное вычисление отображений и последующее выполнение LDA может быть вычислительно затратным, а во многих случаях и неразрешимым. Например, может быть бесконечномерным. Таким образом, вместо явного отображения данных в , данные могут быть неявно внедрены путем переписывания алгоритма в терминах скалярных произведений и использования функций ядра, в которых скалярное произведение в новом пространстве признаков заменяется функцией ядра, . $\mathbf {w} \in F$ $\phi (\mathbf {x} _{i})$ $F$ $F$ $k(\mathbf {x} ,\mathbf {y} )=\phi (\mathbf {x} )\cdot \phi (\mathbf {y} )$

LDA можно переформулировать в терминах скалярных произведений, сначала заметив, что будет иметь расширение вида ^[5] $\mathbf {w}$

\mathbf {w} =\sum _{i=1}^{l}\alpha _{i}\phi (\mathbf {x} _{i}).

Тогда обратите внимание, что

\mathbf {w} ^{\text{T}}\mathbf {m} _{i}^{\phi }={\frac {1}{l_{i}}}\sum _{j=1}^{l}\sum _{k=1}^{l_{i}}\alpha _{j}k\left(\mathbf {x} _{j},\mathbf {x} _{k}^{i}\right)=\mathbf {\alpha } ^{\text{T}}\mathbf {M} _{i},

где

(\mathbf {M} _{i})_{j}={\frac {1}{l_{i}}}\sum _{k=1}^{l_{i}}k(\mathbf {x} _{j},\mathbf {x} _{k}^{i}).

Тогда числитель можно записать как: $J(\mathbf {w} )$

\mathbf {w} ^{\text{T}}\mathbf {S} _{B}^{\phi }\mathbf {w} =\mathbf {w} ^{\text{T}}\left(\mathbf {m} _{2}^{\phi }-\mathbf {m} _{1}^{\phi }\right)\left(\mathbf {m} _{2}^{\phi }-\mathbf {m} _{1}^{\phi }\right)^{\text{T}}\mathbf {w} =\mathbf {\alpha } ^{\text{T}}\mathbf {M} \mathbf {\alpha } ,\qquad {\text{where}}\qquad \mathbf {M} =(\mathbf {M} _{2}-\mathbf {M} _{1})(\mathbf {M} _{2}-\mathbf {M} _{1})^{\text{T}}.

Аналогично знаменатель можно записать как

\mathbf {w} ^{\text{T}}\mathbf {S} _{W}^{\phi }\mathbf {w} =\mathbf {\alpha } ^{\text{T}}\mathbf {N} \mathbf {\alpha } ,\qquad {\text{where}}\qquad \mathbf {N} =\sum _{j=1,2}\mathbf {K} _{j}(\mathbf {I} -\mathbf {1} _{l_{j}})\mathbf {K} _{j}^{\text{T}},

с компонентом , определенным как , является единичная матрица, а матрица со всеми элементами равна . Это тождество может быть получено, начиная с выражения для и используя расширение и определения и $n^{\text{th}},m^{\text{th}}$ $\mathbf {K} _{j}$ $k(\mathbf {x} _{n},\mathbf {x} _{m}^{j}),\mathbf {I}$ $\mathbf {1} _{l_{j}}$ $1/l_{j}$ $\mathbf {w} ^{\text{T}}\mathbf {S} _{W}^{\phi }\mathbf {w}$ $\mathbf {w}$ $\mathbf {S} _{W}^{\phi }$ $\mathbf {m} _{i}^{\phi }$

{\begin{aligned}\mathbf {w} ^{\text{T}}\mathbf {S} _{W}^{\phi }\mathbf {w} &=\left(\sum _{i=1}^{l}\alpha _{i}\phi ^{\text{T}}(\mathbf {x} _{i})\right)\left(\sum _{j=1,2}\sum _{n=1}^{l_{j}}\left(\phi (\mathbf {x} _{n}^{j})-\mathbf {m} _{j}^{\phi }\right)\left(\phi (\mathbf {x} _{n}^{j})-\mathbf {m} _{j}^{\phi }\right)^{\text{T}}\right)\left(\sum _{k=1}^{l}\alpha _{k}\phi (\mathbf {x} _{k})\right)\\&=\sum _{j=1,2}\sum _{i=1}^{l}\sum _{n=1}^{l_{j}}\sum _{k=1}^{l}\left(\alpha _{i}\phi ^{\text{T}}(\mathbf {x} _{i})\left(\phi (\mathbf {x} _{n}^{j})-\mathbf {m} _{j}^{\phi }\right)\left(\phi (\mathbf {x} _{n}^{j})-\mathbf {m} _{j}^{\phi }\right)^{\text{T}}\alpha _{k}\phi (\mathbf {x} _{k})\right)\\&=\sum _{j=1,2}\sum _{i=1}^{l}\sum _{n=1}^{l_{j}}\sum _{k=1}^{l}\left(\alpha _{i}k(\mathbf {x} _{i},\mathbf {x} _{n}^{j})-{\frac {1}{l_{j}}}\sum _{p=1}^{l_{j}}\alpha _{i}k(\mathbf {x} _{i},\mathbf {x} _{p}^{j})\right)\left(\alpha _{k}k(\mathbf {x} _{k},\mathbf {x} _{n}^{j})-{\frac {1}{l_{j}}}\sum _{q=1}^{l_{j}}\alpha _{k}k(\mathbf {x} _{k},\mathbf {x} _{q}^{j})\right)\\&=\sum _{j=1,2}\left(\sum _{i=1}^{l}\sum _{n=1}^{l_{j}}\sum _{k=1}^{l}\left(\alpha _{i}\alpha _{k}k(\mathbf {x} _{i},\mathbf {x} _{n}^{j})k(\mathbf {x} _{k},\mathbf {x} _{n}^{j})-{\frac {2\alpha _{i}\alpha _{k}}{l_{j}}}\sum _{p=1}^{l_{j}}k(\mathbf {x} _{i},\mathbf {x} _{n}^{j})k(\mathbf {x} _{k},\mathbf {x} _{p}^{j})+{\frac {\alpha _{i}\alpha _{k}}{l_{j}^{2}}}\sum _{p=1}^{l_{j}}\sum _{q=1}^{l_{j}}k(\mathbf {x} _{i},\mathbf {x} _{p}^{j})k(\mathbf {x} _{k},\mathbf {x} _{q}^{j})\right)\right)\\&=\sum _{j=1,2}\left(\sum _{i=1}^{l}\sum _{n=1}^{l_{j}}\sum _{k=1}^{l}\left(\alpha _{i}\alpha _{k}k(\mathbf {x} _{i},\mathbf {x} _{n}^{j})k(\mathbf {x} _{k},\mathbf {x} _{n}^{j})-{\frac {\alpha _{i}\alpha _{k}}{l_{j}}}\sum _{p=1}^{l_{j}}k(\mathbf {x} _{i},\mathbf {x} _{n}^{j})k(\mathbf {x} _{k},\mathbf {x} _{p}^{j})\right)\right)\\[6pt]&=\sum _{j=1,2}\mathbf {\alpha } ^{\text{T}}\mathbf {K} _{j}\mathbf {K} _{j}^{\text{T}}\mathbf {\alpha } -\mathbf {\alpha } ^{\text{T}}\mathbf {K} _{j}\mathbf {1} _{l_{j}}\mathbf {K} _{j}^{\text{T}}\mathbf {\alpha } \\[4pt]&=\mathbf {\alpha } ^{\text{T}}\mathbf {N} \mathbf {\alpha } .\end{aligned}}

С этими уравнениями для числителя и знаменателя уравнение для можно переписать как $J(\mathbf {w} )$ $J$

J(\mathbf {\alpha } )={\frac {\mathbf {\alpha } ^{\text{T}}\mathbf {M} \mathbf {\alpha } }{\mathbf {\alpha } ^{\text{T}}\mathbf {N} \mathbf {\alpha } }}.

Тогда, дифференцируя и приравнивая к нулю, получаем

(\mathbf {\alpha } ^{\text{T}}\mathbf {M} \mathbf {\alpha } )\mathbf {N} \mathbf {\alpha } =(\mathbf {\alpha } ^{\text{T}}\mathbf {N} \mathbf {\alpha } )\mathbf {M} \mathbf {\alpha } .

Поскольку имеет значение только направление , а значит и направление , то вышеприведенное уравнение можно решить как $\mathbf {w}$ $\mathbf {\alpha } ,$ $\mathbf {\alpha }$

\mathbf {\alpha } =\mathbf {N} ^{-1}(\mathbf {M} _{2}-\mathbf {M} _{1}).

Обратите внимание, что на практике обычно является единственным числом, поэтому к нему добавляется кратное тождества ^[1] $\mathbf {N}$

\mathbf {N} _{\epsilon }=\mathbf {N} +\epsilon \mathbf {I} .

Учитывая решение для , проекция новой точки данных определяется выражением ^[1] $\mathbf {\alpha }$

y(\mathbf {x} )=(\mathbf {w} \cdot \phi (\mathbf {x} ))=\sum _{i=1}^{l}\alpha _{i}k(\mathbf {x} _{i},\mathbf {x} ).

Мультиклассовый KFD

Расширение на случаи, когда имеется более двух классов, относительно просто. ^[2]^[6]^[7] Пусть будет числом классов. Тогда многоклассовый KFD включает проекцию данных в -мерное пространство с использованием дискриминантных функций. $c$ $(c-1)$ $(c-1)$

y_{i}=\mathbf {w} _{i}^{\text{T}}\phi (\mathbf {x} )\qquad i=1,\ldots ,c-1.

Это можно записать в матричной записи

\mathbf {y} =\mathbf {W} ^{\text{T}}\phi (\mathbf {x} ),

где являются столбцами . ^[6] Кроме того, матрица ковариации между классами теперь имеет вид $\mathbf {w} _{i}$ $\mathbf {W}$

\mathbf {S} _{B}^{\phi }=\sum _{i=1}^{c}l_{i}(\mathbf {m} _{i}^{\phi }-\mathbf {m} ^{\phi })(\mathbf {m} _{i}^{\phi }-\mathbf {m} ^{\phi })^{\text{T}},

где — среднее значение всех данных в новом пространстве признаков. Внутриклассовая ковариационная матрица — это $\mathbf {m} ^{\phi }$

\mathbf {S} _{W}^{\phi }=\sum _{i=1}^{c}\sum _{n=1}^{l_{i}}(\phi (\mathbf {x} _{n}^{i})-\mathbf {m} _{i}^{\phi })(\phi (\mathbf {x} _{n}^{i})-\mathbf {m} _{i}^{\phi })^{\text{T}},

Решение теперь получается путем максимизации

J(\mathbf {W} )={\frac {\left|\mathbf {W} ^{\text{T}}\mathbf {S} _{B}^{\phi }\mathbf {W} \right|}{\left|\mathbf {W} ^{\text{T}}\mathbf {S} _{W}^{\phi }\mathbf {W} \right|}}.

Снова можно использовать трюк с ядром, и цель многоклассового KFD становится ^[7]

\mathbf {A} ^{*}={\underset {\mathbf {A} }{\operatorname {argmax} }}={\frac {\left|\mathbf {A} ^{\text{T}}\mathbf {M} \mathbf {A} \right|}{\left|\mathbf {A} ^{\text{T}}\mathbf {N} \mathbf {A} \right|}},

где и $A=[\mathbf {\alpha } _{1},\ldots ,\mathbf {\alpha } _{c-1}]$

{\begin{aligned}M&=\sum _{j=1}^{c}l_{j}(\mathbf {M} _{j}-\mathbf {M} _{*})(\mathbf {M} _{j}-\mathbf {M} _{*})^{\text{T}}\\N&=\sum _{j=1}^{c}\mathbf {K} _{j}(\mathbf {I} -\mathbf {1} _{l_{j}})\mathbf {K} _{j}^{\text{T}}.\end{aligned}}

Они определены так же, как в предыдущем разделе, и определяются как $\mathbf {M} _{i}$ $\mathbf {M} _{*}$

(\mathbf {M} _{*})_{j}={\frac {1}{l}}\sum _{k=1}^{l}k(\mathbf {x} _{j},\mathbf {x} _{k}).

$\mathbf {A} ^{*}$ Затем можно вычислить, найдя ведущие собственные векторы . ^[7] Кроме того, проекция нового входа, , задается формулой ^[7] $(c-1)$ $\mathbf {N} ^{-1}\mathbf {M}$ $\mathbf {x} _{t}$

\mathbf {y} (\mathbf {x} _{t})=\left(\mathbf {A} ^{*}\right)^{\text{T}}\mathbf {K} _{t},

где компонент задается выражением . $i^{th}$ $\mathbf {K} _{t}$ $k(\mathbf {x} _{i},\mathbf {x} _{t})$

Классификация с использованием KFD

Как в двухклассовом, так и в многоклассовом KFD метка класса нового входа может быть назначена как ^[7]

f(\mathbf {x} )=arg\min _{j}D(\mathbf {y} (\mathbf {x} ),{\bar {\mathbf {y} }}_{j}),

где — прогнозируемое среднее значение для класса , а — функция расстояния. ${\bar {\mathbf {y} }}_{j}$ $j$ $D(\cdot ,\cdot )$

Приложения

Анализ ядра дискриминанта использовался в различных приложениях. К ним относятся:

Распознавание лиц ^[3]^[8]^[9] и обнаружение ^[10]^[11]
Распознавание рукописных цифр ^[1]^[12]
Распознавание отпечатков пальцев ^[13]
Классификация злокачественных и доброкачественных кластерных микрокальцификатов ^[14]
Классификация семян ^[2]
Поиск бозона Хиггса в ЦЕРНе ^[15]

Смотрите также

Ссылки

^ abcde Мика, С.; Рэтш, Г.; Уэстон, Дж.; Шёлькопф, Б.; Мюллер, К. Р. (1999). "Дискриминантный анализ Фишера с ядрами". Нейронные сети для обработки сигналов IX: Труды семинара IEEE Signal Processing Society 1999 года (Кат. № 98TH8468) . Том IX. С. 41–48 . CiteSeerX 10.1.1.35.9904 . doi :10.1109/NNSP.1999.788121. ISBN 978-0-7803-5673-3. S2CID 8473401.
^ abc Baudat, G.; Anouar, F. (2000). «Обобщенный дискриминантный анализ с использованием подхода ядра». Neural Computation . 12 (10): 2385– 2404. CiteSeerX 10.1.1.412.760 . doi :10.1162/089976600300014980. PMID 11032039. S2CID 7036341.
^ ab Li, Y.; Gong, S.; Liddell, H. (2003). «Распознавание траекторий лицевых идентичностей с использованием дискриминантного анализа ядра». Image and Vision Computing . 21 ( 13– 14): 1077– 1086. CiteSeerX 10.1.1.2.6315 . doi :10.1016/j.imavis.2003.08.010.
^ Бишоп, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, Нью-Йорк: Springer.
^ Scholkopf, B; Herbrich, R.; Smola, A. (2001). "A Generalized Representer Theorem". Computational Learning Theory . Lecture Notes in Computer Science. Vol. 2111. pp. 416– 426. CiteSeerX 10.1.1.42.8617 . doi :10.1007/3-540-44581-1_27. ISBN 978-3-540-42343-0.
^ ab Дуда, Р.; Харт, П.; Сторк, Д. (2001). Классификация узоров . Нью-Йорк, Нью-Йорк: Wiley.
^ abcde Чжан, Дж.; Ма, К.К. (2004). «Дискриминант ядра Фишера для классификации текстур». {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Лю, Ц.; Лу, Х.; Ма, С. (2004). «Улучшение дискриминантного анализа ядра Фишера для распознавания лиц». Труды IEEE по схемам и системам для видеотехнологий . 14 (1): 42– 49. doi :10.1109/tcsvt.2003.818352. S2CID 39657721.
^ Лю, Ц.; Хуан, Р.; Лу, Х.; Ма, С. (2002). «Распознавание лиц с использованием дискриминантного анализа Фишера на основе ядра». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
^ Курита, Т.; Тагучи, Т. (2002). «Модификация дискриминантного анализа Фишера на основе ядра для обнаружения лиц». Труды Пятой международной конференции IEEE по автоматическому распознаванию жестов лица . С. 300–305 . CiteSeerX 10.1.1.100.3568 . doi :10.1109/AFGR.2002.1004170. ISBN 978-0-7695-1602-8. S2CID 7581426.
^ Фэн, И.; Ши, П. (2004). «Распознавание лиц на основе дискриминантного анализа ядра Фишера». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
^ Yang, J.; Frangi, AF; Yang, JY; Zang, D., Jin, Z. (2005). «KPCA плюс LDA: полная структура ядра дискриминанта Фишера для извлечения и распознавания признаков». IEEE Transactions on Pattern Analysis and Machine Intelligence . 27 (2): 230– 244. CiteSeerX 10.1.1.330.1179 . doi :10.1109/tpami.2005.33. PMID 15688560. S2CID 9771368. {{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Ван, И.; Руан, К. (2006). «Дискриминантный анализ ядра Фишера для распознавания отпечатков ладоней». Международная конференция по распознаванию образов .
^ Вэй, Л.; Ян, И.; Нишикава, Р. М.; Цзян, И. (2005). «Исследование нескольких методов машинного обучения для классификации злокачественных и доброкачественных кластерных микрокальцификаций». IEEE Transactions on Medical Imaging . 24 (3): 371– 380. doi :10.1109/tmi.2004.842457. PMID 15754987. S2CID 36691320.
^ Malmgren, T. (1997). "Программа итерационного нелинейного дискриминантного анализа: IDA 1.0". Computer Physics Communications . 106 (3): 230– 236. Bibcode : 1997CoPhC.106..230M. doi : 10.1016/S0010-4655(97)00100-8.

Внешние ссылки

Дискриминантный анализ ядра в C# — код C# для выполнения KFD.
Matlab Toolbox для снижения размерности — включает метод выполнения KFD.
Распознавание рукописного ввода с использованием дискриминантного анализа ядра — код C#, демонстрирующий распознавание рукописных цифр с использованием KFD.

[flda-1] Мика, С.; Рэтш, Г.; Уэстон, Дж.; Шёлькопф, Б.; Мюллер, К. Р. (1999). "Дискриминантный анализ Фишера с ядрами". Нейронные сети для обработки сигналов IX: Труды семинара IEEE Signal Processing Society 1999 года (Кат. № 98TH8468) . Том IX. С. 41–48 . CiteSeerX 10.1.1.35.9904 . doi :10.1109/NNSP.1999.788121. ISBN 978-0-7803-5673-3. S2CID 8473401.

[gda-2] Baudat, G.; Anouar, F. (2000). «Обобщенный дискриминантный анализ с использованием подхода ядра». Neural Computation . 12 (10): 2385– 2404. CiteSeerX 10.1.1.412.760 . doi :10.1162/089976600300014980. PMID 11032039. S2CID 7036341.

[faces3-3] Li, Y.; Gong, S.; Liddell, H. (2003). «Распознавание траекторий лицевых идентичностей с использованием дискриминантного анализа ядра». Image and Vision Computing . 21 ( 13– 14): 1077– 1086. CiteSeerX 10.1.1.2.6315 . doi :10.1016/j.imavis.2003.08.010.

[bishop-4] Бишоп, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, Нью-Йорк: Springer.

[5] Scholkopf, B; Herbrich, R.; Smola, A. (2001). "A Generalized Representer Theorem". Computational Learning Theory . Lecture Notes in Computer Science. Vol. 2111. pp. 416– 426. CiteSeerX 10.1.1.42.8617 . doi :10.1007/3-540-44581-1_27. ISBN 978-3-540-42343-0.

[duda-6] Дуда, Р.; Харт, П.; Сторк, Д. (2001). Классификация узоров . Нью-Йорк, Нью-Йорк: Wiley.

[texture-7] Чжан, Дж.; Ма, К.К. (2004). «Дискриминант ядра Фишера для классификации текстур». {{cite journal}}: Цитировать журнал требует |journal=( помощь )

[8] Лю, Ц.; Лу, Х.; Ма, С. (2004). «Улучшение дискриминантного анализа ядра Фишера для распознавания лиц». Труды IEEE по схемам и системам для видеотехнологий . 14 (1): 42– 49. doi :10.1109/tcsvt.2003.818352. S2CID 39657721.

[9] Лю, Ц.; Хуан, Р.; Лу, Х.; Ма, С. (2002). «Распознавание лиц с использованием дискриминантного анализа Фишера на основе ядра». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .

[faceDetection1-10] Курита, Т.; Тагучи, Т. (2002). «Модификация дискриминантного анализа Фишера на основе ядра для обнаружения лиц». Труды Пятой международной конференции IEEE по автоматическому распознаванию жестов лица . С. 300–305 . CiteSeerX 10.1.1.100.3568 . doi :10.1109/AFGR.2002.1004170. ISBN 978-0-7695-1602-8. S2CID 7581426.

[faceDetection2-11] Фэн, И.; Ши, П. (2004). «Распознавание лиц на основе дискриминантного анализа ядра Фишера». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .

[digitRecognition-12] Yang, J.; Frangi, AF; Yang, JY; Zang, D., Jin, Z. (2005). «KPCA плюс LDA: полная структура ядра дискриминанта Фишера для извлечения и распознавания признаков». IEEE Transactions on Pattern Analysis and Machine Intelligence . 27 (2): 230– 244. CiteSeerX 10.1.1.330.1179 . doi :10.1109/tpami.2005.33. PMID 15688560. S2CID 9771368. {{cite journal}}: CS1 maint: multiple names: authors list (link)

[13] Ван, И.; Руан, К. (2006). «Дискриминантный анализ ядра Фишера для распознавания отпечатков ладоней». Международная конференция по распознаванию образов .

[cancer-14] Вэй, Л.; Ян, И.; Нишикава, Р. М.; Цзян, И. (2005). «Исследование нескольких методов машинного обучения для классификации злокачественных и доброкачественных кластерных микрокальцификаций». IEEE Transactions on Medical Imaging . 24 (3): 371– 380. doi :10.1109/tmi.2004.842457. PMID 15754987. S2CID 36691320.

[higgs-15] Malmgren, T. (1997). "Программа итерационного нелинейного дискриминантного анализа: IDA 1.0". Computer Physics Communications . 106 (3): 230– 236. Bibcode : 1997CoPhC.106..230M. doi : 10.1016/S0010-4655(97)00100-8.