Теория адаптивного резонанса ( ART ) — это теория, разработанная Стивеном Гроссбергом и Гейл Карпентер по аспектам того, как мозг обрабатывает информацию . Она описывает ряд моделей искусственных нейронных сетей , которые используют контролируемые и неконтролируемые методы обучения и решают такие проблемы, как распознавание образов и прогнозирование.
Основная интуиция, лежащая в основе модели ART, заключается в том, что идентификация и распознавание объектов обычно происходят в результате взаимодействия ожиданий наблюдателя «сверху вниз» с сенсорной информацией «снизу вверх» . Модель постулирует, что ожидания «сверху вниз» принимают форму шаблона памяти или прототипа , который затем сравнивается с фактическими характеристиками объекта, обнаруженными органами чувств. Это сравнение дает меру принадлежности к категории. Пока эта разница между ощущением и ожиданием не превышает установленного порога, называемого «параметром бдительности», ощущаемый объект будет считаться членом ожидаемого класса. Таким образом, система предлагает решение проблемы «пластичности/стабильности», то есть проблемы приобретения новых знаний без нарушения существующих знаний, что также называется инкрементальным обучением .
Базовая система ART представляет собой модель неконтролируемого обучения . Она обычно состоит из поля сравнения и поля распознавания, состоящих из нейронов , параметра бдительности (порог распознавания) и модуля сброса .
Существует два основных метода обучения нейронных сетей на основе ART: медленный и быстрый. В методе медленного обучения степень обучения весов нейрона распознавания по отношению к входному вектору вычисляется до непрерывных значений с помощью дифференциальных уравнений и, таким образом, зависит от продолжительности времени, в течение которого представлен входной вектор. При быстром обучении алгебраические уравнения используются для вычисления степени корректировок веса, которые необходимо сделать, и используются двоичные значения. В то время как быстрое обучение эффективно и действенно для различных задач, метод медленного обучения более биологически правдоподобен и может использоваться с сетями с непрерывным временем (т. е. когда входной вектор может непрерывно меняться).
ART 1 [1] [2] — это простейшая разновидность сетей ART, принимающая только двоичные входы. ART 2 [3] расширяет возможности сети для поддержки непрерывных входов. ART 2-A [4] — это упрощенная форма ART-2 с радикально ускоренным временем выполнения и качественными результатами, которые лишь изредка уступают полной реализации ART-2. ART 3 [5] основывается на ART-2, имитируя элементарную нейротрансмиттерную регуляцию синаптической активности путем включения имитируемых концентраций ионов натрия (Na+) и кальция (Ca2+) в уравнения системы, что приводит к более физиологически реалистичным средствам частичного ингибирования категорий, которые запускают сброс несоответствия.
ARTMAP [6], также известный как Predictive ART , объединяет два слегка модифицированных блока ART-1 или ART-2 в контролируемую структуру обучения, где первый блок принимает входные данные, а второй блок принимает правильные выходные данные, а затем используется для выполнения минимально возможной корректировки параметра бдительности в первом блоке с целью выполнения правильной классификации.
Fuzzy ART [7] внедряет нечеткую логику в распознавание образов ART, тем самым повышая обобщаемость. Дополнительной (и очень полезной) функцией нечеткого ART является дополнительное кодирование, средство включения отсутствия признаков в классификации образов, что в значительной степени способствует предотвращению неэффективного и ненужного разрастания категорий. Применяемые меры сходства основаны на норме L1 . Известно, что нечеткое ART очень чувствительно к шуму.
Нечеткий ARTMAP [8] — это просто ARTMAP, использующий нечеткие единицы ART, что приводит к соответствующему повышению эффективности.
Упрощенный нечеткий ARTMAP (SFAM) [9] представляет собой сильно упрощенный вариант нечеткого ARTMAP, предназначенный для задач классификации .
Gaussian ART [10] и Gaussian ARTMAP [10] используют гауссовские функции активации и вычисления, основанные на теории вероятностей. Поэтому они имеют некоторое сходство с моделями гауссовой смеси . По сравнению с нечетким ART и нечетким ARTMAP они менее чувствительны к шуму. Но стабильность изученных представлений снижается, что может привести к распространению категорий в открытых учебных задачах.
Fusion ART и связанные с ним сети [11] [12] [13] расширяют ART и ARTMAP на несколько каналов шаблонов. Они поддерживают несколько парадигм обучения, включая неконтролируемое обучение, контролируемое обучение и обучение с подкреплением.
TopoART [14] объединяет нечеткое ART с топологическими обучающими сетями, такими как растущий нейронный газ . Кроме того, он добавляет механизм шумоподавления. Существует несколько производных нейронных сетей, которые расширяют TopoART для дальнейших парадигм обучения.
Hypersphere ART [15] и Hypersphere ARTMAP [15] тесно связаны с fuzzy ART и fuzzy ARTMAP соответственно. Но поскольку они используют другой тип представления категорий (а именно гиперсферы), они не требуют, чтобы их входные данные были нормализованы до интервала [0, 1]. Они применяют меры сходства, основанные на норме L2 .
LAPART [16] Нейронные сети Laterally Primed Adaptive Resonance Theory (LAPART) объединяют два алгоритма Fuzzy ART для создания механизма для прогнозирования на основе изученных ассоциаций. Объединение двух Fuzzy ART обладает уникальной стабильностью, которая позволяет системе быстро сходиться к четкому решению. Кроме того, он может выполнять логический вывод и контролируемое обучение, аналогичное нечеткому ARTMAP.
Этот раздел нуждается в расширении . Вы можете помочь, дополнив его. ( Сентябрь 2015 ) |
Было отмечено, что результаты Fuzzy ART и ART 1 (т. е. изученные категории) критически зависят от порядка, в котором обрабатываются обучающие данные. Эффект может быть уменьшен в некоторой степени за счет использования более медленной скорости обучения, но присутствует независимо от размера входного набора данных. Следовательно, оценки Fuzzy ART и ART 1 не обладают статистическим свойством согласованности . [ 17] Эту проблему можно рассматривать как побочный эффект соответствующих механизмов, обеспечивающих стабильное обучение в обеих сетях.
Более продвинутые сети ART, такие как TopoART и Hypersphere TopoART, которые объединяют категории в кластеры, могут решить эту проблему, поскольку формы кластеров не зависят от порядка создания связанных категорий. (ср. рис. 3(g, h) и рис. 4 из [18] ).
Вассерман, Филип Д. (1989), Нейронные вычисления: теория и практика, Нью-Йорк: Van Nostrand Reinhold, ISBN 0-442-20743-3