This article needs additional citations for verification. (February 2014) |
MANIC , ранее известная как PMML.1, является когнитивной архитектурой , разработанной лабораторией предиктивного моделирования и машинного обучения в Университете Арканзаса . Она отличается от других когнитивных архитектур тем, что пытается «минимизировать новизну». То есть, она пытается организовать устоявшиеся методы в компьютерной науке, а не предлагать какие-либо новые методы для достижения познания. В то время как большинство других когнитивных архитектур вдохновлены некоторыми неврологическими наблюдениями и впоследствии разрабатываются сверху вниз, чтобы вести себя в некотором роде как мозг, MANIC вдохновлена только общепринятыми практиками в компьютерной науке и была разработана снизу вверх с целью объединения различных методов в машинном обучении и искусственном интеллекте .
На самом высоком уровне MANIC описывает программного агента, который, предположительно, будет проявлять когнитивный интеллект. Искусственный мозг агента состоит из двух основных компонентов: системы обучения и системы принятия решений.
Система обучения моделирует среду агента как динамическую систему . Она состоит из «функции наблюдения», которая отображает текущие убеждения агента в прогнозируемые наблюдения, и «функции перехода», которая отображает текущие убеждения в будущие убеждения в следующем временном шаге. Функция наблюдения реализована с помощью генеративной архитектуры глубокого обучения . Она обучается неконтролируемым образом на основе наблюдений, которые делает агент. Внутренние представления этих наблюдений становятся «убеждениями» агентов. Функция перехода обучается контролируемым образом , чтобы предсказывать следующие убеждения из текущих. Вся система обучения основана на статье Майкла С. Гашлера 2011 года, в которой описывается метод обучения глубокой нейронной сети для моделирования простой динамической системы из визуальных наблюдений. [1]
Система принятия решений состоит из модуля планирования и функции удовлетворенности. Модуль планирования использует эволюционный алгоритм для разработки удовлетворяющего плана. Функция удовлетворенности сопоставляет текущие убеждения агента или ожидаемые убеждения с оценкой полезности нахождения в этом состоянии. Она обучается с помощью подкрепления от человека-учителя. Чтобы облегчить это обучение с подкреплением, MANIC предоставляет агенту механизм для генерации «фантастических видеороликов», которые показывают ожидаемые наблюдения, если бы план-кандидат должен был быть выполнен. Идея состоит в том, что человек-учитель оценивал бы эти видеоролики и ранжировал их в соответствии с желательностью или полезностью, а затем агент мог бы использовать эту обратную связь для уточнения своей функции удовлетворенности.
MANIC предполагает, что обучающая система дает агенту осведомленность об окружающей среде, моделируя ее и используя эту модель для прогнозирования будущих убеждений. Далее предлагается, что аналогичный механизм может также реализовать чувствительность . То есть, утверждается, что осведомленность может быть реализована с помощью модели, обращенной вовне, а чувствительность может быть реализована с помощью модели, обращенной вовнутрь. Поэтому предлагается добавить «интроспективные чувства», которые теоретически дают агенту возможность осознавать свои собственные внутренние чувства, моделируя их, так же, как он осознает свою внешнюю среду. В некоторой степени MANIC предполагает, что существующие методы, уже используемые в искусственном интеллекте, непреднамеренно создают субъективные переживания, подобные тем, которые обычно ассоциируются с сознательными существами.