Оригинальный автор(ы) | Джон Роберт Андерсон |
---|---|
Стабильный релиз | 7.21.6-<3099:2020-12-21> / 21 декабря 2020 г. ( 2020-12-21 ) [1] |
Написано в | Общий Лисп |
Тип | Когнитивная архитектура |
Лицензия | GNU LGPL v2.1 |
Веб-сайт | акт-р.пси.cmu.edu |
ACT-R (произносится /ˌækt ˈɑr/; сокращение от " Adaptive Control of Thought—Rational ") — когнитивная архитектура, в основном разработанная Джоном Робертом Андерсоном и Кристианом Лебьером в Университете Карнеги — Меллона . Как и любая когнитивная архитектура, ACT-R направлена на определение базовых и нередуцируемых когнитивных и перцептивных операций, которые позволяют человеческому разуму. Теоретически каждая задача, которую могут выполнять люди, должна состоять из серии этих дискретных операций.
Большинство основных положений ACT-R также вдохновлены прогрессом когнитивной нейронауки , и ACT-R можно рассматривать и описывать как способ определения того, как организован сам мозг, таким образом, чтобы отдельные модули обработки информации могли производить познание.
ACT-R был вдохновлен работой Аллена Ньюэлла , и особенно его пожизненным отстаиванием идеи единых теорий как единственного способа по-настоящему раскрыть основы познания. [2] Фактически, Андерсон обычно приписывает Ньюэллу основной источник влияния на его собственную теорию.
Как и другие влиятельные когнитивные архитектуры (включая Soar , CLARION и EPIC ), теория ACT-R имеет вычислительную реализацию в виде интерпретатора специального языка кодирования. Сам интерпретатор написан на Common Lisp и может быть загружен в любой из дистрибутивов языка Common Lisp.
Это означает, что любой исследователь может загрузить код ACT-R с веб-сайта ACT-R, загрузить его в дистрибутив Common Lisp и получить полный доступ к теории в форме интерпретатора ACT-R.
Кроме того, это позволяет исследователям определять модели человеческого познания в форме скрипта на языке ACT-R. Примитивы языка и типы данных разработаны для отражения теоретических предположений о человеческом познании. Эти предположения основаны на многочисленных фактах, полученных из экспериментов в области когнитивной психологии и визуализации мозга .
Как и язык программирования , ACT-R является фреймворком: для различных задач (например, Ханойская башня , память для текста или списка слов, понимание языка, коммуникация, управление самолетом) исследователи создают «модели» (т. е. программы) в ACT-R. Эти модели отражают предположения разработчиков моделей о задаче в рамках взгляда ACT-R на познание. Затем модель может быть запущена.
Запуск модели автоматически создает пошаговую симуляцию поведения человека, которая определяет каждую отдельную когнитивную операцию (например, кодирование и извлечение памяти, визуальное и слуховое кодирование, программирование и выполнение моторики, манипуляция ментальными образами). Каждый шаг связан с количественными прогнозами задержек и точности. Модель можно протестировать, сравнив ее результаты с данными, собранными в поведенческих экспериментах.
В последние годы ACT-R также был расширен для количественного прогнозирования паттернов активации в мозге, обнаруженных в экспериментах с фМРТ . В частности, ACT-R был расширен для прогнозирования формы и временного хода BOLD- ответа нескольких областей мозга, включая области рук и рта в моторной коре , левую префронтальную кору , переднюю поясную кору и базальные ганглии .
Наиболее важным предположением ACT-R является то, что человеческое знание можно разделить на два нередуцируемых вида представлений: декларативное и процедурное .
В коде ACT-R декларативные знания представлены в виде фрагментов , т.е. векторных представлений отдельных свойств, каждое из которых доступно из помеченного слота.
Фрагменты хранятся и становятся доступными через буферы , которые являются интерфейсом модулей , т.е. специализированных и в значительной степени независимых структур мозга.
Существует два типа модулей:
Ко всем модулям можно получить доступ только через их буферы. Содержимое буферов в данный момент времени представляет состояние ACT-R в этот момент. Единственным исключением из этого правила является процедурный модуль, который хранит и применяет процедурные знания. Он не имеет доступного буфера и фактически используется для доступа к содержимому других модулей.
Процедурные знания представлены в форме продукции . Термин «продукция» отражает фактическую реализацию ACT-R как системы продукции , но, по сути, продукция — это в основном формальная нотация для указания потока информации из корковых областей (т. е. буферов) в базальные ганглии и обратно в кору.
В каждый момент времени внутренний сопоставитель шаблонов ищет продукцию, которая соответствует текущему состоянию буферов. Только одна такая продукция может быть выполнена в данный момент. Эта продукция, будучи выполненной, может модифицировать буферы и, таким образом, изменить состояние системы. Таким образом, в ACT-R познание разворачивается как последовательность срабатываний продукции.
В когнитивных науках различные теории обычно приписываются либо « символическому », либо « коннекционистскому » подходу к познанию. ACT-R явно принадлежит к «символическому» полю и классифицируется как таковое в стандартных учебниках и сборниках. [3] Его сущности (фрагменты и продукции) являются дискретными, а его операции являются синтаксическими, то есть не ссылаются на семантическое содержание представлений, а только на их свойства, которые считают их подходящими для участия в вычислении(ях). Это ясно видно в слотах фрагментов и в свойствах сопоставления буферов в продукции, которые оба функционируют как стандартные символические переменные.
Члены сообщества ACT-R, включая его разработчиков, предпочитают думать об ACT-R как об общей структуре, которая определяет, как организован мозг и как его организация порождает то, что воспринимается (и, в когнитивной психологии, исследуется) как разум, выходя за рамки традиционных символических/коннекционистских дебатов. Ничего из этого, естественно, не противоречит классификации ACT-R как символической системы, поскольку все символические подходы к познанию направлены на описание разума как продукта функционирования мозга, используя определенный класс сущностей и систем для достижения этой цели.
Распространенное заблуждение предполагает, что ACT-R может не быть символической системой, поскольку она пытается охарактеризовать функцию мозга. Это неверно по двум причинам: во-первых, все подходы к вычислительному моделированию познания, символические или иные, должны в некотором отношении характеризовать функцию мозга, поскольку разум — это функция мозга. И, во-вторых, все такие подходы, включая коннекционистские подходы, пытаются охарактеризовать разум на когнитивном уровне описания, а не на нейронном уровне, поскольку только на когнитивном уровне могут быть сохранены важные обобщения. [4]
Дальнейшие недоразумения возникают из-за ассоциативного характера некоторых свойств ACT-R, таких как распространение активации фрагментами друг на друга или фрагментами и продукцией, несущими количественные свойства, относящиеся к их выбору. Ни одно из этих свойств не противоречит фундаментальной природе этих сущностей как символических, независимо от их роли в выборе единиц и, в конечном счете, в вычислении.
Разработчики ACT-R обычно подчеркивают важность разграничения самой теории и ее реализации.
На самом деле, большая часть реализации не отражает теорию. Например, фактическая реализация использует дополнительные «модули», которые существуют только для чисто вычислительных целей и не должны отражать что-либо в мозге (например, один вычислительный модуль содержит генератор псевдослучайных чисел, используемый для создания шумных параметров, в то время как другой содержит процедуры именования для создания структур данных, доступных через имена переменных).
Кроме того, фактическая реализация призвана дать возможность исследователям модифицировать теорию, например, изменяя стандартные параметры, создавая новые модули или частично изменяя поведение существующих.
Наконец, пока лаборатория Андерсона в CMU поддерживает и выпускает официальный код ACT-R, стали доступны и другие альтернативные реализации теории. Эти альтернативные реализации включают jACT-R [5] (написанный на Java Энтони М. Харрисоном в Военно-морской исследовательской лаборатории ) и Python ACT-R (написанный на Python Терренсом К. Стюартом и Робертом Л. Уэстом в Карлтонском университете , Канада). [6]
Аналогично, ACT-RN (теперь прекращенная разработка) была полноценной нейронной реализацией версии теории 1993 года. [7] Все эти версии были полностью функциональны, и модели были написаны и запущены с использованием всех из них.
Из-за этих степеней свободы реализации сообщество ACT-R обычно называет «официальную», основанную на Lisp , версию теории, принятую в ее первоначальном виде и неизмененную, «Vanilla ACT-R».
За прошедшие годы модели ACT-R использовались в более чем 700 различных научных публикациях и цитировались во многих других. [8]
Система декларативной памяти ACT-R использовалась для моделирования человеческой памяти с момента ее создания. В течение многих лет она была принята для успешного моделирования большого количества известных эффектов. Они включают в себя эффект веера помех для ассоциированной информации, [9] эффекты первичности и новизны для списочной памяти, [10] и последовательное припоминание. [11]
ACT-R использовался для моделирования процессов внимания и контроля в ряде когнитивных парадигм. К ним относятся задача Струпа , [12] [13] переключение задач , [14] [15] психологический рефрактерный период , [16] и многозадачность. [17]
Ряд исследователей использовали ACT-R для моделирования нескольких аспектов понимания и производства естественного языка . Они включают модели синтаксического разбора, [18] понимания языка, [19] усвоения языка [20] и понимания метафор. [21]
ACT-R использовался для того, чтобы запечатлеть, как люди решают сложные задачи, такие как Ханойская башня [22] , или как люди решают алгебраические уравнения. [23] Он также использовался для моделирования поведения человека при вождении и полете. [24]
Благодаря интеграции перцептивно-моторных возможностей ACT-R становится все более популярным как инструмент моделирования человеческого фактора и взаимодействия человека с компьютером. В этой области он был принят для моделирования поведения водителя в различных условиях, [25] [26] выбора меню и визуального поиска в компьютерном приложении, [27] [28] и веб-навигации. [29]
Совсем недавно ACT-R использовался для прогнозирования паттернов активации мозга во время экспериментов по визуализации. [30] В этой области модели ACT-R успешно использовались для прогнозирования префронтальной и теменной активности при извлечении памяти, [31] активности передней поясной извилины для операций управления, [32] и изменений в активности мозга, связанных с практикой. [33]
ACT-R часто принималась в качестве основы для когнитивных репетиторов . [34] [35] Эти системы используют внутреннюю модель ACT-R для имитации поведения ученика и персонализации его/ее инструкций и учебной программы, пытаясь «угадать» трудности, которые могут возникнуть у учеников, и предоставить им целенаправленную помощь.
Такие «Когнитивные репетиторы» используются в качестве платформы для исследований в области обучения и когнитивного моделирования в рамках Питтсбургского центра науки обучения. Некоторые из наиболее успешных приложений, такие как «Когнитивный репетитор по математике», используются в тысячах школ по всем Соединенным Штатам.
ACT-R является окончательным преемником серии все более точных моделей человеческого познания, разработанных Джоном Р. Андерсоном .
Ее корни можно проследить до оригинальной модели памяти HAM (Human Associative Memory), описанной Джоном Р. Андерсоном и Гордоном Бауэром в 1973 году. [36] Модель HAM была позже расширена в первую версию теории ACT. [37] Это был первый раз, когда процедурная память была добавлена к оригинальной декларативной системе памяти, вводя вычислительную дихотомию, которая, как позже было доказано, существует в человеческом мозге. [38] Затем теория была дополнительно расширена в модель человеческого познания ACT*. [39]
В конце восьмидесятых Андерсон посвятил себя исследованию и описанию математического подхода к познанию, который он назвал Рациональным анализом . [40] Основное предположение Рационального анализа заключается в том, что познание оптимально адаптивно, а точные оценки когнитивных функций отражают статистические свойства окружающей среды. [41] Позже он вернулся к разработке теории ACT, используя Рациональный анализ в качестве объединяющей структуры для базовых вычислений. Чтобы подчеркнуть важность нового подхода в формировании архитектуры, его название было изменено на ACT-R, где «R» означает «Rational» [42]
В 1993 году Андерсон встретился с Кристианом Лебьером, исследователем в области коннекционистских моделей , в основном известным по разработке совместно со Скоттом Фальманом алгоритма обучения Cascade Correlation. Их совместная работа завершилась выпуском ACT-R 4.0. [43] Благодаря Майку Бирну (сейчас в Университете Райса ), версия 4.0 также включала дополнительные перцептивные и двигательные возможности, в основном вдохновленные архитектурой EPIC, что значительно расширило возможные применения теории.
После выпуска ACT-R 4.0 Джон Андерсон стал все больше интересоваться нейронной обоснованностью своей теории жизни и начал использовать методы визуализации мозга, преследуя свою собственную цель — понять вычислительные основы человеческого разума.
Необходимость учета локализации мозга подтолкнула к серьезному пересмотру теории. ACT-R 5.0 ввел концепцию модулей, специализированных наборов процедурных и декларативных представлений, которые могли быть сопоставлены с известными системами мозга. [44] Кроме того, взаимодействие между процедурными и декларативными знаниями опосредовалось недавно введенными буферами, специализированными структурами для хранения временно активной информации (см. раздел выше). Считалось, что буферы отражают кортикальную активность, и последующая серия исследований позже подтвердила, что активация в кортикальных областях может быть успешно связана с вычислительными операциями над буферами.
Новая версия кода, полностью переписанная, была представлена в 2005 году как ACT-R 6.0. Она также включала значительные улучшения в языке кодирования ACT-R. Это включало новый механизм в спецификации производства ACT-R, называемый динамическим сопоставлением шаблонов. В отличие от предыдущих версий, которые требовали, чтобы шаблон, сопоставленный производством, включал определенные слоты для информации в буферах, динамическое сопоставление шаблонов позволяет сопоставлять слоты, которые также должны быть указаны содержимым буфера. Описание и мотивация для ACT-R 6.0 приведены в Anderson (2007). [45]
На семинаре 2015 года утверждалось, что изменения в программном обеспечении требуют увеличения нумерации моделей до ACT-R 7.0. Основным изменением программного обеспечения стало устранение требования, чтобы фрагменты были указаны на основе предопределенных типов фрагментов. Механизм типа фрагмента не был удален, но был изменен с обязательной конструкции архитектуры на необязательный синтаксический механизм в программном обеспечении. Это позволило добиться большей гибкости в представлении знаний для задач моделирования, требующих изучения новой информации, и расширило функциональность, предоставляемую посредством динамического сопоставления с образцом, теперь позволяющего моделям создавать новые «типы» фрагментов. Это также привело к упрощению синтаксиса, необходимого для указания действий в производстве, поскольку все действия теперь имеют одинаковую синтаксическую форму. Программное обеспечение ACT-R также было впоследствии обновлено для включения удаленного интерфейса на основе JSON RPC 1.0. Этот интерфейс был добавлен для упрощения создания задач для моделей и работы с ACT-R из языков, отличных от Lisp, а учебное пособие, включенное в программное обеспечение, было обновлено с целью предоставления реализаций Python для всех примеров задач, выполняемых учебными моделями.
В 1995 году Университет Карнеги-Меллона начал проводить ежегодный семинар и летнюю школу ACT-R. [46] В настоящее время их семинар ACT-R проводится на ежегодной конференции MathPsych/ICCM, а их летняя школа проводится на территории кампуса с возможностью виртуального участия в Университете Карнеги-Меллона .
Длительное развитие теории ACT-R привело к появлению ряда параллельных и взаимосвязанных проектов.
Наиболее важными из них являются система производства PUPS , первоначальная реализация теории Андерсона, от которой позже отказались; и ACT-RN [7] — нейросетевая реализация теории, разработанной Кристианом Лебьером.
Линн М. Редер, также работающая в Университете Карнеги-Меллона , в начале 1990-х годов разработала SAC — модель концептуальных и перцептивных аспектов памяти, которая во многом схожа с базовой декларативной системой ACT-R, хотя и отличается некоторыми предположениями.
Для своей диссертации в Университете Карнеги — Меллона Кристофер Л. Дэнси разработал и успешно защитил в 2014 году ACT-R/Phi [ 47] — реализацию ACT-R с добавленными физиологическими модулями, которые позволяют ACT-R взаимодействовать с физиологическими процессами человека.
Легкая реализация компонента рабочей памяти ACT-R на Python, pyACTUp , [48] была создана Доном Моррисоном из Университета Карнеги-Меллона , который поддерживает кодовую базу ACT-R. Эта библиотека реализует ACT-R как унимодальную контролируемую модель обучения для задач классификации.