Mark I Perceptron был пионерской контролируемой системой обучения классификации изображений , разработанной Фрэнком Розенблаттом в 1958 году. Это была первая реализация машины искусственного интеллекта (ИИ). Он отличается от Perceptron , который является программной архитектурой, предложенной в 1943 году Уорреном Маккалоком и Уолтером Питтсом [1] , которая также использовалась в Mark I, и улучшения которой продолжают оставаться неотъемлемой частью передовых технологий ИИ, таких как Transformer .
Персептрон Mark I был организован в три слоя: [2]
Связь между сенсорными единицами и ассоциативными единицами была случайной. Работа ассоциативных единиц была очень похожа на работу ответных единиц. [2] Различные версии Mark I использовали разное количество единиц в каждом из слоев. [3]
В своем предложении 1957 года о финансировании разработки «Корнеллского фотоперцептрона» Розенблатт утверждал: [4]
«Ожидается, что устройства такого рода в конечном итоге будут способны формировать концепции, осуществлять языковой перевод, собирать данные военной разведки и решать проблемы с помощью индуктивной логики».
С первой версией персептрона Mark I еще в 1958 году Розенблатт продемонстрировал простой эксперимент по бинарной классификации , а именно, различая листы бумаги, помеченные справа, и листы бумаги, помеченные слева. [5]
Один из последних экспериментов отличил квадрат от круга, напечатанного на бумаге. Формы были идеальными, а их размеры фиксированными; единственное изменение заключалось в их положении и ориентации . Mark I Perceptron достиг точности 99,8% на тестовом наборе данных с 500 нейронами в одном слое. Размер обучающего набора данных составлял 10 000 примеров изображений. Обучающему конвейеру потребовалось 3 секунды, чтобы пройти через одно изображение. Более высокая точность наблюдалась с толстыми контурными фигурами по сравнению со сплошными фигурами, вероятно, потому, что контурные фигуры уменьшали переобучение . [3]
В другом эксперименте различали квадрат и ромб , для которых 100% точность достигалась всего лишь с 60 обучающими изображениями, с персептроном, имеющим 1000 нейронов в одном слое. Время, необходимое для обработки каждого обучающего входа для этого большего персептрона, составляло 15 секунд. Единственным изменением было положение изображения, поскольку вращение было бы неоднозначным.
В том же эксперименте он мог различать буквы X и E со 100% точностью при обучении всего с 20 изображениями (по 10 изображений каждой буквы). Изменения в изображениях включали как положение, так и поворот на 30 градусов. Когда изменение поворота увеличивалось до любого угла (как в обучающих, так и в тестовых наборах данных), точность снижалась до 90% при 60 обучающих изображениях (по 30 изображений каждой буквы). [3]
Для различения букв E и F, более сложной задачи из-за их схожести, тот же 1000 нейронный персептрон достиг точности более 80% с 60 тренировочными изображениями. Различие было только в положении изображения, без вращения. [3]
This article needs additional or more specific categories. (November 2024) |