Клод (языковая модель)

Большая языковая модель, разработанная Anthropic

Клод
Разработчик(и)Антропный
Первоначальный выпускМарт 2023 ; 1 год назад ( 2023-03 )
Тип
ЛицензияЗапатентованный
Веб-сайтКлод.ай

Claude — это семейство больших языковых моделей, разработанных Anthropic . [1] [2] Первая модель была выпущена в марте 2023 года.

Семейство Claude 3, выпущенное в марте 2024 года, состоит из трех моделей: Haiku, оптимизированная для скорости, Sonnet, балансирующая возможности и производительность, и Opus, разработанная для сложных задач рассуждения. Эти модели могут обрабатывать как текст, так и изображения, причем Claude 3 Opus демонстрирует улучшенные возможности в таких областях, как математика , программирование и логическое рассуждение по сравнению с предыдущими версиями. [3]

Обучение

Модели Клода — это генеративные предварительно обученные трансформаторы . Они были предварительно обучены предсказывать следующее слово в больших объемах текста. Затем они были доработаны , в частности, с использованием конституционного ИИ и обучения с подкреплением на основе обратной связи с человеком (RLHF). [4] [5]

Конституционный ИИ

Конституционный ИИ — это подход, разработанный Anthropic для обучения систем ИИ, в частности языковых моделей, таких как Клод, чтобы они были безвредными и полезными без опоры на обширную человеческую обратную связь. [6] Метод, подробно описанный в статье «Конституционный ИИ: безвредность от обратной связи ИИ», включает в себя две фазы: контролируемое обучение и обучение с подкреплением . [7] [8]

В фазе контролируемого обучения модель генерирует ответы на подсказки, самокритикует эти ответы на основе набора руководящих принципов («конституции») и пересматривает ответы. Затем модель настраивается на основе этих пересмотренных ответов. [8]

Для фазы обучения с подкреплением на основе обратной связи ИИ (RLAIF) генерируются ответы, и ИИ сравнивает их соответствие конституции. Этот набор данных обратной связи ИИ используется для обучения модели предпочтений, которая оценивает ответы на основе того, насколько они удовлетворяют конституции. Затем Клод настраивается для соответствия этой модели предпочтений. Эта техника похожа на RLHF , за исключением того, что сравнения, используемые для обучения модели предпочтений, генерируются ИИ и основаны на конституции. [9] [6]

«Конституция» Клода включала 75 пунктов, в том числе разделы из Всеобщей декларации прав человека ООН . [7] [4]

Модели

Скриншот примера ответа Claude 3.5 Haiku, описывающего Википедию

Имя Клод было в значительной степени вдохновлено Клодом Шенноном , пионером в области искусственного интеллекта. [10]

Клод

Claude был первоначальной версией языковой модели Anthropic, выпущенной в марте 2023 года. [11] Клод продемонстрировал мастерство в выполнении различных задач, но имел определенные ограничения в кодировании, математике и возможностях рассуждения. [12] Anthropic сотрудничал с такими компаниями, как Notion (программное обеспечение для повышения производительности) и Quora (для помощи в разработке чат-бота Poe ). [12]

Клод Мгновенный

Claude был выпущен в двух версиях: Claude и Claude Instant, причем Claude Instant был более быстрой, менее дорогой и более легкой версией. Длина входного контекста Claude Instant составляет 100 000 токенов (что соответствует примерно 75 000 слов). [13]

Клод 2

Claude 2 был следующей крупной версией Claude, которая была выпущена в июле 2023 года и стала доступна широкой публике, тогда как Claude 1 был доступен только избранным пользователям, одобренным Anthropic. [14]

Claude 2 расширил свое контекстное окно с 9000 токенов до 100 000 токенов. [11] Функции включали возможность загрузки PDF-файлов и других документов, что позволяло Claude читать, обобщать и помогать с задачами.

Клод 2.1

Claude 2.1 удвоил количество токенов, которые мог обработать чат-бот, увеличив его до окна в 200 000 токенов, что эквивалентно примерно 500 страницам письменного материала. [15]

Anthropic утверждает, что новая модель с меньшей вероятностью будет выдавать ложные утверждения по сравнению с ее предшественниками. [16]

Клод 3

Claude 3 был выпущен 14 марта 2024 года, и в пресс-релизе утверждается, что он установил новые отраслевые стандарты по широкому спектру когнитивных задач. Семейство Claude 3 включает три современные модели в порядке возрастания возможностей: Haiku, Sonnet и Opus. Версия Claude 3 по умолчанию, Opus, имеет контекстное окно в 200 000 токенов, но оно расширяется до 1 миллиона для особых случаев использования. [17] [3]

Клод 3 привлек внимание, продемонстрировав очевидную способность осознавать, что она подвергается искусственному тестированию во время тестов на иголку в стоге сена. [18]

Клод 3.5

Пример вывода сонета Клода 3.5

20 июня 2024 года Anthropic выпустила Claude 3.5 Sonnet, который продемонстрировал значительно улучшенную производительность в тестах по сравнению с более крупным Claude 3 Opus, особенно в таких областях, как кодирование, многошаговые рабочие процессы, интерпретация диаграмм и извлечение текста из изображений. Вместе с 3.5 Sonnet была выпущена новая возможность Artifacts, с помощью которой Claude мог создавать код в специальном окне в интерфейсе и предварительно просматривать отрисованный вывод в реальном времени, например, графику SVG или веб-сайты. [19]

«Обновленный Claude 3.5 Sonnet» был представлен 22 октября 2024 года вместе с Claude 3.5 Haiku. Функция «использование компьютера» также была представлена ​​в публичной бета-версии. Эта возможность позволяет Claude 3.5 Sonnet взаимодействовать с рабочей средой компьютера, выполняя такие задачи, как перемещение курсора, нажатие кнопок и ввод текста, эффективно имитируя взаимодействие человека с компьютером. Эта разработка позволяет ИИ автономно выполнять сложные многошаговые задачи в различных приложениях. [20] [21]

Критика

Claude 2 подвергся критике за его строгое этическое соответствие, которое может снизить удобство использования и производительность. Пользователям было отказано в помощи с безобидными запросами, например, с вопросом системного администратора «Как мне завершить все процессы Python на моем сервере Ubuntu ?» Это привело к дебатам о «налоге на выравнивание» (стоимость обеспечения выравнивания системы ИИ ) в разработке ИИ, при этом обсуждения были сосредоточены на балансе этических соображений и практической функциональности. Критики выступали за автономию и эффективность пользователя, в то время как сторонники подчеркивали важность этического ИИ. [22] [16]

Ссылки

  1. ^ «Что такое Claude AI?». IBM . 24 сентября 2024 г.
  2. ^ Хеншолл, Уилл (18 июля 2023 г.). «Что нужно знать о Клоде 2, конкуренте Anthropic для ChatGPT». TIME . Получено 14 декабря 2024 г. .
  3. ^ ab Whitney, Lance (4 марта 2024 г.). «Чат-бот Claude 3 от Anthropic превзошел ChatGPT, Gemini». ZDNET . Получено 5 марта 2024 г. .
  4. ^ ab "Что нужно знать о Claude 2, конкуренте ChatGPT от Anthropic". TIME . 18 июля 2023 г. Получено 23 января 2024 г.
  5. ^ Нуньес, Майкл (9 мая 2023 г.). «Anthropic выпускает конституцию ИИ для содействия этическому поведению и развитию». VentureBeat . Получено 17 ноября 2024 г.
  6. ^ ab Edwards, Benj (9 мая 2023 г.). «ИИ приобретает «ценности» с новым подходом Anthropic к чат-ботам на основе конституционного ИИ». Ars Technica . Получено 17 ноября 2024 г.
  7. ^ Аб Бай, Юньтао; Кадават, Саурав; Кунду, Сандипан; Аскелл, Аманда; Кернион, Джексон; Джонс, Энди; Чен, Анна; Голди, Анна; Мирхосейни, Азалия (15 декабря 2022 г.), Конституционный ИИ: безвредность от обратной связи ИИ , arXiv : 2212.08073
  8. ^ ab "Конституция Клода". Anthropic . 9 мая 2023 г. Получено 26 марта 2024 г.
  9. ^ Элиот, Лэнс (25 мая 2023 г.). «Последний генеративный ИИ, смело обозначенный как конституционный ИИ, такой как у Клода Антропика, имеет сердце в правильном месте, заявляет этика ИИ и закон ИИ». Forbes . Получено 27 марта 2024 г.
  10. ^ Руз, Кевин (11 июля 2023 г.). «Внутри раскаленного центра ИИ-думизма». The New York Times .
  11. ^ ab Drapkin, Aaron (27 октября 2023 г.). «Что такое Claude AI и Anthropic? Объяснение конкурента ChatGPT». Tech.co . Получено 23 января 2024 г. .
  12. ^ ab "Знакомьтесь, Клод". Anthropic . 14 марта 2023 г.
  13. ^ Яо, Дебора (11 августа 2023 г.). «Anthropic's Claude Instant: более компактная, быстрая и дешевая языковая модель». AI Business .
  14. Мэтьюз, Дилан (17 июля 2023 г.). «Ставка на 1 миллиард долларов, чтобы гарантировать, что ИИ не уничтожит человечество». Vox . Получено 23 января 2024 г.
  15. ^ Дэвис, Уэс (21 ноября 2023 г.). «Конкурент OpenAI Anthropic делает своего чат-бота Claude еще более полезным». The Verge . Получено 23 января 2024 г. .
  16. ^ ab "Anthropic объявляет о выпуске Claude 2.1 LLM с более широким контекстным окном и поддержкой инструментов ИИ". InfoQ . Получено 23 января 2024 г. .
  17. ^ «Представляем следующее поколение Клода». Anthropic . Получено 4 марта 2024 г. .
  18. ^ Эдвардс, Бендж (5 марта 2024 г.). «Клод 3 от Anthropic вызывает переполох, по-видимому, осознавая, когда его испытывали». Ars Technica . Получено 9 марта 2024 г.
  19. Пирс, Дэвид (20 июня 2024 г.). «У Anthropic есть новая быстрая модель ИИ — и новый умный способ взаимодействия с чат-ботами». The Verge . Получено 20 июня 2024 г. .
  20. ^ «Введение в использование компьютера, новый сонет Клода 3.5 и хайку Клода 3.5». www.anthropic.com . Получено 25 октября 2024 г. .
  21. ^ Шакир, Умар (22 октября 2024 г.). «Последнее обновление искусственного интеллекта от Anthropic может использовать компьютер самостоятельно». The Verge . Получено 6 января 2025 г.
  22. ^ Глифтон, Джеральд (3 января 2024 г.). «Критика возникает из-за строгих этических протоколов Claude AI, ограничивающих помощь пользователям». Light Square . Получено 23 января 2024 г.
  • Официальный сайт
Взято с "https://en.wikipedia.org/w/index.php?title=Клод_(языковая_модель)&oldid=1273468386#Конституционный_ИИ"