![]() | |
Тип компании | Частный |
---|---|
Промышленность | Обработка естественного языка |
Основан | 22 июня 2018 г. ( 2018-06-22 ) |
Основатели |
|
Штаб-квартира | , |
Продукция | Стог сена, глубоко посаженное облако |
Количество сотрудников | > 50 |
Веб-сайт | www.deepset.ai |
deepset — поставщик корпоративного программного обеспечения, предоставляющий разработчикам инструменты для создания готовых к производству систем обработки естественного языка (NLP) . Компания была основана в 2018 году в Берлине Милошем Русичем, Мальте Питчем и Тимо Мёллером. [1] deepset является автором и поддерживает программное обеспечение с открытым исходным кодом Haystack [2] и его коммерческое SaaS- предложение deepset Cloud. [3]
В июне 2018 года Милош Русич, Мальте Питч и Тимо Мёллер совместно основали компанию Deepset в Берлине , Германия . [1] В том же году компания обслужила первых клиентов, которые хотели внедрить услуги обработки естественного языка , адаптировав языковые модели BERT к своей области.
В июле 2019 года компания выпустила первую версию программного обеспечения с открытым исходным кодом FARM. [4]
В ноябре 2019 года компания выпустила первую версию программного обеспечения с открытым исходным кодом Haystack. [2]
В течение 2020 и 2021 годов deepset опубликовал несколько прикладных исследовательских работ на EMNLP , COLING и ACL , ведущих конференциях в области NLP . В 2020 году исследовательские вклады включали модели немецкого языка под названием GBERT и GELECTRA [5] , а также набор данных с ответами на вопросы, посвященный пандемии COVID-19 , под названием COVID-QA, который был создан в сотрудничестве с Intel и был аннотирован биомедицинскими экспертами. [6]
В 2021 году исследовательские вклады включали немецкие модели и наборы данных для ответов на вопросы и поиска отрывков, названные GermanQuAD и GermanDPR, [7] семантическую метрику сходства ответов , [8] и подход к мультимодальному поиску текстов и таблиц, позволяющий отвечать на вопросы по табличным данным. [9] Haystack содержит реализации всех трех вкладов, что позволяет использовать исследование через фреймворк с открытым исходным кодом.
В ноябре 2021 года разработка фреймворка FARM была прекращена, а его основные функции были интегрированы в фреймворк Haystack. [4]
В апреле 2022 года компания анонсировала коммерческое SaaS- предложение Deepset Cloud. [3]
По состоянию на август 2023 года самая популярная тонко настроенная языковая модель, созданная deepset, была загружена более 52 миллионов раз. [10]
Haystack — это фреймворк Python с открытым исходным кодом для создания пользовательских приложений с большими языковыми моделями . Благодаря его модульным строительным блокам разработчики программного обеспечения могут реализовывать конвейеры для решения различных задач поиска по большим коллекциям документов, таких как поиск документов , семантический поиск , генерация текста , ответы на вопросы или резюмирование . Он интегрируется с Hugging Face Transformers , Elasticsearch , OpenSearch , OpenAI , Cohere , Anthropic и другими. У фреймворка есть активное сообщество на Discord с более чем 1,8 тыс. участников и GitHub , где на данный момент более 200 человек внесли свой вклад в его непрерывную разработку, [11] а также у него есть активное сообщество на Meetup . [12] Тысячи организаций используют фреймворк, включая предприятия из списка Global 500, такие как Airbus , Intel , Netflix , Apple или Infineon , Alcatel-Lucent Enterprise , BetterUp, Etalab, Sooth.ai и Lego . [13] [14]
Платформа Deepset Cloud поддерживает клиентов при создании масштабируемых приложений обработки естественного языка , охватывая весь процесс прототипирования, экспериментирования, развертывания и мониторинга. [15] Она построена на Haystack.
FARM был фреймворком для адаптации моделей представления. [4] Одной из его основных концепций была реализация адаптивных моделей, которые включали языковые модели и произвольное количество головок прогнозирования. FARM поддерживал доменную адаптацию и тонкую настройку этих моделей с помощью расширенных опций, например, накопление градиента, перекрестная проверка или автоматическое обучение со смешанной точностью . Его основные функции были интегрированы в Haystack в ноябре 2021 года, и его разработка была прекращена в то время. [16]
9 августа 2023 года Deepset объявил о раунде инвестиций серии B в размере 30 миллионов долларов США под руководством Balderton Capital и с участием существующих инвесторов GV , System.One, Lunar Ventures и Harpoon Ventures. [17] [18] [19] [20] 28 апреля 2022 года Deepset объявил о раунде инвестиций серии A в размере 14 миллионов долларов США под руководством GV , при участии Harpoon Ventures, Acequia Capital и команды опытных основателей коммерческого программного обеспечения с открытым исходным кодом и машинного обучения , таких как Алекс Ратнер (Snorkel AI), Мустафа Сулейман ( Deepmind ), Спенсер Кимбалл ( Cockroach Labs ), Джефф Хаммербахер ( Cloudera ) и Эмиль Эйфрем ( Neo4j ). [1] Предыдущий раунд предпосевных инвестиций в размере 1,6 миллиона долларов США 8 марта 2021 года был проведен System.One и Lunar Ventures, которые также участвовали в последующем раунде серии A.