Тип компании | Частный |
---|---|
Промышленность | Технологии баз данных |
Жанр | Многомодельная СУБД |
Основан | Апрель 2010 г. Остин, Техас , США |
Основатель |
|
Штаб-квартира | , Соединенные Штаты |
Ключевые люди | Чет Капур [1] (генеральный директор) Давор Боначи (технический директор) Эд Ануфф (главный директор по закупкам) Дон Диксон (финансовый директор) Брэд Гайгер (директор по управлению рисками) Джейсон Макклелланд (директор по маркетингу) Крис Фогель (директор по кадрам) |
Количество сотрудников | 800+ (июнь 2022 г.) [2] |
Веб-сайт | DataStax.com |
DataStax, Inc. — это компания, предоставляющая данные в режиме реального времени для искусственного интеллекта, расположенная в Санта-Кларе, Калифорния . [3] Ее продукт Astra DB — это облачная база данных как услуга на основе Apache Cassandra . DataStax также предлагает DataStax Enterprise (DSE), локальную базу данных, созданную на основе Apache Cassandra, и Astra Streaming, облачный сервис обмена сообщениями и потоковой передачи событий на основе Apache Pulsar. По состоянию на июнь 2022 года у компании было около 800 клиентов в более чем 50 странах. [4] [5] [2]
DataStax был создан на основе базы данных NoSQL Apache Cassandra с открытым исходным кодом . Cassandra изначально разрабатывалась внутри Facebook для обработки больших наборов данных на нескольких серверах [6] и была выпущена как проект Apache с открытым исходным кодом в 2008 году. [7] В 2010 году Джонатан Эллис и Мэтт Пфайл покинули Rackspace , где они работали с Cassandra, чтобы запустить Riptano в Остине, штат Техас. [6] [8] Позднее Эллис и Пфайл переименовали компанию в DataStax и переместили ее штаб-квартиру в Санта-Клару, штат Калифорния. [3] [9]
Компания продолжила создавать собственную корпоративную версию Cassandra, базу данных NoSQL под названием DataStax Enterprise (DSE). [6]
В 2019 году Чет Капур был назначен новым генеральным директором компании, сменив Билли Босворта. [10]
В мае 2020 года DataStax выпустила Astra DB, DBaaS для приложений Cassandra. [11] В ноябре 2020 года DataStax выпустила K8ssandra, дистрибутив Cassandra с открытым исходным кодом на Kubernetes. [12] В декабре 2020 года DataStax выпустила Stargate, шлюз API данных с открытым исходным кодом. [13]
После приобретения поставщика потоковых событий Kesque в январе 2021 года [14] компания запустила Luna Streaming, платформу потоковой передачи данных для Apache Pulsar. [15] Затем DataStax переделала технологию Kesque в Astra Streaming. [16] Облачный сервис Astra Streaming стал общедоступным 29 июня 2022 года. [17] С выпуском компания добавила поддержку API на уровне инструментов обмена сообщениями Apache Kafka, RabbitMQ и Java Message Service, в дополнение к Apache Pulsar. [18] [19] Astra Streaming может подключаться к более крупной платформе данных, используя облачный сервис Astra DB от DataStax. [18]
Начиная с 2023 года DataStax начала внедрять искусственный интеллект и машинное обучение в свою платформу. [20] В январе 2023 года компания приобрела Kaskada, разработчика платформы, которая помогает организациям использовать данные для приложений ИИ. [21] DataStax сделала ранее запатентованную технологию Kaskada открытым исходным кодом и интегрировала ее в свой сервис Luna ML, который был запущен 4 мая 2023 года. [22] После приобретения бывший генеральный директор Kaskada Давор Боначи был назначен главным технологическим директором и исполнительным вице-президентом DataStax. [22]
24 мая 2023 года DataStax объявила о сотрудничестве с ThirdAI с целью внедрения крупных языковых моделей в DSE и AstraDB, чтобы помочь разработчикам разрабатывать приложения генеративного ИИ. [23]
В июне 2023 года компания объявила о разработке транслятора схем на основе GPT в своем облачном сервисе Astra Streaming. Astra Streaming GPT Schema Translator использует генеративный ИИ для автоматического создания сопоставлений схем , чтобы обеспечить интеграцию данных и взаимодействие между несколькими системами и источниками данных. [24]
18 июля 2023 года компания объявила о партнерстве с Google , чтобы сделать семантический поиск доступным в ее облачной базе данных Astra DB для разработчиков, создающих приложения генеративного ИИ. [20]
13 сентября 2023 года DataStax запустил проект с открытым исходным кодом LangStream, который работает с Astra DB и поддерживает векторные базы данных, включая Milvus и Pinecone. LangStream позволяет разработчикам лучше работать с потоковыми источниками данных, используя технологию Apache Kafka и генеративный ИИ для создания событийно-управляемых архитектур. [25]
В ноябре 2023 года DataStax анонсировала RAGStack, упрощенное коммерческое предложение для RAG ( генерация дополненных поиском данных ) на основе LangChain и векторного поиска Astra DB. [26]
Astra DB доступна в облачных сервисах, таких как Microsoft Azure , Amazon Web Services и Google Cloud Platform . [27] В феврале 2021 года DataStax анонсировала бессерверную версию Astra DB, предлагающую разработчикам оплату по мере использования данных. [28]
В марте 2022 года DataStax представила новые возможности сбора данных об изменениях (CDC) в своем облачном сервисе Astra DB. Astra DB CDC работает на базе Apache Pulsar, что позволяет разработчикам управлять операционными и потоковыми данными в одном месте. [29] DataStax лидирует в области Starlight с открытым исходным кодом, который обеспечивает уровень совместимости для различных протоколов поверх Apache Pulsar. [18]
8 февраля 2023 года DataStax запустил Astra Block, облачный сервис на основе блокчейна Ethereum для поддержки создания приложений Web3 , доступный как часть Astra DB. Разработчики могут использовать Astra Block для потоковой передачи расширенных данных из блокчейна Ethereum для создания или масштабирования опыта Web3 на Astra DB. [30]
Astra DB поддерживает технологию LangChain с открытым исходным кодом, что упрощает разработчикам создание приложений генеративного ИИ. [20]
Версия 1.0 DataStax Enterprise (DSE), выпущенная в октябре 2011 года, была первым коммерческим дистрибутивом базы данных Cassandra, разработанным для обеспечения производительности приложений в реальном времени и сложной аналитики на одной и той же физической инфраструктуре. [31] [32] Она разрослась и стала включать расширенные средства управления безопасностью, графовые модели баз данных, операционную аналитику и расширенные возможности поиска. [33]
В апреле 2016 года компания объявила о выпуске DataStax Enterprise Graph, добавив функциональность графовой модели данных в DSE. [34]
В марте 2017 года DataStax объявила о выпуске своей платформы DSE 5.1, которая включала улучшенные возможности поиска, улучшенный контроль безопасности, улучшения в управлении данными Graph и улучшения в производительности операционной аналитики. DataStax также объявила об изменении стратегии с дополнительным акцентом на приложениях для улучшения клиентского опыта. Вместо нового набора технологий компания начала предлагать пользователям своей основной платформы DSE советы по передовой практике. [35] [33]
В апреле 2018 года DataStax выпустила DSE 6, новую версию которой сфокусировали на предприятиях, использующих модель гибридных облачных вычислений, со всеми преимуществами распределенной облачной базы данных в любом публичном облаке или локально, вдвое большей скоростью реагирования и способностью обрабатывать вдвое большую пропускную способность. [36] [37]
В декабре 2018 года DataStax выпустила DSE 6.7, которая предлагает корпоративным клиентам пять ключевых новых обновлений функций, включая: улучшенную аналитику, геопространственный поиск, улучшенную защиту данных в облаке, улучшенные аналитические данные о производительности и новые инструменты интеграции разработчиков с Apache Kafka Connector и сертифицированными производственными образами Docker. [38]
В апреле 2020 года DataStax выпустила DSE 6.8, предлагающую предприятиям новые возможности для производительности на аппаратном уровне и поддержки большего количества рабочих нагрузок, а также выступающую в качестве оператора Kubernetes для Cassandra. [39]
DSE 7.0 был представлен в августе 2023 года. Он предлагает усовершенствования в облачных операциях и возможностях генеративного ИИ, а также включает векторный поиск. [40]
В сентябре 2014 года DataStax привлекла 106 миллионов долларов в раунде финансирования серии E, увеличив общий объем инвестиций в компанию до 190 миллионов долларов . [3] 15 июня 2022 года компания объявила, что привлекла дополнительно 115 миллионов долларов при оценке в 1,6 миллиарда долларов . [2] [41]
В 2020 году Mergermarket сообщил, что DataStax готовится к первичному публичному размещению акций, которое может состояться в 2021 году. [42] Однако в июне 2022 года генеральный директор DataStax Чет Капур заявил, что компания не будет спешить с IPO. [2]