Тон или стиль этой статьи может не отражать энциклопедический тон , используемый в Википедии . ( Декабрь 2024 ) |
Гибридная транзакционно-аналитическая обработка ( HTAP ) — это термин, созданный Gartner Inc. , исследовательской и консалтинговой компанией в области информационных технологий, в ее исследовательском отчете за начало 2014 года « Гибридная транзакционно-аналитическая обработка будет способствовать возможностям для кардинальных бизнес-инноваций» . [1] Согласно определению Gartner:
Гибридная транзакционно-аналитическая обработка (HTAP) — это новая архитектура приложений, которая «ломает стену» между транзакционной обработкой и аналитикой. Она позволяет принимать более обоснованные решения «в режиме реального времени». [2] [1]
В более поздних отчетах Gartner начала называть HTAP «дополненными транзакциями». [3] Другая аналитическая фирма Forrester Research называет ту же концепцию «транслитической» [4], а 451 Group называет ее «гибридной операционной и аналитической обработкой» или HOAP. [5]
В 1960-х годах использование компьютеров в бизнес-секторе началось с операций по расчету заработной платы, а позднее включило задачи в таких областях, как бухгалтерский учет и выставление счетов. В то время пользователи вводили данные, а система обрабатывала их позднее . Дальнейшее развитие мгновенной обработки данных или онлайн-обработки транзакций (OLTP) привело к широкому использованию OLTP в государственных и деловых информационных системах. [6]
Онлайновая аналитическая обработка (OLAP) охватывает аналитическую обработку, задействованную в создании, синтезе и управлении данными. С ростом потребностей в данных среди предприятий [ нужна цитата ] OLAP также развивалась. Чтобы удовлетворить потребности приложений, обе технологии зависят от своих собственных систем и различных архитектур. [7] [6] В результате сложности информационной архитектуры и инфраструктуры как OLTP, так и OLAP-систем анализ данных задерживается. [7] [ нужна цитата для проверки ]
Существуют различные интерпретации HTAP, отличные от первоначального определения Gartner; «развивающаяся архитектура». Эти интерпретации предполагают различные преимущества, одним из которых является функциональность базы данных. Последние достижения в области исследований, оборудования, возможностей OLTP и OLAP, технологий баз данных в памяти и в облаке, [8] масштабируемое управление транзакциями и продукты позволяют транзакционной обработке и аналитике, или HTAP, работать с одной и той же базой данных. [7] [9] [6]
Однако последние отчеты Gartner предполагают более широкие преимущества, чем может предложить единая унифицированная база данных. Традиционные архитектуры приложений разделяют транзакционные и аналитические системы. Цифровой бизнес и необходимость реагировать на бизнес-моменты означают, что использование анализа «по факту» больше не является адекватным. Бизнес-моменты — это временные возможности, которые необходимо использовать в режиме реального времени. Если организация неспособна распознать и/или быстро отреагировать на бизнес-момент, приняв быстрые и обоснованные решения, то это сделает какая-то другая организация, что приведет к упущенной возможности (или новой бизнес-угрозе). HTAP позволяет выполнять расширенную аналитику в режиме реального времени на данных транзакций «на лету», предоставляя архитектуру, которая позволяет пользователям более эффективно реагировать на бизнес-моменты. [10]
Основные технические проблемы для базы данных HTAP заключаются в том, как быть эффективным как для операционных (множество мелких транзакций с высокой долей обновлений), так и для аналитических рабочих нагрузок (большие и сложные запросы, проходящие через большое количество строк) в одной и той же системе базы данных, и как предотвратить помехи аналитических запросов в операционной рабочей нагрузке. Этот тип операционной рабочей нагрузки также обычно называют операционной аналитической обработкой .
HTAP решает проблему аналитической задержки несколькими способами, включая устранение необходимости в нескольких копиях одних и тех же данных и требования выгрузки данных из операционных баз данных в хранилища данных с помощью процессов ETL . [7] [9]
Большинство приложений HTAP поддерживаются технологиями in-memory, которые могут обрабатывать большой объем транзакций и предлагают такие функции, как прогнозирование и моделирование. Новые технологии HTAP используют масштабируемую обработку транзакций и не нуждаются в хранении всей базы данных в памяти. HTAP имеет потенциал изменить способ ведения бизнеса организациями, предлагая возможности немедленного принятия бизнес-решений на основе живой и сложной аналитики больших объемов данных. Руководители правительства и бизнеса могут быть проинформированы о проблемах, результатах и тенденциях в режиме реального времени, которые требуют действий, например, в областях общественной безопасности, управления рисками и обнаружения мошенничества. [7] [11]
Некоторые проблемы HTAP включают ограниченный отраслевой опыт и навыки, а также неопределенность передового опыта. [7]
В 2020 году команда PingCAP опубликовала первую в отрасли статью , описывающую практическую реализацию распределенной базы данных гибридной транзакционной/аналитической обработки (HTAP): TiDB : база данных HTAP на основе Raft. [12]