Гибридная транзакционно-аналитическая обработка

Архитектура приложения от Gartner Inc.

Гибридная транзакционно-аналитическая обработка ( HTAP ) — это термин, созданный Gartner Inc. , исследовательской и консалтинговой компанией в области информационных технологий, в ее исследовательском отчете за начало 2014 года « Гибридная транзакционно-аналитическая обработка будет способствовать возможностям для кардинальных бизнес-инноваций» . [1] Согласно определению Gartner:

Гибридная транзакционно-аналитическая обработка (HTAP) — это новая архитектура приложений, которая «ломает стену» между транзакционной обработкой и аналитикой. Она позволяет принимать более обоснованные решения «в режиме реального времени». [2] [1]

В более поздних отчетах Gartner начала называть HTAP «дополненными транзакциями». [3] Другая аналитическая фирма Forrester Research называет ту же концепцию «транслитической» [4], а 451 Group называет ее «гибридной операционной и аналитической обработкой» или HOAP. [5]

Фон

В 1960-х годах использование компьютеров в бизнес-секторе началось с операций по расчету заработной платы, а позднее включило задачи в таких областях, как бухгалтерский учет и выставление счетов. В то время пользователи вводили данные, а система обрабатывала их позднее . Дальнейшее развитие мгновенной обработки данных или онлайн-обработки транзакций (OLTP) привело к широкому использованию OLTP в государственных и деловых информационных системах. [6]

Онлайновая аналитическая обработка (OLAP) охватывает аналитическую обработку, задействованную в создании, синтезе и управлении данными. С ростом потребностей в данных среди предприятий [ нужна цитата ] OLAP также развивалась. Чтобы удовлетворить потребности приложений, обе технологии зависят от своих собственных систем и различных архитектур. [7] [6] В результате сложности информационной архитектуры и инфраструктуры как OLTP, так и OLAP-систем анализ данных задерживается. [7] [ нужна цитата для проверки ]

Преимущества и проблемы HTAP

Существуют различные интерпретации HTAP, отличные от первоначального определения Gartner; «развивающаяся архитектура». Эти интерпретации предполагают различные преимущества, одним из которых является функциональность базы данных. Последние достижения в области исследований, оборудования, возможностей OLTP и OLAP, технологий баз данных в памяти и в облаке, [8] масштабируемое управление транзакциями и продукты позволяют транзакционной обработке и аналитике, или HTAP, работать с одной и той же базой данных. [7] [9] [6]

Однако последние отчеты Gartner предполагают более широкие преимущества, чем может предложить единая унифицированная база данных. Традиционные архитектуры приложений разделяют транзакционные и аналитические системы. Цифровой бизнес и необходимость реагировать на бизнес-моменты означают, что использование анализа «по факту» больше не является адекватным. Бизнес-моменты — это временные возможности, которые необходимо использовать в режиме реального времени. Если организация неспособна распознать и/или быстро отреагировать на бизнес-момент, приняв быстрые и обоснованные решения, то это сделает какая-то другая организация, что приведет к упущенной возможности (или новой бизнес-угрозе). HTAP позволяет выполнять расширенную аналитику в режиме реального времени на данных транзакций «на лету», предоставляя архитектуру, которая позволяет пользователям более эффективно реагировать на бизнес-моменты. [10]

Основные технические проблемы для базы данных HTAP заключаются в том, как быть эффективным как для операционных (множество мелких транзакций с высокой долей обновлений), так и для аналитических рабочих нагрузок (большие и сложные запросы, проходящие через большое количество строк) в одной и той же системе базы данных, и как предотвратить помехи аналитических запросов в операционной рабочей нагрузке. Этот тип операционной рабочей нагрузки также обычно называют операционной аналитической обработкой .

HTAP решает проблему аналитической задержки несколькими способами, включая устранение необходимости в нескольких копиях одних и тех же данных и требования выгрузки данных из операционных баз данных в хранилища данных с помощью процессов ETL . [7] [9]

Большинство приложений HTAP поддерживаются технологиями in-memory, которые могут обрабатывать большой объем транзакций и предлагают такие функции, как прогнозирование и моделирование. Новые технологии HTAP используют масштабируемую обработку транзакций и не нуждаются в хранении всей базы данных в памяти. HTAP имеет потенциал изменить способ ведения бизнеса организациями, предлагая возможности немедленного принятия бизнес-решений на основе живой и сложной аналитики больших объемов данных. Руководители правительства и бизнеса могут быть проинформированы о проблемах, результатах и ​​тенденциях в режиме реального времени, которые требуют действий, например, в областях общественной безопасности, управления рисками и обнаружения мошенничества. [7] [11]

Некоторые проблемы HTAP включают ограниченный отраслевой опыт и навыки, а также неопределенность передового опыта. [7]

В 2020 году команда PingCAP опубликовала первую в отрасли статью , описывающую практическую реализацию распределенной базы данных гибридной транзакционной/аналитической обработки (HTAP): TiDB : база данных HTAP на основе Raft. [12]

Ссылки

  1. ^ ab «Гибридная транзакционная/аналитическая обработка будет способствовать возможностям для кардинальных бизнес-инноваций». Gartner . 28 января 2014 г. Получено 4 октября 2021 г.
  2. ^ "Руководство по рынку технологий вычислений в оперативной памяти, поддерживающих HTAP". www.gartner.com . Архивировано из оригинала 17 мая 2017 г. . Получено 15 апреля 2017 г. .
  3. ^ «Цикл ажиотажа в области управления данными, 2019». Gartner .
  4. ^ "Форрестер". Форрестер .
  5. ^ https://mariadb.com/wp-content/uploads/2020/09/enterprises-turn-to-hoap-for-oltp-workloads_analyst-report_1088.pdf [ пустой URL-адрес в формате PDF ]
  6. ^ abc Бог, Аня. Бенчмаркинг транзакционных и аналитических систем обработки: создание смешанного эталона рабочей нагрузки и его применение Springer-Verlage Berlin Heidelberg. 2014
  7. ^ abcdef Пеццини, Массимо; Файнберг, Дональд; Рейнер, Найджел; Эджалли, Роксана. «Гибридная транзакционная/аналитическая обработка будет способствовать возможностям для кардинальных бизнес-инноваций». Gartner. 28 января 2014 г.
  8. ^ «Azure Analytics: ясность в одно мгновение». azure.microsoft.com . 19 мая 2020 г. . Получено 20 июня 2020 г. .
  9. ^ ab Wolpe, Toby. "SQL и NoSQL? Хорошо, но как вписывается гибридная база данных?" ZDNet. 12 мая 2014 г.
  10. ^ «Как обеспечить цифровые бизнес-инновации с помощью гибридной транзакционной/аналитической обработки». www.gartner.com . Получено 15 апреля 2017 г.
  11. ^ Баер, Тони. «Быстрые данные выходят на скоростную полосу больших данных». ZDNet. 16 апреля 2012 г.
  12. ^ "TiDB: База данных HTAP на основе Raft" (PDF) . Труды Фонда VLDB . 13 (12): 3072. doi :10.14778/3415478.3415535. ISSN  2150-8097. S2CID  221666363.
Взято с "https://en.wikipedia.org/w/index.php?title=Гибридная_транзакционная/аналитическая_обработка&oldid=1262703664"