Разработчик(и) | Фонд программного обеспечения Apache |
---|---|
Первоначальный выпуск | 28 апреля 2013 г. ( 2013-04-28 ) |
Стабильный релиз | 4.4.1 / 20 августа 2024 г. ( 2024-08-20 ) |
Репозиторий | Репозиторий Импала |
Написано в | С++ , Java |
Операционная система | Кроссплатформенный |
Тип | Реляционная Hadoop -аналитика |
Лицензия | Лицензия Apache 2.0 |
Веб-сайт | impala.apache.org |
Apache Impala — это система SQL-запросов с открытым исходным кодом и массовой параллельной обработкой (MPP) для данных, хранящихся в компьютерном кластере под управлением Apache Hadoop . [1] Impala описывается как эквивалент Google F1 с открытым исходным кодом , который вдохновил ее на разработку в 2012 году. [2]
Apache Impala — это механизм запросов, работающий на Apache Hadoop. Проект был анонсирован в октябре 2012 года с публичным бета-тестированием [ 3] [4] и стал общедоступным в мае 2013 года. [5]
Impala привносит масштабируемую параллельную технологию баз данных в Hadoop, позволяя пользователям отправлять SQL- запросы с низкой задержкой к данным, хранящимся в HDFS и Apache HBase, без необходимости перемещения или преобразования данных. Impala интегрирована с Hadoop для использования тех же форматов файлов и данных, метаданных, безопасности и фреймворков управления ресурсами, которые используются MapReduce , Apache Hive , Apache Pig и другим программным обеспечением Hadoop.
Impala рекламируется для аналитиков и специалистов по данным для выполнения аналитики данных, хранящихся в Hadoop, с помощью SQL или инструментов бизнес-аналитики . Результатом является то, что крупномасштабная обработка данных (через MapReduce) и интерактивные запросы могут выполняться в одной и той же системе с использованием тех же данных и метаданных, что устраняет необходимость переноса наборов данных в специализированные системы и/или фирменные форматы просто для выполнения анализа.
В число особенностей входят:
В начале 2013 года был анонсирован столбцово-ориентированный формат файла Parquet для архитектур, включая Impala. [6] В декабре 2013 года Amazon Web Services объявили о поддержке Impala. [7] В начале 2014 года MapR добавила поддержку Impala. [8] В 2015 году был анонсирован еще один формат Kudu , который Cloudera предложила пожертвовать Apache Software Foundation вместе с Impala. [9] 28 ноября 2017 года Impala перешла в Apache Top-Level Project (TLP). [10]