28°08′32″с.ш. 80°34′56″з.д. / 28,1422°с.ш. 80,5822°з.д. / 28,1422; -80,5822
Тип компании | Частный |
---|---|
Промышленность | Обработка данных , Сортировка , Интеграция данных , Тестовые данные , Маскирование данных , Преобразование данных |
Штаб-квартира | , США |
Продукция | CoSort, быстрое извлечение (FACT), NextForm, RowGen, FieldShield, CellShield, DarkShield, Voracity |
Веб-сайт | www.iri.com |
Innovative Routines International (IRI), Inc. — американская компания-разработчик программного обеспечения, впервые получившая известность благодаря внедрению функциональности сортировки-слияния для мэйнфреймов в открытые системы . [1] IRI была первым поставщиком, разработавшим коммерческую замену для команды сортировки Unix и объединившим преобразование данных и отчетность в средах пакетной обработки Unix . [2] В 2007 году сопрограмма сортировки IRI («CoSort») стала первым продуктом для сопоставления и преобразования многогигабайтных файлов XML и LDIF , [3] объединения и поиска по нескольким файлам, [4] [5] и применения функций конфиденциальности данных на основе ролей (включая шифрование AES-256 ) для полей в конфиденциальных файлах. [6]
IRI имеет штаб-квартиру в Мельбурне, Флорида, США, и имеет офисы по перепродаже и поддержке в 25 странах, [7] включая Францию, Японию, Южную Африку и Бразилию. [8] Основными партнерами по вычислительным платформам являются HP , [9] IBM , [10] Fujitsu , [11] Intel , [12] Novell , [13] Red Hat , Sun Microsystems и Microsoft . [14] Пользователями CoSort являются: AIM Healthcare, [15] EDS, [16] HSBC Insurance, [17] и Thomson Reuters. [18] Компания была названа «Самым перспективным поставщиком решений для больших данных» по версии CIOReview в 2015 году, поскольку она запустила «Voracity» для поддержки обработки Hadoop, источников данных NoSQL и т. д. [19]
Программное обеспечение IRI предназначено для быстрого преобразования, конвертации, создания отчетов и защиты больших объемов данных в распределенных, гетерогенных вычислительных средах. [20] Эти функции встроены в пакет CoSort или через спин-оффы для извлечения, генерации, безопасности и миграции данных. Каждый инструмент использует одну и ту же графическую IDE, построенную на Eclipse, и формат метаданных для определения и манипулирования данными. [21] Открытый формат файла определения данных IRI также поддерживается AnalytiX DS и Meta Integration Technology (MITI), так что пользователи сторонних ETL, BI и инструментов моделирования данных могут конвертировать или повторно использовать свои существующие метаданные в средах продуктов IRI. [22]
CoSort был выпущен для CP/M в 1978 году, DOS в 1980 году, Unix в середине восьмидесятых и Windows в начале девяностых, [23] и получил награду читателей от журнала DMReview в 2000 году, [24] CoSort изначально был разработан как утилита сортировки файлов и добавлял интерфейсы для замены или преобразования параметров программы сортировки, используемых в IBM Infosphere DataStage , Informatica , Micro Focus COBOL, JCL , NATURAL , SAS и SyncSort Unix. [25]
В 1992 году CoSort добавила соответствующие функции обработки данных через интерфейс языка управления , основанный на синтаксисе утилиты сортировки DEC VAX/VMS [26], который с годами развивался для управления функциями интеграции и подготовки файловых данных в операциях ETL хранилища данных : [27]
Для приложений хранилищ данных и витрин данных CoSort выполняет извлечение исходных данных, очистку данных, сортировку, переформатирование, преобразование типов данных, агрегацию и индексацию — все за один проход. Большинство операционных данных в коммерческих и государственных предприятиях находятся внутри в последовательных плоских файлах, (реляционных) таблицах баз данных или импортируются с лент данных и передач, созданных извне. Эти исторические базы данных оптимизированы для специальных запросов и транзакций, а не для извлечения. CoSort принимает несколько входных файлов (крупномасштабные таблицы или дампы данных плоских файлов) или записи, передаваемые по каналам, для выполнения условного выбора записей для последующих процессов.
— Деннис Хилл, журнал Database Trends, июль 1999 г. [28]
Выпуски CoSort версии 9, начатые в 2007 году, могут одновременно преобразовывать, конвертировать, сообщать и/или защищать данные для ETL , бизнес-аналитики , сбора данных об изменениях , загрузки и запроса базы данных, [29] разработки приложений и миграции данных . Версия 10 была выпущена в 2018 году, добавив поддержку полуструктурированных, потоковых и облачных источников данных.
IRI Voracity — это платформа управления данными, выпущенная в 2016 году для обнаружения, интеграции, миграции, управления и аналитики данных. Она объединяет ключевые действия по курированию данных в графическом интерфейсе IRI Workbench (построенном на Eclipse (программное обеспечение) ™) и преобразует данные в движке CoSort или, опционально, в MapReduce , Spark, Spark Stream, Storm или Tez. Voracity включает в себя большинство автономных инструментов IRI и добавляет профилирование данных, ETL, управление метаданными, управление основными данными, федерацию данных и возможности проектирования и контроля множества заданий. [30]
IRI CoSort, IRI FACT, IRI NextForm и IRI RowGen — продукты из пакета IRI Data Manager . IRI FieldShield, IRI CellShield и IRI DarkShield — продукты из пакета IRI Data Protector .
FACT (FAst ExtraCT) — это высокопроизводительная утилита выгрузки для Oracle , IBM Db2 , Sybase ASE и IQ , SQL Server , MySQL , Altibase и Tibero. Она экспортирует большие таблицы параллельно в плоские файлы для архива, ETL, реорганизации, отчетности и других приложений. [31] FACT и CoSort, используемые вместе, «обеспечивают быструю выгрузку и преобразование данных в базах данных Oracle для поддержки процессов ETL». [32]
NextForm — это ответвление миграции данных от функциональности CoSort, разработанное для преобразования между структурированными форматами файлов , такими как CSV , ISAM , LDIF и XML , [33] а также типами данных , такими как ASCII , EBCDIC , Unicode и Packed Decimal . [34] Более новые версии NextForm могут структурировать данные в неструктурированных источниках, преобразовывать файлы COBOL Vision и облегчать миграцию и репликацию баз данных. [35]
RowGen предназначен для генерации тестовых данных в форматах производственных таблиц, файлов и отчетов для прототипов баз данных, соответствия, аутсорсинга и проектов прототипирования приложений. [36] [37] Графический интерфейс пользователя RowGen анализирует модели данных для определения макетов таблиц и связей, чтобы тестовые наборы баз данных были структурно и ссылочно правильными. [38] RowGen также может преобразовывать и форматировать тестовые данные во время их генерации. [39]
FieldShield — это ответвление CoSort, разработанное для защиты конфиденциальности данных в структурированных и полуструктурированных источниках данных. [40] Программное обеспечение защищает персонально идентифицируемую информацию и другие конфиденциальные данные на уровне поля или записи в таблицах базы данных, файлах и других источниках, подверженных утечке данных . [41] Функции обеспечения конфиденциальности включают шифрование AES , маскирование данных и псевдонимизацию . Подробности работы можно проверить из файла журнала в формате XML . [42]
CellShield — это продукт для обнаружения и маскирования данных, разработанный для защиты данных на уровне ячеек в электронных таблицах Microsoft Excel. CellShield поставляется в версиях Personal и Enterprise, причем последняя способна находить и устранять PII в нескольких файлах и листах на дисках и в папках, доступных в локальной сети.
DarkShield — это продукт для обнаружения и маскирования данных, разработанный для защиты данных, скрытых в так называемых темных данных или неструктурированных файловых хранилищах. DarkShield использует те же функции поиска, классификации и маскирования данных, что и FieldShield и CellShield Enterprise Edition в IRI Workbench.
Workbench — это графический пользовательский интерфейс (GUI) и интегрированная среда разработки (IDE) для всех программных продуктов IRI, созданная на Eclipse™. Workbench — это бесплатное, опциональное место для проектирования, запуска и управления соединениями данных, [43] метаданными и заданиями, а также для использования сторонних плагинов для бизнес-аналитики, моделирования данных, контроля версий и т. д.