Это сравнение программного обеспечения для оптического распознавания символов включает в себя:
Имя | Год основания | Последняя стабильная версия | Последний год выпуска | Лицензия | Онлайн | Окна | Mac OS X | линукс | БСД | андроид | iOS | Язык программирования | SDK ? | Языки | Шрифты | Форматы вывода | Примечания |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ABBYY FineReader | 1989 | 16 | 2022 | Запатентованный | Да | Да | Да | Нет | Да | Да | Да | С/С++ | Да | 192 [1] | Все шрифты | DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2 [2] | ABBYY также поставляет SDK для встраиваемых и мобильных устройств. Professional, Corporate и Site License Editions для Windows, Express Edition для Mac. [3] |
Программное обеспечение AnyDoc | 1989 | ? | ? | Запатентованный | Нет | Да | Нет | Нет | Нет | ? | ? | VBScript | ? | ? | ? | Работает со структурированными, полуструктурированными и неструктурированными документами. | |
Asprise OCR SDK | 1998 | 15 | 2015 | Запатентованный | Да | Да | Да | Да | Да | ? | ? | Java, C#,VB.NET, C/C++/Delphi | Да | 20+ [4] | ? | Обычный текст, PDF с возможностью поиска, XML [5] | Java, C#, VB.NET, C/C++/Delphi SDK для OCR и распознавания штрихкодов в Windows, Linux, Mac OS X и Unix. [6] |
CuneiForm | 1996 | 1.1 | 2011 | BSD -вариант | Нет | Да | Да | Да | Да | ? | ? | С/С++ | Да | 28 | Любой печатный шрифт | HTML, hOCR, нативный, RTF, TeX , TXT [7] | Система корпоративного класса, может сохранять форматирование текста и распознавать сложные таблицы любой структуры |
Э-акшараян | 2010 | Да | Нет | Да | Нет | ? | ? | 14 | RTF, TXT, BRL | ||||||||
ГОКР | 2000 | 0,52 [8] | 2018 | GPL | Да [9] | Да | Да | Да | Да | ? | ? | С | ? | 20+ | ? | ||
Google Drive OCR или Google Cloud Vision | 2015 | Запатентованный | Да | Браузер | Браузер | Браузер | Неизвестный | ? | ? | Неизвестный | Да | 200+ | Все шрифты | текст | Запись в блоге Google [10] [11] | ||
Обработка изображений документов Microsoft Office | ? | Офис 2007 | 2007 | Запатентованный | Нет | Да | Нет | Нет | Нет | ? | ? | ? | ? | ? | ? | Использует OmniPage [ требуется ссылка ] | |
Microsoft Office OneNote 2007 | 2011 | ? | 2007 | Запатентованный | Нет | Да | Нет | Нет | Нет | ? | ? | ? | ? | ? | ? | ||
OCRFeeder | 2009-03 | 0.8.5 | 2022 | GPL | Нет | Нет | Нет | Да | Нет | ? | ? | Питон | ? | ? | ? | Имеет полный пользовательский интерфейс и имеет командную строку для автоматических операций. Имеет свой собственный алгоритм сегментации, но использует общесистемные OCR-движки, такие как Tesseract или Ocrad | |
Окрад | ? | 0,29 [12] | 2024 | GPL | Да | Нет | Да | Да | Да | ? | ? | С++ | Да | латинский алфавит | ? | Командная строка | |
OCRopus | 2007 | 1.3.3 | 2017 | Апачи | Нет | Нет | Да | Да | Да | ? | ? | Питон | ? | Все языки, использующие латиницу (другие языки можно изучать) | Обычная латиница и фрактура (другие письменности можно обучить) | TXT, hOCR, [13] PDF [14] | Подключаемая структура в активной разработке, используется для Google Books |
OmniPage | 1970-е | 19.2 | 2015 | Запатентованный | Да | Да | Да | Да | Нет | ? | ? | С/С++, С# [15] | Да | 125 [16] | Шрифты машинной и ручной печати | DOC/DOCX XLS/XLSX PPTX RTF PDF PDF/A PDF с возможностью поиска HTML Текст XML ePUB MP3 | Продукт Nuance Communications |
Пума.НЕТ | ? | ? | 2009 | БСД | Нет | Да | Нет | Нет | Нет | ? | ? | С# | Да | 28 | Любой печатный шрифт | .NET OCR SDK на основе движка распознавания CuneiForm от Cognitive Technologies. Обертывает сервер Puma COM и предоставляет упрощенный API для приложений .NET | |
ReadSoft | ? | ? | ? | Запатентованный | Нет | Да | Нет | Нет | Нет | ? | ? | ? | ? | ? | ? | Сканируйте, считывайте и классифицируйте деловые документы, такие как счета-фактуры, формы и заказы на закупку, интегрированные с бизнес-процессами. | |
Скантрон | ? | ? | ? | Запатентованный | Нет | Да | Нет | Нет | Нет | ? | ? | ? | ? | ? | ? | Для работы с локализованными интерфейсами необходима соответствующая языковая поддержка. | |
SmartScore | 1991 | 10.5.8 | 2015 | Запатентованный | Нет | Да | Да | Нет | Нет | ? | ? | ? | ? | ? | ? | Для музыкальных партитур | |
Тессеракт | 1985 | 5.4.1 | 2024 | Апачи | Нет | Да | Да | Да | Да | ? | ? | С++, С | Да | 100+ [17] | Любой печатный шрифт | Текст, ALTO , hOCR , [18] PDF, другие с различными пользовательскими интерфейсами [19] или API | Создано Hewlett-Packard ; находится в стадии дальнейшей разработки Google [20] |
Имя | Год основания | Последняя стабильная версия | Год выпуска | Лицензия | Онлайн | Окна | Mac OS X | линукс | БСД | андроид | iOS | Язык программирования | SDK? | Языки | Шрифты | Форматы вывода | Примечания |
Анализ точности и надежности пакетов OCR Google Docs OCR, Tesseract, ABBYY FineReader и Transym, проведенный в 2016 году и использовавший набор данных, включающий 1227 изображений из 15 различных категорий, пришел к выводу, что Google Docs OCR и ABBYY работают лучше других. [21]