Разработчик(и) | Йорг Шуленбург |
---|---|
Первоначальный выпуск | Декабрь 2000 г (2000-12) |
Стабильный релиз | 0.52 / 15 октября 2018 г. (2018-10-15) |
Написано в | С |
Операционная система | Linux , Windows , ОС/2 |
Тип | Оптическое распознавание символов |
Лицензия | Стандартная общественная лицензия GNU |
Веб-сайт | www-e.uni-magdeburg.de/jschulen/ocr/jocr.sourceforge.net |
GOCR (или JOCR ) — это бесплатная программа оптического распознавания символов , изначально написанная Йоргом Шуленбургом. Она может использоваться для преобразования или сканирования файлов изображений ( portable pixmap или PCX ) в текстовые файлы . [1]
GOCR утверждает, что может обрабатывать одноколоночные шрифты без засечек высотой 20–60 пикселей. Он сообщает о проблемах со шрифтами с засечками, перекрывающимися символами, рукописным текстом, неоднородными шрифтами, шумными изображениями, большими углами перекоса и текстом в чем-либо, кроме латинского алфавита . [2]
GOCR также может переводить штрихкоды . [2]
GOCR может использоваться как автономное приложение командной строки или как бэкэнд для других программ. Он поставляется с графическим интерфейсом gocr.tcl . GOCR также может использоваться как OCR-движок в OCRFeeder . [3]
Версия 0.3.0 была выпущена в декабре 2000 года, 0.3.5 — в феврале 2002 года, а 0.37 — в августе 2002 года.
В период с версии 0.40 (март 2005 г.) по версию 0.43 (декабрь 2006 г.) механизм распознавания постепенно заменялся векторной версией.
Версия 0.48 была выпущена в августе 2009 года. [1]
Версия 0.49 была выпущена в сентябре 2010 года. [1]
Версия 0.50 была выпущена в марте 2013 года. [1]
Версия 0.51 была выпущена в августе 2017 года. [4]
Первоначально приложение называлось GOCR, что означает GNU Optical Character Recognition. Когда пришло время регистрировать проект на SourceForge, название GOCR уже было занято, поэтому проект был зарегистрирован как JOCR (Jörg's Optical Character Recognition). [1] [2]
В результате этой ситуации проект и приложение известны как GOCR и JOCR. Шуленбург признает, что это проблематично. [1]
Допустимые форматы изображений: [2]
Другие форматы автоматически конвертируются с помощью netpbm-progs, gzip и bzip2 через использование unix pipe. Эти типы изображений включают: [2]
{{cite web}}
: CS1 maint: year (link)