Категория | Шрифт без засечек |
---|---|
Дизайнер(ы) | Американские шрифтолитейщики |
По заказу | Американский национальный институт стандартов |
Дата выпуска | 1968 [1] |
Вариации | OCR-A расширенный |
Образец |
OCR-A — шрифт, выпущенный в 1966 году [2] и впервые реализованный в 1968 году. [3] Специальный шрифт был необходим на заре компьютерного оптического распознавания символов , когда возникла необходимость в шрифте, который мог бы распознаваться не только компьютерами того времени, но и людьми. [4] OCR-A использует простые, толстые штрихи для формирования узнаваемых символов. [5] Шрифт является моноширинным (фиксированной ширины), и для размещения глифов требовался принтер.0,254 см (0,10 дюйма) друг от друга, и читатель должен принять любой интервал между ними0,2286 см (0,09 дюйма) и0,4572 см (0,18 дюйма).
Шрифт OCR-A был стандартизирован Американским национальным институтом стандартов (ANSI) как ANSI X3.17-1981. С тех пор X3.4 стал INCITS , а стандарт OCR-A теперь называется ISO 1073-1:1976 .
В 1968 году компания American Type Founders выпустила OCR-A, один из первых шрифтов с оптическим распознаванием символов, который соответствовал критериям, установленным Бюро стандартов США. Дизайн прост, поэтому его может легко прочитать машина, но для человеческого глаза он более сложен для чтения. [3]
Когда металлические шрифты уступили место компьютерному набору, Тор Лиллквист использовал Metafont для описания шрифта OCR-A. [ когда? ] Это определение впоследствии было улучшено Ричардом Б. Уэйлсом. Их работа доступна в CTAN . [6]
Чтобы сделать бесплатную версию шрифта более доступной для пользователей Microsoft Windows, Джон Саутер преобразовал определения Metafont в TrueType с помощью potrace и FontForge в 2004 году . [7] В 2007 году Гюркан Сенгюн создал пакет Debian из этой реализации. [8] В 2008 году Люк Девройе исправил вертикальное позиционирование в реализации Джона Саутера и исправил название строчной буквы z. [9]
Независимо Мэтью Скала [10] использовал mftrace [11] для преобразования определений Metafont в формат TrueType в 2006 году. В 2011 году он выпустил новую версию, созданную путем переписывания определений Metafont для работы с METATYPE1 , генерируя контуры напрямую без промежуточного этапа трассировки. 27 сентября 2012 года он обновил свою реализацию до версии 0.2. [12]
В дополнение к этим бесплатным реализациям OCR-A, существуют также реализации, продаваемые несколькими поставщиками. В качестве шутки Тобиас Фрер-Джонс в 1995 году создал Estupido-Espezial, переработанный дизайн с росчерками и длинной s . Он был использован в разделе Rolling Stone, посвященном «технологиям» . [13] [14]
Компания Maxitype разработала шрифт OCR-X, основанный на шрифте OCR-A с функциями OpenType, инопланетными/технологическими тематическими дингбатами, доступный в шести вариантах начертания (тонкий, светлый, обычный, средний, жирный, черный). [15]
Хотя технология оптического распознавания символов достигла такого уровня, что такие простые шрифты больше не нужны, [16] шрифт OCR-A остался в использовании. Его использование по-прежнему широко распространено при кодировании чеков по всему миру. Некоторые компании, занимающиеся сейфами, по-прежнему настаивают на том, чтобы номер счета и сумма задолженности на бланке возврата счета были напечатаны в OCR-A. [17] Кроме того, из-за его необычного вида его иногда используют в рекламе и в графических изображениях.
В частности, он используется для субтитров в фильмах и телесериалах, таких как «Черный список» , и для основных титров в «Притворщике» . Кроме того, OCR-A используется [ как? ] для фильмов «Багровый прилив» и «13 часов: Тайные солдаты Бенгази» . Он также использовался для логотипа, брендинга и маркетинговых материалов детской линии игрушек Hexbug .
Шрифт — это набор символов, или глифов . Чтобы компьютер мог использовать шрифт, каждому глифу должна быть назначена кодовая точка в наборе символов . Когда OCR-A стандартизировался, обычной кодировкой символов был Американский стандартный код для обмена информацией или ASCII. Не все глифы OCR-A вписывались в ASCII, и для пяти символов были альтернативные глифы, что могло указывать на необходимость во втором шрифте. Однако для удобства и эффективности все глифы должны были быть доступны в одном шрифте с использованием кодировки ASCII, при этом дополнительные символы должны были быть размещены в точках кодирования, которые в противном случае остались бы неиспользованными.
Современным потомком ASCII является Unicode , также известный как ISO 10646. Unicode содержит ASCII и имеет специальные положения для символов OCR, поэтому некоторые реализации OCR-A обращались к Unicode за руководством по назначению кодов символов.
Стандарт ISO ISO 2033 :1983 и соответствующий японский промышленный стандарт JIS X 9010:1984 (первоначально JIS C 6229–1984) определяют кодировки символов для OCR-A, OCR-B и E -13B . Для OCR-A они определяют модифицированный 7-битный набор ASCII (также известный по своему номеру ISO-IR ISO-IR-91), включающий только заглавные буквы, цифры, подмножество знаков препинания и символов, а также некоторые дополнительные символы. [18] Коды, которые переопределены относительно ASCII, а не просто опущены, перечислены ниже:
Характер | Изображение | Расположение | В ASCII-коде | Комментарии |
---|---|---|---|---|
£ | 0x23 | # | Соответствует BS 4730, британскому варианту ISO 646. [19 ] | |
{ | 0x28 | ( | Имя персонажа по-прежнему "LEFT PARENTHESIS", несмотря на то, что отображается фигурная скобка. Обычный код ASCII левой фигурной скобки 0x7B опущен. [18] | |
} | 0x29 | ) | Имя персонажа по-прежнему "ПРАВАЯ СКОБКА", несмотря на то, что отображается фигурная скобка. Обычный код правой скобки ASCII 0x7D опущен. [18] | |
⑀ | 0x3C | < | ||
⑁ | 0x3E | > | ||
¥ | 0x5С | \ | Соответствует JIS X 0201. Включен в JIS X 9010, но исключен из ISO 2033. [18] | |
⑂ | 0x5D | ] |
Кроме того, длинная вертикальная отметка () кодируется как 0x7C, что соответствует вертикальной черте ASCII (|). [18]
Следующие символы были определены в целях контроля и теперь находятся в диапазоне Unicode «Оптическое распознавание символов» 2440–245F :
Все реализации OCR-A используют U+0020 для пробела, U+0030–U+0039 для десятичных цифр, U+0041–U+005A для безударных заглавных букв и U+0061–U+007A для безударных строчных букв.
В дополнение к цифрам и неударенным буквам, многие символы OCR-A имеют очевидные кодовые точки в ASCII. Из тех, которые не имеют, большинство, включая все ударные буквы OCR-A, имеют очевидные кодовые точки в Unicode.
Линотип [21] закодировал оставшиеся символы OCR-A следующим образом:
Имя | Глиф | Юникод | Имя в Юникоде |
---|---|---|---|
Длинная вертикальная отметка | U+007C | Вертикальная линия |
Шрифты, которые происходят от работы Тора Лиллквиста и Ричарда Б. Уэйлса, определяют четыре символа, не входящих в OCR-A, для заполнения набора символов ASCII. Эти формы используют тот же стиль, что и формы символов OCR-A. Они следующие:
Имя | Глиф | Юникод |
---|---|---|
Низкая линия | U+005F | |
Серьёзный акцент | U+0060 | |
Вертикальная линия | U+007C | |
Тильда | U+007E |
Линотип также определяет дополнительные символы. [22]
Некоторые реализации не используют вышеуказанные назначения кодовых точек для некоторых символов.
Реализация OCR-A PrecisionID имеет следующие нестандартные кодовые точки: [23]
Реализация OCR-A в Barcodesoft имеет следующие нестандартные кодовые точки: [24] [25]
Реализация OCR-A в Morovia имеет следующие нестандартные кодовые точки: [26]
Реализация OCR-A в IDAutomation имеет следующие нестандартные кодовые точки: [27]
Набор символов OCR-A для оптического распознавания символов был впервые разработан в Соединенных Штатах в 1961 году только как числовой шрифт. В 1966 году был выпущен алфавитно-цифровой шрифт, содержащий 57 символов, включая существующий числовой шрифт, 4 абстрактных символа и только заглавные буквы. Пересмотренный стандарт был назван Американский национальный стандартный набор символов для оптического распознавания символов, ANSI X3.17-1966.
В 1968 году компания American Type Founders выпустила OCR-A, один из первых шрифтов с оптическим распознаванием символов, который соответствовал критериям, установленным Бюро стандартов США. Дизайн прост, поэтому его может читать машина, но его немного сложнее читать человеческому глазу. OCR-A соответствует стандарту 1981 года, установленному Американским национальным институтом стандартов (ANSI), X-3.17-1981 (размер I). Тот же дизайн указан и для немецкого стандарта DIN 66008. OCR-B был разработан в 1968 году Адрианом Фрутигером для Monotype. Этот дизайн расширяет возможности оптического считывателя, но его легче читать людям. Конструкция OCR-B соответствует стандарту ISO 1073/II-1976 (E) с исправлениями 1979 года (дизайн высокой печати, размер I). У OCR-A и OCR-B есть «альтернативные» версии, в которых вместо более ограниченного набора символов OCR используется стандартный набор символов ISO-Adobe.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка )