Арабская письменность в Unicode

Многие письменности в Unicode , такие как арабская , имеют специальные орфографические правила , которые требуют, чтобы определенные комбинации буквенных форм были объединены в специальные лигатурные формы . В английском языке общий амперсанд (&) развился из лигатуры, в которой были объединены рукописные латинские буквы e и t (написание et , латинское для и ). [1] Правила, регулирующие образование лигатуры в арабском языке, могут быть довольно сложными, требуя специальных технологий формирования письменности, таких как арабская каллиграфическая машина DecoType Томаса Мило. [2]

Начиная с Unicode 16.0, арабская письменность содержится в следующих блоках : [3]

Базовый диапазон арабских символов кодирует стандартные буквы и диакритические знаки, но не кодирует контекстные формы (U+0621–U+0652 напрямую основаны на ISO 8859-6 ); а также включает в себя наиболее распространенные диакритические знаки и арабо-индийские цифры . Диапазон арабских дополнительных символов кодирует варианты букв, в основном используемые для записи африканских (неарабских) языков. Диапазоны арабских расширенных-B и арабских расширенных-A кодируют дополнительные коранические аннотации и варианты букв, используемые для различных неарабских языков. Диапазон арабских презентационных форм-A кодирует контекстные формы и лигатуры вариантов букв, необходимых для персидского, урду, синдхи и центральноазиатских языков. Диапазон арабских презентационных форм-B кодирует формы пробелов арабских диакритических знаков и более контекстные формы букв. Формы представления присутствуют только для совместимости со старыми стандартами и в настоящее время не требуются для кодирования текста. [4] Блок арабских математических алфавитных символов кодирует символы, используемые в арабских математических выражениях. Блок индийских чисел сияк содержит специализированное подмножество арабского письма, которое использовалось для бухгалтерского учета в Индии во времена Империи Великих Моголов с 17-го века до середины 20-го века. [5] [6] Блок османских чисел сияк содержит специализированное подмножество арабского письма, также известное как числа сиякат , которое использовалось для бухгалтерского учета в османских турецких документах. [6]

Контекстные формы

Ниже приведена демонстрация базового алфавита, используемого в современном стандартном арабском языке, иллюстрирующая, как арабские буквы должны отображаться в разных контекстах. Кодовые точки, перечисленные как контекстные формы, должны « не использоваться в общем обмене» [4] . В Unicode есть другие методы кодирования разницы, если это необходимо, например, Zero-width joiner .

Общий
Юникод
Контекстные формыИмя
ИзолированныйФинал (Конец)Медиальный (средний)Начальный (Начало)
0627
А
ФЕ8Д
ФЕ8Е
ʾалиф
0628
Б
ФЕ8Ф
ФЕ90
ФЕ92
ФЕ91
ба
062А
К
ФЕ95
ФЕ96
ФЕ98
ФЕ97
таʾ
062Б
Л
ФЕ99
FE9A
FE9C
FE9B
та'
062C
Дж
ФЕ9Д
FE9E
FEA0
FE9F
ǧīm
062D
ح
FEA1
КЭА2
FEA4
FEA3
ха
062E
خ
FEA5
FEA6
FEA8
FEA7
хаʾ
062F
д
FEA9
FEAA
дал
0630
Р
ФЕАБ
FEAC
дал
0631
Р
ФЕД
FEAE
ра
0632
з
ФЕАФ
ФЕВ0
зайн/зай
0633
С
ФЕВ1
ФЕВ2
ФЕВ4
ФЕВ3
грех
0634
Ш
ФЕВ5
6 ФЕВ
8 ФЕВ
7 ФЕВ
шин
0635
х
9 ФЕВ
ФЕБА
ФЕБК
ФЕББ
сад
0636
з
ФЕБД
ФЕБЕ
FEC0
ФЕБФ
ﺿ
папа
0637
г.
FEC1
FEC2
FEC4
FEC3
таʾ
0638
С
FEC5
FEC6
FEC8
FEC7
за
0639
А
FEC9
ФЕКА
FECC
FECB
айн
063А
Г
ФЕКД
ФЕЦЕ
ФЕД0
FECF
гайн
0641
ф
ФЕД1
ФЭД2
ФЭД4
ФЭД3
фа
0642
к
ФЕД5
ФЕД6
FED8
ФЕД7
каф
0643
к
FED9
ФЕДА
FEDC
ФЭБР
каф
0644
л
ФЕДД
ФЕДЕ
ПЛАТА0
ФЕДР
лам
0645
м
ПЛАТА1
ПЛАТА2
ПЛАТА4
ПЛАТА3
мим
0646
н
ПЛАТА5
ПЛАТА6
ПЛАТА8
ПЛАТА7
нун
0647
х
ПЛАТА9
ФЭЭД
FEEC
ФЕЕБ
ха
0648
и
КОРМ
ПЛАТА
вав
064А
й
ФЭФ1
ФЭФ2
FEF4
ФЭФ3
йаʾ
0622
А
FE81
ФЕ82
алиф маддах
0629
ة
ФЕ93
ФЕ94
Та' марбута
0649
ى
FEEF
ФЕФ0
алиф максура

Пунктуация и украшения

В обычном арабском шрифте используются только арабский вопросительный знак ⟨ ؟ ⟩ и арабская запятая ⟨ ، ⟩, а запятая часто заменяется латинской запятой ⟨ , ⟩, которая также используется в качестве десятичного разделителя при использовании восточно-арабских цифр (например, ⟨100,6⟩ по сравнению с ⟨ ١٠٠,٦ ⟩).

  • U+060C ، ‎ АРАБСКАЯ ЗАПЯТАЯ
  • U+060D ؍ ‎ АРАБСКИЙ РАЗДЕЛИТЕЛЬ ДАТЫ
  • U+060E ؎ ‎ АРАБСКИЙ ПОЭТИЧЕСКИЙ СТИХ ЗНАК
  • U+060F ؏ ‎ АРАБСКИЙ ЗНАК МИСРА
  • U+061B ؛ ‎ АРАБСКАЯ ТОЧКА С ЗАПЯТОЙ
  • U+061E ؞ ‎ АРАБСКИЙ ЗНАК ПРЕПИНАНИЯ С ТРОЙНОЙ ТОЧКОЙ
  • U+061F ؟ ‎ АРАБСКИЙ ВОПРОСИТЕЛЬНЫЙ ЗНАК
  • U+066D ٭ АРАБСКАЯ ПЯТИКОНЕЧНАЯ ЗВЕЗДА
  • U+06D4 ۔ ‎ АРАБСКАЯ ТОЧКА
  • U+06DD ۝ ‎ АРАБСКИЙ КОНЕЦ АЯТА
  • U+06DE ۞ ‎ АРАБСКОЕ НАЧАЛО RUB EL HIZB
  • U+06E9 ۩ ‎ АРАБСКОЕ МЕСТО САДЖДА
  • U+06FD ۽ ‎ АРАБСКИЙ ЗНАК СИНДСКИЙ АМПЕРСАНД
  • U+FD3E Арабская декоративная левая скобка
  • U+FD3F ﴿ Арабская декоративная правая скобка

Лигатуры слов

В арабских презентационных формах-A есть несколько символов, определенных как «словесные лигатуры» для терминов, часто используемых в формульных выражениях на арабском языке. Они редко используются вне профессиональной литургической типографии, также графема Rial обычно пишется полностью, а не лигатурой.

  • U+FDF0 ‎ АРАБСКАЯ ЛИГАТУРА САЛЛА, ИСПОЛЬЗУЕМАЯ КАК КОРАНИЧЕСКИЙ ЗНАК СТОП, ИЗОЛЯЦИОННАЯ ФОРМА ( صلى , стилизовано под صلے )
  • U+FDF1 ‎ АРАБСКАЯ ЛИГАТУРА КАЛА, ИСПОЛЬЗУЕМАЯ КАК КОРАНИЧЕСКИЙ ЗНАК СТОП, ИЗОЛЯЦИОННАЯ ФОРМА ( قلى , стилизовано под قلے )
  • U+FDF2 ‎ АРАБСКАЯ ЛИГАТУРА АЛЛАХ ИЗОЛИРОВАННАЯ ФОРМА ( اللّٰه )
  • U+FDF3 ‎ АРАБСКАЯ ЛИГАТУРА АКБАР ИЗОЛИРОВАННАЯ ФОРМА ( اكبر ), как во фразе الله اكبر Аллаху акбар
  • U+FDF4 ‎ АРАБСКАЯ ЛИГАТУРА ИЗОЛИРОВАННАЯ ФОРМА МОХАММАДА ( محمد )
  • U+FDF5 ‎ АРАБСКАЯ ЛИГАТУРА САЛАМ, ИЗОЛИРОВАННАЯ ФОРМА ( صلعم , аббревиатура от صلى الله عليه وسلم «мир ему»)
  • U+FDF6 ‎ АРАБСКАЯ ЛИГАТУРА ИЗОЛИРОВАННАЯ ФОРМА РАСУЛА ( رسول )
  • U+FDF7 ‎ АРАБСКАЯ ЛИГАТУРА ИЗОЛИРОВАННАЯ ФОРМА ALAYHE ( عليه )
  • U+FDF8 ‎ АРАБСКАЯ ЛИГАТУРА ВАСАЛЛАМ ИЗОЛИРОВАННАЯ ФОРМА ( وسلم )
  • U+FDF9 ‎ АРАБСКАЯ ЛИГАТУРА САЛЛА ИЗОЛИРОВАННАЯ ФОРМА ( صلى )
  • U + FDFA ‎ АРАБСКАЯ ЛИГАТУРА САЛЛАЛАХУ АЛАЙХЕ ВАСАЛЛАМ ( صلى الله عليه وسلم «мир ему»)
  • U+FDFB ‎ АРАБСКАЯ ЛИГАТУРА JALLAJALALOUHOU ( جل جلاله )
  • U+FDFC ‎ ЗНАК РИАЛА ( ريال )
  • U+FDFD ‎ АРАБСКАЯ ЛИГАТУРА БИСМИЛЛА АР-РАХМАН АР-РАХИМ ( بسم الله الرحمن الرحيم bism-i llāh-i r-raḥman-i r-raḥīm )

Блоки кода

арабский

Таблица символов

КодРезультатИмя в юникоде
У+0600А   Знак арабской цифры
U+0601А   Арабский знак Санах
U+0602А   Маркер сносок на арабском языке
U+0603ДА   Арабский знак Сафха
U+0604А   Арабский знак Самват

используется для записи дат эры Самват на урду

U+0605А   Арабская цифра сверху

может использоваться с коптскими числами Epact

U+0606А   Арабско-индийский кубический корень

→ U+221B ∛ Кубический корень

U+0607Да   Арабско-индийский четвертый корень

→ U+221C ∜ Четвертый корень

U+0608Д   Арабский луч
U+0609Да   Арабо-индийский знак промилле

→ U+2030 ‰ Знак промилле

У+060АДа   Арабско-индийский за десять тысяч знаков

→ U+2031‱ Знак за десять тысяч

У+060БДа   Афганский знак
У+060С،   Арабская запятая

также используется с тааной и сирийским в современных текстах

→ U+002C, Запятая

→ U+2E32 ⸲ Перевернутая запятая

→ U+2E41 ⹁ Перевернутая запятая

У+060ДДа   Разделитель арабских дат
U+060EДа   Знак арабского поэтического стиха
У+060ФА   Арабский знак Мисра
U+0610ؐ   Арабский знак Салаллаху алейхи Вассаллам

представляет саллаллаху алейхи уа саллям "да пребудет с ним мир и благословение Аллаха"

U+0611А   Арабский знак Алейхи Ассалям

представляет алейхи ассалям "мир ему"

U+0612ؒ   Арабский знак Рахматулла Алайхе

представляет рахматуллаха алейхи "да помилует его Аллах"

U+0613ؓ   Арабский знак Ради Аллаху Анху

представляет собой ради Аллаху 'анху "да будет доволен им Аллах"

U+0614А   Арабский знак Тахаллус

знак, помещаемый над именем или псевдонимом поэта, а в некоторых произведениях используемый для обозначения всех имен собственных

U+0615ДА   Арабский малый высокий Тах

обозначает рекомендуемую позицию паузы в некоторых Коранах, изданных в Иране и Пакистане; не следует путать с маленьким знаком TAH, используемым в качестве диакритического знака для некоторых букв, таких как 0679

U+0616ДА   Арабская маленькая высокая лигатура Алеф с Лям с Йе

ранний персидский

Арабская малая высокая лигатура Алеф с Йе Барри

U+0617ؗ   Арабский Малый Высокий Заин
U+0618Ø   Арабская малая фатха

не следует путать с 064E Fatha

U+0619Ι   Арабская маленькая дамма

не следует путать с 064F Дамма

У+061Аؚ   Арабский Малый Касра

не следует путать с 0650 Касра

У+061Б;   Арабская точка с запятой

также используется с таанским и сирийским в современном тексте → U+003B ; Точка с запятой → U+204F ⁏ Обратная точка с запятой → U+2E35 ⸵ Перевернутая точка с запятой

U+061C؜   Арабская буква Марк (Альм)
У+061Д؝   Арабский знак конца текста
U+061E؞   Арабский знак препинания «тройная точка»
У+061Ф؟   Арабский вопросительный знак

также используется с таана и сирийским в современном тексте → U+003F ? Вопросительный знак → U+2E2E ⸮ Перевернутый вопросительный знак

U+0620А   Арабская буква Кашмири Йе
U+0621А   Арабская буква Хамза

→ U+02BE ʾ Модификатор Буква Правое Полукольцо

U+0622А   Арабская буква Алеф с Маддой сверху

≡ آ U+0627 U+0653

U+0623А   Арабская буква Алеф с хамзой сверху

≡ Σ U+0627 U+0654

U+0624А   Арабская буква «вав» с хамзой сверху

≡ Д U+0648 U+0654

U+0625Арабская буква Алеф с хамзой внизу

≡ EL U+0627 U+0655

U+0626А   Арабская буква Йе с хамзой сверху

в кыргызском языке хамза постоянно располагается вверху справа в изолированных и конечных формах ≡ ئ U+064A U+0654

U+0627ا   Арабская буква Алеф
U+0628Б   Арабская буква Бех
U+0629Да   Арабская буква Те Марбута
У+062АДа   Арабская буква «дэ»
У+062БДа   Арабская буква
U+062CДж   Арабская буква джим
У+062Дح   Арабская буква Ха
U+062Eخ   Арабская буква «Хах»
У+062Фد   Арабская буква Даль
U+0630ذ   Арабская буква Таль
U+0631ر   Арабская буква Рех
U+0632ز   Арабская буква Заин
U+0633С   Арабская буква увидена
U+0634ش   Арабская буква Шин
U+0635ص   Арабская буква Сад
U+0636ض   Арабская буква Дад
U+0637ط   Арабская буква Тах
U+0638ظ   Арабская буква Зах
U+0639ع   Арабская буква Айн

→ U+01B9 ƹ Латинская строчная буква Ezh перевернутая → U+02BF ʿ БУКВА-МОДИФИКАТОР ЛЕВОЕ ПОЛУКОЛЬЦО

У+063Аغ   Арабская буква Гаин
У+063Бػ   Арабская буква Кехе с двумя точками сверху
U+063Cؼ   Арабская буква Кехе с тремя точками внизу
U+063Dؽ   Арабская буква фарси йе с перевернутой буквой V

азербайджанский

U+063Eؾ   Арабская буква фарси йе с двумя точками сверху
У+063Фؿ   Арабская буква фарси йе с тремя точками сверху
U+0640ـ   Арабский Татвил

вставляется для растягивания символов или для переноса ташкиля без базовой буквы, также используется в адламском, ханифитском рохинджа, мандейском, манихейском, псалтырском пехлевийском, согдийском и сирийском = кашида

U+0641ف   Арабская буква Фех
U+0642ق   Арабская буква Каф
U+0643ك   Арабская буква Каф
U+0644ل   Арабская буква Лам
U+0645м   Арабская буква Мим

Синдхи использует форму с коротким хвостиком

U+0646н   Арабская буква полдень
U+0647ه   Арабская буква Хе
U+0648и   Арабская буква Вав
U+0649ى   Арабская буква Алеф Максура

представляет собой двойную соединительную букву в форме ЙЕХ без точек в любой позиционной форме, не предназначенную для использования в сочетании с 0654 → U+0626 ئ Арабская буква Йех с хамзой сверху

У+064Ай   Арабская буква Йе

теряет точки при использовании в сочетании с 0654 сохраняет точки при использовании в сочетании с другими комбинационными знаками → U+08A8 ࢨ Арабская буква Йе с двумя точками снизу и хамзой сверху

У+064Бً   Арабский Фатхатан
U+064Cٌ   арабский Дамматан

распространенная альтернативная форма пишется в виде двух переплетенных дамм, одна из которых повернута на 180 градусов

У+064Дٍ   арабский Касратан
U+064Eَ   Арабский Фатха
У+064Фُ   Арабская Дамма
U+0650ِ   Арабский Касра
U+0651ّ   Арабский Шадда
U+0652ْ   Арабский сукун

обозначает отсутствие гласной после базовой согласной, используется в некоторых Коранах для обозначения долгой гласной, которая игнорируется, может иметь различные формы, включая круглую и форму, похожую на «06E1» → U+06E1 ۡАрабская строчная высокая без точки голова хах

U+0653ٓ   Арабский Маддах выше

используется для мадд джааиз в южноазиатских и индонезийских орфографиях → U + 089C ࢜ арабский Мадда Ваджиб → U + 089E ࢞ арабский двойной Мадда → U + 089F ࢟ арабский полумадда над Маддой

U+0654ٔ   Арабская хамза выше

ограничен семантикой хамзы и эзафе, не используется как диакритический знак для образования новых букв

U+0655ٕ   Арабская хамза внизу
U+0656ٖ   Арабский нижний индекс Алеф
U+0657ٗ   Арабская перевернутая дамма

Кашмирский, урду, суахили, сомалийский

U+0658٘   Арабский Марк Нун Гунна

Белуджи указывает на назализацию в урду

U+0659ٙ   арабский Зваракай

пушту

У+065Аٚ   Арабский гласный знак маленькая буква V сверху

африканские языки

У+065Бٛ   Арабский знак гласной перевернутая маленькая V сверху

африканские языки

У+065Сٜ   Арабский гласный знак с точкой внизу

Африканские языки также используются в текстах Корана в африканской и других орфографиях.

У+065Дٝ   Арабская перевернутая дамма

африканские языки

U+065Eٞ   Арабская фатха с двумя точками

Калами

У+065Фٟ   Арабская волнистая хамза внизу

кашмирский

U+0660٠   Арабско-индийская цифра ноль
U+06611   Арабско-индийская цифра один
U+06622   Арабско-индийская цифра два
U+06633   Арабско-индийская цифра три
U+0664٤   Арабско-индийская цифра четыре
U+06655   Арабско-индийская цифра пять
U+0666٦   Арабско-индийская цифра шесть
U+0667٧   Арабско-индийская цифра семь
U+0668٨   Арабско-индийская цифра восемь
U+0669٩   Арабско-индийская цифра девять
У+066А٪   Арабский знак процента

→ U+0025 % Знак процента

У+066Б٫   Арабский десятичный разделитель

вместо этого чаще всего используется обычная запятая

→ U+002C, Запятая

U+066C٬   Разделитель арабских тысяч

арабская запятая чаще всего используется вместо

→ U+060C ، Арабская запятая

→ U+0027 ' Апостроф

→ U+2019 ' Правая одинарная кавычка

У+066Д   ٭   Арабская пятиконечная звезда

внешний вид довольно изменчив

→ U+002A * Звездочка

U+066Eٮ   Арабская буква без точки Бех
У+066Фٯ   Арабская буква без точки Каф
U+0670ٰ   Арабская буква надстрочный индекс Алеф
U+0671ٱ   Арабская буква Алеф Васла

Коранический арабский

U+0672ٲ   Арабская буква Алеф с волнистой хамзой сверху

Белуджи, Кашмири

U+0673ٳ   Арабская буква Алеф с волнистой хамзой внизу (устарело) [7] Кашмири

этот символ устарел и его использование настоятельно не рекомендуется, используйте вместо него последовательность 0627 065F

U+0674ٴ   Арабская буква Высокий Хамза

Казахский, джавийский языки образуют диграфы

U+0675ٵ   Арабская буква Высокий Хамза Алеф

Предпочтительный вариант написания ‏ ٴا ‎‏ U+0674 U+0627

U+0676ٶ   Арабская буква Высокий Хамза Вав

Предпочтительный вариант написания ‏ ٴو ‎‏ U+0674 U+0648

U+0677ٷ   Арабская буква U с хамзой сверху

Предпочтительный вариант написания ‏ ٴۇ ‎‏ U+0674 U+06C7

U+0678ٸ   Арабская буква Высокий Хамза Йе

Предпочтительный вариант написания ‏ ٴی ‎‏ U+0674 06CC

U+0679ٹ   Арабская буква Ттех

урду

У+067Аٺ   Арабская буква Ттехех

Синдхи

У+067Бٻ   Арабская буква Бих

Синдхи

У+067Сټ   Арабская буква «дэ» с кольцом

пушту

У+067Дٽ   Арабская буква Дэ с тремя точками сверху вниз

Синдхи

U+067Eپ   Арабская буква Пэ

Персидский, урду, ...

У+067Фٿ   Арабская буква «техе»

Синдхи

U+0680ڀ   Арабская буква Бехе

Синдхи

U+0681ځ   Арабская буква Хах с хамзой сверху

На пушту Сариколи представляет фонему /dz/.

U+0682ڂ   Арабская буква Ха с двумя вертикальными точками сверху

не используется в современном пушту

U+0683ڃ   Арабская буква Нье

Синдхи

U+0684ڄ   Арабская буква Дайех

Синдхи, исторически боснийский

U+0685څ   Арабская буква Ха с тремя точками сверху

Пушту, Хорезмийский, Сариколи представляет фонему / ts / на пушту.

U+0686چ   Арабская буква «чех»

Персидский, урду, ...

U+0687ڇ   Арабская буква «чехе»

Синдхи

U+0688ڈ   Арабская буква Ддал

урду

U+0689ډ   Арабская буква Даль с кольцом

пушту

У+068Аڊ   Арабская буква Даль с точкой внизу

Синдхи, ранний персидский, пегон, малагасийский

У+068Бڋ   Арабская буква Даль с точкой внизу и маленькой буквой Тах

Ланда

У+068Сڌ   Арабская буква Дахал

Синдхи

У+068Дڍ   Арабская буква Ддахал

Синдхи

U+068Eڎ   Арабская буква Дул

старая форма для DUL, теперь устаревшая в синдхи-бурушаски

У+068Фڏ   Арабская буква Даль с тремя точками сверху вниз

Форма тока синдхи, используемая для DUL

U+0690ڐ   Арабская буква Даль с четырьмя точками сверху

Старый урду, в настоящее время не используется

U+0691ڑ   Арабская буква Ррех

урду

U+0692ڒ   Арабская буква Ре с маленькой буквой V

курдский

U+0693ړ   Арабская буква Ре с кольцом

пушту

U+0694ڔ   Арабская буква Ре с точкой внизу

Курдский, ранний персидский

U+0695ڕ   Арабская буква Рех с маленькой буквой V внизу

курдский

U+0696ږ   Арабская буква Рех с точкой снизу и точкой сверху

пушту

U+0697ڗ   Арабская буква Ре с двумя точками сверху

Даргва

U+0698ژ   Арабская буква Джех

Персидский, урду, ...

U+0699ڙ   Арабская буква Рех с четырьмя точками сверху

Синдхи

У+069Аښ   Арабская буква с точкой снизу и точкой сверху

пушту

У+069Бڛ   Арабская буква с тремя точками внизу

ранний персидский

У+069Сڜ   Арабская буква с тремя точками снизу и тремя точками сверху

марокканский арабский

У+069Дڝ   Арабская буква Грустно с двумя точками внизу

тюркский

U+069Eڞ   Арабская буква Грустно с тремя точками сверху

Берберский, бурушаски

У+069Фڟ   Арабская буква Тах с тремя точками сверху

Старый хауса

У+06А0ڠ   Арабская буква Айн с тремя точками сверху

Джави

У+06А1ڡ   Арабская буква без точки Фе

адыгейский

У+06А2ڢ   Арабская буква Фе с точкой, перемещенной ниже

Магрибский арабский

У+06А3ڣ   Арабская буква Фе с точкой внизу

ингушский

У+06А4ڤ   Арабская буква Вех

Ближневосточный арабский для иностранных слов курдский, хорезмийский, ранний персидский, джави

У+06А5ڥ   Арабская буква Фе с тремя точками внизу

Североафриканский арабский для иностранных слов

У+06А6ڦ   Арабская буква Пехе

Синдхи

У+06А7ڧ   Арабская буква Каф с точкой сверху

Магрибский арабский, уйгурский

У+06А8ڨ   Арабская буква Каф с тремя точками сверху

Тунисский и алжирский арабский

У+06А9ک   Арабская буква Кехе

Персидский, урду, синдхи, ...= каф машкула

У+06ААڪ   Арабская буква «сваш» Каф

представляет собой букву, отличную от арабской KAF (0643) в синдхи

У+06АБګ   Арабская буква Каф с кольцом

Пушту может выглядеть как арабская буква KAF (0643) с кольцом под основанием.

U+06ACڬ   Арабская буква Каф с точкой сверху

Не рекомендуется использовать для джави-гафа, хотя его можно найти в некоторых существующих текстовых данных; рекомендуемый символ для джави-гафа — 0762 → U+0762 ™ Арабская буква Кехе с точкой сверху

У+06АДڭ   Арабская буква Нг

Уйгурский, казахский, марокканский арабский, ранний джави, ранний персидский, ...

У+06АЕڮ   Арабская буква Каф с тремя точками внизу

Бербер, ранняя персидская пегонская альтернатива для 08B4

У+06АФگ   Арабская буква Гаф

Персидский, урду, ...

U+06B0ڰ   Арабская буква Гаф с кольцом

Ланда

У+06Б1ڱ   Арабская буква Нгоэ

Синдхи

У+06Б2ڲ   Арабская буква Гаф с двумя точками внизу

не используется в синдхи

У+06Б3ڳ   Арабская буква «Гуэ»

Синдхи, Сарайки

У+06Б4ڴ   Арабская буква Гаф с тремя точками сверху

не используется в синдхи, каракалпакском

У+06Б5ڵ   Арабская буква Лам с маленькой буквой V

Курдский, исторически боснийский

У+06Б6ڶ   Арабская буква Лам с точкой сверху

курдский

У+06Б7ڷ   Арабская буква Лам с тремя точками сверху

курдский

У+06Б8ڸ   Арабская буква Лам с тремя точками внизу

Аварский, Сокотрийский

U+06B9ڹ   Арабская буква полдень с точкой внизу
У+06БАں   Арабская буква Нун Гхунна

Урду, архаичный арабский язык без точек во всех четырех контекстных формах

U+06BBڻ   Арабская буква Рнун

без точек во всех четырех контекстных формах синдхи

U+06BCڼ   Арабская буква полдень с кольцом

пушту

У+06БДڽ   Арабская буква полдень с тремя точками сверху

Джави

У+06БЭھ   Арабская буква Хе Доахашми

образует придыхательные диграфы в урду и других языках Южной Азии представляет гортанный фрикативный звук /h/ в уйгурском языке

У+06БФڿ   Арабская буква «че» с точкой сверху
U+06C0ۀ   Арабская буква Хе с Йе сверху

для ezafe используйте 0654 над соответствующей языку базовой буквой, на самом деле это лигатура, а не самостоятельная буква арабская буква хамза на ha (1.0) ≡ ۀ U+06D5 U+0654

U+06C1ہ   Арабская буква Хе Гол

урду

U+06C2ۂ   Арабская буква Хе Гол с хамзой сверху

Урду на самом деле лигатура, а не самостоятельная буква ≡ ۂ U+06C1 U+0654

U+06C3ۃ   Арабская буква Тех Марбута Цель

урду

U+06C4ۄ   Арабская буква Вав с кольцом

кашмирский

U+06C5ۅ   Арабская буква киргизский Оэ

В кыргызском языке встречается вариант глифа, в котором петлевой хвост заменяется горизонтальной чертой, проходящей через хвост.

U+06C6ۆ   Арабская буква Оэ

Уйгур, курд, казах, азербайджанец, исторически боснийец

U+06C7ۇ   Арабская буква U

азербайджанский, казахский, кыргызский, уйгурский

U+06C8ۈ   Арабская буква Ю

уйгурский

U+06C9ۉ   Арабская буква Киргиз Ю

казах, киргиз, исторически боснийец

У+06КАۊ   Арабская буква Вав с двумя точками сверху

курдский

У+06СВۋ   Арабская буква Ве

Уйгурский, казахский

U+06CCی   Арабская буква фарси йе

Арабский, персидский, урду, кашмирский, ... начальные и средние формы этой буквы имеют точки → U+0649 ى АРАБСКАЯ БУКВА АЛЕФ МАКСУРА → U+064A ي Арабская буква Йе

U+06CDۍ   Арабская буква Йе с хвостиком

Пушту, Синдхи

U+06CEێ   Арабская буква Йе с маленькой буквой V

курдский

U+06CFۏ   Арабская буква Вав с точкой сверху

Джави

У+06Д0ې   Арабская буква E

Пушту, уйгурский, используется как буква bbeh в синдхи

У+06Д1ۑ   Арабская буква Йе с тремя точками внизу

языки менде, хауса

У+06Д2ے   Арабская буква Йе Барри

урду

У+06Д3ۓ   Арабская буква Йе Барри с хамзой сверху

урду

У+06Д4۔   Арабская точка

урду

У+06Д5ە   Арабская буква Ае

Уйгурский, казахский, киргизский

У+06Д6ۖ   Арабский Малый Высокий Лигатура Сад С Лам С Алеф Максура
У+06Д7ۗ   Арабская малая высокая лигатура Каф с лямом и алефом Максура
У+06Д8ۘ   Арабский Малый Высокий Мим Начальная Форма
У+06Д9ۙ   Арабский малый высокий лам алеф
У+06ДАۚ   Арабский Малый Высокий Джим
U+06DBۛ   Арабский Строчные Высокие Три Точки
U+06DCۜ   Арабский Маленький Высокий Видно
У+06ДД۝   Арабский Конец Аята
U+06DE۞   Арабская звезда Руб Эль Хизб
У+06ДФ۟   Арабский Маленький Высокий Округленный Ноль

меньше, чем типичная круглая форма, используемая для 0652

U+06E0۠   Арабский Маленький Высокий Вертикальный Прямоугольный Ноль

Термин «прямоугольный ноль» является переводом арабского названия этого знака.

U+06E1ۡ   Форма представления арабской маленькой высокой без точек головы кха 0652, использование технологии шрифтов для выбора варианта является предпочтительным

используется в некоторых Коранах для обозначения отсутствия гласной = арабский джазм → U+0652 ْ арабский сукун

U+06E2ۢ   Арабский Малый Высокий Мим Изолированная Форма
U+06E3ۣ   Арабский Маленький Низкий Видно
U+06E4ۤ   Арабский Малый Высокий Мадда

обычно используется с 06E5, 06E6, 06E7 и 08F3

U+06E5ۥ   Арабский малый Вав

→ U+08D3 ࣓ Арабский маленький низкий вав → U+08F3 ࣳ Арабский маленький высокий вав

U+06E6ۦ   Арабский малый Йе
U+06E7ۧ   Арабский Малый Высокий Йе
U+06E8ۨ   Арабский Малый Полдень
U+06E9۩   Арабское Место Саджда

Для этого символа существует ряд приемлемых глифов.

У+06ЕА۪   Арабский пустой центр низкий стоп
U+06EB۫   Арабский пустой центр высокий стоп
U+06EC۬   Арабский округлый высокий стоп с заполненным центром

также используется в коранических текстах в африканской и других орфографиях для обозначения васла, ихтилас и т. д.

U+06EDۭ   Арабский Малый Низкий Мим
У+06ЕЕۮ   Арабская буква Даль с перевернутой буквой V
У+06ЕФۯ   Арабская буква Ре с перевернутой буквой V

также использовался в раннем персидском языке

У+06Ф0۰   Расширенная арабско-индийская цифра ноль
У+06Ф11   Расширенная арабско-индийская цифра один
У+06Ф22   Расширенная арабско-индийская цифра два
У+06Ф3۳   Расширенная арабско-индийская цифра три
У+06Ф4۴   Расширенная арабско-индийская цифра четыре

В персидском языке глиф отличается от глифов в синдхи и урду.

У+06Ф5۵   Расширенная арабско-индийская цифра пять

Персидский, синдхи и урду имеют общий глиф, отличающийся от арабского

У+06Ф6۶   Расширенная арабско-индийская цифра шесть

В персидском, синдхском и урду есть глифы, отличающиеся от арабских.

У+06Ф77   Расширенная арабско-индийская цифра семь

В урду и синдхи глифы отличаются от арабских.

У+06Ф8۸   Расширенная арабско-индийская цифра восемь
У+06Ф9۹   Расширенная арабско-индийская цифра девять
У+06ФАۺ   Арабская буква Шин с точкой внизу
U+06FBۻ   Арабская буква «дад» с точкой внизу
U+06FCۼ   Арабская буква гайн с точкой внизу
U+06FD۽   Арабский знак Синдхи Амперсанд
У+06ФЭ۾   Арабский Знак Синдхи Послелог Мужчины
У+06ФФۿ   Арабская буква Хе с перевернутой буквой V

Компактный стол

Арабский [1] [2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+060x А  ؁  ؂  ؃  ДА  ؅ А؇Д؉ЫДа,؍؎؏
U+061xؐАؒؓؔДАÖؗØÙ; АЛМ ؝؞؟
U+062xؠءАãДАåАاБةتЬДжحخد
U+063xذرòСشхضطظعغػؼؽؾؿ
U+064xـفقкلмнхوىйًٌٍَُ
U+065xِّْٕٖٓٔٗмٜٟٙٚٛٝٞ
U+066x٠123٤5٦٧٨٩٪٫٬٭ٮٯ
U+067xٰٱٲٳٴٵٶٷٸٹٺٻټٽپٿ
U+068xڀځڂڃڄڅچڇڈډڊڋڌڍڎڏ
U+069xڐڑڒړڔڕږڗژڙښڛڜڝڞڟ
U+06Axڠڡڢڣڤڥڦڧڨکڪګڬڭڮگ
У+06Бxڰڱڲڳڴڵڶڷڸڹںڻڼڽھڿ
U+06Cxۀہۂۃۄۅۆۇۈۉۊۋیۍێۏ
У+06Дхېۑےۓ۔ەۖۗۘۙۚۛۜ ۝ ۞۟
U+06Exۣ۠ۡۢۤۥۦۧۨ۩۪ۭ۫۬ۮۯ
U+06Fx۰102۳۴5۶7۸۹ۺۻۼ۽۾ۿ
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Кодовая точка Unicode U+0673 устарела, начиная с версии Unicode 6.0.

Арабское приложение

Приложение к арабскому языку [1] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
У+075xнннтннлцннннннннн��
У+076xн💡😉tн😉ннннннтннтt
U+077xtнннннннннннетнетннt
Примечания
1. ^ Начиная с версии Unicode 16.0

Арабский расширенный-B

Арабский расширенный-B [1] [2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+087x
U+088xе
U+089x ࢐  ࢑ гт
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.

Арабский расширенный-А

Арабский расширенный-A [1] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+08Axбм
У+08Бx
U+08Cx
У+08Дхкт
U+08Ex ࣢ 
U+08Fx
Примечания
1. ^ Начиная с версии Unicode 16.0

Арабские формы представления A

В основном это лигатуры, которые можно создать из символов предыдущих таблиц, за исключением графем, похожих на скобки ﴾ ﴿ , а некоторые из них являются лигатурами обычных литургических фраз.

Арабские формы представления-A [1] [2] [3] Официальная таблица кодов Консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+FB5x
U+FB6x
U+FB7xﭿ
U+FB8x
U+FB9x
U+FBAx
U+FBBx﮿
U+FBCx
U+FBDx
U+FBEx
U+FBFxﯿ
U+FC0x
U+FC1x
U+FC2x
U+FC3xﰿ
U+FC4x
U+FC5x
U+FC6x
U+FC7xﱿ
U+FC8x
U+FC9x
U+FCAx
U+FCBxﲿ
U+FCCx
U+FCDx
U+FCEx
U+FCFxﳿ
U+FD0x
У+ФД1х
У+ФД2х
U+FD3x﴿
У+ФД4х
У+ФД5х
У+ФД6х
U+FD7xﵿ
У+ФД8х
U+FD9x
U+FDAx
U+FDBxﶿ
U+FDCx
U+FDDx
U+FDEx
U+FDFx﷿
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.
3. ^ Черные области обозначают несимволы (кодовые точки, которые гарантированно никогда не будут назначены в качестве закодированных символов в стандарте Unicode)

Арабские формы представления B

Все они могут быть созданы из символов базовой таблицы.

Арабские формы представления-B [1] [2] Официальная таблица кодов Консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+FE7xﹿ
U+FE8x
U+FE9x
U+FEAx
U+FEBxﺿ
U+FECx
U+FEDx
U+FEEx
U+FEFxZW
НБСП
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.

Числовые символы Руми

Символы чисел Руми [1] [2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
У+10Е6х𐹠𐹡𐹢𐹣𐹤𐹥𐹦𐹧𐹨𐹩𐹪𐹫𐹬𐹭𐹮𐹯
U+10E7x𐹰𐹱𐹲𐹳𐹴𐹵𐹶𐹷𐹸𐹹𐹺𐹻𐹼𐹽𐹾
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серая область указывает на неназначенную кодовую точку.

Арабский расширенный-C

Арабский расширенный-C [1] [2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+10ECx𐻂𐻃𐻄
U+10EDx
U+10EEx
U+10EFx𐻼𐻽𐻾𐻿
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.

Индийские числа Siyaq

Индийские числа сияк [1] ​​[2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+1EC7x🞱🞱🞱�🞱�🞱�🞱�🞱️🞱�𞱹🞱�🞱�🞱�🞱�🞱�𞱿
U+1EC8x💜💜💥🞲�💡🞲�🞲�🞲�💜🞲�🞲�𞲋💥🞲�🞲�🞲�
U+1EC9x🞲�🞲�🞲�💓💔🞲�🞲�🞲�🞲�💙💚💛💜💝🞲�🞲💜
U+1ECAx𞲠🞲�💢💣💜🞲�🞲�💧💨💪💪🞲�🞲�🞲�💮🞲�
U+1ECBx💰🞲🞲🞲�🞲�
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.

Османские числа Сияка

Османские числа сияка [1] [2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+1ED0x🞴🞴�🞴�🞴🞴�🞴🞴�🞴🞴�🞴�🞴🞴�🞴�🞴�🞴�
У+1ED1x🞴🞴-🞴🞴�🞴🞴�🞴🞴🞴�🞴🞴�🞴🞴🞴�🞴�🞴🏻
У+1ED2x🞴🞴🞴🞴🞴🞴�🞴�🞴�🞴🞴💪🞴�🞴�🞴�🞴🞴�
У+1ED3x🞴️🞴🞴🞴💴🞴️🞴🞴️🞴�🞴🞴️🞴🞴🞴️
У+1ED4x
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.

Арабские математические алфавитные символы

Символы арабского математического алфавита [1] [2] Официальная таблица кодов консорциума Unicode (PDF)
 0123456789АБСДЭФ
U+1EE0x😉😉😉😉😉😉😉😉😉😉😉😉😍😉🞸�
У+1ЕЕ1х😉😉😉😉😉😉😉😉😉😉😉😉😉😉😉😉
У+1ЕЕ2х😉😉😉😉😉😉😉😉😉😉😉
У+1ЕЕ3х😉😉😉😉😉😉😉😉😉
У+1ЕЕ4х𞹂🞹�🞹�𞹋🞹�🞹�🞹�
У+1ЕЕ5х𞹑🞹�𞹔🞹�🞹�𞹛𞹝🞹
У+1ЕЕ6х🞹�𞹢🞹🞹�𞹨🞹�𞹪𞹬𞹭🞹�🞹�
У+1ЕЕ7х🞹�🞱🞹�🞹�𞹵🞹�🞹·🞹🞹�🞹�𞹼🞹�
У+1ЕЕ8х🞀🞺🞺�🞺�💡🞺�🞺🞺�💥🞺�🞺💥🞺🞺�🞺�
U+1EE9x🞺�🞑🞒🞺�🞺�💕💖🞺�🞺�🞺�🞺💛
U+1EEAx🞺�🞺�💣🞺�💦🞺💨💩🞺�🞺�🞺�🞺💯
U+1EEBx💰🞺💪🞺💪💵💫🞺🞺🞺🞺🞺
U+1EECx
U+1EEDx
U+1EEEx
U+1EEFx🞻�🞻
Примечания
1. ^ Начиная с версии Unicode 16.0
2. ^ Серые области обозначают неназначенные кодовые точки.

Ссылки

  1. ^ «Каково происхождение амперсанда (&)?»
  2. ^ unicode.org Биография: Томас Мило - DecoType
  3. ^ "UAX #24: Файл данных скрипта". База данных символов Unicode . Консорциум Unicode.
  4. ^ ab "Раздел 9.2: Арабский язык, арабские формы представления-B". Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г.
  5. ^ Пандей, Аншуман (2015-11-05). "L2/15-121R2: Предложение по кодированию индийских чисел сияк" (PDF) .
  6. ^ ab "Глава 22: Символы". Unicode, Inc. Сентябрь 2024 г.
  7. ^ Устарело с версии Unicode 6.0 История изменений UCD «Конкретная комбинация алефа с этим знаком гласной должна быть записана с помощью последовательности <U+0627 АРАБСКАЯ БУКВА АЛЕФ, U+065F АРАБСКАЯ ВОЛНИСТАЯ ХАМЗА НИЖЕ>, а не с помощью символа U+0673 АРАБСКАЯ БУКВА АЛЕФ С ВОЛНИСТАЮЩЕЙ ХАМЗОЙ НИЖЕ, который устарел и не является канонически эквивалентным. «Раздел 9.2: Арабский язык, Дополнительные знаки гласных». Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г.
  • Oibane. "Проблемы Unicode". Арабский на Linux . Архивировано из оригинала 2008-02-03.
  • Арабский. "Арабский: unicode <-> глифы, 2-сторонний преобразователь". Java-апплет, преобразующий глифы в unicode (и unicode в глифы). Он учитывает лигатуры, lam-alif, диакритические знаки и т. д .
  • Шехерезада или Шехерезада Новая — расширенный арабский шрифт, разработанный SIL International и распространяемый по лицензии SIL Open Font License (OFL).
  • Harmattan — расширенный арабский шрифт, разработанный SIL International для Западной Африки, распространяемый по лицензии SIL Open Font License (OFL)
Взято с "https://en.wikipedia.org/w/index.php?title=Арабский_скрипт_в_Юникоде&oldid=1262626961"