Электронное письмо, в заголовке которого содержатся символы, не входящие в набор ASCII
Международная электронная почта возникает из комбинированного предоставления интернационализированных доменных имен ( IDN ) [1] и интернационализации адресов электронной почты ( EAI ). [2] Результатом является электронная почта, которая содержит международные символы (символы, которые не существуют в наборе символов ASCII ), закодированные как UTF-8 , в заголовке электронной почты и в поддерживающих протоколах передачи почты. Наиболее важным аспектом этого является разрешение адресов электронной почты (также известных как идентификаторы электронной почты) в большинстве мировых систем письма, как на уровне интерфейса, так и на уровне транспорта.
Адреса электронной почты
Традиционные адреса электронной почты ограничены символами английского алфавита и несколькими другими специальными символами. [3]
Ниже приведены допустимые традиционные адреса электронной почты:
Русский человек может захотеть использовать иван.сергеев@пример.рф в качестве своего идентификатора, но будет вынужден использовать транскрипцию, например ivan.sergeev@example.ru или даже какой-либо другой совершенно не связанный идентификатор. То же самое касается китайцев, японцев и других национальностей, которые не используют латиницу , но также применимо к пользователям из неанглоязычных европейских стран, чьи желаемые адреса могут содержать диакритические знаки (например, André или Płużyna ). В результате пользователи электронной почты вынуждены идентифицировать себя с помощью неродных письменностей, что может привести к ошибкам из-за неоднозначности транслитерации (например, иван.сергеевможет стать ivan.sergeev, ivan.sergeyevили что-то еще). В качестве альтернативы разработчики систем электронной почты должны компенсировать это путем преобразования идентификаторов из своих родных письменностей в ASCII-скрипты и обратно на уровне пользовательского интерфейса.
Международная электронная почта, напротив, использует символы Unicode , закодированные как UTF-8, что позволяет кодировать текст адресов в большинстве мировых систем письма. [4]
用户@例子.广告 ( китайский , Unicode )ಬೆಂಬಲ@ಡೇಟಾಮೇಲ್.ಭಾರತ ( каннада , Unicode)अजय@डाटा.भारत ( хинди , Unicode)квіточка@пошта.укр ( украинский , Unicode)χρήστης@παράδειγμα.ελ ( греческий , Unicode)Dörte@Sörensen.example.com ( немецкий , Unicode)коля@пример.рф ( русский , Unicode)
Заголовки UTF-8
Хотя традиционный формат раздела заголовка электронной почты позволяет включать символы, не входящие в ASCII, в часть значений некоторых полей заголовка с использованием слов в кодировке MIME (например, в отображаемых именах или в поле заголовка Subject ), кодировка MIME не должна использоваться для кодирования другой информации в заголовке, например адреса электронной почты или полей заголовка, таких как Message-ID или Received . Более того, кодировка MIME требует дополнительной обработки заголовка для преобразования данных в представление слова в кодировке MIME и обратно и ухудшает читаемость раздела заголовка.
Стандарты RFC 6532 и RFC 6531 2012 года допускают включение символов Unicode в содержимое заголовка с использованием кодировки UTF-8 и их передачу через SMTP, но на практике поддержка развертывается лишь медленно. [5]
Взаимодействие посредством понижения версии
Интернационализация домена работает путем понижения. Части UTF-8, известные как U-метки, преобразуются в A-метки с помощью специального метода, называемого IDNA. Например, sörensen.example.comкодируется как xn--srensen-90a.example.com. В 2003 году, когда возникла необходимость, это казалось проще, чем проверка того, что все программное обеспечение DNS может соответствовать строкам UTF-8, хотя в теории DNS может передавать двоичные данные. Это кодирование необходимо перед отправкой DNS-запросов.
Поскольку традиционные стандарты электронной почты ограничивают все значения заголовков электронной почты только символами ASCII, возможно, что наличие символов UTF-8 в заголовках электронной почты снижает стабильность и надежность передачи такой электронной почты. Это связано с тем, что некоторые серверы электронной почты не поддерживают эти символы. Проверка соответствия строкам UTF-8 должна выполняться пакетом программного обеспечения (см. #Adoption ниже.) Был предложен экспериментальный метод IETF, с помощью которого электронная почта могла быть каким-то образом понижена до устаревшего формата all-ASCII, который поддерживают все стандартные серверы электронной почты. [2] [6] Это предложение было сочтено слишком громоздким; значение левой части адреса электронной почты является локальным для целевого сервера, и поэтому нет способа проверить, является ли это допустимым именем пользователя, используемым в каком-либо домене. Позднее, в 2012 году, оно было отменено. [7]xn--something
Стандарты структуры
Набор документов RFC для Интернета RFC 6530, RFC 6531, RFC 6532 и RFC 6533, все из которых были опубликованы в феврале 2012 года, определяет механизмы и расширения протоколов, необходимые для полной поддержки интернационализированных адресов электронной почты. Эти изменения включают расширение SMTP и расширение синтаксиса заголовка электронной почты для размещения данных UTF-8. Набор документов также включает обсуждение ключевых предположений и проблем при развертывании полностью интернационализированной электронной почты.
Unicode также рекомендует профили безопасности электронной почты для идентификаторов.
Принятие
2010-10-29: PRweb Afilias и .JO Registry предоставляют электронную почту на родном языке арабским интернет-пользователям [8]
2013-11-14: Почтовый клиент The Bat! реализовал поддержку интернационализированных доменных имен (IDN) в адресах электронной почты. [9]
2014-07-15: Почтовая программа Postfix начала поддерживать [10] интернационализированную электронную почту, также известную как EAI или SMTPUTF8 , определенную в RFC 6530 .. RFC 6533. Первоначальная поддержка была доступна с версии разработки 20140715, а 2015-02-08 завершилась в стабильной версии 3.0.0. [11] Она поддерживает UTF-8 в адресах отправителя SMTP или LMTP, адресах получателей и значениях заголовков сообщений.
2014-07-19: Почтовый сервер XgenPlus начал поддерживать [12] электронную почту на основе IDN [13] , также известную как поддержка SMTPUTF8 , особенно для домена .भारत.
2014-08-05: Google объявил [14] , что Gmail будет распознавать адреса, содержащие акцентированные или нелатинские символы, с дальнейшей поддержкой интернационализации. Их почтовые программы (MX MTA) объявляют о поддержке расширения SMTP для интернационализированной электронной почты (SMTPUTF8, RFC 6531).
2014-09-30: Компания Message Systems объявила [15] , что ее продукт Momentum (версии 4.1 и 3.6.5) обеспечивает поддержку SMTPUTF8 , расширения интернационализации адресов электронной почты для протокола SMTP, что позволяет отправлять электронные письма новым получателям, не имеющим западных адресов.
2014-10-22: выпущена версия 2.10.0 фильтра содержимого почты Amavis [16], в которую добавлена поддержка SMTPUTF8 , EAI и IDN .
2016-10-18: Data Xgen Technologies запустила бесплатный лингвистический адрес электронной почты под названием «DATAMAIL». В поддержку Digital India это заставило индийское приложение электронной почты остановиться, которое поддерживает IDN ( интернационализированное доменное имя ) на хинди (हिन्दी), гуджарати (ગુજરાતી), урду (�ردو), пенджаби (ਪੰਜਾਬੀ ਦੇ), тамильском (தமிழ்), телгу (తెలుగు), бенгали (বাংলা), маратхи (मराठी), латинском английском. DATAMAIL запустила международные языки для стран, использующих арабский (العَرَبِيَّة), русский (русский) и китайский (汉语/漢語) в качестве базового языка. [17] [18]
2016-12-07: почта.рус запускает полностью русскую (кириллицу) электронную почту в Москве через пресс-конференцию. [19] [20]
2017-12-03: Главный министр Раджастхана Васундхара Радже запускает один бесплатный адрес электронной почты @rajasthan.in и домен @राजस्थान.भारत. Штат Раджастхан становится первым в мире штатом, который предоставляет каждому гражданину адрес электронной почты на его родном языке. [ необходима цитата ]
2017-12-27: Microsoft объявляет о предстоящей поддержке электронной почты IDN в Office 365 [22] , а также объявляет о партнере XgenPlus, размещающем почтовые ящики IDN. [23]
2018-01-03: Microsoft добавляет интернационализацию электронной почты в Exchange Online. [24]
2018-09-18: Courier-MTA выпускает поддержку сообщений электронной почты Unicode в UTF-8 для всех пакетов Courier. Кроме того, Courier-IMAP использует Unicode (UTF8) для имен папок maildir. [25]
2020-07-29: DataMail запустил адрес электронной почты на языке каннада [26], чтобы преодолеть языковой барьер
Спонсируемая ICANN рабочая группа по универсальному принятию работает над тем, чтобы EAI принимался в большем количестве мест, и публикует ежегодные отчеты о принятии .
^ Начато: Пол Хоффман; Марк Бланше (7 марта 2003 г.). Nameprep: Профиль Stringprep для интернационализированных доменных имен (IDN). doi : 10.17487/RFC3491 . RFC 3491.
^ ab Начато: John C Klensin; YangWoo Ko (7 февраля 2007 г.). Обзор и структура для интернационализированной электронной почты. doi : 10.17487/RFC4952 . RFC 4952.
^ RFC 5322: Формат интернет-сообщений
^ RFC 6530: Обзор и структура для интернационализированной электронной почты
^ Mackie, Kurt (2 января 2018 г.). "Exchange Online Getting E-Mail Internationalization Support". Журнал Redmond . Получено 1 ноября 2018 г.
^ Цзянькан ЯО; Вэй МАО (8 июля 2008 г.). Расширение SMTP для интернационализированных адресов электронной почты. doi : 10.17487/RFC5336 . RFC 5336.
^ Дж. Кленсин; Ю. Ко (февраль 2012 г.). Обзор и структура интернационализированной электронной почты. дои : 10.17487/RFC6530 . РФК 6530.
^ "Afilias и .JO Registry предоставляют электронную почту на родном языке арабским интернет-пользователям". 2010-10-29. Архивировано из оригинала 15 ноября 2010 г.
^ "The Bat! 6.0 с поддержкой Unicode и IDN: The Bat! говорит на многих языках". 2013-11-14.
^ [1] Поддержка Postfix SMTPUTF8 (адреса электронной почты в кодировке Unicode)
^ [2] Стабильная версия Postfix 3.0.0
^ "Правительство предложит бесплатное доменное имя .bharat при покупке .in" . Получено 13 августа 2016 г.
^ [3] Первый шаг к более глобальной электронной почте
^ [4] Message Systems представляет последнюю версию Momentum с новыми возможностями на основе API
^ [5] Выпущена версия Amavis 2.10.0
^ "Data Xgen Technologies запускает адрес электронной почты на индийских языках". Deccan Chronicle . 2016-10-18 . Получено 2016-10-22 .
^ "DataMail: Первая в мире бесплатная лингвистическая служба электронной почты поддерживает восемь языков Индии - The Economic Times". The Economic Times . Получено 22 октября 2016 г.
^ ""Почта.рус" хочет удалить от внешних".
^ "Кириллическая электронная почта запущена в .РУС". cctld.ru . Архивировано из оригинала 2016-12-20.
^ "EAI Mail". apple.com . 7 марта 2017 г.
^ "EAI support announcement". Блог команды Microsoft Exchange . Получено 9 ноября 2018 г.
^ Холландер, Дон (21 февраля 2018 г.). «Microsoft анонсирует EAI в Индии». Группа по управлению всеобщим принятием (UASG) . Получено 06.07.2019 .
^ Курт Маки (3 января 2018 г.). «Microsoft добавляет интернационализацию электронной почты в Exchange Online». MCPmag.
^ Сэм Варшавчик (18 сентября 2018 г.). "Новые выпуски пакетов Courier". courier-announce (список рассылки) . Получено 5 июля 2019 г.
^ "DataMail запустил адрес электронной почты на языке каннада, чтобы сломать языковой барьер". Business News This Week . 2020-07-29 . Получено 2022-06-14 .