Формат файла документа

Type of text or binary file format

Формат файла документа — это текстовый или двоичный формат файла для хранения документов на носителе , особенно для использования компьютерами . В настоящее время существует множество несовместимых форматов файлов документов.

Примерами открытых стандартов на основе XML являются DocBook , XHTML и, в последнее время, стандарты ISO / IEC OpenDocument (ISO 26300:2006) и Office Open XML (ISO 29500:2008).

В 1993 году ITU-T попытался установить стандарт для форматов файлов документов, известный как Open Document Architecture (ODA), который должен был заменить все конкурирующие форматы файлов документов. Он описан в документах ITU-T T.411 — T.421, которые эквивалентны ISO 8613. Это не удалось.

Языки описания страниц, такие как PostScript и PDF, стали фактическим стандартом для документов, которые типичный пользователь должен иметь возможность только создавать и читать, но не редактировать. В 2001 году начала публиковаться серия стандартов ISO / IEC для PDF, включая спецификацию самого PDF, ISO-32000 .

HTML является наиболее используемым и открытым международным стандартом, а также используется как формат файла документа. Он также стал стандартом ISO / IEC (ISO 15445:2000).

Двоичный формат файла, используемый Microsoft Word по умолчанию ( .doc ), стал фактическим стандартом для офисных документов, но это закрытый формат , который не всегда полностью поддерживается другими текстовыми процессорами.

Распространенные форматы файлов документов

  • ASCII , UTF-8 — кодировки простого текста . С этими двумя наборами символов используются три различных окончания строк: (a) LF — перевод строки в UNIX и подобных системах, (b) CRLF — возврат каретки, перевод строки в системах DOS и Windows, и (c) CR — возврат каретки в старых системах Macintosh.
  • Amigaguide
  • .doc для Microsoft Word — структурный двоичный формат, разработанный Microsoft (спецификации доступны с 2008 года в рамках Open Specification Promise ) [1] [2]
  • DjVu — формат файла, предназначенный в первую очередь для хранения отсканированных документов [3]
  • DocBook — XML-формат для технической документации
  • HTML (.html, .htm), (открытый стандарт, ISO от 2000 г.), в сочетании с возможными файлами изображений , на которые дана ссылка.
  • FictionBook (.fb2) — открытый формат электронной книги на основе XML
  • Markdown (.md) — язык разметки для создания форматированного текста с использованием обычного текста
  • Office Open XML — .docx (стандарт на основе XML для офисных документов)
  • OpenDocument — .odt (стандарт на основе XML для офисных документов)
  • OpenOffice.org XML — .sxw (открытый формат на основе XML для офисных документов)
  • OXPS — спецификация Open XML Paper (Windows 8.1 и выше, более старая версия — XPS, используемая в Windows 7)
  • PalmDoc — формат карманного документа
  • .pages для страниц
  • PDF — открытый стандарт для обмена документами. Стандарты ISO включают PDF/X (eXchange), PDF/A (Archive), PDF/E (Engineering), ISO 32000 (PDF), PDF/UA (Accessibility) и PDF/VT (Variable data and transactional print). PDF можно читать практически на любой платформе с помощью бесплатных или открытых программ для чтения. Также доступны программы для создания PDF с открытым исходным кодом.
  • Постскриптум — .ps
  • Rich Text Format (RTF) — формат метаданных, разрабатываемый корпорацией Microsoft с 1987 года для продуктов Microsoft и кроссплатформенного обмена документами [4] [5] [6] [7] [8]
  • СИМБОЛИЧЕСКАЯ ССЫЛКА (SYLK)
  • Масштабируемая векторная графика (SVG) — графический формат, предназначенный в первую очередь для векторных изображений.
  • TeX — Программа и формат набора текста с открытым исходным кодом. Первый успешный язык математической нотации.
  • TEI — XML-формат для цифровой публикации
  • Трофф
  • Единый офисный формат — китайский стандарт
  • WordPerfect (.wpd, .wp, .wp7, .doc) (Примечание: возможна путаница с расширением формата Word)

Смотрите также

Ссылки

  1. ^ "Форматы двоичных файлов Microsoft Office (doc, xls, ppt)". Microsoft . 2008-02-15. Архивировано из оригинала 2009-03-08 . Получено 2010-03-18 .
  2. ^ Корпорация Microsoft (2010-07-23). ​​"MS-DOC - Спецификация структуры двоичного формата файла Word (.doc)" . Получено 2010-08-08 .
  3. ^ "Что такое DjVu - DjVu.org". DjVu.org . Архивировано из оригинала 2019-01-21 . Получено 2009-03-05 .
  4. ^ Корпорация Microsoft (май 1999 г.). "Спецификация формата Rich Text Format (RTF), версия 1.6" . Получено 13.03.2010 .
  5. ^ "4.3 Форматы файлов, отличные от HTML". Подразделение электронного правительства. Май 2002 г. Архивировано из оригинала 18 февраля 2010 г. Получено 13 марта 2010 г.
  6. ^ "RTF (.rtf) — Документация по языку Wolfram". reference.wolfram.com .
  7. ^ "WD: Спецификация формата Rich Text Format (RTF) 1.7". support.microsoft.com .
  8. ^ Ранджан Парекх, Ранджан (2006). Принципы мультимедиа . Tata McGraw-Hill. стр. 87. ISBN 0-07-058833-3.
  • Трудности перевода: проблемы взаимодействия открытых стандартов — ODF и OOXML в качестве примеров
Retrieved from "https://en.wikipedia.org/w/index.php?title=Document_file_format&oldid=1217810072"