Инфобокс

Шаблон, используемый для сбора и представления подмножества информации о предмете
Реальный информационный блок из вагона 43185 класса 43 компании British Rail, эксплуатируемого компанией First Great Western.

Информационное поле — это цифровая или физическая таблица, используемая для сбора и представления подмножества информации о ее предмете, например, документе . Это структурированный документ, содержащий набор пар атрибут-значение , [1] и в Википедии представляет собой сводку информации о предмете статьи . [ 2] Таким образом, они сопоставимы с таблицами данных в некоторых аспектах. При представлении в более крупном документе, который он резюмирует, информационное поле часто представляется в формате боковой панели .

Информационное поле можно реализовать в другом документе, включив его в этот документ и указав некоторые или все пары атрибут-значение, связанные с этим информационным полем, что называется параметризацией .

Википедия

Информационное поле может использоваться для обобщения информации статьи в Википедии . [3] Они используются в похожих статьях для обеспечения согласованности представления путем использования общего формата. [4] [2] Первоначально информационные поля (и шаблоны в целом) использовались для целей макета страницы . [2] Информационное поле может быть включено в статью путем указания значения для некоторых или всех его параметров . [5] Используемое имя параметра должно быть таким же, как указано в шаблоне информационного поля, но с ним может быть связано любое значение. [5] Имя отделяется от значения знаком равенства . [5] Имя параметра может рассматриваться как атрибут темы статьи. [6]

{{ Infobox готовая еда | имя =  | изображение =  | размер_изображения =  | подпись =  | альтернативное_имя =  | страна =  | регион =  | создатель =  | курс =  | тип =  | подается =  | основной_ингредиент =  | вариации =  | калории =  | другое =  }}
{{ Infobox готовая еда | name = Crostata | image = Crostata limone e zenzero 3.jpg | image_size =  | caption = Crostata с лимонно-имбирной начинкой | alternative_name =  | country =  [[ Italy ]] | region =  [[ Lombardia ]] | creator =  | course =  [[ Dessert ]] | type =  [[ Tart ]] | serve =  | main_ingredient = Тесто, [[ jam ]] или [[ ricotta ]] , фрукты | variations =  ''Crostata di frutta'' , ''crostata di ricotta'' , много других сладких или соленых вариаций | calorities =  | other =  }}
Информационное поле Infobox подготовило еду, используемую в статьях Википедии, посвященных еде, без указания значений ее параметров (атрибутов).Тот же информационный блок, который реализован в статье crostata . Значения находятся справа от знака равенства (=), а имена параметров совпадают с именами параметров в спецификации шаблона информационного блока. Значения указаны в вики-разметке : записи, заключенные в квадратные скобки (например, [[Tart]]), будут отображаться как ссылка на соответствующую статью Википедии (например, Tart ), а связанный файл будет включен в статью вместо ее разметки.
Информационное поле для статьи Википедии Crostata, отображаемое движком веб-браузера на настольном компьютере

В Википедии инфобокс включается в статью путем заключения его имени и пар атрибут-значение в двойные фигурные скобки . Затем программное обеспечение MediaWiki, на котором работает Википедия, анализирует документ, для которого инфобокс и другие шаблоны обрабатываются процессором шаблонов . Это шаблонизатор , который создает веб-документ и таблицу стилей , используемую для представления документа. Это позволяет отделить дизайн инфобокса от содержимого, которым он манипулирует; [2] то есть дизайн шаблона может быть обновлен без влияния на информацию в нем, и новый дизайн будет автоматически распространяться на все статьи, которые включают инфобокс. [4] Обычно инфобоксы форматируются так, чтобы отображаться в правом верхнем углу статьи Википедии в десктопном представлении [3] или в верхней части в мобильном представлении.

Размещение инфобокса в викитексте статьи важно для обеспечения доступности . [7] Лучше всего размещать их после шаблонов устранения неоднозначности (тех, которые направляют читателей к статьям по темам со схожими названиями) и шаблонов обслуживания (например, тех, которые отмечают статью как не имеющую ссылок), но перед всем остальным содержимым . [8] [9]

Баеза-Йейтс и Кинг говорят, что некоторые редакторы считают шаблоны, такие как информационные поля, сложными, [10] поскольку шаблон может скрывать текст о свойстве или ресурсе, который редактор хочет изменить; это усугубляется цепочками шаблонов, то есть шаблонами, включенными в другие шаблоны. [10]

По состоянию на август 2009 года английская Википедия использовала около 3000 шаблонов инфобоксов, которые в совокупности использовали более 20 000 атрибутов. [11] С тех пор многие из них были объединены, чтобы уменьшить избыточность. По состоянию на июнь 2013 года было не менее 1 345 446 трансляций родительского шаблона инфобокса , [12] использовавшегося некоторыми, но не всеми инфобоксами, в 4 251 127 статьях.

Имя инфобокса обычно «Инфобокс [жанр]»; однако широко используемые инфобоксы могут иметь более короткие имена, например «таксобокс» для таксономии. [8]

Машинное обучение

Около 44,2% статей Википедии содержали инфобокс в 2008 году [13] и около 33% в 2010 году [14] Автоматизированное извлечение семантических знаний с использованием алгоритмов машинного обучения используется для «извлечения машинно-обрабатываемой информации при относительно низкой стоимости сложности». [1] Однако низкий охват усложняет задачу, хотя это можно частично преодолеть, дополняя данные статьи данными из категорий , в которые включена статья. [13] Французская Википедия инициировала проект Infobox Version 2 в мае 2011 года. [15] [16]

Знания, полученные с помощью машинного обучения, можно использовать для улучшения статьи, например, с помощью автоматизированных программных предложений редакторам по добавлению данных инфобокса. [13] Проект iPopulator создал систему для добавления значения к параметру инфобокса статьи посредством автоматизированного анализа текста этой статьи. [11]

DBpedia использует структурированный контент, извлеченный из информационных блоков [2] с помощью алгоритмов машинного обучения, для создания ресурса связанных данных в семантической паутине ; Тим Бернерс-Ли описал его как «один из самых известных» компонентов проекта связанных данных. [17]

Машинное извлечение создает тройку, состоящую из субъекта, предиката или отношения и объекта. [1] Каждая пара атрибут-значение информационного поля используется для создания RDF- утверждения с использованием онтологии . [18] Этому способствует более узкий разрыв между Википедией и онтологией, чем существующий между неструктурированным или свободным текстом и онтологией. [19]

Семантическая связь между субъектом и объектом устанавливается предикатом. [1] В примере информационного поля тройка ("crostata", тип, "tart") указывает, что crostata является типом tart . Тема статьи используется в качестве субъекта, имя параметра используется в качестве предиката, а значение параметра - в качестве объекта. [18] [1] Каждый тип информационного поля сопоставляется с классом онтологии, а каждое свойство (параметр) внутри информационного поля сопоставляется со свойством онтологии. [20] Эти сопоставления используются при анализе статьи Википедии для извлечения данных.

Метаданные

Скриншот ссылки на эту статью, размещенной в группах по работе с приложениями Microsoft
Ссылка на эту статью, размещенная в Microsoft Teams и приложении, с использованием метаданных из информационного поля, чтобы сделать ссылку более полной, добавив изображение и краткий текст.

Представление основных фактов статьи в информационном поле также позволяет представлять факты в удобном для машин виде, что обеспечивает дополнительную функциональность, например, когда ссылка на Википедию вставляется в совместимую программу, вместо публикации только самой ссылки также публикуется другая информация, например изображение статьи.

Цитаты

  1. ^ abcde Баеза-Йейтс и Кинг 2009, стр. 31.
  2. ^ abcde Liyang 2011, стр. 385.
  3. ^ ab Broughton 2008, стр. 357.
  4. ^ ab Broughton 2008, стр. 17.
  5. ^ abc Broughton 2008, стр. 18.
  6. ^ Баеза-Йейтс и Кинг 2009, стр. 30.
  7. ^ Бротон 2008, стр. 234.
  8. ^ ab Broughton 2008, стр. 235.
  9. ^ Политика английской Википедии о доступности указана в Wikipedia:Manual of Style/Accessibility . Политика о макете викитекста указана в Wikipedia:Manual of Style/Layout и Wikipedia:Manual of Style/Lead section .
  10. ^ ab Baeza-Yates & King 2009, стр. 345.
  11. ^ аб Ланге, Бём и Науманн 2010, стр. 7.
  12. ^ "Jarry1250's Toolsserver Tools - Template transclusion count". Список проектов Wikimedia . 7 июня 2013 г. Получено 7 июня 2013 г.
  13. ^ abc Baeza-Yates & King 2009, стр. 28.
  14. ^ Ланге, Бём и Науманн 2010, с. 5.
  15. ^ Гертман, Рейнхардт и Топпен 2011, стр. 493.
  16. ^ Проект размещен на странице французской Википедии Infobox/V2.
  17. ^ Миллер 2008.
  18. ^ ab Liyang 2011, стр. 387.
  19. ^ Вирвоу и Мацуура 2012, с. 315.
  20. ^ Лиян 2011, стр. 395.

Цитируемые работы

  • Баеза-Йейтс, Рикардо; Кинг, Ирвин, ред. (2009). Услуги ткачества и люди в Интернете . Springer. ISBN 9783642005695. LCCN  2009926100.
  • Бротон, Джон (14 июля 2008 г.). Барбер, Нэн; Мейерс, Питер (ред.). Википедия — Недостающее руководство . О'Рейли Медиа . ISBN 9780596553777.
  • Гертман, Стэн; Рейнхардт, Вольфганг; Топпен, Фред, ред. (2011). Продвижение геоинформационной науки в меняющемся мире . Конспект лекций по геоинформации и картографии. Том. 1. Спрингер. дои : 10.1007/978-3-642-19789-5. ISBN 9783642197888. ISSN  1863-2246. LCCN  2011925152.
  • Ланге, Дастин; Бём, Кристоф; Науманн, Феликс (2010). Извлечение структурированной информации из статей Википедии для заполнения информационных полей. Университет Потсдама. ISBN 9783869560816. Архивировано из оригинала 2014-06-06 . Получено 2013-06-02 . {{cite book}}: |work=проигнорировано ( помощь )
  • Ю, Лиян (2011). Руководство разработчика по семантической паутине . Springer. Bibcode :2011adgt.book.....Y. doi :10.1007/978-3-642-15970-1. ISBN 9783642159695.
  • Миллер, Пол (2008-02-07). «Сэр Тим Бернерс-Ли беседует с Талисом о семантической паутине». Транскрипция CastingWords. Talis Group. Архивировано из оригинала 2013-05-10 . Получено 2013-06-02 .
  • Вирвоу, Мария; Мацуура, Саэко, ред. (2012). Программная инженерия на основе знаний: Труды Десятой совместной конференции по программной инженерии на основе знаний . Границы и искусственный интеллект и приложения. Том 240. IOS Press. ISBN 9781614990932. LCCN  2012943674.

Дальнейшее чтение

  • Киран, Кумар Н.; Сантош, ГСК; Варма, Васудева (июнь 2011 г.). Многопрофильный информационный поиск . Конспект лекций по информатике. Том 6653. Springer Berlin Heidelberg. doi :10.1007/978-3-642-21353-3. ISBN 9783642213533. ISSN  0302-9743. S2CID  9901886.
  • Chutiporn, Anutariya; Domingue, John, ред. (2008). Семантическая паутина: 3-я Азиатская конференция по семантической паутине, ASWC 2008, Бангкок, Таиланд, 8-11 декабря 2008 г. Труды . Конспект лекций по информатике. Том 5367. Springer. ISBN 9783540897033. ISSN  0302-9743.
  • Wu, Fei; Hoffmann, Ralph; Weld, Daniel s. (2008). «Извлечение информации из Википедии». Труды 14-й международной конференции ACM SIGKDD по обнаружению знаний и добыче данных . Ассоциация вычислительной техники . стр. 731–739. doi :10.1145/1401890.1401978. ISBN 9781605581934. S2CID  7781746.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Infobox&oldid=1246924583"