Текстовая аннотация — это практика и результат добавления примечания или глоссария к тексту, который может включать в себя выделение или подчеркивание, комментарии, сноски, теги и ссылки. Текстовые аннотации могут включать заметки, написанные для личных целей читателя, а также общие аннотации, написанные для целей совместного письма и редактирования , комментариев или социального чтения и обмена. В некоторых областях текстовая аннотация сопоставима с метаданными, поскольку она добавляется post hoc и предоставляет информацию о тексте без принципиального изменения исходного текста. [1] Текстовые аннотации иногда называют marginalia , хотя некоторые резервируют этот термин специально для рукописных заметок, сделанных на полях книг или рукописей. Было обнаружено, что аннотации полезны и помогают развивать знания английской литературы.
Аннотации могут быть как частными, так и общедоступными, включая рукописные и основанные на информационных технологиях аннотации. Аннотации отличаются от заметок, поскольку аннотации должны быть физически написаны или добавлены к фактическому оригинальному фрагменту. [2] Это может быть запись на странице книги или выделение строки, или, если фрагмент цифровой, комментарий или сохраненное выделение или подчеркивание в документе. Для получения информации об аннотации веб-контента, включая изображения и другой нетекстовый контент, см. также Веб-аннотация .
Текстовая аннотация может быть такой же старой, как и написание на носителях, где можно было сделать дополнительную копию с разумными усилиями. Это стало заметной деятельностью около 1000 г. н.э. в комментариях к Талмуду и арабских риторических трактатах. В эпоху Средневековья писцы, которые копировали рукописи, часто делали пометки на полях, которые затем распространялись вместе с рукописями и, таким образом, передавались сообществу; иногда аннотации копировались на новые версии, когда такие рукописи позже переписывались. [3]
С развитием печатного станка и относительной простотой распространения и покупки индивидуальных (а не общих) копий текстов распространенность социальных общих аннотаций снизилась, и текстовая аннотация стала более частной деятельностью, состоящей из взаимодействия читателя с текстом. [3] Аннотации, сделанные на общих копиях текстов (например, библиотечных книгах), иногда рассматриваются как обесценивание текста или как акт порчи. Таким образом, технологии печати поддерживают распространение аннотаций в первую очередь как формальных научных комментариев или текстовых сносок или концевых сносок, а не маргинальных рукописных комментариев, сделанных частными читателями, хотя рукописные комментарии или аннотации были распространены при совместном написании или редактировании. [3]
Компьютерные технологии предоставили новые возможности для индивидуальных и социально распределенных текстовых аннотаций, которые поддерживают множество целей, включая индивидуальные цели чтения читателей, обучение , социальное чтение , написание и редактирование и другие практики. Текстовая аннотация в системах информационных технологий (ИТ) поднимает технические вопросы доступа, связи и хранения , которые, как правило, не имеют отношения к бумажной текстовой аннотации, и поэтому исследования и разработки таких систем часто затрагивают эти области. [1]
Текстовые аннотации могут выполнять множество функций как для личного, так и для публичного чтения и общения. В своей статье «От краев к центру: будущее аннотации» ученые Джоанна Вулф и Кристин Нойвирт выделяют четыре основные функции, которые текстовые аннотации обычно выполняют в современную эпоху, в том числе: (1) «облегчение чтения и последующих задач по письму», что включает аннотации, которые поддерживают чтение как в личных, так и в профессиональных целях; (2) «подслушивание идей других читателей», что подразумевает обмен аннотациями; (3) «предоставление обратной связи писателям или содействие общению с соавторами», что может включать личную, профессиональную и связанную с образованием обратную связь; и (4) «привлечение внимания к темам и важным отрывкам», для чего часто используются научные аннотации, сноски и выноски. [3] Что касается способов, которыми аннотации могут поддерживать индивидуальные задания по чтению, Кэтрин Маршалл указывает, что способы, которыми читатели аннотируют тексты, зависят от цели, мотивации и контекста чтения. Читатели могут аннотировать, чтобы помочь интерпретировать текст, привлечь внимание к разделу для будущего обращения или чтения, поддержать память и припоминание, помочь сосредоточить внимание на тексте во время чтения, решить проблему, связанную с текстом, или создать аннотации, не связанные конкретно с текстом вообще. [4]
Образовательные исследования в области аннотирования текста изучили роль, которую могут играть как личные, так и общие текстовые аннотации в поддержке учебных целей и коммуникации . Многие образовательные исследования изучают, как личные аннотации текстов студентами поддерживают понимание и память; например, исследования показывают, что аннотирование текстов вызывает более глубокую обработку информации, что приводит к лучшему воспроизведению информации. [3] Поскольку аннотации делаются во время чтения с письменными принадлежностями в руках, читатели должны быть более осведомлены о своих мыслях во время чтения. Это означает, что читатели, наряду с созданием заметок, помогающих им запомнить или лучше понять содержание, активно вовлечены в деятельность и, следовательно, более восприимчивы к информации при аннотировании текста. [2]
Другие области образовательных исследований изучают преимущества аннотаций текста, которыми обмениваются в социальных сетях, для совместного обучения , как для обмена аннотациями на бумажных носителях, так и для обмена аннотациями на основе ИТ. Например, исследования Джоанны Вулф изучали преимущества воздействия аннотаций других людей на учащихся-читателей и писателей. В исследовании 2000 года Вулф обнаружила, что воздействие аннотаций других людей на учащихся влияет на их восприятие аннотаторов, что, в свою очередь, формирует их реакцию на материал и их письменные продукты. [5] В более позднем исследовании Вулф обнаружила, что просмотр письменных комментариев других людей к тексту на бумаге, особенно пар аннотаций, которые представляют противоположные ответы на текст, может помочь учащимся заняться критическим чтением и принятием позиции, необходимыми для эффективного аргументативного письма . [6]
Хотя общие аннотации могут быть полезны отдельным читателям, «с 1920-х годов теория грамотности все больше подчеркивает важность социальных факторов в развитии грамотности». [7] Таким образом, общие аннотации могут не только помочь лучше понять содержание конкретного текста, но и могут помочь в приобретении навыков грамотности. Например, мать может оставлять пометки внутри книги, чтобы привлечь внимание своего ребенка к определенной теме или концепции; благодаря развитию аудиоаннотаций родители теперь могут оставлять заметки для детей, которые только начинают читать и могут испытывать трудности с текстовыми аннотациями. [7]
Более поздние исследования эффектов общих текстовых аннотаций были сосредоточены на учебных приложениях для веб-систем аннотаций, некоторые из которых были разработаны на основе рекомендаций по дизайну из исследований, описанных выше. Например, Ананда Гунавардена, Аарон Тан и Дэвид Кауфер провели пилотное исследование, чтобы изучить, поощряет ли аннотирование документов в Classroom Salon, веб-платформе аннотаций и социального чтения, активное чтение, обнаружение ошибок и сотрудничество в курсе компьютерных наук в Университете Карнеги-Меллона . Это исследование предположило корреляцию между общей успеваемостью студентов в курсе и их способностью находить ошибки в тексте, который они аннотировали в Classroom Salon; также было обнаружено, что студенты, скорее всего, изменят свои аннотации в ответ на аннотации, сделанные другими в курсе. [8]
Аналогичным образом, веб-инструмент аннотации HyLighter использовался в курсе письма на первом году обучения и показал улучшение развития ментальных моделей текстов у студентов, включая поддержку понимания прочитанного, критического мышления и способности разрабатывать тезис. Сотрудничество с коллегами и экспертами вокруг общего текста улучшило эти навыки и сблизило понимание сообществ. [9]
Метаанализ эмпирических исследований использования инструментов социальной аннотации (SA) в высшем образовании показывает, что такие инструменты были протестированы в нескольких курсах, среди которых английский язык , спортивная психология и гипермедиа . Исследования показали, что функции социальной аннотации, включая комментирование, обмен информацией и выделение, могут поддерживать обучение, разработанное для содействия совместному обучению и общению, а также пониманию прочитанного, метапознанию и критическому анализу. Несколько исследований показали, что студентам понравилось использовать инструменты социальной аннотации, и что это повысило мотивацию в курсе. [10]
Также было обнаружено, что « мультисенсорные » аннотации помогают учащимся не только запоминать информацию в классе, но и тем, кто пытается выучить новый язык. [ требуется цитата ] Изображения можно размещать рядом со словами или связывать со словами, чтобы люди могли лучше понять, что означает это слово, глядя на него. [ требуется цитата ] То же самое можно сделать с аудиоклипом того, как это слово произносится, а также его значением. Конечно, это проще сделать с помощью технологий, и для того, чтобы быть именно аннотацией, она должна быть встроена в ссылочный документ. Однако в физических копиях текста изображение может быть нарисовано рядом со словом и все равно оставаться сенсорной аннотацией. Такая форма аннотации способствует пониманию, особенно в классе, потому что она требует большего участия мозга учащихся для удержания предоставленной информации. [11]
Текстовые аннотации давно используются в процессах написания и редактирования как способ для рецензентов предлагать изменения и сообщать о тексте. [3] Например, в книгоиздании сотрудничество авторов и редакторов по разработке и редактированию рукописи часто включает обмен как встроенными правками или примечаниями, так и аннотациями на полях. Аналогичным образом, редакторы часто делают аннотации на полях или заметки, которые объясняют или предлагают исправления или направлены автору в виде вопросов или предложений (обычно называемых «запросами»). [12] Асинхронное совместное письмо и разработка документов часто зависят от текстовых аннотаций как способа не только предлагать исправления, но и обмениваться идеями во время разработки документа или содействовать принятию групповых решений, хотя такие процессы часто осложняются использованием различных коммуникационных технологий (таких как телефонные звонки или электронные письма, а также совместное использование документов) для различных задач. [13] Текстовые аннотации также могут функционировать, чтобы позволить членам группы или сообщества общаться по поводу общего текста, например, как врач аннотирует карту пациента. [3]
В области совместной работы с использованием компьютеров было проведено много исследований функциональности и дизайна систем коллективного письма на основе ИТ, которые часто поддерживают аннотирование текста . [14]
В корпусной лингвистике , цифровой филологии и обработке естественного языка аннотации используются для объяснения лингвистических, текстовых или других особенностей текста (или других цифровых представлений естественного языка). В лингвистике аннотации включают комментарии и метаданные; нетранскрипционные аннотации также являются нелингвистическими .
В этих дисциплинах аннотации являются основой для количественных исследований , эмпирических исследований и применения машинного обучения . В отличие от аннотаций в вышеупомянутых применениях (которые встречаются очень редко), лингвистическая аннотация обычно требует, чтобы каждый элемент (токен) в тексте нес одну или несколько аннотаций, и чтобы существовали сложные отношения между различными аннотациями. Существует ряд специализированных форматов (и инструментов) для этой цели, ниже показана аннотация с использованием в проекте Universal Dependencies . Для ясности обычно используемые значения, разделенные табуляцией, были заменены таблицей HTML.
Номер слова | Как написано | Строковое значение ( FORM ) | Часть речи ( POS ) | Лемма ( LEMMA ) | Морфологические признаки ( FEAT ) | Синтаксические зависимости ( HEAD относительно номера слова) | Синтаксические отношения (зависимости, DEP ) | Расширенные зависимости | Комментарии |
---|---|---|---|---|---|---|---|---|---|
1 | Что | что | ДЭТ | ВДТ | PronType=Int | 2 | дет | 2:дет | _ |
2 | язык | язык | СУЩЕСТВИТЕЛЬНОЕ | НН | Число=Петь | 4 | nsubj:пасс | 4:nsubj:pass | _ |
3 | является | быть | AUX | ВБЗ | Число=Пение|Лицо=3|Время=Настоящее|Форма глагола=Конечное | 4 | aux:пасс | 4:вспомогательный:пасс | _ |
4 | говорили | разговаривать | ГЛАГОЛ | ВБН | ГлаголФорма=Прошедшее | 0 | корень | 0:корень | _ |
5 | в | в | АДП | В | _ | 6 | случай | 6:дело | _ |
6 | Игуасу | Игуасу | ПРОПН | ННП | Число=Петь | 4 | обл | 4:обл:в | ПробелПосле=Нет |
7 | ? | ? | ПУНКТ | . | _ | 4 | пункт | 4:пункт | _ |
Визуализация примера представлена на рис. 2. Помимо аннотаций на уровне слов, слово (а также предложение и т. д.) в этом формате может нести метаданные.
Существуют и другие различные форматы аннотаций, часто в сочетании с определенными программными обеспечениями для их создания, обработки или запроса , см. обзор Ide et al. (2017) [15] . Linguistic Annotation Wiki [16] описывает инструменты и форматы для создания и управления лингвистическими аннотациями. Отдельные проблемы и приложения также обсуждаются в разделе Перекрывающаяся разметка и веб-аннотация . Помимо значений, разделенных табуляцией, и других текстовых форматов, форматы для лингвистических аннотаций часто основаны на языках разметки, таких как XML (и ранее, SGML ), более сложные аннотации могут также использовать графовые модели данных и форматы, такие как JSON-LD , например, в соответствии со стандартом веб-аннотаций .
Лингвистическая аннотация имеет независимую исследовательскую традицию и собственную терминологию: [15] Цель аннотации обычно называется «отмечаемым», тело аннотации — «аннотацией», связь между аннотацией и отмечаемым обычно выражается в формате аннотации (например, путем размещения аннотации и текста рядом), поэтому явные привязки не нужны.
Исследования в области проектирования и разработки систем аннотаций используют специальную терминологию для обозначения отдельных структурных компонентов аннотаций, а также различают варианты отображения цифровых аннотаций.
Структурные компоненты любой аннотации можно грубо разделить на три основных элемента: тело , якорь и маркер . Тело аннотации включает в себя символы и текст, созданные читателем, такие как рукописные комментарии или звездочки на полях. Якорь — это то, что указывает на объем исходного текста, к которому относится тело аннотации; он может включать в себя круги вокруг разделов, скобки, выделения, подчеркивания и т. д. Аннотации могут быть привязаны к очень широким фрагментам текста (например, ко всему документу) или к очень узким разделам (например, к определенной букве, слову или фразе). Маркер — это визуальное представление якоря, например, является ли он серым подчеркиванием или желтым выделением. Аннотация, которая имеет тело (например, комментарий на полях), но не имеет конкретного якоря, не имеет маркера. [4]
Системы аннотаций на базе ИТ используют различные варианты отображения аннотаций, в том числе:
Интерфейсы аннотаций также могут позволять выделение или подчеркивание, а также цепочку обсуждений. [3] [17] Обмен и общение посредством аннотаций, привязанных к определенным документам, иногда называют привязанным обсуждением . [6]
Системы аннотаций на основе ИТ включают автономные и клиент-серверные системы . В 1980-х и 1990-х годах ряд таких систем был создан в контексте библиотек , патентных бюро и юридической обработки текстов. Их разработка привела исследователей к созданию таксономий форм аннотаций. [18] Исследования текстовых аннотаций проводились в нескольких учреждениях, включая исследовательские центры Xerox в Пало-Альто и Гренобле (Франция), Центральную исследовательскую лабораторию Hitachi (в частности, для аннотации патентов), а также в связи со строительством новой Французской национальной библиотеки между 1989 и 1995 годами [19] в Институте исследований в области информатики в Тулузе и в компании AIS (Advanced Innovation Systems).
Функциональность аннотаций присутствует в программном обеспечении для обработки текста уже много лет посредством встроенных заметок, отображаемых как всплывающие окна, сноски и концевые сноски; однако только недавно функциональность для отображения аннотаций в виде заметок на полях появилась в таких программах, как OpenOffice.org / LibreOffice Writer и Microsoft Word . Персональные или автономные аннотации включают программное обеспечение для обработки текста, которое поддерживает встроенные или закрепленные текстовые аннотации, а также Adobe Acrobat , который в дополнение к комментированию позволяет выделять текст, делать штампы и использовать другие типы разметки. [1]
Тим Бернерс-Ли уже реализовал концепцию [20] прямого редактирования веб-документов в 1990 году в WorldWideWeb , первом веб-браузере, [21] но более поздние портированные версии удалили эту совместную возможность. [20] Ранняя версия NCSA Mosaic в 1993 году также включала возможность совместного аннотирования, [22] хотя она была быстро удалена. Затем Web Distributed Authoring and Versioning, WebDAV , был повторно представлен как расширение.
Другой подход к распределенному созданию заключается в том, чтобы сначала собрать множество аннотаций от широкой общественности, а затем объединить их все для создания следующей версии документа. Этот подход был впервые предложен Stet , системой, созданной для сбора комментариев к черновикам версии 3 GNU General Public License . Эта система возникла после определенного требования, которому она полностью соответствовала, но не была настолько легко настраиваемой, чтобы быть удобной для аннотирования любого другого документа в Интернете. Система co-ment использует концепции интерфейса аннотаций, аналогичные Stet, но она основана на совершенно новой реализации, использующей Django / Python на стороне сервера и различные библиотеки AJAX, такие как JQuery, на стороне клиента. И Stet, и co-ment лицензируются в соответствии с GNU Affero General Public License .
С 2011 года некоммерческая организация Hypothes Is Project [23] предлагает бесплатный открытый веб-сервис аннотаций Hypothes.is . Сервис предлагает аннотации через расширение Chrome, букмарклет или прокси-сервер, а также интеграцию в LMS или CMS . Аннотировать можно как веб-страницы , так и PDF-файлы . Другие веб-системы текстовых аннотаций представляют собой программное обеспечение для совместной работы для распределенного редактирования и управления версиями текста, которые также имеют интерфейсы аннотаций и комментариев.
Специализированные веб-текстовые аннотации существуют в контексте научных публикаций, как для рецензирования, так и после публикации. Онлайновый журнал PLoS ONE , издаваемый Публичной научной библиотекой , разработал собственную веб-систему, в которой ученые и общественность могут комментировать опубликованные статьи. Аннотации отображаются в виде всплывающих окон с якорем в тексте.
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ){{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ){{cite book}}
: |journal=
проигнорировано ( помощь )