В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
Минимальные отображения являются результатом усовершенствованной техники семантического сопоставления , техники, используемой в информатике для идентификации информации, которая семантически связана. [1]
Семантическое сопоставление было предложено как допустимое решение проблемы семантической неоднородности, а именно, поддержка разнообразия в знаниях. [2] При наличии любых двух графоподобных структур, например, классификаций, баз данных или XML-схем и онтологий , сопоставление является оператором , который идентифицирует те узлы в двух структурах, которые семантически соответствуют друг другу. Например, применяемый к файловым системам, он может определить, что папка с меткой «car» семантически эквивалентна другой папке «automobile», поскольку они являются синонимами в английском языке.
Предлагаемая методика работает на легких онтологиях, а именно, на древовидных структурах, где каждый узел помечен предложением на естественном языке, например, на английском. [3] Эти предложения переводятся в формальную логическую формулу (в соответствии с недвусмысленным искусственным языком ). Формула кодифицирует значение узла, учитывая его положение в графе. Например, в случае, если папка «car» находится под другой папкой «red», мы можем сказать, что значение папки «car» в этом случае — «red car». Это переводится в логическую формулу «red AND car».
Выход сопоставления — это отображение, а именно набор семантических соответствий между двумя графами. Каждый элемент отображения прикреплен с семантическим отношением , например, эквивалентностью . Среди всех возможных отображений минимальное отображение таково, что все другие элементы отображения могут быть вычислены из минимального набора за время, пропорциональное размеру входных графов (линейное время), и ни один из элементов в минимальном наборе не может быть удален без предотвращения такого вычисления.
Главное преимущество минимальных отображений заключается в том, что они минимизируют количество узлов для последующей обработки. Обратите внимание, что это довольно важная функция, поскольку количество возможных отображений может достигать n × m , где n и m — размер двух входных онтологий. В частности, минимальные отображения становятся критически важными для больших онтологий, например DMOZ , где даже относительно небольшие (неминимальные) подмножества количества возможных элементов отображения, потенциально миллионы из них, неуправляемы.
Минимальные отображения обеспечивают преимущества удобства использования. Для управления отображениями было предоставлено множество систем и соответствующих интерфейсов, в основном графических, но все они плохо масштабируются с количеством узлов. Визуализации больших графов довольно запутанны. [4] Обслуживание меньших отображений намного проще, быстрее и менее подвержено ошибкам.