В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
Учредил | 2004 |
---|---|
Головное учреждение | Факультет компьютерных наук, Манчестерский университет |
Принадлежность | Манчестерский университет |
Директор | София Ананиаду |
Расположение | , |
Веб-сайт | www.nactem.ac.uk |
Национальный центр текстовой добычи ( NaCTeM ) [1] — это финансируемый государством центр текстовой добычи (ТМ). Он был создан для предоставления поддержки, консультаций и информации о технологиях ТМ и для распространения информации в более широком сообществе ТМ, а также для предоставления услуг и инструментов в ответ на требования академического сообщества Соединенного Королевства.
Программные инструменты и услуги, которые предоставляет NaCTeM , позволяют исследователям применять методы текстового интеллектуального анализа к проблемам в рамках их конкретных областей интересов – примеры этих инструментов приведены ниже. Помимо предоставления услуг, центр также участвует и вносит значительный вклад в сообщество исследователей текстового интеллектуального анализа как на национальном, так и на международном уровне в таких инициативах, как Europe PubMed Central .
Центр расположен в Манчестерском институте биотехнологии и управляется и организуется кафедрой компьютерных наук Манчестерского университета . NaCTeM вносит свой вклад в обработку естественного языка и извлечение информации , включая распознавание именованных сущностей и извлечение сложных взаимосвязей (или событий), которые существуют между именованными сущностями, а также параллельные и распределенные системы интеллектуального анализа данных в биомедицинских и клинических приложениях.
TerMine — это независимый от домена метод автоматического распознавания терминов, который можно использовать для поиска наиболее важных терминов в документе и их автоматического ранжирования. [2]
AcroMine находит все известные развернутые формы аббревиатур , как они встречались в записях Medline , или наоборот, его можно использовать для поиска возможных аббревиатур расширенных форм, как они ранее встречались в Medline, и устранения их неоднозначности. [3]
Medie — интеллектуальная поисковая система для семантического поиска предложений, содержащих биомедицинские корреляции из рефератов Medline. [4] [5]
Facta+ — поисковая система Medline для поиска связей между биомедицинскими концепциями. [6]
Facta+ Visualizer — это веб-приложение, которое помогает понять результаты поиска FACTA+ с помощью интуитивно понятной графической визуализации. [7]
KLEIO — это многогранная семантическая система поиска информации по рефератам Medline.
Europe PMC EvidenceFinder Europe PMC EvidenceFinder помогает пользователям исследовать факты, которые касаются интересующих их объектов в полных текстах статей базы данных Europe PubMed Central . [8]
EUPMC Evidence Finder для анатомических сущностей с мета-знаниями похож на Europe PMC EvidenceFinder, позволяя исследовать факты, касающиеся анатомических сущностей, в полнотекстовых статьях базы данных Europe PubMed Central. Факты можно фильтровать по различным аспектам их интерпретации (например, отрицание, уровень определенности, новизна).
Info-PubMed предоставляет информацию и графическое представление биомедицинских взаимодействий, извлеченных из Medline с использованием технологии глубокого семантического анализа . Это дополняется словарем терминов, состоящим из более чем 200 000 названий белков / генов и идентификацией типов заболеваний и организмов .
ASCOT — это эффективное, семантически улучшенное поисковое приложение, настроенное для документов клинических испытаний. [9]
HOM — это семантическая поисковая система по архивам исторических медицинских документов.
BioLexicon — это крупный терминологический ресурс в области биомедицины. [10]
GENIA — это коллекция справочных материалов для разработки систем анализа биомедицинских текстов.
GREC — это семантически аннотированный корпус рефератов Medline, предназначенный для обучения систем IE и/или ресурсов, которые используются для извлечения событий из биомедицинской литературы. [11]
Это корпус рефератов Medline, аннотированных экспертами с названиями метаболитов и ферментов.
Коллекция корпусов, вручную аннотированных с помощью мелкозернистых, независимых от видов анатомических сущностей, для содействия разработке систем интеллектуального анализа текста, которые могут выполнять подробный и всесторонний анализ биомедицинского научного текста. [12] [13]
Это обогащение корпуса событий GENIA, в котором события обогащаются различными уровнями информации, относящейся к их интерпретации. Цель состоит в том, чтобы позволить системам обучаться, чтобы различать события, которые являются фактической информацией или экспериментальным анализом, определенной информацией от предполагаемой информации и т. д. [14]
Целью проекта Argo является разработка рабочей среды для анализа (в первую очередь аннотирования) текстовых данных. Рабочая среда, доступ к которой осуществляется как к веб-приложению, поддерживает комбинацию элементарных компонентов обработки текста для формирования комплексных рабочих процессов обработки. Она предоставляет функциональные возможности для ручного вмешательства в в противном случае автоматический процесс аннотирования путем исправления или создания новых аннотаций и облегчает совместную работу пользователей, предоставляя возможности совместного использования ресурсов, принадлежащих пользователям. Argo приносит пользу пользователям, таким как проектировщики текстового анализа, предоставляя интегрированную среду для разработки рабочих процессов обработки; аннотаторам/кураторам, предоставляя функции ручной аннотации, поддерживаемые автоматической предварительной и последующей обработкой; и разработчикам, предоставляя рабочую среду для тестирования и оценки текстовой аналитики.
Большие механизмы — это большие, объяснительные модели сложных систем, в которых взаимодействия имеют важные причинно-следственные эффекты. В то время как сбор больших данных все больше автоматизируется, создание больших механизмов остается в значительной степени человеческим усилием, которое становится все более сложным в соответствии с фрагментацией и распределением знаний. Возможность автоматизировать построение больших механизмов может оказать большое влияние на научные исследования. Как один из ряда различных проектов, составляющих программу больших механизмов, финансируемую DARPA , цель состоит в том, чтобы собрать всеобъемлющий большой механизм из литературы и предыдущих экспериментов и использовать его для вероятностной интерпретации данных паномики новых пациентов. Мы интегрируем машинное чтение литературы по раку с вероятностным рассуждением по заявлениям о раке, используя специально разработанные онтологии, вычислительное моделирование механизмов рака (путей), автоматизированную генерацию гипотез для расширения знаний о механизмах и «робота-ученого», который проводит эксперименты для проверки гипотез. Повторяющийся цикл интеллектуального анализа текста, моделирования, экспериментального тестирования и обновления мировоззрения призван привести к расширению знаний о механизмах рака.
Pathtext/Refine — это система, разработанная для интеграции визуализатора пути, систем интеллектуального анализа текста и инструментов аннотирования. [15] [16]
Целью этого проекта является создание хранилища знаний о биоразнообразии Филиппин путем объединения экспертных знаний и ресурсов филиппинских партнеров в соответствующей области с аналитикой больших данных на основе интеллектуального анализа текста Национального центра интеллектуального анализа текста Манчестерского университета. Репозиторий будет представлять собой синергию различных типов информации, например, таксономической, встречающейся, экологической, биомолекулярной, биохимической, тем самым предоставляя пользователям комплексное представление об интересующих их видах, что позволит им (1) проводить предиктивный анализ распределения видов и (2) исследовать потенциальные медицинские применения натуральных продуктов, полученных из филиппинских видов.
Это сотрудничество с группой Text-Mining Европейского института биоинформатики (EBI) и Mimas (центр обработки данных) , формирующее рабочий пакет в проекте Europe PubMed Central (ранее UKPMC), размещенном и координируемом Британской библиотекой . Europe PMC в целом формирует европейскую версию репозитория документов PubMed Central в сотрудничестве с Национальными институтами здравоохранения (NIH) в Соединенных Штатах. Europe PMC финансируется консорциумом ключевых финансирующих организаций из числа спонсоров биомедицинских исследований. Вклад в этот крупный проект заключается в применении решений по интеллектуальному анализу текста для улучшения поиска информации и обнаружения знаний. Таким образом, это применение технологии, разработанной в других проектах NaCTeM, в больших масштабах и в качестве важного ресурса для сообщества биомедицины.
Целью этого проекта является преобразование Библиотеки наследия биоразнообразия (BHL) в социальный цифровой библиотечный ресурс следующего поколения для содействия изучению и обсуждению (через интеграцию социальных сетей) научных документов по биоразнообразию в мировом сообществе и повышения осведомленности широкой общественности об изменениях в биоразнообразии с течением времени. Проект интегрирует новые методы интеллектуального анализа текста, визуализацию, краудсорсинг и социальные сети в BHL. Полученный цифровой ресурс обеспечит полностью взаимосвязанный и индексированный доступ к полному содержанию документов библиотеки BHL с помощью семантически улучшенных и интерактивных возможностей просмотра и поиска, что позволит пользователям легко и эффективно находить именно ту информацию, которая им интересна.
Целью этого проекта является проведение новых исследований в области интеллектуального анализа текста и машинного обучения для преобразования способа проведения обзоров общественного здравоохранения на основе фактических данных ( EBPH ). Цели проекта включают разработку новых неконтролируемых методов интеллектуального анализа текста для получения сходств терминов, поддержку скрининга во время обзоров EBPH и создание новых алгоритмов для ранжирования и визуализации значимых ассоциаций нескольких типов в динамическом и итеративном режиме. Эти недавно разработанные методы будут оцениваться в обзорах EBPH на основе внедрения пилотного проекта для определения уровня трансформации в обзорах EBPH.
{{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite conference}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link)