Основной автор этой статьи, по-видимому, тесно связан с ее темой. ( Август 2011 г. ) |
eTBLAST был бесплатным сервисом текстового сходства, ныне не существующим. Первоначально он был разработан Александром Перцемлидисом и Гарольдом «Скипом» Гарнером в 2005 году в Юго-Западном медицинском центре Техасского университета. Он предлагал доступ к следующим базам данных:
eTBLAST искал в базах данных цитирования [1] и базах данных, содержащих полный текст, таких как PUBMED . Он сравнивал естественный текстовый запрос пользователя с целевыми базами данных, используя гибридный алгоритм поиска. Алгоритм состоял из низкочувствительного, взвешенного, основанного на ключевых словах первого прохода, за которым следовал новый второй проход, основанный на выравнивании предложений. Позднее eTBLAST стал веб-сервисом Лаборатории инноваций в Институте биоинформатики Вирджинии .
Механизм текстового сходства изучал дублирующие публикации и потенциальный плагиат в биомедицинской литературе. eTBLAST получил тысячи случайных образцов рефератов Medline для масштабного исследования. Те, у кого было наибольшее сходство, были оценены, а затем введены в онлайн-базу данных. Работа выявила несколько тенденций, включая увеличивающуюся скорость дублирования в биомедицинской литературе, согласно известным научным журналам Bioinformatics , [2] Anaesthesia and Intensive Care , [3] Clinical Chemistry , [4] Urologic oncology , [5] Nature , [6] and Science . [7]