Трансляционная биоинформатика ( TBI ) — это область, которая возникла в 2010-х годах для изучения медицинской информатики , сосредоточенная на конвергенции молекулярной биоинформатики , биостатистики , статистической генетики и клинической информатики. Ее фокус заключается в применении методологии информатики к растущему объему биомедицинских и геномных данных для формулирования знаний и медицинских инструментов, которые могут использоваться учеными, врачами и пациентами. [1] Кроме того, она включает применение биомедицинских исследований для улучшения здоровья человека с помощью компьютерной информационной системы. [2] TBI использует интеллектуальный анализ данных и анализ биомедицинской информатики для создания клинических знаний для применения. [3] Клинические знания включают поиск сходств в популяциях пациентов, интерпретацию биологической информации для предложения терапевтических методов лечения и прогнозирования результатов лечения. [4]
Трансляционная биоинформатика — относительно молодая область в трансляционных исследованиях. [5] [6] Google Trends показывает, что использование термина « биоинформатика » сократилось с середины 1990-х годов, когда он был предложен в качестве преобразующего подхода к биомедицинским исследованиям. [6] Однако он был придуман почти десятью годами ранее. [7] Затем TBI был представлен как средство для облегчения организации данных, доступности и улучшенной интерпретации имеющихся биомедицинских исследований. [6] [8] Он считался инструментом поддержки принятия решений, который мог бы интегрировать биомедицинскую информацию в процессы принятия решений, которые в противном случае были бы упущены из-за природы человеческой памяти и моделей мышления. [8]
Первоначально TBI фокусировался на онтологии и дизайне словаря для поиска в хранилищах больших объемов данных. Однако эта попытка была в значительной степени безуспешной, поскольку предварительные попытки автоматизации привели к дезинформации. TBI необходимо было разработать базовую линию для перекрестных ссылок на данные с алгоритмами более высокого порядка, чтобы связать данные, структуры и функции в сетях. [6] Это шло рука об руку с фокусом на разработке учебной программы для программ аспирантуры и капитализации для финансирования на основе растущего общественного признания потенциальных возможностей в TBI. [6]
Когда в начале 2000-х годов был завершен первый черновик генома человека , TBI продолжала расти и демонстрировать известность как средство соединения биологических открытий с клинической информатикой , влияя на возможности как для биологии, так и для здравоохранения. [9] Профилирование экспрессии, интеллектуальный анализ текста для анализа тенденций, интеллектуальный анализ данных на основе популяции, обеспечивающий биомедицинскую информацию, и разработка онтологий были изучены, определены и установлены как важные вклады в TBI. [6] [10] Достижения в этой области, которые использовались для обнаружения знаний, включают связывание клинических записей с геномными данными, связывание лекарств с происхождением, секвенирование всего генома для группы с общим заболеванием и семантику в интеллектуальном анализе литературы. [10] Было обсуждение совместных усилий по созданию межюрисдикционных стратегий для TBI, особенно в Европе. Последнее десятилетие также стало свидетелем развития персонализированной медицины и обмена данными в фармакогеномике . Эти достижения укрепили общественный интерес, привлекли средства для инвестиций в обучение и дальнейшее развитие учебных программ, увеличили спрос на квалифицированный персонал в этой области и подтолкнули текущие исследования и разработки в области черепно-мозговой травмы. [6]
В настоящее время исследования TBI охватывают несколько дисциплин; однако применение TBI в клинических условиях остается ограниченным. В настоящее время оно частично применяется в разработке лекарственных препаратов , нормативном обзоре и клинической медицине . [8] Возможности применения TBI гораздо шире, поскольку все больше медицинских журналов упоминают термин «информатика» и обсуждают темы, связанные с биоинформатикой. [2] Исследования TBI опираются на четыре основные области дискурса: клиническая геномика, геномная медицина, фармакогеномика и генетическая эпидемиология . [9] Растет число конференций и форумов, посвященных TBI, с целью создания возможностей для обмена знаниями и развития отрасли. Общие темы, которые поднимались на последних конференциях, включают: (1) персональную геномику и геномную инфраструктуру, (2) исследования лекарственных препаратов и генов для выявления нежелательных явлений, взаимодействия и повторного использования лекарственных препаратов, (3) биомаркеры и представление фенотипа, (4) секвенирование, наука и системная медицина, (5) вычислительные и аналитические методологии для черепно-мозговой травмы и (6) применение связующих генетических исследований и клинической практики. [8] [10] [11]
С помощью биоинформатиков биологи могут анализировать сложные данные, создавать веб-сайты для экспериментальных измерений, содействовать обмену результатами измерений и сопоставлять результаты с клиническими результатами. [2] Трансляционные биоинформатики, изучающие конкретное заболевание, будут иметь больше выборочных данных относительно данного заболевания, чем отдельный биолог, изучающий это заболевание в одиночку.
С момента завершения генома человека новые проекты теперь пытаются систематически анализировать все изменения генов при таком заболевании, как рак , а не сосредотачиваться на нескольких генах за раз. В будущем крупномасштабные данные будут интегрироваться из разных источников для извлечения функциональной информации. Наличие большого количества геномов человека позволит проводить статистический анализ их связи с образом жизни, взаимодействием лекарств и другими факторами. Таким образом, трансляционная биоинформатика трансформирует поиск генов болезней и становится важнейшим компонентом других областей медицинских исследований, включая фармакогеномику. [12]
В исследовании, оценивающем вычислительные и экономические характеристики облачных вычислений при выполнении крупномасштабной интеграции данных и анализа геномной медицины, облачный анализ имел схожую стоимость и производительность по сравнению с локальным вычислительным кластером. Это говорит о том, что технологии облачных вычислений могут быть ценной и экономичной технологией для содействия крупномасштабным трансляционным исследованиям в геномной медицине. [13]
В настоящее время доступно огромное количество биоинформатических данных, и их количество продолжает расти. Например, база данных GenBank, финансируемая Национальным институтом здравоохранения (NIH), в настоящее время содержит 82 миллиарда нуклеотидов в 78 миллионах последовательностей, кодирующих 270 000 видов. Эквивалент GenBank для микрочипов экспрессии генов , известный как Gene Expression Omnibus (GEO), содержит более 183 000 образцов из 7 200 экспериментов, и это число удваивается или утраивается каждый год. Европейский институт биоинформатики (EBI) имеет похожую базу данных под названием ArrayExpress, в которой содержится более 100 000 образцов из более чем 3 000 экспериментов. В общей сложности TBI в настоящее время имеет доступ к более чем четверти миллиона образцов микрочипов. [2]
Для извлечения соответствующих данных из больших наборов данных TBI использует различные методы, такие как консолидация данных, федерация данных и хранилище данных . В подходе консолидации данных данные извлекаются из различных источников и централизуются в одной базе данных. Этот подход позволяет стандартизировать разнородные данные и помогает решать проблемы взаимодействия и совместимости между наборами данных. Однако сторонники этого метода часто сталкиваются с трудностями при обновлении своих баз данных, поскольку он основан на единой модели данных. Напротив, подход федерации данных связывает базы данных вместе и извлекает данные на регулярной основе, а затем объединяет данные для запросов. Преимущество этого подхода заключается в том, что он позволяет пользователю получать доступ к данным в реальном времени на одном портале. Однако ограничением этого подхода является то, что собранные данные не всегда могут быть синхронизированы, поскольку они получены из нескольких источников. Хранилище данных предоставляет единую унифицированную платформу для курирования данных. Хранилище данных объединяет данные из нескольких источников в общий формат и обычно используется в биологии исключительно для целей поддержки принятия решений. [14]
Аналитические методы служат для перевода биологических данных с использованием высокопроизводительных методов в клинически значимую информацию. В настоящее время существует множество программного обеспечения и методологий для запроса данных, и это число продолжает расти по мере того, как все больше исследований проводится и публикуется в журналах по биоинформатике, таких как Genome Biology , BMC Bioinformatics , BMC Genomics и Bioinformatics . Чтобы определить наилучший аналитический метод, были созданы такие инструменты, как Weka, для шифрования массива программного обеспечения и выбора наиболее подходящего метода, абстрагируясь от необходимости знать конкретную методологию. [15]
Интеграция данных включает разработку методов, которые используют биологическую информацию для клинических условий. Интеграция данных предоставляет врачам инструменты для доступа к данным, поиска знаний и поддержки принятия решений. Интеграция данных служит для использования богатства информации, доступной в биоинформатике, для улучшения здоровья и безопасности пациентов. Примером интеграции данных является использование систем поддержки принятия решений (DSS), основанных на трансляционной биоинформатике. DSS, используемые в этом отношении, выявляют корреляции в электронных медицинских картах пациентов (EMR) и других клинических информационных системах для оказания помощи врачам в постановке диагноза. [14]
Компании теперь могут предоставлять секвенирование и анализ всего человеческого генома как простую аутсорсинговую услугу. Планируется, что версии систем секвенирования второго и третьего поколения увеличат количество геномов в день на один инструмент до 80. По словам генерального директора Complete Genomics Клиффа Рида, общий рынок секвенирования всего человеческого генома во всем мире вырос в пять раз в 2009 и 2010 годах и оценивался в 15 000 геномов в 2011 году. Более того, если цена упадет до 1000 долларов за геном, он утверждал, что компания все равно сможет получать прибыль. Компания также работает над усовершенствованием процесса, чтобы снизить внутренние затраты примерно до 100 долларов за геном, исключая подготовку образцов и затраты на рабочую силу. [16] [17]
По данным Национального института исследований генома человека (NHGRI), затраты на секвенирование всего генома значительно снизились с более чем 95 миллионов долларов в 2001 году до 7666 долларов в январе 2012 года. Аналогичным образом, затраты на определение одной мегабазы (миллиона оснований) также снизились с более чем 5000 долларов в 2001 году до 0,09 доллара в 2012 году. В 2008 году центры секвенирования перешли от технологий Сэнгера (секвенирование с терминацией дидезоксицепи) к технологиям секвенирования ДНК «второго поколения» (или «следующего поколения») . Это привело к значительному снижению затрат на секвенирование. [18]
TBI имеет потенциал играть значительную роль в медицине; однако, многие проблемы все еще остаются. Главной целью TBI является «разработка информационных подходов для связывания традиционно разрозненных данных и источников знаний, позволяющих как генерировать, так и проверять новые гипотезы». [9] Текущие приложения TBI сталкиваются с проблемами из-за отсутствия стандартов, что приводит к разным методологиям сбора данных. Кроме того, аналитические и хранимые возможности затруднены из-за больших объемов данных, присутствующих в текущих исследованиях. Эта проблема, как прогнозируется, возрастет с персональной геномикой, поскольку она создаст еще большее накопление данных. [6] [9]
Проблемы существуют также в исследовании лекарств и биомаркеров, геномной медицине, метагеномике белкового дизайна, открытии инфекционных заболеваний, курировании данных , поиске литературы и разработке рабочих процессов. [6] Постоянная вера в возможности и преимущества TBI оправдывает дальнейшее финансирование инфраструктуры, защиты интеллектуальной собственности и политик доступности. [6] [19]
Доступное финансирование для TBI за последнее десятилетие увеличилось. [2] Спрос на исследования в области трансляционной биоинформатики отчасти обусловлен ростом во многих областях биоинформатики и медицинской информатики, а отчасти — народной поддержкой таких проектов, как проект «Геном человека» . [7] [9] [20] Этот рост и приток финансирования позволил отрасли создать такие активы, как репозиторий данных об экспрессии генов и данных геномного масштаба, а также добиться прогресса в направлении концепции создания генома стоимостью 1000 долларов и завершения проекта «Геном человека». [9] [20] Некоторые полагают, что TBI вызовет культурный сдвиг в способе обработки научной и клинической информации в фармацевтической промышленности, регулирующих органах и клинической практике. Это также рассматривается как средство перехода от клинических исследований к анализу EMR. [8]
Лидеры в этой области представили многочисленные прогнозы относительно направления TBI и того, какое направление должно принять. Ниже приведен набор прогнозов:
«В мире, богатом информацией, обилие информации означает нехватку чего-то еще — дефицит того, что потребляет информация. То, что потребляет информация, довольно очевидно: она потребляет внимание своих получателей. Следовательно, обилие информации создает скудость внимания и необходимость эффективно распределять это внимание среди избыточного изобилия источников информации, которые она может потребить» (Герберт Саймон, 1971).
Ниже приведен список существующих ассоциаций, конференций и журналов, которые специфичны для TBI. Это ни в коем случае не всеобъемлющий список, и его следует дополнять по мере обнаружения других.
Ниже приведен неполный список программ обучения и сертификации, посвященных черепно-мозговой травме.