Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2020 г. ) |
Хемоинформатика (также известная как хемоинформатика ) относится к использованию теории физической химии с компьютерными и информационными методами науки — так называемыми методами « in silico » — в применении к ряду описательных и предписывающих проблем в области химии , включая ее приложения к биологии и связанным с ней молекулярным областям . Такие методы in silico используются, например, фармацевтическими компаниями и в академических учреждениях для помощи и информирования процесса открытия лекарств , например, при проектировании четко определенных комбинаторных библиотек синтетических соединений или для содействия в структурно-ориентированном проектировании лекарств . Эти методы также могут использоваться в химической и смежных отраслях промышленности, а также в таких областях, как экология и фармакология , где химические процессы вовлечены или изучаются. [1]
Химическая информатика была активной областью в различных проявлениях с 1970-х годов и ранее, с деятельностью в академических отделах и коммерческих фармацевтических отделах исследований и разработок. [2] [ нужна страница ] [ нужна цитата ] Термин «хемоинформатика» был определен в его применении к открытию лекарств Ф. К. Брауном в 1998 году: [3]
Хемоинформатика — это смешение этих информационных ресурсов для преобразования данных в информацию, а информации в знания с целью более быстрого принятия более обоснованных решений в области идентификации и оптимизации лекарственных препаратов.
С тех пор оба термина, хемоинформатика и хемоинформатика, использовались, [ необходима ссылка ], хотя, лексикографически , хемоинформатика, по-видимому, используется чаще, [ когда? ] [4] [5] несмотря на то, что ученые в Европе высказались за вариант хемоинформатика в 2006 году. [6] В 2009 году известный журнал Springer в этой области был основан трансатлантическими исполнительными редакторами под названием Journal of Cheminformatics . [7]
Хемоинформатика объединяет научные области химии, компьютерных наук и информационных наук, например, в областях топологии , теории химических графов , поиска информации и интеллектуального анализа данных в химическом пространстве . [8] [ нужна страница ] [9] [ нужна страница ] [10] [11] [ нужна страница ] Хемоинформатика также может применяться для анализа данных в различных отраслях промышленности, таких как целлюлозно- бумажная , красильная и смежные отрасли. [12]
Основным применением хемоинформатики является хранение, индексирование и поиск информации, касающейся химических соединений. [13] Эффективный поиск такой хранимой информации включает темы, которые рассматриваются в компьютерной науке, такие как интеллектуальный анализ данных, поиск информации, извлечение информации и машинное обучение . [ необходима цитата ] Связанные темы исследований включают: [ необходима цитата ]
Для представления химических структур in silico используются специализированные форматы, такие как спецификации ввода упрощенной молекулярной строки ввода (SMILES) [14] или язык химической разметки на основе XML . [15] Эти представления часто используются для хранения в больших химических базах данных . [ требуется ссылка ] В то время как некоторые форматы подходят для визуальных представлений в двух- или трехмерном пространстве, другие больше подходят для изучения физических взаимодействий, моделирования и исследований стыковки. [ требуется ссылка ]
Химические данные могут относиться к реальным или виртуальным молекулам. Виртуальные библиотеки соединений могут быть созданы различными способами для исследования химического пространства и выдвижения гипотез о новых соединениях с желаемыми свойствами. Виртуальные библиотеки классов соединений (лекарства, натуральные продукты, синтетические продукты, ориентированные на разнообразие) были недавно созданы с использованием алгоритма FOG (оптимизированный по фрагментам рост). [16] Это было сделано с помощью инструментов хемоинформатики для обучения вероятностей перехода цепи Маркова на аутентичных классах соединений, а затем с помощью цепи Маркова для создания новых соединений, которые были похожи на учебную базу данных.
В отличие от высокопроизводительного скрининга , виртуальный скрининг включает в себя вычислительный скрининг in silico библиотек соединений с помощью различных методов, таких как стыковка , для выявления членов, которые, вероятно, обладают желаемыми свойствами, такими как биологическая активность против заданной цели. В некоторых случаях комбинаторная химия используется при разработке библиотеки для повышения эффективности добычи химического пространства. Чаще всего скринингу подвергается разнообразная библиотека малых молекул или природных продуктов .
Это расчет количественных значений соотношения структура-активность и количественных значений соотношения структура-свойство , используемых для прогнозирования активности соединений по их структурам. В этом контексте также существует сильная связь с хемометрикой . Химические экспертные системы также актуальны, поскольку они представляют части химических знаний как представление in silico . Существует относительно новая концепция анализа пар согласованных молекул или MMPA на основе предсказаний, которая связана с моделью QSAR для определения обрыва активности. [17]