Décrypthon — проект, который использует ресурсы сетевых вычислений для содействия медицинским исследованиям. Слово является гибридом французских слов «décrypter» (расшифровывать) и « telethon ».
Описание
Décrypthon — это технологическая платформа, обеспечивающая вычислительную мощность, необходимую для обработки сложных данных в биологии. Она позволяет с помощью технологий, называемых « сетками », собирать (в сетке) мощности нескольких суперкомпьютеров (500 Gflop), установленных IBM в 6 французских университетах (Бордо 1, Лилль 1, Париж 6 Jussieu, ENS Lyon, Криан в Руане, Орсе) и/или отдельных персональных компьютеров через World Community Grid , [1] сам по себе являющийся проектом BOINC . В рамках программы Décrypthon было завершено около дюжины научных проектов, отобранных по результатам тендера.
История
Во время Французского телемарафона 2001 года AFM («Французская ассоциация по борьбе с миопатией») и IBM обратились с призывом мобилизовать пользователей Интернета: «Сделайте неиспользуемое компьютерное время доступным для исследований». Цель: выполнить первое картирование протеома : всех белков/молекул, производимых клетками.
Этот научный, технологический и человеческий вызов был блестяще принят: мобилизовано 75 000 пользователей Интернета, выполнены миллиарды сложных вычислений, картировано 550 000 белков. Это библиотека для сравнения белков из разных видов живых организмов (животных, растений, человека). Она содержит около 2,2 миллиона файлов, разделенных на 17 000 каталогов.
Все это менее чем за два месяца, тогда как для достижения этой цели с помощью одного компьютера потребовалось бы более 1170 лет. Каждый компьютер внес около 133 часов, или более 10 миллионов часов вычислений в общей сложности. Двадцать один сервер IBM координировал решения и данные на протяжении всей операции.
После этого успеха в 2003 году AFM объявил тендеры на продвижение использования этой базы знаний. Было выбрано четыре проекта:
Проект был предложен двумя командами из Commissariat à l'Energie Atomique (CEA, Комиссия по атомной энергии) Департамента наук о жизни в Сакле (S Zinn-Justin и R Guérois) в сотрудничестве с A Poupon из Национального центра научных исследований (Centre Nationale de la recherche scientifique ou CNRS), Лаборатория структурной геномики дрожжей из Университета Орсе. Целью этого проекта было изучение взаимосвязи между структурой и функцией белков, которые снижают риск генетических аномалий у людей и дрожжей.
Три другие группы из IGBMC (Институт генетики, молекулярной и клеточной биологии, Геномный институт молекулярной и клеточной биологии) в Илькирхе: Дж. Лапорт и Дж. Л. Мандель, А. Пужоль и Дж. Л. Мандель, Дж. Бей, Ф. Сирокин, Ф. Плевняк и О. Пох предложили три проекта возрастающей сложности.
Первый проект включал идентификацию и характеристику белков, участвующих в ряде нервно-мышечных заболеваний , а также прогнозирование белковых доменов и тканеспецифичных функций.
Второй проект включал анализ белков клеточной органеллы — пероксисомы , которая участвует во многих важнейших метаболических функциях.
Третий проект, в масштабе организма, заключался в выявлении новых потенциальных терапевтических целей у Vibrio cholerae и бактериальных диарейных организмов, вызывающих диарейные заболевания.
В 2003/2004 годах были выбраны два проекта. Оба проекта были успешно реализованы на сетке и предоставили полезные расчеты. [2]
После успеха этих двух проектов в мае 2004 года было подписано соглашение между AFM, CNRS и IBM, формализующее тогдашний проект под названием «Décrypthon based» на основе сети серверов [3], предоставленных IBM в шести университетах-партнерах.
В 2009 году покровителем Décrypthon становится французский актер Тьерри Лермитт .
Проекты
Проект координирует Алессандра Карбоне ( подразделение Inserm 511, Университет Пьера и Марии Кюри ). Масштабное исследование взаимодействий белок-белок, белок-ДНК и белок-лиганд, приводящее к таргетированию лекарств. Целью этого проекта является разработка компьютерных инструментов для идентификации на поверхности белка участков взаимодействия с другими белками, ДНК или лигандами .
Проект Кристофа Пуза и Паскаля Вио (CNRS UMR 8118, Университет Рене Декарта , Париж V). Параллелизация метода Монте-Карло для сортировки потенциалов действия: улучшение инструмента для фундаментальных исследований в области нейронауки и диагностики нервно-мышечных заболеваний. Целью этого проекта является автоматизация обработки нейронных сигналов, записанных врачами, для обнаружения любых сбоев нейронов в мозге или мотонейронов, которые контролируют мышечные волокна.
Проект координирует Марк Робинсон-Рехави (Факультет биологии и медицины Лозаннского университета/ ENS Lyon). Анализ данных транскриптомов животных для аннотации нервно-мышечных процессов человеческого генома . Этот проект позволит точно определить, какие гены должны быть экспрессированы (или экспрессированы неправильно) в мышечных клетках, что является важной информацией для понимания нервно-мышечных заболеваний.
Проект координируется EK. Talbi ( LIFL – Лаборатория базовой компьютерной науки в Лилле, USTL , CNRS, INRIA , Вильнёв-д'Аск). Конформационная выборка и стыковка на сетках: применение к нервно-мышечным заболеваниям. Цель состоит в том, чтобы предсказать, путем расчета, природу и тип связей молекул, участвующих в функционировании нормальной клетки, и разработать исследование "in silico" (путем расчета), средства вмешательства в нормальные или патологические физиологические процессы - и, следовательно, рационально разрабатывать лекарства.
Проект координируется F. Relaix и O. Poch (Институт миологии, Париж - IGBMC, Илькирх). Масштабная идентификация транскрипционных сетей во время миогенеза. Целью этого проекта является идентификация молекулярных механизмов транскрипции в развитии мышц.
Проект координируют М. Робинсон-Рехави и Л. Шеффер (Факультет биологии и медицины Лозаннского университета/ ENS Lyon). Интеграция множественных подходов функциональной геномики для понимания мышц.
Ссылки
^ Бертис, Виктор; Больц, Рафаэль; Депре, Фредерик; Рид, Кевин (апрель 2008 г.). «Крупномасштабное выполнение биоинформатического приложения на добровольной сетке». Семинар по параллельным и распределенным научным и инженерным вычислениям (PDSEC08) .
^ Бертис, В.; Больц, Р.; Деспрез, Ф. (декабрь 2009 г.). «От выделенной сетки к добровольной сетке: крупномасштабное выполнение биоинформатического приложения». Журнал Grid Computing . 7 (4): 463– 478. doi :10.1007/s10723-009-9130-7. S2CID 22791104.