SEA-PHAGES означает Science Education Alliance-Phage Hunters Advancing Genomics and Evolutionary Science ; ранее он назывался National Genomics Research Initiative. [1] Это была первая инициатива, запущенная Howard Hughes Medical Institute (HHMI) Science Education Alliance (SEA) их директором Туаджундой С. Джорданом в 2008 году для улучшения удержания студентов, изучающих науку, технологии, инженерию и математику (STEM). [2] SEA-PHAGES — это двухсеместровая программа бакалавриата, которую администрируют группа Грэма Хэтфулла из Питтсбургского университета и Отдел научного образования Howard Hughes Medical Institute . Студенты из более чем 100 университетов по всей стране участвуют в аутентичных индивидуальных исследованиях, которые включают лабораторные занятия и компонент биоинформатики . [3]
В течение первого семестра этой программы группы из примерно 18-24 студентов бакалавриата работают под руководством одного или двух преподавателей университета и аспиранта-ассистента, которые прошли двухнедельные учебные семинары, чтобы выделить и охарактеризовать свой собственный бактериофаг , который заражает определенную бактериальную клетку-хозяина из местных образцов почвы. [1] После того, как студенты успешно изолируют фаг, они могут классифицировать их, визуализируя их с помощью изображений электронного микроскопа (ЭМ) . [3] Кроме того, студенты извлекают и очищают ДНК , и один образец отправляется на секвенирование, чтобы быть готовым к учебной программе второго семестра. [1]
Второй семестр состоит из аннотации генома, который класс отправил на секвенирование. В этом случае студенты работают вместе, чтобы оценить гены для координат старт-стоп, сайтов связывания рибосом и возможных функций тех белков , в которых кодируется последовательность. После завершения аннотации она отправляется в базу данных последовательностей ДНК GenBank Национального центра биотехнологической информации (NCBI) . [1] Если в семестре еще есть время или отправленная ДНК не может быть секвенирована, класс может запросить файл генома из Университета Питтсбурга , который еще не был секвенирован. В дополнение к приобретенным лабораторным и биоинформационным навыкам студенты имеют возможность опубликовать свою работу в академических журналах и посетить национальную конференцию SEA-PHAGES в Вашингтоне, округ Колумбия , или региональный симпозиум.
Все данные, касающиеся фага каждого студента, публикуются путем ввода их в онлайн-базу данных PhagesDB для расширения знаний сообщества SEA-PHAGES в целом. [4]
Starterator создает отчет, сравнивая вызываемые стартовые сайты генов в одном и том же Pham в аннотированных геномах фагов и других черновиках; поэтому студенты могут предложить подходящее начало для автоматически аннотированных генов в своем геноме актинобактериофага. [3] [4] Обычно это не основной источник для вызова начала гена, поскольку он не всегда поддерживается информацией из других программ или координаты начала-конца не совпадают для гена, вызываемого DNA Master. [5]
Они сравнивают аминокислотную последовательность гена с другими секвенированными или аннотированными геномами фагов в базе данных для студентов сообщества SEA-PHAGES, чтобы предсказать начало и функции их белков. [5]
Это программное обеспечение генерирует отчет с помощью своего алгоритма, который показывает потенциал кодирования для шести возможных открытых рамок считывания конкретного генома, поэтому вероятность существования гена может быть оценена во время аннотации. [5]
DNA Master — это бесплатный программный инструмент, который студенты могут загрузить на компьютер с ОС Windows, который использует программы GLIMMER , GeneMark , Aragorn и tRNAscan-SE для автоматического аннотирования генома, загруженного в виде файла формата FASTA . [3] Поскольку это делается с помощью компьютерного алгоритма, который использует только три программы и может быть не таким обновленным, как онлайн-версии, каждый предложенный ген должен быть подтвержден студенческими аннотациями. Они проходят несколько раундов рецензирования, прежде чем будут приняты для рецензирования экспертами из PhagesDB, после чего их можно будет отправить в GenBank . [1]
Эти программы используются DNA Master для прогнозирования начала генов путем оценки вероятности шести открытых рамок считывания (ORF) и сигналов сайта связывания рибосомы (RBS). [6] Часто GLIMMER и GeneMark соглашаются с прогнозами во время автоматической аннотации, но иногда они дают разные начала, которые необходимо оценить во время ручной аннотации; GLIMMER в настоящее время является наиболее обновленным программным обеспечением и обычно используется для окончательной координаты начала.
Этот алгоритм используется DNA Master, и существует онлайн-версия, которую можно использовать для перекрестных ссылок на вызовы, сделанные программным обеспечением. [3] Он показывает определенные тРНК и тмРНК в геноме, ища очень специфические последовательности, которые будут складываться в отличительную вторичную структуру клеверного листа. [7] Хотя этот алгоритм считается очень точным, учитывая, как быстро он выдает результаты, он может пропустить некоторые тРНК, которые не совсем соответствуют его параметрам поиска. [7]
Эта программа позволяет студентам идентифицировать возможные кодирующие области для тРНК в последовательности, которые были бы пропущены Арагорном, поскольку она включает обнаружение необычных гомологов тРНК; хотя обе программы имеют чувствительность от 99 до 100%. [8] tRNAscan-SE не обнаруживает сами тРНК, а вместо этого выводит результаты информации, обработанной из трех независимых программ прогнозирования тРНК: tRNAscan, EufindtRNA и поиска модели ковариации тРНК. [8]
Phamerator показывает визуальное представление генов и их сходство с другими выбранными геномами фагов, отмечая их цветными прямоугольниками на основе Phamily или Pham, в которые он их группирует. [3] Затем студенты могут просматривать, сравнивать, сохранять и распечатывать цветные карты генома во время своих аннотаций. [5] Возможные вставки или делеции можно увидеть с помощью соединительных линий между выбранными геномами фагов. [9] Кроме того, через эту программу можно получить доступ к последовательностям нуклеотидов и белков; однако начала и остановки не всегда совпадают с таковыми в DNA Master, поэтому последовательности могут быть неправильными. [10]
Эти онлайн-программы используются для прогнозирования функций белков путем сравнения аминокислотных или нуклеотидных последовательностей всех секвенированных геномов, а не только геномов фагов. HHPred обнаруживает гомологию в последовательностях с другими белками, функции которых были вызваны в любом организме. [11] Кроме того, если белок был идентифицирован в другой последовательности, может быть предоставлена сгенерированная компьютером структура для визуализации возможного сворачивания аминокислот. [11]