Точечная принятая мутация

Точечная принятая мутация — также известная как PAM — это замена одной аминокислоты в первичной структуре белка другой одной аминокислотой, которая принимается процессами естественного отбора . Это определение не включает все точечные мутации в ДНК организма. В частности, молчаливые мутации не являются точечными принятыми мутациями, как и мутации, которые являются летальными или которые отвергаются естественным отбором иными способами.

Матрица PAM — это матрица , в которой каждый столбец и строка представляют одну из двадцати стандартных аминокислот. В биоинформатике матрицы PAM иногда используются в качестве матриц замещения для оценки выравнивания последовательностей белков. Каждая запись в матрице PAM указывает на вероятность замены аминокислоты этой строки аминокислотой этого столбца посредством серии из одной или нескольких точечных принятых мутаций в течение указанного эволюционного интервала, а не на то, что эти две аминокислоты будут выровнены случайно. Различные матрицы PAM соответствуют различным промежуткам времени в эволюции последовательности белка.

Биологическое происхождение

Генетические инструкции каждой реплицирующейся клетки в живом организме содержатся в ее ДНК. ^[1] На протяжении всей жизни клетки эта информация транскрибируется и реплицируется клеточными механизмами для производства белков или предоставления инструкций дочерним клеткам во время деления клетки , и существует вероятность того, что ДНК может быть изменена во время этих процессов. ^[1]^[2] Это известно как мутация . На молекулярном уровне существуют регуляторные системы, которые исправляют большинство — но не все — этих изменений в ДНК до ее репликации. ^[2]^[3]

Одной из возможных мутаций является замена одного нуклеотида , известная как точечная мутация. Если точечная мутация происходит в пределах экспрессируемой области гена , экзона , то это изменит кодон, определяющий определенную аминокислоту в белке, продуцируемом этим геном. ^[2] Несмотря на избыточность в генетическом коде , существует вероятность того, что эта мутация затем изменит аминокислоту, продуцируемую во время трансляции , и, как следствие, структура белка будет изменена.

Функциональность белка во многом зависит от его структуры. ^[4] Изменение одной аминокислоты в белке может снизить его способность выполнять эту функцию, или мутация может даже изменить функцию, которую выполняет белок. ^[2] Подобные изменения могут серьезно повлиять на важную функцию в клетке, потенциально вызывая гибель клетки — а в крайних случаях и организма. ^[5] И наоборот, изменение может позволить клетке продолжать функционировать, хотя и по-другому, и мутация может быть передана потомству организма. Если это изменение не приводит к какому-либо значительному физическому недостатку для потомства, существует вероятность того, что эта мутация сохранится в популяции. Существует также вероятность того, что изменение функции станет выгодным. В любом случае, подвергаясь процессам естественного отбора, точечная мутация была принята в генетический пул.

20 аминокислот, транслируемых генетическим кодом, сильно различаются по физическим и химическим свойствам их боковых цепей. ^[4] Однако эти аминокислоты можно разделить на группы со схожими физико-химическими свойствами. ^[4] Замена аминокислоты на другую из той же категории, скорее всего, окажет меньшее влияние на структуру и функцию белка, чем замена на аминокислоту из другой категории. Следовательно, принятие точечных мутаций сильно зависит от аминокислоты, заменяемой в мутации, и заменяющей аминокислоты. Матрицы PAM являются математическим инструментом, который учитывает эти различные скорости принятия при оценке сходства белков во время выравнивания.

Терминология

Термин принятая точечная мутация изначально использовался для описания феномена мутации. Однако аббревиатура PAM была предпочтительнее АПМ из-за удобства чтения, поэтому термин принятая точечная мутация используется чаще. ^[6] Поскольку значение в матрице PAM _n представляет собой количество мутаций на 100 аминокислот, что можно сравнить с процентом мутаций, иногда используется термин процент принятой мутации . $n$

Важно различать точечные принятые мутации (PAM), матрицы точечных принятых мутаций (матрицы PAM) и матрицу PAM _n . Термин «точечная принятая мутация» относится к самому событию мутации. Однако «матрица PAM» относится к одной из семейства матриц, которые содержат оценки, представляющие вероятность того, что две аминокислоты будут выровнены из-за серии событий мутации, а не из-за случайной случайности. «Матрица PAM _n » — это матрица PAM, соответствующая временному интервалу, достаточно длинному для того, чтобы события мутации произошли на 100 аминокислот. $n$

Построение матриц PAM

Матрицы PAM были введены Маргарет Дейхофф в 1978 году. ^[7] Расчет этих матриц был основан на 1572 наблюдаемых мутациях в филогенетических деревьях 71 семейства близкородственных белков. Белки для изучения были выбраны на основе их высокого сходства с их предшественниками. Включенные выравнивания белков должны были демонстрировать по крайней мере 85% идентичности. ^[6]^[8] В результате разумно предположить, что любые выровненные несоответствия были результатом одного мутационного события, а не нескольких в одном и том же месте.

Каждая матрица PAM имеет двадцать строк и двадцать столбцов — по одному для каждой из двадцати аминокислот, транслируемых генетическим кодом. Значение в каждой ячейке матрицы PAM связано с вероятностью того, что аминокислота строки до мутации будет выровнена с аминокислотой столбца после нее. ^[6]^[7]^[8] Согласно этому определению, матрицы PAM являются примером матрицы замещения .

Сбор данных из филогенетических деревьев

Для каждой ветви филогенетических деревьев семейств белков регистрировалось количество наблюдавшихся несоответствий и велась запись двух вовлеченных аминокислот. ^[7] Эти подсчеты использовались в качестве записей под главной диагональю матрицы . Поскольку подавляющее большинство образцов белков поступает из организмов, которые живут сегодня (существующие виды), «направление» мутации определить невозможно. То есть аминокислоту, присутствовавшую до мутации, нельзя отличить от аминокислоты, которая заменила ее после мутации. Из-за этого матрица считается симметричной , и записи над главной диагональю вычисляются на этой основе. Записи вдоль диагонали не соответствуют мутациям и могут быть оставлены незаполненными. $А$ $А$ $А$ $А$

В дополнение к этим подсчетам были получены данные о мутабельности и частоте аминокислот. ^[6]^[7] Мутабельность аминокислоты представляет собой отношение числа мутаций, в которых она участвует, к числу раз, когда она встречается в выравнивании. ^[7] Мутабельность измеряет, насколько вероятно, что аминокислота будет мутировать приемлемо. Аспарагин , аминокислота с небольшой полярной боковой цепью, оказалась наиболее мутабельной из аминокислот. ^[7] Цистеин и триптофан оказались наименее мутабельными аминокислотами. ^[7] Боковые цепи цистеина и триптофана имеют менее распространенные структуры: боковая цепь цистеина содержит серу, которая участвует в дисульфидных связях с другими молекулами цистеина, а боковая цепь триптофана большая и ароматическая . ^[4] Поскольку существует несколько небольших полярных аминокислот, эти крайности предполагают, что аминокислоты с большей вероятностью будут мутировать приемлемо, если их физические и химические свойства более распространены среди альтернативных аминокислот. ^[6]^[8]

Построение матрицы мутаций

Для аминокислоты th значения и являются ее изменчивостью и частотой. Частоты аминокислот нормализованы так, что их сумма равна 1. Если общее число появлений аминокислоты th равно , а — общее число всех аминокислот, то $j$ $m(j)$ $f(j)$ $j$ $n(j)$ $N$

f(j)={\frac {n(j)}{N}}

На основе определения мутабильности как отношения мутаций к встречаемости аминокислоты

m(j)={\frac {\sum _{i=1,i\neq j}^{20}A(i,j)}{n(j)}}

или

{\frac {1}{Nf(j)}}={\frac {1}{n(j)}}={\frac {m(j)}{\sum _{i=1,i\neq j}^{20}A(i,j)}}

Матрица мутаций строится так, что запись представляет вероятность мутации аминокислоты th в аминокислоту th. Недиагональные записи вычисляются по уравнению ^[7] $М$ $М(я,j)$ $j$ $я$

M(i,j)=\lambda A(i,j){\frac {m(j)}{\sum _{i=1,i\neq j}^{20}A(i,j)}}={\frac {\lambda A(i,j)}{Nf(j)}}={\frac {\lambda A(i,j)}{n(j)}}

где — константа пропорциональности. Однако это уравнение не вычисляет диагональные элементы. Каждый столбец в матрице перечисляет каждый из двадцати возможных результатов для аминокислоты — она может мутировать в одну из 19 других аминокислот или остаться неизменной. Поскольку недиагональные элементы, перечисляющие вероятности каждой из 19 мутаций, известны, а сумма вероятностей этих двадцати результатов должна быть равна 1, эту последнюю вероятность можно вычислить с помощью $\лямбда$ $М$

M(j,j)=1-\sum _{i=1,i\neq j}^{20}M(i,j)

что упрощается до ^[7]

M(j,j)=1-\lambda m(j)

Расчет диагональных записей

M(j,j)=1-\sum _{i=1,i\neq j}^{20}M(i,j)

Подставим в выражение для матрицы мутаций недиагональных элементов:

M(j,j)=1-\sum _{i=1,i\neq j}^{20}{\frac {\lambda m(j)A(i,j)}{\sum _{i=1,i\neq j}^{20}A(i,j)}}

M(j,j)=1-{\frac {\sum _{i=1,i\neq j}^{20}\lambda m(j)A(i,j)}{\sum _{i=1,i\neq j}^{20}A(i,j)}}

Поскольку значения и являются константами, которые не изменяются со значением $\лямбда$ $m(j)$ $я$

M(j,j)=1-{\frac {\lambda m(j)\sum _{i=1,i\neq j}^{20}A(i,j)}{\sum _{i=1,i\neq j}^{20}A(i,j)}}

И таким образом отмена показывает, что

M(j,j)=1-\lambda m(j)

Особое значение имеет тот факт, что для недиагональных записей

f(j)M(i,j)={\frac {\lambda }{N}}A(i,j)={\frac {\lambda }{N}}A(j,i)=f(i)M(j,i)

Это означает, что для всех записей в матрице мутаций

f(j)M(i,j)=f(i)M(j,i)

Выбор коэффициента пропорциональности

Вероятности, содержащиеся в , изменяются как некоторая неизвестная функция времени, в течение которого белковой последовательности разрешено мутировать. Вместо того, чтобы пытаться определить эту связь, значения рассчитываются для короткого периода времени, а матрицы для более длительных периодов времени рассчитываются, предполагая, что мутации следуют модели цепи Маркова . ^[9]^[10] Базовой единицей времени для матриц PAM является время, необходимое для возникновения 1 мутации на 100 аминокислот, иногда называемое «единицей PAM» или «PAM» времени. ^[6] Это именно та продолжительность мутации, которая предполагается матрицей PAM ₁ . $М$ $М$

Константа используется для контроля доли аминокислот, которые не изменяются. Используя только выравнивания белков, которые имеют по крайней мере 85% сходства, можно было бы обоснованно предположить, что наблюдаемые мутации были прямыми, без каких-либо промежуточных состояний. Это означает, что уменьшение этих подсчетов на общий множитель даст точную оценку количества мутаций, если бы сходство было ближе к 100%. Это также означает, что количество мутаций на 100 аминокислот, в PAM _n, равно количеству мутировавших аминокислот на 100 аминокислот. $\лямбда$ $n$

Чтобы найти матрицу мутаций для матрицы PAM ₁ , накладывается требование, чтобы 99% аминокислот в последовательности были сохранены. Количество равно числу консервативных аминокислотных единиц, и поэтому общее число консервативных аминокислот равно $n(j)M(j,j)$ $j$

\sum _{j=1}^{20}n(j)M(j,j)=\sum _{j=1}^{20}n(j)-\lambda \sum _{j =1}^{20}n(j)m(j)=NN\lambda \sum _{j=1}^{20}f(j)m(j)

Значение, которое необходимо выбрать для получения 99% идентичности после мутации, затем определяется уравнением $\лямбда$

0,99=1-\lambda \sum _{j=1}^{20}f(j)m(j)

Это значение затем можно использовать в матрице мутаций для матрицы PAM ₁ . $\лямбда$

Строительство ПАМ_нматрицы

Модель цепи Маркова мутации белка связывает матрицу мутаций для PAM _n , , с матрицей мутаций для матрицы PAM ₁ простым соотношением $M_{n}$ $М_{1}$

M_{n}=M_{1}^{n}

Матрица PAM _n строится из отношения вероятности точечных принятых мутаций, заменяющих аминокислоту th на аминокислоту th, к вероятности случайного выравнивания этих аминокислот. Элементы матрицы PAM _n задаются уравнением ^[11]^[12] $j$ $я$

{\text{PAM}}_{n}(i,j)=log{\frac {f(j)M_{n}(i,j)}{f(i)f(j)}}=log{\frac {f(j)M^{n}(i,j)}{f(i)f(j)}}=log{\frac {M^{n}(i,j)}{f(i)}}

Обратите внимание, что в книге Гасфилда записи и связаны с вероятностью мутации аминокислоты th в аминокислоту th. ^[11] Это является источником другого уравнения для записей матриц PAM. $М(я,j)$ ${\text{ПАМ}}_{n}(i,j)$ $я$ $j$

При использовании матрицы PAM _n для оценки выравнивания двух белков делается следующее предположение:

Если эти два белка родственны, то эволюционный интервал, разделяющий их, представляет собой время, необходимое для возникновения точечных принятых мутаций на 100 аминокислот. $n$

При рассмотрении выравнивания аминокислот th и th оценка показывает относительную вероятность выравнивания из-за родства белков или из-за случайности. $я$ $j$

Если белки связаны, то для мутации исходной аминокислоты в ее замену должна была произойти серия точечных принятых мутаций. Предположим, что аминокислота th является исходной. Исходя из распространенности аминокислот в белках, вероятность того, что аминокислота th является исходной, составляет . При любой конкретной единице этой аминокислоты вероятность быть замененной аминокислотой th в предполагаемом временном интервале составляет . Таким образом, вероятность выравнивания составляет , числитель внутри логарифма. $j$ $j$ $f(j)$ $я$ $M_{n}(i,j)$ $f(j)M_{n}(i,j)$
Если белки не связаны, события, что две выровненные аминокислоты являются th и th аминокислотами, должны быть независимыми . Вероятности этих событий равны и , что означает, что вероятность выравнивания равна , знаменателю логарифма. $я$ $j$ $f(i)$ $f(j)$ $f(i)f(j)$
Таким образом, логарифм в уравнении дает положительный результат, если выравнивание, скорее всего, обусловлено точечными принятыми мутациями, и отрицательный результат, если выравнивание, скорее всего, обусловлено случайностью.

Свойства матриц PAM

Симметрия матриц PAM

Хотя матрица вероятности мутации не является симметричной, каждая из матриц PAM симметрична. ^[6]^[7] Это несколько удивительное свойство является результатом взаимосвязи, которая была отмечена для матрицы вероятности мутации: $М$

f(j)M(i,j)=f(i)M(j,i)

Фактически, это соотношение справедливо для всех положительных целых степеней матрицы : $М$

f(j)M^{n}(i,j)=f(i)M^{n}(j,i)

Обобщение свойства на положительные целые матричные степени

Это обобщение можно доказать с помощью математической индукции . Предположим, что для матрицы $М$

f(j)M(i,j)=f(i)M(j,i)

И это для положительного целого числа $к$

f(j)M^{k}(i,j)=f(i)M^{k}(j,i)

Путем расширения матричного произведения , $M^{k+1}=M^{k}\cdot M$

f(j)M^{k+1}(i,j)=f(j)\sum _{n=0}^{N}M^{k}(i,n)M(n,j)

f(j)M^{k+1}(i,j)=\sum _{n=0}^{N}M^{k}(i,n)(f(j)M(n,j))

Используя свойство матрицы, которое мы предположили $M$

f(j)M^{k+1}(i,j)=\sum _{n=0}^{N}M^{k}(i,n)(f(n)M(j,n))

f(j)M^{k+1}(i,j)=\sum _{n=0}^{N}(f(n)M^{k}(i,n))M(j,n)

И используя свойство для матрицы $M^{k}$

f(j)M^{k+1}(i,j)=\sum _{n=0}^{N}(f(i)M^{k}(n,i))M(j,n)

f(j)M^{k+1}(i,j)=f(i)\sum _{n=0}^{N}M(j,n)M^{k}(n,i)

f(j)M^{k+1}(i,j)=f(i)M^{k+1}(j,i)

В этом случае сначала известно только, что результат справедлив для . Однако приведенный выше аргумент показывает, что свойство справедливо и для . Затем это новое знание показывает, что свойство справедливо и для , и это повторяется, чтобы показать, что свойство справедливо для всех положительных целых чисел . $k=1$ $k=2$ $k$ $k$

В результате элементы матрицы PAM _n симметричны, поскольку

{\text{PAM}}_{n}(i,j)=log{\frac {f(j)M^{n}(i,j)}{f(j)f(i)}}=log{\frac {f(i)M^{n}(j,i)}{f(i)f(j)}}={\text{PAM}}_{n}(j,i)

Связь количества мутировавших аминокислот и количества мутаций

Значение представляет собой количество мутаций, которые происходят на 100 аминокислот, однако это значение редко доступно и часто оценивается. Однако при сравнении двух белков вместо этого легко вычислить, что является количеством мутировавших аминокислот на 100 аминокислот. Несмотря на случайный характер мутации, эти значения можно приблизительно связать с ^[13] $n$ $m$

{\frac {m}{100}}=1-e^{-{\frac {n}{100}}}

Вывод связи между и

m

n

Мутации в первичной структуре белка могут происходить в любом месте последовательности. Если предположить, что распределение мутаций среди позиций аминокислот равномерно, то проблема аналогична распределению "шариков по корзинам", распространенной проблеме в комбинаторике . В случае, когда шары (т.е. мутации) распределены по корзинам (позициям аминокислот), число корзин, содержащих хотя бы один шар, имеет распределение со средним значением, заданным как ^[14] $K$ $N$ $M$

E(M)=N-N(1-{\frac {1}{N}})^{K}

{\frac {E(M)}{N}}=1-(1-{\frac {1}{N}})^{K}

Если скорость мутации равна мутациям на 100 аминокислот, то $n$

{\frac {n}{100}}={\frac {K}{N}}

А если на 100 аминокислот приходится мутировавших аминокислот, то это примерно равно $m$

{\frac {m}{100}}={\frac {E(M)}{N}}

Теперь и можно связать $m$ $n$

{\frac {m}{100}}=1-(1-{\frac {1}{N}})^{\frac {nN}{100}}

При больших значениях , что можно обоснованно предположить для типичных белков, это выражение приблизительно равно $N$

{\frac {m}{100}}=1-e^{-{\frac {n}{100}}}

Справедливость этих оценок можно проверить, подсчитав количество аминокислот, которые остаются неизменными под действием матрицы . Общее количество неизмененных аминокислот за временной интервал матрицы PAM _n равно $M$

\sum _{j=1}^{20}n(j)M^{n}(j,j)

и поэтому доля неизмененных аминокислот составляет

{\frac {\sum _{j=1}^{20}n(j)M^{n}(j,j)}{N}}=\sum _{j=1}^{20}f(j)M^{n}(j,j)=1-{\frac {m}{100}}

Пример - PAM250

Матрица PAM250 с заполненными обеими половинами.

PAM250 — это часто используемая матрица оценки для сравнения последовательностей. Только нижняя половина матрицы должна быть вычислена, поскольку по своей конструкции матрицы PAM должны быть симметричными. Каждая из 20 аминокислот показана сверху и сбоку матрицы, с 3 дополнительными неоднозначными аминокислотами . Аминокислоты чаще всего показаны в алфавитном порядке или перечислены в группах. Эти группы являются характеристиками, общими для аминокислот. ^[7]

Использование в биоинформатике

Определение времени расхождения в филогенетических деревьях

Гипотеза молекулярных часов предсказывает, что скорость замены аминокислот в конкретном белке будет приблизительно постоянной с течением времени, хотя эта скорость может различаться между семействами белков. ^[13] Это говорит о том, что количество мутаций на аминокислоту в белке увеличивается приблизительно линейно со временем.

Определение времени, в которое два белка распались, является важной задачей в филогенетике . Ископаемые останки часто используются для установления положения событий на временной шкале эволюционной истории Земли, но применение этого источника ограничено . Однако, если известна скорость, с которой тикают молекулярные часы семейства белков, то есть скорость, с которой увеличивается число мутаций на аминокислоту, то знание этого числа мутаций позволит найти дату расхождения.

Предположим, что ищется дата расхождения двух родственных белков, взятых из организмов, живущих сегодня. Оба белка накапливали принятые мутации с даты расхождения, и поэтому общее число мутаций на аминокислоту, разделяющее их, примерно вдвое больше, чем то, которое отделяет их от их общего предка . Если диапазон матриц PAM используется для выравнивания двух белков, которые, как известно, связаны, то значение в матрице PAM _n , которое приводит к наилучшему результату, скорее всего, будет соответствовать мутациям на аминокислоту, разделяющую два белка. Деление этого значения пополам и деление на скорость, с которой принятые мутации накапливаются в семействе белков, дает оценку времени расхождения этих двух белков от их общего предка. То есть время расхождения в myr равно ^[13] $n$

T={\frac {K}{2r}}

Где — число мутаций на аминокислоту, а — скорость накопления принятых мутаций в мутациях на аминокислотный участок за миллион лет. $K$ $r$

Использовать в BLAST

Матрицы PAM также используются в качестве матрицы подсчета при сравнении последовательностей ДНК или белковых последовательностей для оценки качества выравнивания. Эта форма системы подсчета используется широким спектром программного обеспечения для выравнивания, включая BLAST . ^[15]

Сравнение PAM и BLOSUM

Хотя матрицы логарифмических шансов PAM были первыми матрицами оценки, использованными с BLAST, матрицы PAM были в значительной степени заменены матрицами BLOSUM . Хотя обе матрицы дают схожие результаты оценки, они были сгенерированы с использованием разных методологий. Матрицы BLOSUM были сгенерированы непосредственно из различий аминокислот в выровненных блоках, которые расходились в разной степени, матрицы PAM отражают экстраполяцию эволюционной информации, основанной на тесно связанных последовательностях, на более длительные временные масштабы. ^[16] Поскольку информация об оценке для матриц PAM и BLOSUM была сгенерирована совершенно разными способами, числа, связанные с матрицами, имеют принципиально разные значения; числа для матриц PAM увеличиваются для сравнений среди более расходящихся белков, тогда как числа для матриц BLOSUM уменьшаются. ^[17] Однако все матрицы замены аминокислот можно сравнивать в рамках теории информации ^[18], используя их относительную энтропию.

Матрицы PAM с аналогичными матрицами BLOSUM (относительная энтропия каждой матрицы PAM взята из Altschul 1991) ^[18]
Матрица ПАМ	Эквивалентная матрица BLOSUM	Относительная энтропия (бит)
ПАМ100	Blosum90	1.18
ПАМ120	Blosum89	0,98
ПАМ160	Blosum60	0,70
ПАМ200	Blosum52	0,51
ПАМ250	Blosum45	0,36

Смотрите также

Ссылки

^ ab Campbell NA, Reece JB, Meyers N, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2009). «Молекулярная основа наследования». Биология (8-е изд.). Pearson Education Australia. стр. 307–325 . ISBN 9781442502215.
^ abcd Campbell NA, Reece JB, Meyers N, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2009). «От гена к белку». Биология: Австралийская версия (8-е изд.). Pearson Education Australia. стр. 327–350 . ISBN 9781442502215.
^ Pal JK, Ghaskadbi SS (2009). «Повреждение ДНК, восстановление и рекомбинация». Основы молекулярной биологии (1-е изд.). Oxford University Press. С. 187–203. ISBN 9780195697810.
^ abcd Campbell NA, Reece JB, Meyers N, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2009). «Структура и функции больших биологических молекул». Биология: Австралийская версия (8-е изд.). Pearson Education Australia. стр. 68–89 . ISBN 9781442502215.
^ Лобо I (январь 2008). «Менделевские соотношения и летальные гены». Nature Education . 1 (1): 138.
^ abcdefg Певснер Дж (2009). «Попарное выравнивание последовательностей». Биоинформатика и функциональная геномика (2-е изд.). Уайли-Блэквелл. стр. 58–68. ISBN 978-0-470-08585-1.
^ abcdefghijk Dayhoff MO, Schwartz RM, Orcutt BC (1978). "Модель эволюционного изменения белков". Атлас последовательности и структуры белков (том 5, приложение 3-е изд.). Вашингтон, округ Колумбия: Национальный фонд биомедицинских исследований. стр. 345–358 . ISBN 978-0-912466-07-1.
^ abc Wing-Kin S (2010). Алгоритмы в биоинформатике: практическое введение . CRC Press. стр. 51–52 . ISBN 978-1-4200-7033-0.
^ Kosiol C, Goldman N (2005). «Различные версии матрицы скоростей Дейхоффа». Молекулярная биология и эволюция . 22 (2): 193– 9. doi : 10.1093/molbev/msi005 . PMID 15483331.
^ Лио П., Голдман Н. (1998). «Модели молекулярной эволюции и филогении». Genome Research . 8 (12): 1233– 44. doi : 10.1101/gr.8.12.1233 . PMID 9872979.
^ ab Gusfield D (1997). Алгоритмы на строках, деревьях и последовательностях - Компьютерная наука и вычислительная биология . Cambridge University Press. С. 383–384 . ISBN 978-0521585194.
^ Boeckenhauer HJ, Bongartz D (2010). Алгоритмические аспекты биоинформатики . Springer. стр. 94–96 . ISBN 978-3642091001.
^ abc Pevsner J (2009). «Молекулярная филогения и эволюция». Биоинформатика и функциональная геномика (2-е изд.). Wiley-Blackwell. С. 221–227. ISBN 978-0-470-08585-1.
^ Мотвани Р., Рагхаван П. (1995). Рандомизированные алгоритмы. Cambridge University Press. стр. 94. ISBN 978-0521474658.
^ "Статистика оценок сходства последовательностей". Национальный центр биотехнологической информации . Получено 20 октября 2013 г.
^ Henikoff S , Henikoff JG (1992). "Матрицы аминокислотных замен из белковых блоков". Труды Национальной академии наук Соединенных Штатов Америки . 89 (22): 10915– 10919. Bibcode :1992PNAS...8910915H. doi : 10.1073/pnas.89.22.10915 . PMC 50453 . PMID 1438297.
^ Saud O (2009). "Матрицы подстановки PAM и BLOSUM". Birec . Архивировано из оригинала 9 марта 2013 года . Получено 20 октября 2013 года .
^ ab Altschul SF (июнь 1991). "Матрицы замены аминокислот с точки зрения теории информации". Журнал молекулярной биологии . 219 (3): 555– 65. doi :10.1016/0022-2836(91)90193-A. PMC 7130686. PMID 2051488 .

Внешние ссылки

http://www.inf.ethz.ch/personal/gonnet/DarwinManual/node148.html
http://www.bioinformatics.nl/tools/pam.html Для быстрого расчета матрицы PAM.
http://web.expasy.org/docs/relnotes/relstat.html Самые последние статистические данные из базы знаний Swiss-Prot по белкам. Раздел 6.1 содержит самые последние частоты аминокислот

[campbell-ch16-1] Campbell NA, Reece JB, Meyers N, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2009). «Молекулярная основа наследования». Биология (8-е изд.). Pearson Education Australia. стр. 307–325 . ISBN 9781442502215.

[campbell-ch17-2] Campbell NA, Reece JB, Meyers N, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2009). «От гена к белку». Биология: Австралийская версия (8-е изд.). Pearson Education Australia. стр. 327–350 . ISBN 9781442502215.

[pal-3] Pal JK, Ghaskadbi SS (2009). «Повреждение ДНК, восстановление и рекомбинация». Основы молекулярной биологии (1-е изд.). Oxford University Press. С. 187–203. ISBN 9780195697810.

[campbell-ch5-4] Campbell NA, Reece JB, Meyers N, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2009). «Структура и функции больших биологических молекул». Биология: Австралийская версия (8-е изд.). Pearson Education Australia. стр. 68–89 . ISBN 9781442502215.

[5] Лобо I (январь 2008). «Менделевские соотношения и летальные гены». Nature Education . 1 (1): 138.

[Pevsner-ch3-6] Певснер Дж (2009). «Попарное выравнивание последовательностей». Биоинформатика и функциональная геномика (2-е изд.). Уайли-Блэквелл. стр. 58–68. ISBN 978-0-470-08585-1.

[dayhoff1978-7] Dayhoff MO, Schwartz RM, Orcutt BC (1978). "Модель эволюционного изменения белков". Атлас последовательности и структуры белков (том 5, приложение 3-е изд.). Вашингтон, округ Колумбия: Национальный фонд биомедицинских исследований. стр. 345–358 . ISBN 978-0-912466-07-1.

[sung-8] Wing-Kin S (2010). Алгоритмы в биоинформатике: практическое введение . CRC Press. стр. 51–52 . ISBN 978-1-4200-7033-0.

[Kosiol-9] Kosiol C, Goldman N (2005). «Различные версии матрицы скоростей Дейхоффа». Молекулярная биология и эволюция . 22 (2): 193– 9. doi : 10.1093/molbev/msi005 . PMID 15483331.

[Lio-10] Лио П., Голдман Н. (1998). «Модели молекулярной эволюции и филогении». Genome Research . 8 (12): 1233– 44. doi : 10.1101/gr.8.12.1233 . PMID 9872979.

[Gusfield-11] Gusfield D (1997). Алгоритмы на строках, деревьях и последовательностях - Компьютерная наука и вычислительная биология . Cambridge University Press. С. 383–384 . ISBN 978-0521585194.

[Boecken-12] Boeckenhauer HJ, Bongartz D (2010). Алгоритмические аспекты биоинформатики . Springer. стр. 94–96 . ISBN 978-3642091001.

[Pevsner-ch7-13] Pevsner J (2009). «Молекулярная филогения и эволюция». Биоинформатика и функциональная геномика (2-е изд.). Wiley-Blackwell. С. 221–227. ISBN 978-0-470-08585-1.

[14] Мотвани Р., Рагхаван П. (1995). Рандомизированные алгоритмы. Cambridge University Press. стр. 94. ISBN 978-0521474658.

[15] "Статистика оценок сходства последовательностей". Национальный центр биотехнологической информации . Получено 20 октября 2013 г.

[16] Henikoff S , Henikoff JG (1992). "Матрицы аминокислотных замен из белковых блоков". Труды Национальной академии наук Соединенных Штатов Америки . 89 (22): 10915– 10919. Bibcode :1992PNAS...8910915H. doi : 10.1073/pnas.89.22.10915 . PMC 50453 . PMID 1438297.

[17] Saud O (2009). "Матрицы подстановки PAM и BLOSUM". Birec . Архивировано из оригинала 9 марта 2013 года . Получено 20 октября 2013 года .

[:0-18] Altschul SF (июнь 1991). "Матрицы замены аминокислот с точки зрения теории информации". Журнал молекулярной биологии . 219 (3): 555– 65. doi :10.1016/0022-2836(91)90193-A. PMC 7130686. PMID 2051488 .