Индекс адаптации кодонов (CAI) [1] является наиболее распространенным методом анализа смещения использования кодонов . В отличие от других мер смещения использования кодонов, таких как « эффективное число кодонов » (Nc), которые измеряют отклонение от равномерного смещения (нулевая гипотеза), CAI измеряет отклонение заданной последовательности гена, кодирующего белок, относительно референтного набора генов. CAI используется как количественный метод прогнозирования уровня экспрессии гена на основе его последовательности кодонов. [1]
В идеале референтный набор в CAI состоит из высокоэкспрессируемых генов, так что CAI обеспечивает указание уровня экспрессии генов при предположении, что существует трансляционный отбор для оптимизации последовательностей генов в соответствии с их уровнями экспрессии. Обоснование этого двоякое: высокоэкспрессируемые гены должны конкурировать за ресурсы (т. е. рибосомы) в быстрорастущих организмах, и имеет смысл, чтобы они также были более точно транслированы. Обе гипотезы приводят к высокоэкспрессируемым генам, использующим в основном кодоны для видов тРНК, которые в изобилии присутствуют в клетке.
Для каждой аминокислоты в гене вес каждого из ее кодонов, представленный параметром, называемым относительной адаптивностью ( w i ), вычисляется из набора референтных последовательностей как отношение между наблюдаемой частотой кодона fi и частотой наиболее частого синонимичного кодона f j для этой аминокислоты.
CAI гена определяется просто как геометрическое среднее веса, связанного с каждым кодоном по длине ( L ) последовательности гена (измеряемой в кодонах). [2]