Русская Википедия:Предпочтение кодонов

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Предпочте́ние кодо́нов — понятие, описывающее явление неравных частот встречаемости синонимичных кодонов в кодирующих областях генома[1][2].

В целом генетический код консервативен среди организмов. Однако предпочтение кодонов варьируется между организмами: в разных организмах выбор частых и редких синонимичных кодонов различен[3][4][5][6]. В то же время этот выбор более или менее постоянен в разных генах одного генома[6][7][8]. Гипотеза о том, что различные организмы имеют различные предпочтения, получила название геномной гипотезы предпочтения кодонов[8].

По мере накопления доступных для анализа нуклеотидных последовательностей из разных организмов становилось понятно, что неравное распределение синонимичных кодонов находится под действием эволюционных сил (естественный отбор, дрейф генов, мутации) и может проявляться по-разному в разных участках генов[6][9][10], геномов и в разных организмах.

Общий обзор

Вследствие вырожденности генетического кода часть аминокислот закодирована несколькими кодонами. Кодоны, кодирующие одну аминокислоту, называют синонимичными, или изоакцепторными. Для 18 аминокислот существует более одного кодона (от 2 до 6). Для восьми аминокислот третья позиция их кодонов является вырожденной — там может встречаться любой из четырёх возможных нуклеотидов. Длительное время считалось, что изоакцепторные кодоны равноправны, поскольку последовательность кодируемого белка не меняется, и мутации, превращающие один изоакцепторный кодон в другой (например, мутации по третьему положению четырёхкратно вырожденных кодонов), являются нейтральными («молчащими»). Однако с появлением в открытом доступе нуклеотидных последовательностей различных генов стали накапливаться свидетельства неравного распределения синонимичных кодонов в кодирующей ДНК. В англоязычной литературе это явление получило название Codon usage bias[1].

Эволюционные механизмы

Существуют две гипотезы, объясняющие явление предпочтения кодонов[5][11][12][13]. Мутационная (нейтральная) гипотеза предполагает, что предпочтение кодонов существует из-за различных мутационных паттернов — некоторые кодоны в большей степени подвержены мутациям и поэтому встречаются реже. Гипотеза отбора объясняет существование кодонного предпочтения действием естественного отбора — предпочтение кодонов влияет на эффективность и точность экспрессии генов и, таким образом, создаётся и поддерживается отбором.

Мутационная гипотеза

Мутационная гипотеза основана на том, что мутационные паттерны различаются у разных организмов и в разных частях одного генома. В результате этого различные кодоны мутируют с различной частотой, что может быть причиной различных предпочтений кодонов. Например, одним из наиболее значимых параметров, объясняющих различные предпочтения кодонов в разных организмах, является GC-состав[7][14][15].

Гипотеза естественного отбора

Существуют доказательства и в пользу влияния естественного отбора. Мутационная гипотеза не может объяснить, почему наиболее частыми кодонами являются те, которые узнаются наиболее встречаемыми тРНК[6][16][17][18]. Также, помимо GC-состава, предпочтение кодонов очень сильно коррелирует с уровнем экспрессии гена[5][6][9]. Часто функционально связанные гены, с большой вероятностью экспрессирующиеся на одном уровне, имеют одинаковые кодонные предпочтения. В принципе, уровень экспрессии гена может влиять на мутационные паттерны и, именно таким образом, на предпочтение кодонов[19]. Однако было показано, что предпочтения кодонов в экзонах и тринуклеотидов в интронах могут различаться, из чего следует, что кодонные предпочтения генов не могут быть объяснены только влиянием экспрессии на мутационный процесс (то есть может быть вовлечен и естественный отбор)[5][20].

Модель баланса действующих сил

Точные причины выбора предпочтительных кодонов остаются неясными. Однако, учитывая существование свидетельств в пользу и естественного отбора, и мутационного процесса, была сформирована модель предпочтения мажорных кодонов, или модель баланса мутационного процесса, естественного отбора и генетического дрейфа. В рамках этой модели естественный отбор поддерживает некоторые кодоны (предпочтительные, или мажорные) на более высоких частотах, в то время как мутационный процесс и генетический дрейф позволяют существовать минорным кодонам. Уровень экспрессии, функциональные связи, скорость рекомбинации и другие факторы могут обеспечивать разную степень выраженности предпочтения кодонов в разных генах[5][10][21][22][23].

Модель предпочтения мажорных кодонов пытались проверить количественно. Поначалу существование и направление естественного отбора и мутационного процесса пытались оценить для разных видов Drosophila[21][22][23][24][25][26]. Результаты несколько менялись с появлением новых данных, однако в целом было показано, что в разных генах обычно либо наблюдается слабый положительный отбор в пользу мажорных кодонов, либо отбор не наблюдается. Это в общем не противоречит модели предпочтения мажорных кодонов и тому факту, что в разных генах степень выраженности предпочтения кодонов различается. Однако для некоторых генов был показан слабый положительный отбор в пользу минорных кодонов, что свидетельствует о том, что естественный отбор не всегда поддерживает кодоны, обеспечивающие эффективность и точность экспрессии[26][27].

Биологические эффекты

Кодонные предпочтения можно рассматривать на разных уровнях: на уровне различных видов, внутри одного генома и в пределах одного гена.

Видовой уровень

На данном уровне кодонные предпочтения в значительной мере определяются GC-составом генома. Показано, что по одним лишь некодирующим областям можно довольно точно предсказать различия в кодонных предпочтениях разных видов бактерий[7]. Для млекопитающих, чья скорость мутаций в большой степени определяется контекстом (в частности, CpG динуклеотидами), показана зависимость паттерна предпочтения кодонов от контекста последовательности[28]. Таким образом, видовые различия кодонных предпочтений объясняются преимущественно мутационными процессами[7].

Геномный уровень

Степень выраженности кодонного предпочтения варьируется среди различных генов в геноме. Общими закономерностями, продемонстрированными на многих модельных организмах, являются положительная корреляция между уровнем экспрессии и силой кодонного предпочтения (степень выраженности неравных частот кодонов) и отрицательная корреляция между уровнем экспрессии и скоростью синонимичных замен[11][29]. Классическим объяснением данных закономерностей является действие естественного отбора: в генах с высоким уровнем экспрессии предпочтение кодонов сильно выражено и хорошо согласуется с паттерном встречаемости изоакцепторных тРНК в клетке. Это объяснение не охватывает всех полученных на данных момент сведений: около трети бактериальных геномов не содержат доказательства подобного отбора на уровне трансляции[30]. Кроме того, остаётся неясной причина трансляционного отбора: предпочтение кодонов в высоко экспрессируемых генах может быть обусловлено как эффективностью, так и точностью трансляции. Обе модели имеют экспериментальные подтверждения:

  • связь точности трансляции и кодонного предпочтения показана для D. melanogaster[31], C. elegans[32] и некоторых одноклеточных[33]. Для этих видов установлено, что высококонсервативные аминокислотные остатки имеют более выраженную адаптацию кодонного состава к уровню изоакцепторных тРНК. Для кишечной палочки показана[34] корреляция между степенью кодонной адаптации и длиной белка: поскольку ошибки трансляции энергетически невыгодны, цена ошибки увеличивается с длиной белка. Эта корреляция, однако, не наблюдается у ряда многоклеточных модельных организмов[20];
  • в пользу важности эффективности трансляции говорит корреляция между минимальным временем жизни поколения бактериальных видов и степенью кодонной адаптации в высоко экспрессируемых генах[30]. В этом случае логично ожидать корреляцию, если адаптация повышает скорость элонгации белковой цепи, но не точность трансляции.

В принципе, эти две модели не противоречат друг другу. Но для некоторых аминокислот показано, что скорость элонгации и точность трансляции имеют различные оптимальные кодоны[35].

Уровень одного гена

В генах есть определённые мотивы (сайты посадки различных факторов, сайты сплайсинга и т. д.), нарушение которых может привести к серьёзным последствиям. В этих мотивах даже синонимические замены находятся под отбором. Так, например, показано, что вблизи сайтов сплайсинга паттерн кодонного предпочтения отличается от паттерна по гену в целом и может не совпадать с трансляционно оптимальным паттерном[36]. Особые паттерны минорных кодонов могут возникать в местах остановки рибосомы, необходимых для правильного сопряжённого с трансляцией фолдинга[37].

Помимо этих мотивов можно выделить некоторые общие закономерности, задающие вариацию кодонного предпочтения в пределах одного гена:

  • образование третичной структуры на 5'-конце мРНК подавляет инициацию трансляции. Для широкого спектра организмов показано, что в 5'-регионе мРНК снижены кодонная адаптация и частота синонимичных замен[38];
  • обнаружена слабая адаптация кодонов в пределах первых 90—150 нуклеотидов гена. Предложено несколько объяснений данному наблюдению. Возможно, регуляторное замедление начальных этапов элонгации препятствует столкновению рибосом на 3'-конце мРНК[39]. Другое возможное преимущество — упрощение посадки шаперонов на синтезируемый полипептид[40];
  • если предположить, что тРНК, передавшая аминокислоту рибосоме, диссоциирует с рибосомы медленнее, чем происходит повторное ацилирование этой тРНК новой аминокислотой, то может быть эффективным повторное использование этой же тРНК для той же аминокислоты в этом участке мРНК. В таком случае можно ожидать локальные паттерны кодонного предпочтения в разных участках гена, если на близком расстоянии закодировано несколько одинаковых аминокислот. Такие паттерны были обнаружены в эукариотах, в частности, в генах ответа на стресс, а явление получило название кодонной автокорреляции. Автокорреляция была наиболее выражена для изоакцепторных кодонов редких тРНК высоко экспрессирующихся генов[41].

Методы детекции и количественного измерения

Предложено несколько способов измерения степени выраженности кодонного предпочтения.

  • Наиболее известная мера предложена Shapr & Li в 1986 году[42]. Индекс отношения использования синонимичных кодонов (relative synonymous codon usage) отражает то, насколько отклоняется частота использования конкретного кодона от ожидаемой частоты при равномерном распределении синонимичных кодонов:

<math> RSCU_{ij} = \frac {X_{ij} } { \left(\frac {1} {n_{i} }\right) \sum\limits_{j=1}^{n_{i} } X_{ij} } </math> , где <math>{X_{ij} }</math> — число j-х кодонов, кодирующих i-ую аминокислоту, n — число синонимичных кодонов для i-й аминокислоты.

  • Авторами RSCU был также предложен Шаблон:Нп5[43] — мера адаптации гена к кодонному предпочтению. Эта мера определяется как среднее геометрическое значений относительной адаптивности для всех кодонов в гене:

<math> CAI(g) = { \left (\prod_{k=1}^{L} w_{k} \right )}^{\frac {1} {L} } </math>, где <math>g</math> — ген, <math>L</math> — число кодонов в гене, <math>w_{k}</math> — относительная адаптивность <math>k</math>-го кодона в гене. Относительная адаптивность кодона рассчитывается следующим образом:

<math>w_{i,j} = \frac {x_{i,j} } {y_{j} }</math>, где <math>x_{i,j}</math> — количество в гене <math>i</math>-ых кодонов, соответствующих <math>j</math>-ой аминокислоте, <math>y_{j}</math> — количество в гене кодонов наиболее представленного типа (среди всех кодонов, соответствующих <math>j</math>-ой аминокислоте).

  • Другой подход к оценке кодонного предпочтения основан на использовании энтропии Шеннона[44]. Этот подход нашёл применение в ряде статистик (например, SCUO[45]).

Также существуют методы для оценки различий кодонного предпочтения в разных генах. В их основе могут лежать метод главных компонент[46], метод k средних, метод максимального правдоподобия[47]. Многие из них реализованы в виде отдельных программ[47][48][49].

Примеры

Предпочтение кодонов у бактерий

В 2012 году группой учёных был обнаружен один из аспектов кодонного предпочтения в бактериях. С помощью рибосомного профайлинга на бактериях E. coli и B. subtilis было показано, что наличие в теле гена последовательностей, похожих на последовательность Шайна — Дальгарно (ШД), вызывает остановку трансляции. Это задаёт направление для характера предпочтения кодонов: ШД-подобные последовательности в генах избегаются. Остановка объясняется гибридизацией ШД-подобной последовательности с антиШД-последовательностью в составе рибосомы. Несмотря на то, что на пары кодонов, способных к образованию ШД-подобной последовательности, действует отбор, они всё же встречаются в последовательностях. На это можно смотреть с двух разных точек зрения. Во-первых, не для любой пары аминокислот можно подобрать «правильные» кодоны, которые не будут гибридизоваться с рибосомой, то есть действие отбора ограничено аминокислотной последовательностью. Во-вторых, такие участки могут нести регуляторную функцию. Остановки рибосомы могут использоваться для регуляции сопряжённого с трансляцией фолдинга или транскрипции (которая в бактериях также сопряжена с трансляцией)[50].

Предпочтение кодонов у насекомых

В результате исследования 6698 ортологов из 12 видов Drosophila было показано, что во всех видах, кроме одного, существует предпочтение кодонов, заканчивающихся на G или C. У Шаблон:Нп5 наблюдался сдвиг в сторону кодонов, заканчивающихся на А или Т. В большинстве генов наблюдался положительный отбор на кодоны, заканчивающиеся на G или C; в небольшой части генов сдвиг кодонного состава был вызван мутационным процессом. Наиболее сильный отбор был показан у группы melanogaster[51].

У пчёл в генах, расположенных в GC-бедных регионах, наблюдается намного большее разнообразие в предпочтении кодонов и аминокислот, чем в генах, расположенных в GC-богатых регионах[52].

Биотехнологическое значение

Экспрессия функциональных белков в модельных организмах (таких, как бактерии)[53] повсеместно используется в биотехнологии. Такие технологии часто сталкиваются с трудностями, связанными с экспрессией белка вне родного организма. Для оптимизации синтеза применяется редизайн последовательности гена, направленный на модификацию зоны инициации трансляции, изменение структурных элементов мРНК и изменение паттерна предпочтения кодонов, чтобы получившаяся последовательность была максимально похожа на последовательности используемого организма[54]. Для модификации целевого гена применяют как сайт-направленный мутагенез[55], так и ресинтез всего гена[56]. Помимо этого может подвергаться модификации и сам используемый организм, например, в нём могут быть так изменены уровни экспрессии генов тРНК, чтобы состав пула тРНК соответствовал кодонным предпочтениям целевого гена[57].

Тем не менее, подобных оптимизаций может быть недостаточно, либо они могут приводить к тому, что функциональный продукт синтезироваться не будет. Стратегия оптимизации кодонов основывается на трех предположениях:

  1. Минорные кодоны уменьшают скорость синтеза пептидов.
  2. Синонимичные замены не влияют на структуру и функции белка.
  3. Замена минорных кодонов на синонимичные мажорные приводит к увеличению скорости синтеза пептидов[58].

Поскольку не у всех организмов и не во всех генах кодонный состав коррелирует с уровнем экспрессии, предположения 1 и 3 выполняются не всегда. Предположение 2 также выполняется не всегда: первичная последовательность влияет на ритм движения рибосомального комплекса по мРНК, что, в свою очередь, влияет на правильность сворачивания полипептидной цепи в пространственную структуру. Более того, первичная последовательность участвует в комплементарных взаимодействиях — формировании вторичной структуры мРНК, а также взаимодействии и рибосомальными и различными малыми РНК. Все это может повлиять на инициацию, элонгацию, паузы и терминацию транскрипции, а также реинициацию, фреймшифты и стабильность мРНК[58].

Примечания

Шаблон:Примечания

Литература

Шаблон:Добротная статья

  1. 1,0 1,1 Шаблон:Cite pmid
  2. Шаблон:Cite pmid
  3. Шаблон:Cite pmid
  4. Шаблон:Cite pmid
  5. 5,0 5,1 5,2 5,3 5,4 Шаблон:Cite pmid
  6. 6,0 6,1 6,2 6,3 6,4 Шаблон:Cite pmid
  7. 7,0 7,1 7,2 7,3 Шаблон:Cite pmid
  8. 8,0 8,1 Шаблон:Cite pmid
  9. 9,0 9,1 Шаблон:Cite pmid
  10. 10,0 10,1 Шаблон:Cite pmid
  11. 11,0 11,1 Шаблон:Cite pmid
  12. Шаблон:Cite pmid
  13. Шаблон:Cite pmid
  14. Шаблон:Cite pmid
  15. Шаблон:Cite pmid
  16. Шаблон:Cite pmid
  17. Шаблон:Cite pmid
  18. Шаблон:Cite pmid
  19. Шаблон:Cite pmid
  20. 20,0 20,1 Шаблон:Cite pmid
  21. 21,0 21,1 Шаблон:Cite pmid
  22. 22,0 22,1 Шаблон:Cite pmid
  23. 23,0 23,1 Шаблон:Cite pmid
  24. Шаблон:Cite pmid
  25. Шаблон:Cite pmid
  26. 26,0 26,1 Шаблон:Cite pmid
  27. Шаблон:Cite pmid
  28. Шаблон:Cite pmid
  29. Шаблон:Cite pmid
  30. 30,0 30,1 Шаблон:Cite pmid
  31. Шаблон:Cite pmid
  32. Шаблон:Cite pmid
  33. Шаблон:Cite pmid
  34. Шаблон:Cite pmid
  35. Шаблон:Cite pmid
  36. Шаблон:Cite pmid
  37. Шаблон:Cite pmid
  38. Шаблон:Cite pmid
  39. Шаблон:Cite pmid
  40. Шаблон:Cite pmid
  41. Шаблон:Cite pmid
  42. Шаблон:Cite pmid
  43. Шаблон:Cite pmid
  44. Шаблон:Cite pmid
  45. Шаблон:Cite pmid
  46. Шаблон:Cite pmid
  47. 47,0 47,1 Шаблон:Cite pmid
  48. Шаблон:Cite pmid
  49. Шаблон:Cite pmid
  50. Шаблон:Cite pmid
  51. Шаблон:Cite pmid
  52. Шаблон:Cite pmid
  53. Шаблон:Cite pmid
  54. Шаблон:Cite pmid
  55. Шаблон:Cite pmid
  56. Шаблон:Cite pmid
  57. Шаблон:Cite pmid
  58. 58,0 58,1 Шаблон:Cite pmid