Русская Википедия:Генетический код

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Кратное изображение Генети́ческий код (Шаблон:Lang-en) — совокупность правил, согласно которым в живых клетках последовательность кодонов (генов и мРНК) переводится в последовательность аминокислот (белков). Собственно перевод (трансляцию) осуществляет рибосома, которая соединяет аминокислоты в цепочку согласно инструкции, записанной в кодонах мРНК. Соответствующие аминокислоты доставляются в рибосому молекулами тРНК. Генетический код всех живых организмов Земли един (имеются лишь незначительные вариации), что свидетельствует о наличии общего предка.

Правила генетического кода определяют, какой аминокислоте соответствует триплет (три подряд идущих нуклеотида) в мРНК. За редкими исключениями[1], каждому кодону соответствует только одна аминокислота. Конкретная аминокислота может кодироваться более чем одним кодоном, есть также кодоны, означающие начало и конец белка. Вариант генетического кода, который используется подавляющим большинством живых организмов, называют стандартным, или каноническим, генетическим кодом. Однако известно несколько десятков исключений из стандартного генетического кода, например, при трансляции в митохондриях используются несколько изменённые правила генетического кода.

Простейшим представлением генетического кода может служить таблица из 64 ячеек, в которой каждая ячейка соответствует одному из 64 возможных кодонов[2].

История изучения

Файл:Marshall Nirenberg.jpg
Маршалл Ниренберг, начавший расшифровку генетического кода

Попытки понять, каким образом последовательность ДНК кодирует аминокислотную последовательность белков, начали предприниматься почти сразу же после того, как в 1953 году была установлена структура ДНК (двойная спираль). Георгий Гамов предположил, что кодоны должны состоять из трёх нуклеотидов, чтобы кодонов хватило для всех 20 аминокислот (всего же возможно 64 различных кодона из трёх нуклеотидов: на каждую из трёх позиций можно поставить один из четырёх нуклеотидов)[3].

В 1961 году триплетность генетического кода удалось подтвердить экспериментально. В том же году Маршалл Ниренберг и его коллега Шаблон:Нп5 использовали бесклеточную систему для трансляции in vitro. В качестве матрицы был взят олигонуклеотид, состоящий из остатков урацила (UUUU…). Пептид, синтезированный с него, содержал только аминокислоту фенилаланин[4]. Так впервые было установлено значение кодона: кодон UUU кодирует фенилаланин. Дальнейшие правила соответствия между кодонами и аминокислотами были установлены в лаборатории Северо Очоа. Было показано, что полиадениновая РНК (ААА…) транслируется в полилизиновый пептид[5], а на матрице полицитозиновой РНК (ССС…) синтезируется пептид, состоящий только из остатков пролина[6]. Значение остальных кодонов было установлено при помощи разнообразных сополимеров в ходе экспериментов, проведённых в лаборатории Хара Гобинда Кораны. Вскоре после этого Роберт Холли установил структуру молекулы тРНК, которая служит посредником при трансляции. В 1968 году Ниренберг, Корана и Холли были удостоены Нобелевской премии по физиологии и медицине[7].

После установления правил генетического кода многие учёные занялись его Шаблон:Нп5. Так, начиная с 2001 года в генетический код были внедрены 40 аминокислот, которые в природе не входят в состав белков. Для каждой аминокислоты создавались свой кодон и соответствующая аминоацил-тРНК-синтетаза. Искусственное расширение генетического кода и создание белков с новыми аминокислотами могут помочь глубже изучить структуру белковых молекул, а также получить искусственные белки с заданными свойствами[8][9]. Х. Мураками и М. Сисидо смогли превратить некоторые кодоны из трёхнуклеотидных в четырёх- и пятинуклеотидные. Стивен Бреннер получил 65-й кодон, который был функционален in vivo[10].

В 2015 году у бактерии Escherichia coli удалось изменить значение всех кодонов UGG с триптофана на тиенопиррол-аланин, не встречающийся в природе[11]. В 2016 году был получен первый полусинтетический организм — бактерия, геном которой содержал два искусственных азотистых основания (X и Y), сохраняющихся при делении[12][13]. В 2017 году исследователи из Южной Кореи заявили о создании мыши с расширенным генетическим кодом, способной синтезировать белки с аминокислотами, не встречающимися в природе[14].

Свойства

Файл:Homo sapiens-mtDNA~NC 012920-ATP8+ATP6 Overlap.svg
Рамки считывания в митохондриальной ДНК человека в области генов Шаблон:Нп5 и Шаблон:Нп5 (чёрным цветом показан участок между позициями 8525 и 8580). В направлении считывания 5' → 3' возможны три рамки считывания, начинающиеся с первой (+1), второй (+2) и третьей позиций (+3). Соответствие между кодонами (кодоны выделены квадратными скобками) определяется Шаблон:Нп5 в рамке +1 для MT-ATP8 (показана красным) или в рамке +3 для MT-ATP6 (показана синим). Ген MT-ATP8 заканчивается стоп-кодоном TAG (отмечен красной точкой) в рамке +1. Ген MT-ATP6 начинается с кодона ATG (кодирует аминокислоту метионин (М) и выделен синим кружком) в рамке +3

Выделяют следующие свойства генетического кода, также называемые принципами трансляции:

  • триплетность — одной аминокислоте соответствует триплет из трех нуклеотидов РНК;
  • неперекрываемость — один нуклеотид входит в состав единственного триплета;
  • однозначность — одному триплету соответствует единственная аминокислота (за исключением стоп-кодонов);
  • вырожденность — многим аминокислотам соответствует несколько триплетов (кроме метионина и триптофана);
  • компактность — отсутствие знаков препинания внутри гена;
  • наличие стоп-кодонов;
  • универсальность — генетический код един для всех живых организмов;
  • помехоустойчивость — большая часть однонуклеотидных замен внутри триплетов не приводят к изменению свойств аминокислоты.

Рамка считывания

Гены кодируются в направлении 5'→3' нуклеотидной последовательности[15]. Рамка считывания определяется самым первым триплетом, с которого начинается трансляция. Последовательность неперекрывающихся кодонов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном, называют открытой рамкой считывания. Например, последовательность 5'-AAATGAACG-3' (см. рис.) при чтении с первого нуклеотида разбивается на кодоны AAA, TGA и ACG. Если чтение начинается со второго нуклеотида, то ей соответствуют кодоны AAT и GAA. Наконец, при чтении с третьего нуклеотида используются кодоны ATG и AAC. Таким образом, любую последовательность можно прочесть в направлении 5' → 3' тремя разными способами (с тремя разными рамками считывания), причём в каждом случае последовательность белкового продукта будет отличаться из-за распознавания рибосомой разных кодонов. Если учесть, что ДНК имеет двуцепочечную структуру, то возможны 6 рамок считывания: три на одной цепи и три на другой[16]. Однако считывание генов с ДНК не является случайным. Все другие рамки считывания в пределах одного гена обычно содержат многочисленные стоп-кодоны, чтобы быстро остановить и уменьшить метаболическую стоимость неправильного синтеза[17].

Старт- и стоп-кодоны

Трансляция информации с последовательности мРНК в аминокислотную последовательность начинается с так называемого старт-кодона — как правило, AUG, причём у эукариот он читается как метионин, а у бактерий — как формилметионин. Одного старт-кодона недостаточно для запуска трансляции; для него необходимы факторы инициации трансляции, а также особые элементы в соседних последовательностях, например, последовательность Шайна — Дальгарно у бактерий. У некоторых организмов в роли старт-кодонов используются кодоны GUG, который в норме кодирует валин, и UUG, который в стандартном коде соответствует лейцину[18].

После инициационного кодона трансляция продолжается через последовательное считывание кодонов и присоединение аминокислот друг к другу рибосомой до достижения сигнала к прекращению трансляции — стоп-кодона. Существуют три стоп-кодона, каждый из которых имеет своё название: UAG (янтарь), UGA (опал) и UAA (охра). Стоп-кодоны также называют терминаторными. В клетках нет тРНК, соответствующих стоп-кодонам, поэтому, когда рибосома доходит до стоп-кодона, вместо тРНК с ним взаимодействуют факторы терминации трансляции, которые гидролизуют последнюю тРНК от аминокислотной цепочки, а затем заставляют рибосому диссоциировать[19]. У бактерий в терминации трансляции принимают участие три Шаблон:Нп5: RF-1, RF-2 и RF-3: RF-1 узнаёт кодоны UAG и UAA, а RF-2 распознаёт UAA и UGA. Фактор RF-3 выполняет вспомогательную работу. Трёхмерная структура RF-1 и RF-2 напоминает формой и распределением заряда тРНК и, таким образом, представляет собой пример Шаблон:Нп5Шаблон:Sfn. У эукариот фактор терминации трансляции eRF1 распознаёт все три стоп-кодона. Зависимая от рибосомы ГТФаза eRF3, которую рассматривают как второй фактор терминации трансляции эукариот, помогает eRF1 в высвобождении с рибосомы готового полипептида[20][21][22].

Распределение стоп-кодонов в геноме организма неслучайно и может быть связано с GC-составом генома[23][24]. Например, у штамма E. coli K-12 в геноме имеется 2705 кодонов TAA (63 %), 1257 TGA (29 %) и 326 TAG (8 %) при GC-составе 50,8 %[25]. Масштабное исследование геномов разных видов бактерий показало, что доля кодона TAA положительно коррелирует с GC-составом, а доля TGA — отрицательно. Частота самого редко используемого стоп-кодона, TAG, не связана с GC-составом[26]. Сила стоп-кодонов также неодинакова. Спонтанный обрыв трансляции чаще всего происходит на кодоне UGA, а на UAA — реже всего[22].

Помимо собственно стоп-кодона, важнейшее значение для терминации трансляции имеет его окружение. Наиболее велика роль нуклеотида, расположенного сразу за стоп-кодоном (+4). Вероятно, нуклеотид +4 и другие нуклеотиды, следующие за ним, влияют на терминацию трансляции, обеспечивая сайты связывания факторов терминации трансляции. По этой причине некоторые исследователи предлагают рассматривать четырёхнуклеотидный стоп-сигнал вместо трёхнуклеотидного стоп-кодона. Нуклеотиды, расположенные выше стоп-кодонов, также влияют на трансляцию. Например, для дрожжей было показано, что аденин, располагающийся на 2 позиции выше первого нуклеотида стоп-кодона, стимулирует обрыв трансляции на стоп-кодоне UAG (возможно, и на остальных кодонах)[22].

Иногда стоп-кодоны выступают в роли смысловых. Например, кодон UGA кодирует нестандартную аминокислоту селеноцистеин, если рядом с ним в транскрипте находится так называемый SECIS-элемент[27]. Стоп-кодон UAG может кодировать другую нестандартную аминокислоту — пирролизин. Иногда стоп-кодон распознаётся как смысловой при мутациях, затрагивающих тРНК. Наиболее часто это явление наблюдается у вирусов, но оно также описано у бактерий, дрожжей, дрозофилы и человека, у которых играет регуляторную роль[28][29].

Генетический код и мутации

В ходе репликации ДНК изредка возникают ошибки при синтезе дочерней цепи. Эти ошибки, называемые мутациями, могут повлиять на фенотип организма, особенно если они затрагивают кодирующую область гена. Ошибки происходят с частотой 1 на каждые 10—100 миллионов пар оснований (п. о.), так как ДНК-полимеразы могут эффективно исправлять свои ошибки[30][31].

Под точечными мутациями понимают единичные замены одного азотистого основания. Если новое основание относится к тому же классу, что и исходное (оба пурины или оба пиримидины), то мутацию относят к транзициям. Если происходит замена пурина на пиримидин или пиримидина на пурин, то говорят о трансверсиях. Транзиции встречаются чаще трансверсийШаблон:Sfn. Примерами точечных мутаций являются миссенс- и нонсенс-мутации. Они могут вызывать такие заболевания, как серповидноклеточная анемия и талассемия соответственно[32][33]. Клинически значимые миссенс-мутации приводят к замене аминокислотного остатка на остаток с другими физико-химическими свойствами, а нонсенс-мутации заключаются в появлении преждевременного стоп-кодона[16].

Мутации, при которых нарушается правильная рамка считывания из-за вставок и делеций (в совокупности они называются Шаблон:Нп5), содержащих некратное трём число нуклеотидов, называются мутациями сдвига рамки считывания. При этих мутациях белковый продукт получается совершенно иной, чем в диком типе. Как правило, при сдвигах рамки считывания появляются преждевременные стоп-кодоны, которые вызывают образование усечённых белков[34]. Поскольку эти мутации значительно нарушают функцию белка, они довольно редко закрепляются отбором: нередко отсутствие белка приводит к гибели организма ещё до рождения[35]. Мутации сдвига рамки считывания связаны с такими заболеваниями, как болезнь Тея — Сакса[36].

Хотя подавляющее число мутаций вредно или Шаблон:Нп5, некоторые оказываются полезными[37]. Они могут давать организму лучшую приспособленность по сравнению с диким типом к определённым условиям окружающей среды или дают ему возможность размножаться быстрее особей дикого типа. В этом случае мутация будет постепенно распространяться в популяции в ходе нейтрального отбора[38]. Вирусы, геномы которых представлены РНК, мутируют очень быстро[39], что нередко приносит им пользу, потому что иммунная система, эффективно распознающая одни варианты вирусных антигенов, оказывается бессильна против слегка изменённых[40]. В больших популяциях организмов, размножающихся бесполым путём, например, E. coli, одновременно может происходить несколько полезных мутаций. Этот феномен получил название Шаблон:Нп5 и вызывает конкуренцию между мутациями[41].

Вырожденность

Файл:Genetic Code Simple Corrected.pdf
Группировка кодонов по молярному количеству (ось Y) и гидрофобности аминокислот (ось Х). Более подробная схема на Викискладе

Способность разных кодонов кодировать одну аминокислоту называется вырожденностью кода. Впервые генетический код назвали Шаблон:Нп5 Ниренберг и Бернфилд. Однако, несмотря на вырожденность, в генетическом коде полностью отсутствует двусмысленность. Например, кодоны GAA и GAG оба кодируют глутамат, но ни один из них не кодирует одновременно ещё какую-то аминокислоту. Кодоны, соответствующие одной аминокислоте, могут различаться по любым позициям, однако чаще всего две первые позиции у таких кодонов совпадают, а различается только последняя. Благодаря этому мутация, затронувшая третью позицию кодона, скорее всего, не скажется на белковом продуктеШаблон:Sfn.

Эта особенность может быть объяснена гипотезой неоднозначной пары оснований, предложенной Франсисом Криком. Согласно этой гипотезе, третий нуклеотид в кодоне ДНК может быть не полностью комплементарен антикодону тРНК для компенсации несоответствия числа типов тРНК числу кодонов[42][43].

Кодоны близких по физико-химическим свойствам аминокислот также нередко похожи, благодаря чему мутации не приводят к значительным нарушениям белковой структуры. Так, кодоны NUN (N — любой нуклеотид) обычно кодируют гидрофобные аминокислоты. NCN кодируют маленькие аминокислоты с умеренной гидрофобностью, а NAN кодируют гидрофильные аминокислоты среднего размера. Генетический код устроен настолько оптимально с точки зрения гидрофобности, что математический анализ при помощи сингулярного разложения 12 переменных (4 нуклеотида на 3 позиции) даёт значимую корреляцию (0,95) для предсказания гидрофобности аминокислоты по её кодону[44]. На восемь аминокислот мутации по третьим позициям не влияют вообще, а мутации по второй позиции, как правило, приводят к замене на аминокислоту с совершенно другими физико-химическими свойствами. Однако наибольшее влияние на белковый продукт имеют мутации по первым позициям. Так, мутации, приводящие к замене заряженной аминокислоты на аминокислоту с противоположным зарядом, могут затрагивать только первую позицию, а вторую — никогда. Такая замена заряда, вероятнее всего, окажет сильный эффект на структуру белка[45].

Стандартный генетический код

В таблице ниже представлен генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований — от 5'- к 3'-концу мРНК. Приведены трёхбуквенные и однобуквенные обозначения аминокислот. Шаблон:Таблица кодонов Шаблон:-

Шаблон:Small
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA

Альтернативные генетические коды

Нестандартные аминокислоты

В некоторых белках нестандартные аминокислоты кодируются стоп-кодонами в зависимости от наличия особой сигнальной последовательности в мРНК. Например, стоп-кодон UGA может кодировать селеноцистеин, а UAG — пирролизин. Селеноцистеин и пирролизин рассматривают как 21-ю и 22-ю протеиногенную аминокислоту соответственно. В отличие от селеноцистеина, у пирролизина есть собственная аминоацил-тРНК-синтетаза[46]. Хотя обычно генетический код, используемый клетками одного организма, фиксирован, архея Шаблон:Нп5 может переключаться с 20-аминокислотного кода на 21-аминокислотный (включая пирролизин) при разных условиях роста[47].

Вариации

Файл:FACIL genetic code logo.png
Схема митохондриального генетического кода Globobulimina pseudospinescens. Показаны 64 кодона (слева направо), предсказанные отклонения от стандартного генетического кода изображены красным. Красной линией показаны стоп-кодоны. Высота буквы, соответствующей аминокислоте, пропорциональна частоте соответствия этой аминокислоты данному кодону

Существование отклонений от стандартного генетического кода предсказывалось ещё в 1970-х[48]. Первое отклонение было описано в 1979 году в митохондриях человека[49]. Впоследствии было описано ещё несколько альтернативных генетических кодов, слегка отличающихся от стандартного, в том числе альтернативные митохондриальные коды[50].

Например, у бактерий рода Mycoplasma стоп-кодон UGA кодирует триптофан, а у дрожжей из так называемой «CTG-клады» (в том числе патогенного вида Candida albicans) кодон CUG кодирует серин, а не лейцин, как в стандартном генетическом коде[51][52][53]. Поскольку вирусы используют тот же генетический код, что и клетки-хозяева, отклонения от стандартного генетического кода могут нарушить размножение вирусов[54]. Впрочем, некоторые вирусы, например, вирусы рода Шаблон:Нп5, используют тот же альтернативный генетический код, что и организм-хозяин[55].

У бактерий и архей GUG и UUG нередко выступают старт-кодонами[56]. Некоторые отклонения от стандартного генетического кода есть и в ядерном геноме человека: так, в 4 % мРНК фермента малатдегидрогеназы один из стоп-кодонов кодирует триптофан или аргинин[57]. Значение стоп-кодона зависит от его окружения[29]. Отклонения в генетическом коде организма можно обнаружить, если найти в его геноме очень консервативные гены и сравнить их кодоны с соответствующими аминокислотами гомологичных белков близкородственных организмов. По такому принципу работает программа FACIL, которая рассчитывает, с какой частотой каждый кодон соответствует той или иной аминокислоте, а также определяет поддержку стоп-кодона и представляет результат в виде логотипа (LOGO)[58]. Впрочем, несмотря на все перечисленные отличия, генетические коды, используемые всеми организмами, в общих чертах схожи[59].

В таблице ниже перечислены известные на данный момент нестандартные генетические коды[60][61]. Насчитывают 23 нестандартных генетических кода, причём наиболее частым отличием от стандартного генетического кода является превращение стоп-кодона UGA в смысловой, кодирующий триптофан[62]. Шаблон:Начало скрытого блока

Биохимические свойства аминокислот неполярная полярная основная кислая Терминация: стоп-кодон
Сравнение значений кодонов в альтернативных и стандартном генетических кодах
Код Таблица
трансляции
ДНК-кодон РНК-кодон Трансляция
с данным кодом
Стандартная трансляция Примечания
Шаблон:Нп5 1 Включает таблицу трансляции 8 (хлоропласты растений)
Митохондриальный код позвоночных 2 AGA AGA Ter (*) Arg (R)
AGG AGG Ter (*) Arg (R)
ATA AUA Met (M) Ile (I)
TGA UGA Trp (W) Ter (*)
Шаблон:Нп5 3 ATA AUA Met (M) Ile (I)
CTT CUU Thr (T) Leu (L)
CTC CUC Thr (T) Leu (L)
CTA CUA Thr (T) Leu (L)
CTG CUG Thr (T) Leu (L)
TGA UGA Trp (W) Ter (*)
CGA CGA absent Arg (R)
CGC CGC absent Arg (R)
Шаблон:Нп5 4 TGA UGA Trp (W) Ter (*) Включает таблицу трансляции 7 (кинетопласт)
Шаблон:Нп5 5 AGA AGA Ser (S) Arg (R)
AGG AGG Ser (S) Arg (R)
ATA AUA Met (M) Ile (I)
TGA UGA Trp (W) Ter (*)
Шаблон:Нп5 6 TAA UAA Gln (Q) Ter (*)
TAG UAG Gln (Q) Ter (*)
Шаблон:Нп5 9 AAA AAA Asn (N) Lys (K)
AGA AGA Ser (S) Arg (R)
AGG AGG Ser (S) Arg (R)
TGA UGA Trp (W) Ter (*)
Шаблон:Нп5 10 TGA UGA Cys (C) Ter (*)
Шаблон:Нп5 11 См. таблицу трансляции 1
Шаблон:Нп5 12 CTG CUG Ser (S) Leu (L)
Шаблон:Нп5 13 AGA AGA Gly (G) Arg (R)
AGG AGG Gly (G) Arg (R)
ATA AUA Met (M) Ile (I)
TGA UGA Trp (W) Ter (*)
Шаблон:Нп5 14 AAA AAA Asn (N) Lys (K)
AGA AGA Ser (S) Arg (R)
AGG AGG Ser (S) Arg (R)
TAA UAA Tyr (Y) Ter (*)
TGA UGA Trp (W) Ter (*)
Шаблон:Нп5 15 TAG UAG Gln (Q) Ter (*)
Шаблон:Нп5 16 TAG UAG Leu (L) Ter (*)
Шаблон:Нп5 21 TGA UGA Trp (W) Ter (*)
ATA AUA Met (M) Ile (I)
AGA AGA Ser (S) Arg (R)
AGG AGG Ser (S) Arg (R)
AAA AAA Asn (N) Lys (K)
Шаблон:Нп5 22 TCA UCA Ter (*) Ser (S)
TAG UAG Leu (L) Ter (*)
Шаблон:Нп5 23 TTA UUA Ter (*) Leu (L) Сходна с таблицей трансляции 11.
Шаблон:Нп5 24 AGA AGA Ser (S) Arg (R)
AGG AGG Lys (K) Arg (R)
TGA UGA Trp (W) Ter (*)
Шаблон:Нп5 25 TGA UGA Gly (G) Ter (*)
Шаблон:Нп5 26 CTG CUG Ala (A) Leu (L)
Шаблон:Нп5 27 TAA UAA Gln (Q) Ter (*)
TAG UAG Gln (Q) Ter (*)
TGA UGA Ter (*) или Trp (W) Ter (*)
Шаблон:Нп5 28 TAA UAA Ter (*) или Gln (Q) Ter (*)
TAG UAG Ter (*) или Gln (Q) Ter (*)
TGA UGA Ter (*) или Trp (W) Ter (*)
Шаблон:Нп5 29 TAA UAA Tyr (Y) Ter (*)
TAG UAG Tyr (Y) Ter (*)
Шаблон:Нп5 30 TAA UAA Glu (E) Ter (*)
TAG UAG Glu (E) Ter (*)
Шаблон:Нп5 31 TAA UAA Ter (*) или Gln (Q) Ter (*)
TAG UAG Ter (*) или Gln (Q) Ter (*)
TGA UGA Trp (W) Ter (*)

Шаблон:Конец скрытого блока

Предпочтение кодонов

Шаблон:Main В геномах многих организмов наблюдается так называемое предпочтение кодонов, то есть частота встречаемости всех синонимичных кодонов, соответствующих определённой аминокислоте, не равна и для одних кодонов выше, чем для других[63][64]. Эволюционные основы возникновения предпочтения кодонов неясны. Согласно одной гипотезе, реже встречаются те кодоны, которые наиболее часто мутируют. Другая гипотеза утверждает, что предпочтение кодонов регулируется естественным отбором в пользу тех, которые обеспечивают наибольшую эффективность и точность экспрессии генов[65][66]. Предпочтение кодонов в значительной мере связано с GC-составом генома, и в некоторых случаях по GC-составу можно даже предсказать частоту использования кодонов[67]. С функциональной точки зрения предпочтение кодонов связано с эффективностью и точностью трансляции и, следовательно, уровнем экспрессии гена[68][69].

Файл:Full length hammerhead ribozyme.png
Структура рибозима — молекулы РНК, выполняющей функцию катализа

Происхождение

Шаблон:Main В настоящее время наиболее общепринятой гипотезой о происхождении жизни на Земле является гипотеза мира РНК. Любая модель возникновения генетического кода использует гипотезу о передаче основных функций от РНК-ферментов (рибозимов) к белковым ферментам. Как и предполагает гипотеза мира РНК, тРНК появились раньше аминоацил-тРНК-синтетаз, поэтому эти ферменты не могли оказать влияние на свойства тРНК[70].

Генетический код последнего универсального общего предка (LUCA) был основан, вероятнее всего, на ДНК, а не РНК[71]. Генетический код состоял из трёхнуклеотидных кодонов, и всего было возможно 64 различных кодона. Поскольку для построения белков использовалось только 20 аминокислот, некоторые аминокислоты кодировались несколькими кодонами[72][73][74][75].

Если бы соответствие между кодонами и аминокислотами было случайным, в природе существовало бы 1,5 × 1084 генетических кодов[76]. Это число получилось в результате расчёта количества способов, которыми можно 21 предмет (20 кодонов, кодирующих аминокислоты, и один стоп-кодон) разложить в 64 корзины, так, чтобы каждый предмет был использован по крайней мере единожды[77]. Однако соответствия кодонов и аминокислот неслучайны[78]. Аминокислоты, которые имеют общий путь биосинтеза, как правило, имеют общую первую позицию кодонов. Этот факт может быть пережитком раннего, более простого генетического кода, который содержал меньше аминокислот, чем современный, и постепенно включил в свой состав все 20 аминокислот[79]. Кодоны аминокислот со схожими физико-химическими свойствами также, как правило, похожи, что смягчает последствия точечных мутаций и нарушений трансляции[80][81].

Поскольку генетический код неслучаен, правдоподобная гипотеза о его возникновении должна объяснять такие свойства стандартного генетического кода, как отсутствие кодонов для D-аминокислот, включение всего лишь 20 аминокислот из возможных 64, ограничение синонимичных замен третьей позицией кодонов, функционирование в качестве стоп-кодонов именно кодонов UAG, UGA и UAA[82]. Существуют три основные гипотезы происхождения генетического кода. Каждая из них представлена множеством моделей, многие модели гибридны[83].

  • Замороженная случайность: генетический код возник случайно и в таком виде закрепился. Возможно, древние рибозимы, подобные современным тРНК, имели разное сродство к аминокислотам, причём кодоны из разных частей одного и того же рибозима могли обладать наибольшим сродством к разным аминокислотам. После того, как появились первые функциональные пептиды, любое изменение генетического кода было бы летальным, поэтому он оказался «заморожен»[84].
  • Стереохимическое сродство: генетический код определяется высоким сродством каждой аминокислоты с соответствующими ей кодонами и антикодонами. Сродство аминокислоты и антикодона означает, что предковым тРНК соответствовали те аминокислоты, с которыми они связывались с наибольшим сродством. В ходе эволюции соответствие антикодонов и аминокислот заменилось соответствием аминоацил-тРНК-синтетаз и аминокислот[85].
  • Оптимальность: генетический код продолжал некоторое время изменяться после своего появления, поэтому современный код обеспечивает максимальную приспособленность и минимизирует последствия мутаций, то есть является лучшим из возможных генетических кодов[83].

Примечания

Шаблон:Примечания

Литература

Внешние ссылки

  1. Шаблон:Cite pmid
  2. Шаблон:Cite pmid
  3. Шаблон:Книга
  4. Шаблон:Cite pmid
  5. Шаблон:Cite pmid
  6. Шаблон:Cite pmid
  7. Шаблон:Cite press release
  8. Шаблон:Cite pmid
  9. Шаблон:Cite pmid
  10. Шаблон:Книга
  11. Шаблон:Cite pmid
  12. Шаблон:Cite web
  13. Шаблон:Cite pmid
  14. Шаблон:Cite pmid
  15. Шаблон:Cite pmid
  16. 16,0 16,1 Шаблон:Книга Шаблон:Wayback
  17. Шаблон:Cite pmid
  18. Шаблон:Cite pmid
  19. Шаблон:Cite web
  20. Шаблон:Cite pmid
  21. Шаблон:Cite pmid
  22. 22,0 22,1 22,2 Шаблон:Cite doi
  23. Шаблон:Cite pmid
  24. Шаблон:Cite pmid
  25. Шаблон:Cite web
  26. Шаблон:Cite pmid
  27. Шаблон:Cite pmid
  28. Шаблон:Cite pmid
  29. 29,0 29,1 Шаблон:Cite pmid
  30. Шаблон:Книга
  31. Шаблон:Cite pmid
  32. Шаблон:Cite pmid
  33. Шаблон:Cite pmid
  34. Шаблон:Cite pmid
  35. Шаблон:Cite pmid
  36. Шаблон:Книга
  37. Шаблон:Cite pmid
  38. Шаблон:Статья Шаблон:Cite web
  39. Шаблон:Cite pmid
  40. Шаблон:Cite pmid
  41. Шаблон:Cite pmid
  42. Шаблон:Книга
  43. Шаблон:Книга
  44. Шаблон:Книга Шаблон:Wayback
  45. Шаблон:Cite pmid
  46. Шаблон:Cite pmid
  47. Шаблон:Cite pmid
  48. Шаблон:Cite doi
  49. Шаблон:Cite pmid
  50. Шаблон:Cite pmid
  51. Шаблон:Cite pmid
  52. Шаблон:Cite pmid
  53. Шаблон:Cite pmid
  54. Шаблон:Cite pmid
  55. Шаблон:Cite pmid
  56. Шаблон:Cite web
  57. Шаблон:Cite pmid
  58. Шаблон:Cite pmid
  59. Шаблон:Cite pmid
  60. Шаблон:Cite web
  61. Шаблон:Cite doi
  62. Шаблон:Cite pmid
  63. Шаблон:Cite pmid
  64. Шаблон:Cite pmid
  65. Шаблон:Cite pmid
  66. Шаблон:Cite pmid
  67. Шаблон:Cite pmid
  68. Шаблон:Cite pmid
  69. Шаблон:Cite pmid
  70. Шаблон:Cite pmid
  71. Шаблон:Статья
  72. Шаблон:Cite doi
  73. Шаблон:Cite web
  74. Шаблон:Cite pmid
  75. Шаблон:Cite pmid
  76. Шаблон:Книга
  77. Шаблон:Cite web
  78. Шаблон:Cite pmid
  79. Шаблон:Cite pmid
  80. Шаблон:Cite pmid
  81. Шаблон:Cite pmid
  82. Шаблон:Cite pmid
  83. 83,0 83,1 Шаблон:Cite pmid
  84. Шаблон:Cite pmid
  85. Шаблон:Cite pmid

Шаблон:Выбор языка Шаблон:Избранная статья