Число нуклеидов

Число нуклеидовВ отличие от белков молекулы ДНК построены из остатков более сложных (по сравнению с аминокислотами) органических соединений — нуклеотидов (оплат, nucleus — «ядро», так как ДНК содержится в клеточном ядре). Кодировка того или иного белка осуществляется определённой последовательностью нуклеотидов в ДНК. Когда в организме синтезируется конкретный белок, происходит «считывание» кода ДНК и последующее соединение друг с другом нужного числа молекул аминокислот в определённой последовательности.
Сколько различных нуклеотидов необходимо иметь в молекуле ДНК, чтобы можно было закодировать любой белок?

Эту чисто математическую проблему пришлось решать природе в ходе эволюции. Обозначим разные нуклеотиды прописными буквами русского алфавита, а разные аминокислоты — цифрами.

Простейшее (но не самое экономичное) решение задачи — иметь столько нуклеотидов, сколько существует различных аминокислот.

При этом нуклеотиду А будет соответствовать белок 1, нуклеотиду Б — белок 2 и т. д. Например, последовательность нуклеотидов АГЕЕДБ… будет означать, что надо соединять аминокислоты в такой последовательности: 1-4-6-6-5-2… И чтобы закодировать, например, 30 разных аминокислот, потребуется 30 разных нуклеотидов (то есть при наших обозначениях — почти все буквы алфавита).

Можно ли уменьшить число необходимых нуклеотидов? Попробуем кодировать аминокислоты сочетанием двух нуклеотидов.

Тогда потребуется намного меньше разных нуклеотидов — всего шесть (проверьте это сами). Но природа поступила ещё более экономно: в молекулах ДНК обычно имеется всего четыре (реже — пять) типов нуклеотидов.

Очевидно, что, имея всего четыре нуклеотида, с помощью «однобуквенного» кода можно было бы строить белки, состоящие всего из четырёх разных аминокислот.

Попробуем теперь «двухбуквенный код» из четырёх нуклеотидов — А, Б, В, Г: Итак, двухбуквенным кодом можно зашифровать не более 15 различных аминокислот. Числа «двухбуквенных слов» не хватило!

А можно ли использовать одновременно и одно-, и двухбуквенный код, закодировав белки с номерами 16, 17,18 и 19 одиночными нуклеотидами А, Б, В и Г? Конечно, нет! Ведь тогда возникнет путаница; например, последовательность нуклеотидов АВГАББВААБ…

можно будет «прочитать» по-разному, так что вместо одного нужного белка будут синтезироваться белки 3-12-6-9-1..-, 16-18-12-6-9-16-17… и множество других.

А вот «трёхбуквенного» кода более чем достаточно; так, только «слов», начинающихся с А, оказывается 16: Столько же будет «слов», начинающихся с Б, В и Г, а всего — 64. Так что трёхбуквенных «слов»-кодов оказывается достаточно не только для того, чтобы закодировать любую аминокислоту, но и чтобы указать, с какого места в молекуле ДНК необходимо начать «чтение» и когда его закончить.

Избыточность информации дала возможность одну и ту же аминокислоту кодировать несколькими «словами»: лейцин и серии — шестью, валин, пролин, треонин, аланин и глицин — четырьмя и т. д. Это повышает надёжность считывания информации, так как в ряде случаев «опечатки» в генетическом коде (мутации) просто не будут замечены, и синтезируется полноценный белок.

Именно так поступила природа. И вряд ли здесь было бы возможно какое-то другое решение.

И в отличие от памяти компьютера информация в молекуле ДНК записана не двумя, а четырьмя знаками.