ЦЕННОСТЬ ИНФОРМАЦИИ И ГЕНЕТИЧЕСКИЙ КОД
Рассмотрим в связи с изложенным количество и ценность ин- формаций в кодонах [75]. Информация (количество информации) любого из 61 функциональных кодонов, определяемая безотносительно к кодированию аминокислотного остатка, равна log2 61 = 5,93 бита. Информация канонического аминокислотного остатка, вычисленная без учета кодирования, равна log220 = 4,32 бита. Информация кодона применительно к процессу кодирования или, что то же, информация остатка, вычисляемая с учетом вырождения, различна для разных кодонов или остатков. Она равна log2(61/a), где а — степень вырождения кодона, принимающая значения 1, 2, 3, 4, 6. Соответственно получаем 5,93, 4,93, 4,35, 3,93, 3,35 бита. Кодоны АУГ (Мет) н УГГ (Трп), будучи невырожденными, имеют наибольшую информацию 5,93 бита, наименьшая информация 3,35 бита отвечает шестикратно вырожденным триплетам, кодирующим Apr, Сер и Лей. Средняя информация, приходящаяся на кодон или на аминокислотный остаток, вычисляется по формуле Шеннона и составляет
20
<=і
Еестествено, что эта величина меньше log2 20, так как кодовый словарь определяет неодинаковые вероятности появления различных остатков вследствие различного их вырождения. Отметим попутно, что средняя информация, приходящаяся на букву русского текста, равна 4,35 бита, на букву английского текста — 4,03 бита, т. е. весьма близка к найденным для «аминокислотного текста».
Ценность информации, содержащейся в нуклеотидном триплете, должна определяться применительно к кодированию аминокислотного остатка, к программированию синтеза белка. Информация, приходящаяся на один нуклеотид, равна log2 4 — = 2 бита. Определим ее ценность как биологическую значимость замены данного нуклеотида другим. «Ценность» нуклеотида тем выше, чем сильнее меняет свойства синтезируемого белка замена аминокислотного остатка, отвечающая мутационной замене нуклеотида. Очевидно, что определяемая таким образом ценность информации нуклеотида зависит от его положения в кодоне xyz. При замещениях 2 в 61 функциональном кодоне лишь 28%' приводят к изменению аминокислотного остатка. При замещениях х остаток меняется в 95% и при замещениях у в 100% случаев. Следовательно, информационная ценность нуклеотида меньше всего для z и больше всего для у. Здесь, однако, нет количественной оценки.
Мутационные замены аминокислотных остатков неравнозначны в отношении влияния на пространственную структуру белка и на его биологическую функцию. Изменения структуры и нарушения функции, вообще говоря, наиболее значительны, если мутация изменяет класс остатка — гидрофобный остаток заменяется на гидрофильный и наоборот. Показано, что кодовый словарь обеспечивает уменьшенную вероятность таких опасных мутаций по сравнению с мутациями, не сопровождающимися изменением класса остатков ([7], § 9.7, [76—78]). Конечно, разделение остатков на гидрофобные и гидрофильные условно, необходимо характеризовать остаток количественной мерой гидро - фобности. В качестве этой меры Тенфорд предложил величину изменения свободной энергии, приходящуюся на боковую группу свободной аминокислоты при переносе из этанола в воду [79]. Эти значения указаны в табл. 9.2.
Будем считать, что опасность мутации для биологической функции белка тем больше, чем больше разность гидрофобно - стей исходного остатка и остатка, получаемого в результате мутационного замещения. Средние разности гидрофобностей при однократных замещениях нуклеотидов в кодоне xyz равны для х 1,00, для у 1,28 и для z 0,34 ккал/моль. В среднем по всем трем нуклеотидам получаем 0,87, что существенно меньше 1,22 ккал/моль — средней разности гидрофобностей при произвольном замещении любого остатка на любой, вычисляемой без учета кодирования. Величина 0,87 согласуется с опытом: для 70 мутантов гемоглобина человека имеем 0,83, для 6 цитохромов с разных видов 0,90 и т. д. Код уменьшает разность гидрофобностей, отвечающую мутациям.
Определим относительную ценность информации кодона как сумму средних разностей гидрофобностей, возникающих при всех однократных замещениях xyz. Считаем наиболее ценным кодон, мутации которого сильнее всего меняют гидрофобно - сти аминокислотных остатков. Таковым оказывается УГГ, кодирующий Трп. В табл. 9.2 приведены количества информации 9
Таблица 9.2
V Х |
А |
Ц |
Г |
У |
Z |
А |
Лиз 1,50 4,9 3,5 Асн 0,01 4,9 3,9 Лиз 1,50 4,9 2,9 Асн 0,01 4,9 3,9 |
Г 2,6 Тре 0,44 3,9 | fl, 2J |
Apr 0,73 3,4 1,9 Сер 0,04 3,4 2,0 Apr 0,73 3,4 2,0 Сер 0,04 3,4 2,0 |
Иле 2,97 4 4 3,4 Иле 2,97 4,4 4,1 Мет 1,30 5,9 3,1 Иле 2,97 4,4 4,1 |
А И Г У |
Ц |
Глн 0.10 4,9 4,2 Гис 1,40 4,9 3,2 Глн 0,10 4,9 4,2 Гис 1,40 4,9 3,2 |
Ґ 3,8 Про 2,60 3,9 1 g'g |
,1,8 Apr 0,73 3,4 1 2'б 1І9 |
/1.8 Лей 2,42 3,4 і ^ 1 Ь5 |
А Ц Г У |
Г |
Глу 0,55 4,9 1,4 Асп 0,54 4,9 1,6 Глу 0,55 4,9 1,4 Асп 0,54 4,9 1,6 |
Г 1,6 Ала 0,63 3,9 J'g 1 Ь6 |
Г1,7 Гли 0,00 3,9 ^ ''д 1 М |
/•2,2 Вал 1,69 3,9 і 2>3 2,3 |
А Ц Г У |
У |
Тир 2,87 4,9 4,0 Тир 2,87 4,9 4,0 |
Г 3,6 Сер 0,04 3,4 | д'д 1 3,2 |
Цис 0,65 4,9 3,2 Три 3,00 5,9 6,6 Цис 0,65 4,9 3,2 |
Лей 2,42 3,4 3,0 Фен 2,65 4,9 2,3 Лей 2,42 3,4 2,3 Фен 2,65 4,9 2,3 |
А Ц Г У |
■ количество информации в битах, третье — ценность инфор-
Первое число — гндрофобность в ккал/моль, второе ■ мании в ккал/моль.
Битах (второе число) и определенные указанным способом цен-' ности информации в ккал/моль (третье число). *
Ясно, что приведенные значения ценности информации не' должны коррелировать со значениями ее количества. Триплеты»; кодирующие одну и ту же аминокислоту, могут иметь различ*! ную ценность. ::
Если справедливо предположение Куна о том, что первоначальное кодирование в добиологической эволюции определялось^ только нуклеотидом у и, соответственно, различались только четыре группы аминокислот (см. стр. 504), то ценность ИНфор-,( мации кодона должна была возрастать в ходе эволюции. ;
Ясно, что приведенное определение ценности информации- кодона условно и оценки в табл. 9.2 имеют главным образом, иллюстративный характер. Они не учитывают роли ряда факторов, участвующих в синтезе белка. Во многих случаях любая,' замена некоторых аминокислотных остатков в белке полностью; нарушает его функцию. Бачинский провел анализ аминокислотных замен в изофункциональных белках и оценил на этой основе функциональную близость аминокислот, т. е. их способность замещать друг друга в белках с сохранением последними их активности [100].
Если воспользоваться его оценками, то условные ценности: кодонов естественно окажутся отличными от приведенных в табл. 9.2. В табл. 9.3 приведены эти значения в условных единицах. Очевидно, что они имеют смысл эмпирических. Ценность кодона тем выше, чем реже встречается замена соответствующего аминокислотного остатка. По-прежнему наибольшей ценностью обладает кодон УГГ (Трп), второй по ценности — кодой АУГ (Мет).
Рассмотрим теперь относительные ценности кодонов, кото-, рые могут превращаться в терминальные кодоны УАА, УАГ fl( УГА в результате точечных мутаций [101]. Эти наиболее опас-1 ные мутации, приводящие к обрыву белковой цепи, летальный если они не супрессированы. Имеется 23 таких мутационных за-' мещений. Точечные мутации в кодонах разделяются на транзиЩ ции (замены нуклеотидов с сохранением их класса А Г, У 5іЦ) и трансверсии (замены пурина на пиримидин и наоборот:? У, Ц?±А, Г). Среди 23 терминальных мутаций (nonsense mu'4 tations) 18 трансверсий и лишь 5 транзиций. В работе Джукса! [102] приведены данные, относящиеся к 250 спонтанным мута* циям глобинов и других белков. Из них — 32 неидентнфициро» ванные трансверсии. Общее число трансверсий 138, транзиций: 112, отношение этих чисел q= 1,23. Это не означает, что их средние вероятности близки друг другу. Если бы вероятности транзиций и трансверсий были одинаковы, то число последних должно было бы превышать число первых не менее чем вдвое,
Таблица 9.3 Эмпирические ценности кодонов в условных единицах
У К |
А |
Ц |
Г |
У |
Z |
А |
Лиз 1,35 Асн 1,31 Лиз 1,35 Асн 1,31 |
( 0,76 т 1 0,75 ТРе і 0,79 0,75 |
Apr 1,07 Сер 1,32 Apr 1,09 Сер 1,32 |
Иле 0,95 Иле 0,98 Мет 3,33 Иле 0,96 |
А Ц Г У |
Ц |
Глн 1,52 Гис 1,79 Глн 1,52 Гис 1,79 |
( 0,85 гт J 0,87 ПР° і 0,85 0,87 |
( 0,69 Д 3 0,88 АРГ 1 0,69 0,88 |
( 0,64 П » J 0,79 Леи і 0,66 1. 0,79 |
А Ц Г У |
Г |
Глу 1,23 Асп 1,25 Глу 1,23 Асп 1,25 |
( 0,69 л о J °.69 Ала ) 0,69 t 0,69 |
( 0,80 Г 1 0,76 Гли і 0,80 t 0,76 |
( 0,71 к ) 0.75 Вал1 0,76 0,75 |
А Ц Г У |
У |
Тир 1,92 Тир 1,92 |
( 0,78 r ) 0,77 1 0,73 0,78 |
Цис 2,56 Трп 20.00 Цис 2,56 |
Лей 1,04 Фен 1,52 Лей 1,06 Фен 1,52 |
А Ц Г У |
Так как каждый пурин может быть замещен двумя пиримиди - нами и лишь одним пурином и наоборот. Для нахождения относительных вероятностей трансверсий и транзиций необходимо найти их возможные числа согласно кодовой таблице. Всего возможно 64 X 9 = 576 однократных замещений в кодонах. Из них в 50 замещениях фигурируют терминальные кодоны и 134 замены не меняют кодируемый аминокислотный остаток. Остаются 392 мутации (missense mutations), которые в принципе могут быть наблюдаемы. Из них 176 трансверсий и 116 транзиций. Их отношение равно р — 176/116 = 2,37. Находим средние относительные вероятности трансверсий w и транзиций 1 — ш из формулы
Получаем w = 0,34, 1 — w = 0, 66. Транзиции в среднем вдвое более вероятны, чем трансверсии.
При рассмотрении эволюционных изменений в глобинах было найдено 293 транзиции и 548 трансверсий [103]. В этом случае q == 1,87 и w = 0,44. Факторы, связанные с естественным отбором, повышают значение w.
Таблица 9.4 Числа наблюдаемых мутаций вм, числа мутаций пк, следующие из кодового словаря, и относительные вероятности замещений Wj
Замещающий нуклеотид
Заменяемый нуклеотид |
А |
Г |
Ц |
У |
||||||||
"м |
"к |
Wi |
"м |
"к |
Wi |
"м |
"к |
"м |
Пк |
|||
А Г Ц У |
39 17 8 |
33 |
0,18 0,08 0,04 |
36 13 11 |
31 38 35 |
0,17 0,05 0,05 |
17 15 20 |
33 38 27 |
0,08 0,06 0,11 |
9 16 17 |
32 35 27 |
0,04 0,07 0,09 |
Оценим теперь относительные вероятности отдельных замещений в кодонах мРНК - Данные о мутациях пм из работы [102] приведены в табл. 9.4. Неидентифицируемые трансверсии здесь
Таблица 9.5
Вероятности замещений нуклеотидов в 5S РНК
А |
-»Г |
-»Ц |
-»У |
|
А -> |
_ |
0,10 |
0,06 |
0,05 |
Г-> |
0,12 |
— |
0,06 |
0,09 |
0,06 |
0,06 |
— |
0,20 |
|
У-> |
0,03 |
0,04 |
0,12 |
— |
Wi
218
Не учитываются. Всего имеется 218 мутаций. В табл. 9.4 приведены также данные кодовой таблицы (пк). Сравнивая значения им и пк, находим относительные вероятности отдельных замещений Wi:
П М
392
Нормированные к единице значения Wi также приведены в табл. 9.4. Очевидно, что найденные таким образом вероятности Wi характеризуют белки, а не кодирующие их молекулы ДНК и мРНК. Летальные мутации, приводящие к значительным изменениям структуры и функции белка, не наблюдаются.
В работе [104] были систематизированы данные о точечных мутациях непосредственно в нуклеиновой кислоте — в 5S рибо- сомальной РНК ряда организмов.
В табл. 9.5 приведены нормированные значения соответствующих вероятностей замещений.
W
Согласно табл. 9.5, средние относительные вероятности трансверсий и транзиций находятся из соотношения
О — = 0,06 . 4 + 0,05 + 0,09 + 0,03 + 0,04 = - Z — q— 0,10+0,12 + 0,20 + 0,12 — U,8d,
Т. с. w = 0,29, что меньше значения, найденного из данных о мутациях в белках. Сравним табл. 9.5 и 9.4. Главное различие состоит в том, что вероятности транзиций А —* Г и Г —* А, оцененные по замещениям в белках, существенно больше найденных для РНК, а вероятности транзиций Ц —► У и У —* Ц — значительно меньше. Это объясняется относительно большей летальностью результатов транзиций Ц+ty в белках. В самом деле, средние изменения гидрофобности аминокислот для отдельных переходов равны (в ккал/моль):
А Г 0,75, А Ц 1,21, А 5±У 1,15, Г Ц 1,06, Г У 1,42, Ц 1,45.
Транзиции А їі Г связаны с наименьшими, транзиции Ц У — с наибольшими изменениями гидрофобности. При умножении величин вероятностей wit указанных в табл. 9.4, на приведенные значения изменений гидрофобности после нормировки получаем значения вероятностей, сходные с приведенными в табл. 9.5. Это вновь доказывает, что значительное изменение гидрофобности остатка может означать летальность мутации.
Теоретические расчеты вероятностей образования нуклео- тидных пар при трансверсиях и транзициях, проведенные методами квантовой химии, согласуются с приведенными значениями [105].
Пользуясь значениями вероятностей w{, указанными в табл. 9.5, определим ценности кодонов по отношению к терминальным мутациям как относительные вероятности последних. Терминальными являются мутации (мутирующий нуклеотид показан точкой):
У У Г (Лей), У Г У (Цис) У А, ценность 0,03;
А А А, А А Г (Лиз), А Г A (Apr) А —»• У, ценность 0,05;
У Ц Г (Сер), У Г Ц (Цис) Ц -> А, ценность 0,06;
У У А (Лей), У А У (Тир) У - н>- Г + У -> А, ценность 0,07;
Г А А, Г А Г (Глу). Г Г А (Гли) Г -> У, ценность 0,09;
У Ц А (Сер), У А Ц(Тнр)Ц —>А + Ц -> Г, ценность 0.12;
Ц А А, Ц А Г (Глн), Ц Г A (Apr) Ц -> У, ценность 0,20;
У Г Г (Трц) 2Г -> А, ценность 0,24,
Ценность кодона УГГ в 8 раз больше, чем кодона УУГ, так как терминальная мутация кодона УГГ в 8 раз более вероятна. Ко - дон УГГ и в этом отношении остается наиболее ценным.
Рассмотренные здесь примерные определения функциональной ценности кодонов поучительны. На такой основе возможно дальнейшее развитие теории. При этом придется учесть влияние соседних пар нуклеотидов на мутации в данной паре (см. [106|). Теория явлений развития, основанная на информационных подходах, еще не разработана. Есть основания думать, что эти подходы окажутся весьма полезными.