ечовин більшість наукових робіт вважалося престижним писати на французькою або німецькою, то приблизно з середини минулого століття стало традицією публікувати роботу з новими принциповими результатами поряд із рідною мовою також і англійською.
Елементарна математика та інформатика
Дивовижна простота початкової (первинної) структури білків і олігопептидів дозволяє провести простий математичний аналіз всієї сукупності цих речовин. Спочатку задамося питанням: скільки існує різних лінійних послідовностей, в написанні яких може бути використано 20 стандартних амінокислотних залишків? Якщо через N позначити число можливих послідовностей, а через n - кількість амінокислотних залишків у молекулі, то відповідь на поставлене питання дасть найпростіша алгебраїчна формула, що враховує всі можливі повтори амінокислотних залишків в одній структурі:
N = 20n. p> З цієї формули випливає, що максимальне число різних дипептидов (n = 2) одно 400, трипептидів (n = 3) - 8000, тетрапептид (n = 4) - 160 000 і т.д. Як бачимо (див. табл. 2), число N дуже швидко росте із збільшенням n.
Тоді виникає інше питання: а які можливості живого організму вміщати в себе подібну інформацію? Первинна інформація міститься в нуклеотидної послідовності, і хоча вона й дуже велика, але все ж не безмежна. У табл. 3 представлені числа азотистих основ сумарною ДНК у представників різних царств живої природи. Перше, на що звертаєш увагу, це те, що загальна їх кількість варіює в дуже широких межах і може становити від 107 (Деякі бактерії і гриби) до 1011 (представники рослин і риб). При цьому зауважимо, що цар природи людина аж ніяк не є чемпіоном серед інших представників живої природи, вдовольняючись лише приблизно одним мільярдом азотистих основ. Але для нас головне не це. Виявляється, найбільший геном не може вмістити інформацію навіть про всіх можливих декапептид (n = 10) при їх послідовному розташуванні.
Дійсно, при n = 10:
N = 6,7 х1011. p> Eсли врахувати те, що для запису одного амінокислотного залишку потрібно 3 азотистих підстави і що частина генома, шифрующая амінокислотні послідовності, становить тільки кілька відсотків від його загальної величини, то виходить, що найбільший геном здатний вмістити інформацію про послідовності, складається лише з 109 амінокислотних залишків. Таким чином, в ньому може міститися інформація менш ніж про 1% всіх можливих декапептид. А адже відомі білки, що містять більше 5 тис. амінокислотних залишків! p>
Звідси випливає висновок про те, що в природі зустрічаються далеко не всі лінійні комбінації амінокислотних залишків. Це підтверджується комп'ютерним аналізом зустрічальності різних лінійних комбінацій амінокислотних залишків у всіх розшифрованих білках і пептидах (більше 100 тис.). Отримані результати наведені в табл. 2, дані якої свідчать про те, що в разі вже октапептид (N = 8) зустрічається всього лише близько 0,001% можливих лінійних комбінацій амінокисло...