9950922 Статья в журнал "Биохимия"
Уважаемый рецензент! Просим обратить внимание на следующее
обстоятельство. Наши аргументы не достаточны для Вашего
решения опубликовать таблицу композиционного кода, а
Ваши вопросы с нашей точки зрения вполне об'ективны, но
к сожалению не предсказуемы. Мы не можем их заранее учесть.
Если Вы действительно считаете, что возможность существования
композиционного кода "представляет определенный интерес", то
не могли бы Вы ускорить связь с нами от 3-4 месяцев до
телефонного звонка. Представьте, сколько можно сэкономить
Вашего времени, если Вы за пол-часа убедите нас по телефону,
что таблица композиционного кода всего лишь иллюзия.
Мы сразу перестанем заваливать Вас новыми вариантами статей,
которые Вам приходится читать по нескольку раз в год.
Если же композиционный код реально существует, то Вы согласитесь,
что задержка публикации таблицы кода на несколько месяцев или
на несколько лет - это колоссальные экономические потери.
Мы просим лишь передать Вашу рецензию без задержки, а если
Вам не в тягость, свяжитесь для ускорения диалога с Кушелевым
Александром по тел.218-18-48 (дом).
Доработка:
2. документировать (ссылки на статьи из банков данных)
УДК 547.963.3
577.322.4
Построение масштабной модели пространственной структуры бел-
ка по его нуклеотидной последовательности.
А.Ю.Кушелев, Д.Н.Кожевников, В.В.Яким, С.С.Марковский,В.В.Беляев.
место работы:
А.Ю.Кушелев - лаборатория "Наномир" (общественная организация)
Д.Н.Кожевников - лаборатория "Пикотехнология" (общественная орг.)
В.В.Яким - фирма "А-граф" (ТОО)
С.С.Марковский - студия "Нанограф" (общественная организация)
В.В.Беляев - студия "Нанограф"
Корреспонденцию для всех авторов просьба направлять по адресу:
адрес 127254 Москва, до востребования, Кушелеву Александру
Юрьевичу тел. 218-18-48 (дом)
E-MAIL:valka@agraph.msk.su
Ключевые слова:
пикотехнология, композиционный генетический код, биотехнология,
генная инженерия, геном, электронная поверхность, наномир.
Резюме:
Предлагается метод предсказания вторичной и третичной структур
белков эукариот по нуклеотидной последовательности
соответствующих генов. Точность достигает долей пикометра.
В настоящее время остается нерешенным вопрос, каким образом
длинной полипептидной цепи удается принять ту единственную
трехмерную форму, которая необходима для выполнения биохимической
функции. Мы предполагаем, что вторичная структура
натурального белка эукариот определяется в процессе его
биосинтеза на рибосоме третьим нуклеотидом кодона и предлагаем
таблицу "квазикомпозиционного кода" (ТКК)- соответствия определенного
кодона с той структурой, в которую входит данная аминокислота.
Введение
Настоящая работа является составной частью комплексного
исследования в смежных областях науки. Гипотеза о связи
генетического кода и структуры белка появилась в другой области,
которая выходит за рамки настоящей статьи, однако проверка этой
гипотезы и аппробация таблицы квазикомпозиционного кода основана
на биохимических методах. Это сузило список цитированной
литературы до трех: справочник по корреляционному анализу, банк
нуклеотидных последовательностей и банк структур.
Суть работы заключается в следующем. Существует две
общепризнанных таблицы генетического кода. Одна из них
связывает триплетный код ДНК с первичной структурой белка,
синтезируемого рибосомой клетки. Вторая таблица - код
митохондрий. Мы предлагаем третью таблицу для клеток
эукариот, в которой есть дополнительная графа, указывающая
на композицию данного аминокислотного остатка по отношению
к предыдущему.
Цель настоящей работы - проверка таблицы квазикомпозиционного
кода методом корреляционного анализа.
Для этого сравним вторичные структуры, полученные по
нуклеотидной последовательности белка с использованием
нашей таблицы и вторичные структуры этого белка по
данным координатного банка.
На этом пути нас подстерегают следующие проблемы:
1. Механизм рибосомы эукариотической клетки, согласно нашей
гипотезе, лишь "правильно" устанавливает аминокислоты в
растущую молекулу белка, что заменяет длительный процесс
самосборки вторичной и третичной структур.
Мутация в третьей позиции кодона лишь замедлит процесс
биосинтеза, но физикохимические взаимодействия переведут белок в
"правильную" устойчивую конформацию. В таком белке-мутанте
композиционный код нарушен, а процесс сборки белка замедлен.
2. Микроструктура гомологичных участков может кардинально
различаться (разными микропутями можно вычертить
макроструктуру).
Эта проблема исключает проверку ТКК по кодам гомологов,
в частности с разным содержанием C+G-оснований.
Ограничивая выборку классической альфа-спиралью
(альфа-керотины, тропонин-С, миоглобин, инсулин),
классической бета-структурой (фиброины), известными
структурами, для которых код известен не по гомологам,
мы с одной стороны рискуем потерять достоверность,
а с другой стороны увеличиваем чистоту эксперимента.
Требование чистоты эксперимента ограничило выборку от многих сотен до 15
белков. Общее количество альфа-спиральных участков в этих белках составило
несколько сотен, а количество сопоставляемых аминокислотных
остатков превысило 2800. Используя биномиальный критерий
нам удалось получить достоверные результаты в рамках
жестких финансовых ограничений настоящего исследования,
не позволивших обработать весь об'ем банков данных.
Нам приходится опираться только на очень надежные данные по
классическим альфа-спиральным участкам и классическим бета-слоям.
По этим соображениям мы провели дополнительное исследование
семейства фиброинов, белков с классической бета-структурой, и
альфа-керотинов с классической альфа-структурой.
3. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Таблица композиционного генетического кода (ТКК)
код ост.вар. код ост.вар. код ост.вар. код ост.вар.
AAA Lys 3 CAA Gln 3 GAA Glu 3 TAA TKD -
AAC Asn 1 CAC His 1 GAC Asp 1 TAC Tyr 1
AAG Lys 1 CAG Gln 1 GAG Glu 1 TAG TKD -
AAT Asn 3 CAT His 3 GAT Asp 3 TAT Tyr 3
ACA Thr 2 CCA Pro 2 GCA Ala 2 TCA Ser 2
ACC Thr 1 CCC Pro 1 GCC Ala 1 TCC Ser 1
ACG Thr 4 CCG Pro 4 GCG Ala 4 TCG Ser 4
ACT Thr 3 CCT Pro 3 GCT Ala 3 TCT Ser 3
AGA Arg 3 CGA Arg 2 GGA Gly 2 TGA TKD -
AGC Ser 1 CGC Arg 1 GGC Gly 1 TGC Cys 1
AGG Arg 1 CGG Arg 4 GGG Gly 4 TGG Trp 1
AGT Ser 3 CGT Arg 3 GGT Gly 3 TGT Cys 3
ATA Ile 2 CTA Leu 2 GTA Val 2 TTA Leu 3
ATC Ile 1 CTC Leu 1 GTC Val 1 TTC Phe 1
ATG Met 1 CTG Leu 4 GTG Val 4 TTG Leu 1
ATT Ile 3 CTT Leu 3 GTT Val 3 TTT Phe 3
Вариант 1 соответствует вхождению остатка в 4/10 альфа-спираль
Вариант 4 соответствует вхождению остатка в 3/10 альфа-спираль
Вариант 2 соответствует вхождению остатка в классический бета-слой
Вариант 3 соответствует положению второго остатка бета-поворота
На примере альфа-керотина с классической альфа-структурой
рассмотрим работу компьютерной программы, в основу которой
положена таблица квазикомпозиционного генетического кода.
Каждый триплет нуклеотидной поледовательности белка
преобразуется, согласно таблице в вариант композиции 1...4.
Результат работы программы перекодировки генетического кода
в композиционный в типовом случае одного из 30 альфа-керотинов:
111311411141143143111334141341111114131131111111111141111421
141313114111311431311411314111411141111314114431414131141113
111111411411121131111311432113411111334141114111431111141111
Программа показывает большое количество кодов 1 и 4,
соответствующих 4/10 и 3/10 альфа-спиралям соответственно.
Бета-кодов (2 и 3) в керотине содержится 28/120=0.23, т.е.
менее 24%. Все 30 разновидностей керотинов, коды которых нам
были доступны, программа причислила к альфа-структурным белкам.
Теперь рассмотрим результат перекодировки кодов одного из 3
типовых фиброинов с классической бета-структурой [4].
131313411223413133232113333113323313133332233233323423133332
333134333112232333311141321431131113213341112313333333333334
2233114212213211313231131333213223323313333431233323333334
В бета-структурном белке, процент
бета кодов должен превышать процент альфа кодов. В данном
(типовом) случае бета-кодов (2 и 3) содержится 63/118=0.53,
т.е. действительно более 50%. Все доступные коды фиброинов
программа причислила к бета-структурным белкам.
Не является ли различие кодов случайным совпадением? Мы ведь
проверили всего 30 альфа-структурных и 3 бета-структурных белка.
Для проведения корелляционного анализа сформулируем нулевую
гипотезу: в алфа-спиральных участках (по данным из банка
структур) вероятность обнаружить бета-код (2 или 3 по ТКК) равна
среднему значению по всей структуре белка.
На примере белка "Cholesterol oxidase" покажем, как исходная
нуклеотидная последовательность этого белка из банка EMBL была
преобразована в композиционный код, а затем производилось
сопоставление с данными из брукхэвенского банка структур.
18 GGC Gly GLY 1
19 AGT Ser SER 3
20 GGA Gly GLY 2
21 TAC Tyr TYR 1 HELIX
22 GGC Gly GLY 1 HELIX
23 GGT Gly GLY 3 HELIX
24 GCC Ala ALA 1 HELIX
25 GTC Val VAL 1 HELIX
26 GCC Ala ALA 1 HELIX
27 GCG Ala ALA 4 HELIX
28 CTG Leu LEU 4 HELIX
29 CGG Arg ARG 4 HELIX
30 CTG Leu LEU 4 HELIX
31 ACG Thr THR 4 HELIX
32 CAG Gln GLN 1 HELIX
33 GCC Ala ALA 1
34 GGT Gly GLY 3
35 ATC Ile VAL 1
Колонка Значение
1 номер аминокислотного остатка
2 триплет нуклеотидов, кодирующий данный остаток
3 название аминокислотного остатка (по коду)
4 название аминокислотного остатка (из банка структур)
5 вариант композиции (по ТКК)
6 вариант композиции (из банка структур)
Количество аминокислотных остатков: 502
Процент альфа-спиралей (по рентгену) 24.10 %
Символ Содержание в процентах (по программе)
1....................... 76.10 % 4/10 HELIX
4....................... 16.33 % 3/10 HELIX
2....................... 2.19 % BETA
3....................... 5.38 % BETA-2
1 + 4............. 92.43 % HELIX
2 + 3............. 7.57 % BETA
Все альфа-спиралные участки (по рентгену) содержат 96.69%
Альфа-кодов (по ТКК) и 3.31% бета-кодов соответственно.
Отношение процентного состава бета-кодов по всей длине белка
к процентному составу в альфа-спиральных участках (по рентгену)
составляет 2.289.
Эта цифра означает, что в альфа-спиралях (по рентгену) бета-кодов
(по ТКК) примерно вдвое меньше, чем в среднем по белку.
Детальный анализ показывает, что альфа-спиральные участки (по
рентгену) бывают сдвинуты на один-два-три остатка вперед или назад,
относительно тех же участков по ТКК. Этот сдвиг является погрешностью
рентгеноструктурного метода, а его величина, т.е. погрешность
рентгена зависит от свежести рентгеноструктурных
данных. Чем более поздние исследования, тем меньше погрешность.
Если концы альфа-спиральных участков, которые не определяются
рентгеном, не учитывать, то корреляция возрастает.
Результаты обработки статистических данных по 8 белкам сведены
в таблицу 2.
Таблица 2.
Название белка кол-во состав Отношение
остатков альфа% % состава
Cholesterol Oxidase(E.C.1.1.3.6) 502 92.43 2.2898
Arabinose-binding protein 306 57.52 1.0821
Lysozyme(E.C.3.2.1.17) 130 41.54 1.0231
Aldolase(E.C.4.1.2.13) 363 73.00 1.2045
Aminotransferase(E.C.2.6.1.1) 411 72.02 0.9021
Trp-repressor(E-coli) 107 61.68 1.0306
Glycogen phosphorylase(E.C.2.4.1.1) 842 85.75 1.0630
Myoglobin 153 70.59 1.0339
Общее кол-во остатоков в выборке = 2814
Для тех белков, для которых отношение процентного состава (по
рентгену) не известно, положительным эффектом будем считать
превышение альфа-кодов значения 50%, если белок альфа-структурный
и непревышение этого значения в ином случае, например, для
фиброина шелка. Данные по этим 7 белкам сведены в таблицу 3
Таблица 3.
Название белка кол-во состав Тип Эффект
остатков альфа% белка
по ТКК
Insoulin 54 94.44 ALPHA Положительный
Fibroin(fibr) 77 37.66 BETA Положительный
Fibroin(fibr01) 177 31.07 BETA Положительный
Alpha-kerotine(mker11) 244 56.15 ALPHA Положительный
Alpha-kerotine(mker13) 151 84.77 ALPHA Положительный
Alpha-kerotine(mker20) 183 82.51 ALPHA Положительный
Troponin-C 159 86.79 ALPHA Положительный
Это сокращенная таблица, т.к. мы не видим смысла перегружать
статью индивидуальными данными по 30 керотинам. Заинтересованные
читатели могут сами убедиться, что все семейство керотинов
распознается программой "Пикотехнология" как альфа-структурные
белки.
Используем критерий знаков (биномиальный).
При этом методе сначала подсчитывают число случаев, когда
эффект имеет знак "+" (в нашем случае число бета-кодов в
среднем по белку превышает число бета-кодов в альфа-спиралях
(по рентгену),т.е. их отношение больше 100 %), а затем сравни-
вают его с числом, которое можно было бы ожидать на основе чис-
той случайности ( в нашем случае вероятност случайного события
равна 1/2).
Далее определяют разницу между этими двумя числами, чтобы
выяснить, насколько она достоверна.
При подсчетах результаты, свидетельствующие о положительной
разнице, берут со знаком плюс, а об отрицательной - со знаком ми-
нус; случаи отсутствия разницы не учитывают.
Расчет ведется по следующей формуле:
Z = ((X-0.5)-N/2)/корень из (N/2), где
X - сумма положительных отклонений
N/2 - число отклонений при чистой случайности (один шанс из двух)
0.5 - поправочный коэффициент, который добавляют к X, если XN/2.
В нашей выборке из 15 имеем 14 положительных и одно
отрицательное отклонение (оно относится к прокариотическому белку,
который не обязан подчиняться нашей таблице).
Z = ((14-0.5)-15/2)/корень(15/2) = (13.5-5)/корень(7.5) = 3.10
Из таблицы значений Z можно узнать, что для уровня значимос-
ти 0.01 Z составляет 2.33. Поскольку полученная нами величина
оказалась выше табличной, нулевую гипотезу следует отвергнуть.
Значит, существует корелляция между данными, полученными путем
преобразования нуклеотидной последовательности белков (по ТКК) и
данными рентгеноструктурного анализа этих белков. Если не учитывать
данные по белкам прокариот, то корреляция возрастет.
Существует другой способ аппробации ТКК, не зависимый от надежности
и различной интерпретации данных рентгеноструктурного анализа.
Он заключается в способности программы, использующей ТКК отличать
одни типы белков от других, т.е. обнаруживать их индивидуальность.
Может ли программа продемонстрировать индивидуальность белков по
их нуклеотидной последовательности или нет, наглядно показывает
следующий эксперимент.
Заменим ТКК в программе "Пикотехнология" на генератор случайных
чисел из набора 1...4. Программа выводит их вторичную структуру
в виде символов псевдографики:
- single alpha-code
- 3/10 alpha-helix
- 4/10 alpha-helix
\\\\\ - single beta-code
///// - single beta-2-code
1 2 3 4 5 6 7 8 9 10
BTBPTIG DVRUB ECTRPR1 HSLSZA HVPLASC1 LEPLACY LSERABUB OCINSAA UDNATOXA
UDNATOXB
///// \\\\\ ///// /////
///// \\\\\ ///// \\\\\
\\\\\ /////
\\\\\ ///// \\\\\ ///// ///// ///// \\\\\
\\\\\ ///// ///// ///// /////
///// ///// ///// \\\\\ \\\\\
///// \\\\\ ///// ///// ///// \\\\\ \\\\\
///// ///// \\\\\
///// ///// ///// \\\\\ \\\\\ \\\\\
///// \\\\\ ///// ///// \\\\\
///// ///// ///// \\\\\ \\\\\ \\\\\
\\\\\ \\\\\ ///// \\\\\
///// ///// \\\\\ \\\\\ /////
\\\\\ ///// \\\\\ ///// ///// \\\\\
///// \\\\\ \\\\\
\\\\\ \\\\\ ///// ///// /////
\\\\\ \\\\\ ///// /////
\\\\\ ///// /////
///// \\\\\ \\\\\
///// \\\\\ ///// ///// ///// \\\\\
///// \\\\\ ///// ///// ///// /////
///// ///// ///// \\\\\ ///// \\\\\
///// \\\\\ ///// \\\\\ \\\\\
\\\\\ \\\\\ \\\\\ \\\\\ \\\\\
///// ///// \\\\\ \\\\\ /////
///// \\\\\ \\\\\ \\\\\
\\\\\ \\\\\ \\\\\ \\\\\ ///// ///// \\\\\
\\\\\ \\\\\ \\\\\ ///// /////
\\\\\ \\\\\ \\\\\ \\\\\ /////
\\\\\ ///// \\\\\ /////
\\\\\ /////
\\\\\ ///// ///// \\\\\ ///// \\\\\
///// ///// \\\\\ /////
///// ///// \\\\\ \\\\\ \\\\\ \\\\\
///// ///// ///// ///// \\\\\ /////
///// \\\\\ ///// \\\\\ \\\\\ /////
\\\\\ ///// \\\\\ \\\\\ \\\\\
///// ///// /////
///// ///// \\\\\ \\\\\ ///// ///// /////
\\\\\ ///// ///// \\\\\ ///// /////
\\\\\ \\\\\ ///// \\\\\ ///// /////
\\\\\ \\\\\ \\\\\ \\\\\ ///// ///// \\\\\
\\\\\
\\\\\ ///// \\\\\ ///// \\\\\
///// \\\\\ ///// /////
///// \\\\\ ///// \\\\\ ///// /////
\\\\\ ///// ///// ///// \\\\\ /////
///// \\\\\ \\\\\ /////
\\\\\ ///// ///// \\\\\ \\\\\ \\\\\
Названия этих белков:
1. TRYPSIN INHIBITOR
2. RUBREDOXIN
3. TRIPSIN REPRESSOR
4. LYSOZYME
5. PLASTOCYANIN-1
6. PLASTOCYANIN-2
7. ERABUTOXIN-B
8. INSULIN
9. SCORPION NEUROTOXIN-A
10.SCORPION NEUROTOXIN-B
Все они похожи друг на друга. Попробуйте отличить "структуру"
глобулярных белков от фибриллярных. Не получается?
А теперь восстановим в программе ТКК, составленную нами по
масштабным моделям, которые мы обсудим ниже, и повторим преобразование.
1 2 3 4 5 6 7 8 9 10
BTBPTIG DVRUB ECTRPR1 HSLSZA HVPLASC1 LEPLACY LSERABUB OCINSAA UDNATOXA
UDNATOXB
///// /////
///// ///// ///// /////
///// /////
\\\\\ \\\\\ /////
///// /////
///// ///// /////
\\\\\ ///// ///// /////
\\\\\ ///// ///// ///// /////
///// ///// ///// /////
/////
///// \\\\\ ///// \\\\\ \\\\\
///// ///// ///// ///// \\\\\
\\\\\ /////
///// ///// ///// ///// \\\\\ \\\\\
///// \\\\\ \\\\\
///// /////
/////
///// ///// \\\\\ \\\\\ \\\\\
///// ///// ///// ///// /////
///// ///// ///// ///// ///// /////
///// ///// ///// \\\\\ ///// /////
\\\\\ \\\\\ ///// /////
///// ///// ///// /////
///// \\\\\ \\\\\
///// /////
///// ///// /////
\\\\\ ///// ///// /////
///// \\\\\ /////
/////
///// ///// \\\\\ /////
///// ///// /////
///// ///// /////
\\\\\ ///// /////
///// ///// /////
///// ///// ///// \\\\\ /////
///// ///// ///// \\\\\
///// \\\\\ /////
///// ///// \\\\\ \\\\\ \\\\\
\\\\\ ///// ///// ///// ///// /////
///// ///// /////
///// \\\\\
\\\\\ ///// /////
\\\\\ \\\\\ ///// /////
///// /////
///// /////
///// ///// /////
\\\\\ ///// ///// ///// /////
///// /////
\\\\\ ///// /////
/////
Все вторичные структуры "обрели" индивидуальность. Отчетливо
видны альфа-спиральные участки и повороты в одних и
практически полное отсутствие альфа-спиральных участков в
других.
Нужно иметь очень веские аргументы, чтобы не заметить эффективной
работы программы "Пикотехнология". Возражения должны быть
подкреплены если не статистическими, то хотя бы одиночными данными,
в противном случае они будут выглядеть просто голословными и
неубедительными.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Достоверность полученных результатов можно увеличить, путем
целенаправленного получения кодов белков, из организмов чистых
линий. В этом случае эксперимент будет максимально чистым. При
этом рентгеноструктурные данные тоже должны быть сделаны именно
для белка этой чистой линии.
Трудоемкость этой задачи очевидна. Решить ее без финансирования
этой темы затруднительно, поэтому авторы считают целесообразным
ознакомить с этой проблемой других исследователей.
Для нас представляют большой интерес даже одиночные примеры,
которые поставили бы под сомнение открытую нами закономерность,
т.к. истина всегда дороже красивых иллюзий.
Рассмотрим наиболее интересные вопросы, связанные с ТКК.
1. В гомологичных белках для консервативных остатков,
вовлеченных во вторичные структуры, используются все четыре
буквы в третьих положениях триплетов. Не исключает ли
этот факт возможности композиционного кодирования?
Если микроструктура гомологов идентична, то это указывает
на вероятностный характер ТКК, т.е. не все аминокислоты,
согласно ТКК рибосома ставит "правильно". Однако такие
"отклонения" кода от "нормы" приводят лишь к снижению
эффективности биосинтеза и не так критичны, как нарушение
функции белка.
2. Не исключает ли существование
организмов с разным содержанием G+C-оснований возможность
композиционного кодирования?
Исключает, но только в том случае, если содержание G+C
либо увеличивается до 100%, либо уменьшается до 0.
3. Известно, что по аминокислотной последовательности полипептида
(а не по нуклеотидной) можно предсказать его вторичную структуру.
Каким образом это удавалось до сих пор без привлечения
квазикомпозиционного кода?
Квазикомпозиционный код лишь дублирует физикохимические
взаимодействия. Его можно, не принимать во внимание,
однако, по ТКК структуру белка можно определить мгновенно,
хотя 100%-ная достоверность не гарантируется.
4. Различные организмы характеризуются различным G+C составом
ДНК, при высоком содержании G+C некоторые кодоны практически не
используются. Однако белки, выполняющие одну и ту же функцию у
разных организмов, обладают высокой гомологией и формируют
сходные вторичные и третичные структуры. Применима ли
ТКК для анализа последовательностей ДНК в этом случае?
Имея под рукой только ТКК этот вопрос можно решить только формально.
Гомологичные белки с одинаковой микроструктурой (такие гомологи
существуют) имеют одинаковый композиционный код. В качестве примера
можно привести гомологичные участки нейротоксинов скорпиона (их
вторичные структуры представлены под номерами 9 и 10). Более того,
с помощью сопоставления таких гомологов нам удалось исправить
четыре кода ТКК из 64 полученных другим методом.
Неформально решить вопрос о сохранении функций гомологичными
учасками, в которых заменены одни остатки на другие, поможет
детальное рассмотрение методики, которая помогла составить
ТКК.
Необходимо отметить, что нашу методику не удается аппробировать
на простых молекулах, т.к. существующие экспериментальные методы,
применяемые для исследования простых молекул не позволяют различить
какая модель лучше: общепринятая или наша. Модели неразличимы на
уровне физических и химических экспериментов. Простота и наглядность
наших классических моделей не убеждает рецензентов, которые считают,
что необходимо повременить до тех пор, пока прямые эксперименты
подтвердят или опровергнут наши модели. Это может случиться,
когда в микроскоп можно будет увидеть форму отдельного электрона.
Однако мы считаем, что аппробацию наших моделей можно провести
другим способом, получив следствия, например в области биологии,
которые проверяются экспериментально. ТКК как раз и есть такое
следствие.
История составления ТКК необычна. Причиной настоящего ис-
следования явилось наше исследование в смежной области, которую
можно назвать "формообразование в микромире". Первопричиной ис-
следования является создание нами кольцевой модели электрона,
позволившее применить для "неклассических" объектов законы клас-
сической физики, в частности создать масштабные геометрические
модели электронных оболочек атомов и молекул. Эта работа отмече-
на в 1989 г. серебряной медалью ВДНХ СССР.
В наших классических моделях микрообъектов, электроны пред-
ставлены кольцевыми магнитами. Эта модель аналогична рассмотрен-
ной в [1]. Для упрощения дальнейших рассуждений отметим, что рас-
смотрение внутренней структуры электрона, зависимости радиуса
электрона-кольца от напряженности поля ядра и другие физические
нюансы кольцевой модели электрона выходят за рамки нашего
обсуждения. Они обсуждаются в монографии "Формы, механизмы, энергия
наномира", которая готовится к публикации.
Метод исследования, который помог составить ТКК, заключался
в проведении модельных экспериментов с кольцевыми магнитами,
изображающими электроны. Число кольцевых магнитов соответствовало
числу валентных электронов молекулы.
В экспериментах использовались дополнительные поверхности,
имитирующие компенсацию электростатического воздействия на элек-
троны со стороны ядер атомов и других электронов молекулы.
Некоторые модели были изготовлены методом симметричного раз-
мещения заданного количества колец, с учетом всевозможных свойств
реальных электронов.
Использовались методы перебора вариантов, аналогии, оптими-
зации, систематизации и др.
Первый экспериментальный результат был получен в модельном
эксперименте с кольцевыми магнитами, который проводился с целью
проверки гипотезы: "Кольца-электроны образуют электронную оболоч-
ку-многогранник". Действительно, 8 кольцевых магнитов поддержи-
вают форму восьмигранника из колец, уложенных на сферу электрос-
татического равновесия электронов (Рис.1.). Более темным цветом
помечены обращенные наружу южные полюса электронов. Эта модель
электронной оболочки соответствует ферми-поверхности, обнаружен-
ной экспериментально [2].
Замещение четырех колец-электронов недостроенными восьмиг-
ранниками (без одного кольца) превращает форму фосьмигранного
атома в знакомую нам форму тетраэдрической молекулы (Рис.2.). Та-
кую форму имеют электронные поверхности молекул тетрахлорида уг-
лерода и фосфорной кислоты.
Наглядная демонстрация форм молекул в модельном эксперимен-
те увлекла нас, и мы построили более 1 500 кольцевых моделей раз-
личных химических соединений (постоянная экспозиция в павильоне
"Центральный" ВВЦ ст.М. ВДНХ).
Особый класс химических соединений - сопряженные системы.
Модельный эксперимент показал, что взаимовлияние углеродоподоб-
ных атомов является причиной перестройки электронной структуры
молекулы из многогранной в многослойную, что приводит к формиро-
ванию "плоской" сопряженной системы, например, молекулы бензола
(Рис.3.).
Композиция многогранных и многослойных атомов и молекул поз-
волила нам составить кольцегранную структуру нуклеотидов ДНК
(Рис.4.). Структура нашей модели ДНК в общих чертах не противоре-
чит общепринятой модели [3].
Как проверить, совпадают ли формы моделей из колец с форма-
ми реальных молекул?
Это не так просто, как может показаться на первый взгляд.
Дело в том, что не только электроны, но и многие атомы на элек-
тронных фотографиях молекул неразличимы. Общий контур молекулы
хорошо различим лишь для крупных белков, насчитывающих тысячи и
более атомов [4].
Мы решили построить кольцевые модели нескольких известных
белковых молекул. Одна из них troponin-C, насчитывающая около 8
000 поверхностных электронов, представлена на Рис.5. Она построе-
на не по результатам рентгеноструктурного анализа, а ПО ГЕ-
НЕТИЧЕСКОМУ КОДУ этой молекулы. Рассмотрим, как это было сделано.
В настоящее время считается, что белковые молекулы рождают-
ся в развернутом виде, а затем сами сворачиваются под действием
межатомных сил [4]. Однако, в пробирке этого может и не произой-
ти. Почему?
Мы построили модель группы CCON (Рис.6.) (а) - электронная
поверхность, (в) - упрощенное изображение.
Гипотеза: треугольник DEF каждой группы CCON совмещается ри-
босомой с треугольником АBC предыдущей группы CCON в соответ-
ствии с ТКГК.
Проверку гипотезы мы начали с того, что изготовили модель
полимера, в котором точки D треугольников DEF совмещены с точка-
ми A треугольников ABC(вариант 1). В полученной структуре на один
виток спирали пришлось 3,65 моделей аминокислотных остатков. Это
значение соответствует структуре альфа-спирали.
Совместив точки D треугольников DEF с точками C треугольни-
ков ABC(вариант 2) мы получили более вытянутую спираль. Коэффи-
циент удлиннения составил 1.3, что, согласно экспериментальным
данным отличает бета-структуру от альфа-структуры.
Третий вариант соединения моделей остатков дал левую спи-
раль, которой мы не нашли экспериментального соответствия, одна-
ко чередования вариантов 1-3-1 привело к повороту бета-структуры
на 180 градусов, причем группы CO расположились напротив групп NH.
Треугольник DEF в случае образования 3/10 и 4/10 альфа-спи-
ралей несколько повернут относительно ABC за счет образования до-
полнительной водородной связи. Таким образом вариант 1 расщеп-
ляется на три.
Следующий шаг - проверка, одинаковы ли коды одного и того же
аминокислотного остатка, если он, согласно рентгеноструктурным
данным входит в состав альфа-спирали ?
Анализ кодов миоглобина и тропонина-С подтвердил это предпо-
ложение. Участки альфа-спиралей содержали преимущественно одни и
те же коды. В частности Gly в альфа спиралях кодируется трипрета-
ми GGC и GGG.
Следующий шаг - попытка построения кольцевых моделей белков
с известной структурой, в частности, миоглобина, инсулина, тропо-
нина, окситоцина. Перебор помог выбрать варианты соединения моде-
лей групп CCON, дающие формы этих белков. При этом оказалось,
что, например, аминокислота глицин Giy кодируется кодом GGC, ес-
ли входит в состав 4/10-альфа-спирали, кодом GGA, если входит в
состав бета-слоя, кодом GGG, если входит в состав 3/10-альфа-спи-
рали, где водородная связь установлена не с четвертым, а с
третьим аминокислотным остатком и, наконец кодом GGT, если яв-
ляется вторым аминокислотным остатком бета-поворота.
А.Кушелев составил ТКК, в которой каждому из 64 кодов соот-
ветствует вариант композиции. Впервые эта таблица была опублико-
вана в газете "Экономика сегодня и завтра" N1(4) 1993г.
С этого момента началась проверка ТКК различными группами
специалистов из МГУ и ин-та молекулярной биологии. Официальных
ответов мы не получили.
Авторам представляется интересным обсудить вопрос о
возможных применениях открытой закономерности, представленной
в виде ТКК.
Таблица квазикомпозиционного кода помогает получить сведения
о структурах большого класса белков без проведения
дорогостоящего рентгеноструктурного анализа. Это позволяет
организовать надстройку банка EMBL, которая, занимая 12
килобайт(!) оперативной памяти компьютера сможет
интерпретировать код белка (с учетом перечисленных
выше ограничений) как структуру, причем в масштабе реального
времени доступа к банку нуклеотидных последовательностей.
Версия 2.0 программы продемонстрирована в настоящей статье.
В упакованном виде она занимает 5 килобайт. Версию 2.0
(Определение вторичной структуры) можно получить бесплатно.
Мгновенность получения структурных данных ставит ТКК вне конкуренции
с рентгеном и другими методами. 100% достоверность, согласно
нашей гипотезе может быть получена в случае учета ТКК и физико-
химических взаимодействий между отдельными аминокислотными
остатками, отдельными атомами и отдельными элктронами, классическая
модель которых создана в лаборатории "Наномир".
6. СПИСОК ЛИТЕРАТУРЫ
1.Cohen C., Parry D.A.D a helical coiled coils. Trends
Biochem. Sci., 11, 245-248, 1986. Dickerson R.E. The DNA helix
and how it is read. Sci. Am., 249(6), 94-111, 1983.
2.Грин Н., Стаут У., Тейлор Д. Биология в 3-х томах Т.1.:
Пер с англ./Под ред. Р. Сопера.-М.: Мир, 1993. стр.173-182.
3.Лим В.И. "Стереохимический анализ формирования простран-
ственной структуры белка в процессе биосинтеза".- Диссертация на
соискание ученой степени доктора биологических наук. Москва,
1986, ротапринт МГУ.
4.Lim V.I., Steinberg S.V. A novel structural model for silk
fibroin: alfa-L, alfa-R, beta-structure. - FEBS Lett., 1981,
v.131, No.2, p. 203-207.
http://ftp.decsy.ru/nanoworld/index.htm