Как проверить пикотехнологию белков? (jpg, htm)

Кушелев: -Эти "детские игрушки" (Программа Пикотех) покруче К"М" будут ;)
Кстати "примитивная программка":

http://nanoworld.pointclark.net/nanoworld/20041130/20050216/index4.html

может определить структуру практически любого белка, а К"М" не может. То-то же :)

Emergency2: Почему вы говорите "определить"?
Не определить, а предложить вариант, выданный наперед заданным алгоритмом.

Виртуальный Кушелев: А что, "наперёд заданный алгоритм" не может определять
"немеренное" число вариантов белковых структур?

Рибосома тоже строит наперёд заданную структуру белка, ведь эта структура
закодирована (наперёд задана) генетически, не так ли?

Какая разница, подаёте Вы генетический код (нуклеотидную последовательность)
на вход реальной рибосоме или на вход виртуальной, т.е. программе "Пикотех"?
На выходе будет одна и та же реальная/виртуальная структура белка.

Точно так же, как без разницы, кладёте Вы на стол два реальных яблока или
на виртуальный стол - два виртуальных.

Добавляя к ним ещё два реальных/виртуальных яблока Вы получаете четыре.

Если модель адекватна, то результат одинаков.

Так что Вы можете лишь пытаться продемонстрировать, что структура,
выдаваемая программой "Пикотех" отличается от структуры, выдаваемой
реальной рибосомой по той же нуклеотидной последовательности.

А Кушелев уже проверил, набрал статистику и опубликовал её здесь:

http://nanoworld.pointclark.net/nanoworld/01/DATA/TEXTS.RUS/20000509.htm

Вам осталось лишь найти ошибку или согласиться с Кушелевым.

***
Emergency2: ... Определяют экспериментально. Да, утомительно и сложно,
зато хоть какая-то надежда, что так и есть. А получать структуры с
помощью алгоритма, построенного так, чтобы для десятка аминокислот
получались результаты идентичныме экспериментальным, это не определение,
а гадание на кофейной гуще, напоминающее предсказание лысин генсеков,
исходя из того, что несколько первых были лысыми через одного.

Кушелев: Вы не отличаете десяток белковых структур от десятка аминокислот? ;)

Это по-Вашему десяток белковых структур или десяток аминокислот?



Некоторые структуры были получены в 3D: 3D Demo

Вы в курсе, что была собрана максимально полная статистика
на момент написания статьи?

Ведь кроме этих 10 белковых структур:

1 TRYPSIN INHIBITOR
2 RUBREDOXIN
3 TRIPSIN REPRESSOR
4 LYSOZYME
5 PLASTOCYANIN-1
6 PLASTOCYANIN-2
7 ERABUTOXIN-B
8 INSULIN
9 SCORPION NEUROTOXIN-A
10 SCORPION NEUROTOXIN-B

были исследованы структуры более 30 альфа-керотинов, фиброина,
альфа-амилазы, миоглобина, геомглобина и десятков других белков.

Программа "Пикотех" (виртуальная рибосома) определила структуры 40
белков на конкурсе CASP:
 http://nanoworld.pointclark.net/nanoworld/01/DATA/e_mail/20010111/cafasp.htm

http://nanoworld.pointclark.net/nanoworld/01/DATA/e_mail/20010111/leszek.txt -
здесь Вы найдёте переписку Кушелева с организаторами конкурса CASP.

Они подтверждают, что получили все структуры с T0089 по T0120

Структуры этих белков участники конкурса определяли до того, как
структура белков была определена методом РСА.

Вы можете проверить, правильно ли была определена структура конкурсных
белков программой "Пикотех".

Сделать это очень просто.

Вы берёте в буфер обмена данными Windows код любого белка прямо из
текста переписки:

http://nanoworld.pointclark.net/nanoworld/01/DATA/e_mail/20010111/leszek.txt

Например, код белка T0086

Организатор конкурса Leszek прислал его нуклеотидную последовательность:

По этому фрагменту Вы легко её найдёте.

BASE COUNT 2757 a 2687 c 2937 g 2933 t
ORIGIN
1 cacaaaacac acaaagcctg tcacaggtga tgtgaaaaaa gaaaagcaat gactcaggag

***

После этого запускаете программу Пикотех:

http://nanoworld.pointclark.net/nanoworld/20041130/20050216/index4.html

Включаете режим Edit Source

и вставляете из буфера обмена данными нуклеотидную последовательность,
например эту:

CDS 66..1406

(с 66 символа по 1406-ой)

Вот этот фрагмент (CDS, последовательность, начиная с первого символа,
т.к. программа Пикотех сама возьмёт символы с 66 и далее):

CDS 66..1406

1 cacaaaacac acaaagcctg tcacaggtga tgtgaaaaaa gaaaagcaat gactcaggag
61 atagaatgat gattactctg cgcaaacttc ctctggcggt tgccgtcgca gcgggcgtaa

***

Далее стандартизируете входные данные по шаблону:

FT CDS 66..1406

     cacaaaacac acaaagcctg tcacaggtga tgtgaaaaaa gaaaagcaat gactcaggag
     atagaatgat gattactctg cgcaaacttc ctctggcggt tgccgtcgca gcgggcgtaa
     tgtctgctca ggcaatggct gttgatttcc acggctatgc acgttccggt attggttgga
     caggtagcgg cggtgaacaa cagtgtttcc agactaccgg tgctcaaagt aaataccgtc
     ttggcaacga atgtgaaact tatgctgaat taaaattggg tcaggaagtg tggaaagagg
     gcgataagag cttctatttc gacactaacg tggcctattc cgtcgcacaa cagaatgact
     gggaagctac cgatccggcc ttccgtgaag caaacgtgca gggtaaaaac ctgatcgaat
     ggctgccagg ctccaccatc tgggcaggta agcgcttcta ccaacgtcat gacgttcata
     tgatcgactt ctactactgg gatatttctg gtcctggtgc cggtctggaa aacatcgatg
     ttggcttcgg taaactctct ctggcagcaa cccgctcctc tgaagctggt ggttcttcct
     ctttcgccag caacaatatt tatgactata ccaacgaaac cgcgaacgac gttttcgatg
     tgcgtttagc gcagatggaa atcaacccgg gcggcacatt agaactgggt gtcgactacg
     gtcgtgccaa cttgcgtgat aactatcgtc tggttgatgg cgcatcgaaa gacggctggt
     tattcactgc tgaacatact cagagtgtcc tgaagggctt taacaagttt gttgttcagt
     acgctactga ctcgatgacc tcgcagggta aagggctgtc gcagggttct ggcgttgcat
     ttgataacga aaaatttgcc tacaatatca acaacaacgg tcacatgctg cgtatcctcg
     accacggtgc gatctccatg ggcgacaact gggacatgat gtacgtgggt atgtaccagg
     atatcaactg ggataacgac aacggcacca agtggtggac cgtcggtatt cgcccgatgt
     acaagtggac gccaatcatg agcaccgtga tggaaatcgg ctacgacaac gtcgaatccc
     agcgcaccgg cgacaagaac aatcagtaca aaattaccct cgcacaacaa tggcaggctg
     gcgacagcat ctggtcacgc ccggctattc gtgtcttcgc aacctacgcc aagtgggatg
     agaaatgggg ttacgactac accggtaacg ctgataacaa cgcgaacttc ggcaaagccg
     ttcctgctga tttcaacggc ggcagcttcg gtcgtggcga cagcgacgag tggaccttcg
     gtgcccagat ggaaatctgg tggtaatagc aaaacctggg ccggataagg cgtttacgcc
//

Данные должны начинаться с 5 пробелов.



Теперь вставляете эти данные в режиме Edit Source и смотрите структуру
конкурсного белка.

Теперь переключаетесь из режима Edit Source в режим Secondary structure:



Если Вы получили такую же картинку, значит Вы всё сделали правильно.

Теперь ищите данные РСА по этому белку и убеждаетесь, что РСА по части
начала и конца альфа-спиральных участков ошибается не более, чем на 5
аминокислотных остатков. Почему так происходит я уже объяснял.

Ошибка в 1 агстрем означат возможность ошибки на один атом. Атом может
принадлежать соседнему аминокислотному остатку, а соседний остаток
может принадлежать соседнему витку альфа-спирали.

Вы можете убедиться в работоспособности программы Пикотех на любом белке.
Исключения составляют белки, которые собираются без рибосомы, т.е.
самосборкой или по старому (митохондриальному) коду.