К.В. Шайтан, К.Б. Терёшкина
Молекулярная динамика белков и пептидов
Методическое пособие

2.2. Изучение динамики молекулы с помощью программы MoDyp.
2.2.1. Создание входных файлов для модуля premd.exe.
В состав пакета MoDyp (Molecular Dynamics Package) входят два главных исполняемых файла – собственно modyp.exe и препроцессор premd.exe, служащий для преобразования информации о молекуле из файлов *.ent или *.hin в формат, понимаемый программой modyp.exe, и имеющий расширение str.
Программа premd.exe – консольная, её запуск осуществляется следующим образом: в командной строке пишется premd.exe_premd.pbatch или premd.exe_premd.pbatch_log В файл log будет записана вся информация о процессе преобразования структуры в формат str. Там же будут записи, касающиеся ошибок. Рассмотрим файл premd.pbatch:

set autor  "Shaitan K.V."
set autocenter on
set coloring element
load forcefield  amber  amber99.ff
load topology  topo96.tpl
load pdbstr pdbstr.pos
mselect amber96
process nuvot.ent		nuvot.str
processhin netnet.hin		netnet.str
end

Примечание 1: символом _ в команде запуска программы обозначен пробел. Если в команде не встречается этот символ, значит текст нужно вводить без пробела.
Примечание 2: в текстах файлов пакета Modyp сохранена орфография разработчиков пакета.
SET AUTOR – задать имя создателя этого файла.
SET AUTOCENTER – задать включение / выключение центрирования молекулы при переводе из файла *.ent, ON / OFF, соответственно.
SET COLORING ELEMENT – задать различные цвета для разных атомов.
LOAD FORCEFIELD AMBER AMBER99.FF – загрузить силовое поля типа "AMBER" из файла AMBER99.FF.
LOAD TOPOLOGY TOPO96.TPL – загрузить файл топологии TOPO96.TPL.
LOAD PDBSTR PDBSTR.POS – загрузить файл PDBSTR.POS (описание см. ниже).
MSELECT AMBER96 – выбор модели.
PROCESS – команда перевода файла *.ent в файл *.str.
PROCESSHIN – команда перевода файла *.hin в файл *.str.
Таким образом, кроме файла со структурой требуются следующие файлы:
  1. *.tpl – файл топологии, где прописаны типы остатков, из каких атомов они состоят, а также все связи внутри остатка. (Только при преобразовании *.ent-файла).
  2. *.ff – файл силового поля, где содержится вся информация о силах, с которыми взаимодействуют атомы.
  3. *.pos – файл, в котором записана информация о структуре pdb файла.
  4. *.pbatch – последовательность команд, которые должен выполнить premd.exe.
Примечание: при переводе из формата hin в str модулю premd требуется наличие любого tpl-файла. При этом там не нужно прописывать структуру переводимой молекулы. Достаточно использовать файл со стандартными аминокислотными остатками.
Для того, чтобы создать файл *.str, сначала нужно модифицировать файл *.ent. Основные команды для работы в текстовом редакторе Far приведены в табл.3.
Таблица 3. Основные функции при работе с текстовым редактором Far
F3 Просмотр файла
F4 Редактирование файла
F2 Сохранить
Shift F2 Сохранить как
Ctrl home В начало файла
Ctrl end В конец файла
Ctrl F7 Заменить
Insert Заменять / вставлять символы
Shift ^ или Shift v Выделить строки
Alt и стрелка Выделять символы
Alt U или Alt I Переместить выделенный столбец влево или вправо
Ctrl Insert Копировать
Shift Insert Вставить
Сtrl U Снять выделение

Файл структуры *.ent и его описание *.pos

REMARK Periodic Box 20 20 20
ATOM      1 1H   ACE     1       0.305   0.184   4.791
ATOM      2  CH3 ACE     1      -0.242   0.603   3.947
ATOM      3 2H   ACE     1      -1.305   0.419   4.091
ATOM      4 3H   ACE     1      -0.086   1.679   3.904
ATOM      5  C   ACE     1       0.220  -0.053   2.653
ATOM      6  O   ACE     1      -0.007  -1.256   2.481
ATOM      7  N   PHE     2       0.847   0.718   1.765
ATOM      8  H   PHE     2       0.976   1.702   1.977
::::
::::
ATOM     30 1HA  NME     3       5.366  -0.306  -0.898
ATOM     31 2HA  NME     3       5.082  -1.566   0.324
ATOM     32 3HA  NME     3       4.832  -1.922  -1.389
TER      33      NME     3 
HETATM   34  O   WAT     1      -1.725  -2.101  -0.184
HETATM   35  H1  WAT     1      -1.660  -1.808   0.740
HETATM   36  H2  WAT     1      -2.341  -1.455  -0.554
HETATM   37  O   WAT     2      -2.595   1.890   2.176
HETATM   38  H1  WAT     2      -3.071   1.713   3.006
HETATM   39  H2  WAT     2      -2.077   2.670   2.412
::::
CONECT  775  776  777
CONECT  776  775
CONECT  777  775
END

Рис. 9 Файл pdbstr.pos, во второй колонке – номер начальной позиции, в четвёртой – количество столбцов. В третьей колонке: tag – слово "АТОМ", atomno – номер атома, atomtype – имя атома, residue – название остатка, chainid – номер цепи (часто опускается), residueno – номер остатка, coordx, coordy, coordz – координаты по осям x, y и z соответственно.
REMARK periodic box 20 20 20 – размер "ящика" с водой.
АТОМ – указание на то, что далее следует описание атома: уникальный номер атома, имя атома в остатке, название остатка, номер остатка в последовательности и три декартовы координаты атома.
TER – указание на окончание последовательности. Для premd строку нужно удалить.
HETATM – так называемый "гетероатом", то есть атом, не входящий в стандартный для программы, где он был собран, остаток. При запуске программы premd.exe, такие записи игнорируются. Поэтому всегда необходимо заменять слово "HETATM" на "ATOM__" (с двумя пробелами, чтобы сохранить расположение столбцов).
CONECT – описание связей: первый номер – номер атома, который связан с другими (следующие номера). При создании топологического справочника (*.tpl) удобно использовать эту информацию при описании связей.

Файл структуры *.hin
Файл *.hin может использоваться при переводе координат нестандартных молекул в формат str. При этом файлы *.pos и *.tpl не используются. Некоторые параметры, например, правильные заряды на атомах, придётся вносить в *.str вручную.
Пример для молекул, состоящих из стандартных остатков (монопептид пролина в воде):

forcefield amber
sys 0 0 1
view 40 0.065372:
box 20 20 20
seed -1110
mol 1
res 1 ACE 1 - -
atom 1 1H H HC - 0.01 0.5211817 0.8022858 -4.399683 1 2 s
atom 2 CH3 C CT - -0.142 1.401836 0.6444302 -3.778286 4 1 s 3 s 4 s 5 s
atom 3 2H H HC - 0.01 1.760729 -0.3736996 -3.912139 1 2 s
atom 4 3H H HC - 0.01 2.176968 1.339131 -4.09395 1 2 s
atom 5 C C C i 0.616 1.057617 0.8883146 -2.312582 3 2 s 7 s 6 d
atom 6 O O O - -0.504 1.639959 1.773163 -1.677541 1 5 d
endres 1
res 2 PRO 2 - -
atom 7 N N N i -0.229 0.1135035 0.1206233 -1.773465 3 5 s 8 s 18 s
atom 8 CA C CT - 0.035 -0.2958276 0.3186279 -0.4082801 4 7 s 9 s 10 s 12 s
atom 9 HA H HC - 0.048 -0.6812353 1.331479 -0.3078263 1 8 s
atom 10 C C C i 0.526 0.8532816 0.06834622 0.5704045 3 8 s 21 s 11 d
atom 11 O O O - -0.5 1.641413 -0.8649697 0.421405 1 10 d
atom 12 CB C CT - -0.115 -1.411033 -0.6914164 -0.1769076 4 8 s 15 s 13 s 14 s
atom 13 1HB H HC - 0.061 -0.9572152 -1.555701 0.2917716 1 12 s
atom 14 2HB H HC - 0.061 -2.217021 -0.3106433 0.4451269 1 12 s
atom 15 CG C CT - -0.121 -1.908573 -1.079469 -1.565344 4 12 s 18 s 16 s 17 s
atom 16 1HG H HC - 0.063 -2.267472 -2.107143 -1.585348 1 15 s
atom 17 2HG H HC - 0.063 -2.696258 -0.3900914 -1.870854 1 15 s
atom 18 CD C CT - -0.012 -0.684899 -0.8829539 -2.453686 4 7 s 15 s 19 s 20 s
atom 19 1HD H HC - 0.06 -1.003528 -0.5857712 -3.453772 1 18 s
atom 20 2HD H HC - 0.06 -0.1071138 -1.802373 -2.512915 1 18 s
endres 2
res 3 NME 3 - -
atom 21 N N N - -0.463 0.9060994 0.8792239 1.623696 3 22 s 10 s 23 s
atom 22 H H H - 0.252 0.2400249 1.642878 1.637041 1 21 s
atom 23 CA C CT - 0.067 1.340683 0.4332927 2.924588 4 21 s 24 s 25 s 26 s
atom 24 1HA H HC - 0.048 0.4968369 -0.04036276 3.426524 1 23 s
atom 25 2HA H HC - 0.048 2.153537 -0.2852627 2.840401 1 23 s
atom 26 3HA H HC - 0.048 1.649684 1.305584 3.501063 1 23 s
endres 3
endmol 1
mol 2
res 1 WAT 1 - -
atom 1 O O OW - -0.834 -1.791891 1.660319 2.246055 2 2 s 3 s
atom 2 H1 H HW - 0.417 -1.975522 0.7162368 2.264446 1 1 s
atom 3 H2 H HW - 0.417 -2.549447 2.037338 2.708455 1 1 s
endres 1
endmol 2
mol 3
res 1 WAT 2 - -
atom 1 O O OW - -0.834 -1.172214 3.311394 -3.127628 2 2 s 3 s
atom 2 H1 H HW - 0.417 -0.448992 3.608016 -2.55468 1 1 s
atom 3 H2 H HW - 0.417 -1.383347 4.113186 -3.624905 1 1 s
endres 1
endmol 3

Forcefield Amber – тип силового поля – "Amber", только в этом случае можно использовать файл *.hin для перевода в формат *.str.
ATOM – описание атома:
2 – порядковый номер,
CH3 – уникальное имя атома в остатке (для нестандартных молекул в этом столбце прочерк),
C – символ атома в таблице Менделеева,
CT – тип атома в силовом поле,
–0.142 – эффективный заряд,
1.401836 0.6444302 –3.778286 – координаты x, y, z
4 1 S 3 S 4 S 5 S – число и типы связей с другими атомами (s – одинарная, d – двойная и т.д.).
RES – описание остатка:
1 – номер остатка в молекуле,
WAT – название остатка,
2 – порядковый номер остатка.
Описания молекул и остатков создаются по типу вложенных циклов:

mol 1				начало первой молекулы
res 1 ACE 1 - -				начало первого остатка
endres 1				конец первого остатка
res 2 PRO 2 - -
endres 2
res 3 NME 3 - -
endres 3
endmol 1			конец первой молекулы
mol 2
res 1 WAT 1 - -
endres 1
endmol 2

Следует обратить внимание, что любая молекула в данном случае содержит остатки. Молекула монопептида состоит из трёх остатков, молекула воды - из одного. Если была собрана нестандартная молекула, то она не будет содержать остатки, их номера и названия надо будет добавить в *.hin вручную! Так выглядит файл для нестандартной молекулы:

forcefield amber94
sys 0 0 1
view 40 0.41209 55 15 1 0 0 0 1 0 0 0 1 -1.7504 0.034747 -55
seed -1111
mol 1
atom 1 - O O - 0 1.75044 -0.8047471 2.221536e-025 1 2 d
atom 2 - C C - 0 1.75044 0.4152529 2.221536e-025 3 1 d 3 s 4 s
atom 3 - H HC - 0 2.685747 0.9552529 -3.306437e-017 1 2 s
atom 4 - H HC - 0 0.8151323 0.9552529 3.306437e-017 1 2 s
endmol 1

Чтобы его можно было переводить в другой формат с помощью программы premd, модифицируем его:

forcefield amber94
sys 0 0 1
view 40 0.41209 55 15 1 0 0 0 1 0 0 0 1 -1.7504 0.034747 -55
seed -1111
mol 1
res 1 UHU 1
atom 1 - O O - 0 1.75044 -0.8047471 2.221536e-025 1 2 d
atom 2 - C C - 0 1.75044 0.4152529 2.221536e-025 3 1 d 3 s 4 s
atom 3 - H HC - 0 2.685747 0.9552529 -3.306437e-017 1 2 s
atom 4 - H HC - 0 0.8151323 0.9552529 3.306437e-017 1 2 s
endres 1
endmol 1


Топологический справочник *.tpl
В файле с расширением tpl содержатся данные, сопоставляющие имена атомов из файла структуры с типами атомов в справочнике силового поля, а также эффективные заряды и расположение связей:

;Residue of Glycine, created by Belyakov A.A.
residue  GLY  inchain  automatic  amber96
incoming 1
outgoing 6
tag   PDB   Type  GType   Charge   Comment
----  ----  ----  -----   -------  --------------
atom     N  N       3      -0.4157  ;1
atom     H  H       1      +0.2719  ;2
atom    CA  CT      4      -0.0252  ;3
atom   1HA  H1      1      +0.0698  ;4
atom   2HA  H1      1      +0.0698  ;5
atom     C  C       3      +0.5973  ;6
atom     O  O       1      -0.5679  ;7
bond   1  2    ;1
bond   1  3    ;2
bond   3  4    ;3
bond   3  5    ;4
bond   3  6    ;5
bond   6  7    ;7
endr   ;23.03.01

Каждая запись начинается словом residue и заканчивается словом endr.
RESIDUE – имя остатка (как в файле *.ent), тип остатка, способ вычисления параметров (automatic / manual), тип модели (должен быть тот же, что и после слова mselect в premd.pbatch). Типы остатков: atbegin начальный (первый в цепи), inchain – в цепи, atend – конечный, single – одиночный. Для первых трёх типов остатков указывается номер атома, который соединён с предыдущим остатком (incoming) и / или номер атома, который соединён с последующим остатком (outgoing).
ATOM – имя атома из файла .ent, тип атома из справочника (.ff), количество атомов, с которыми связан данный атом, эффективный заряд. После точки с запятой следует комментарий. В четвёртом столбце нужно указывать именно количество атомов, а не связей. Так, для атома углерода в ацетилене их будет 2. Имена атомов можно перенести из файла *.ent, а типы из *.hin (если мы не забыли преобразовать типы атомов в формат AMBER, когда работали с программой HyperChem!)
BOND  1  2 – между атомами 1 и 2 существует связь. Таким же образом описываются все остальные связи в остатке (без повторов!). Для описания связей удобно пользоваться данными из файла *.ent. Например, строка

CONECT	3	4	56	78	999

будет соответствовать следующим строкам в файле *.tpl:

BOND	3	4
BOND	3	56
BOND	3	78
BOND	3	999


Силовое поле amber *.ff
В этом справочнике содержится информация по всем константам для атомов и групп атомов, которые используются в расчётах. Справочник содержит несколько частей, различающихся формой записи (разделённых пустыми строками):

1. CT 12.01         0.878               sp3 aliphatic C
2. C -CM  410.0    1.444       JCC,7,(1986),230; THY,URA
3. HW-OW-HW    100.      104.52    TIP3P water
4. CT-CT-N -C    1    0.15        180.0         -3.         phi,psi,parm94
5. X -X -N -H          1.0          180.      2.           JCC,7,(1986),230
6. HW  OW  0000.     0000.                     4.  flag for fast water
7. N   NA  N2  N*  NC  NB  N3  NT  NP  NO  NY
8. H2          1.2870  0.0157             Veenstra et al JCC,8,(1992),963

1. Атомы:
Тип атома CT
Атомная масса 12.01
Поляризуемость, Å3 0.878
Описание атома sp3 aliphatic C
2. Связи:
Типы атомов, образующих связь C –CM
Гармоническая силовая константа, ккал/моль·Å2 410.0
Равновесная длина связи, Å 1.444
Примечание, ссылка JCC,7,(1986),230; THY,URA
3. Валентные углы:
Типы атомов, образующих угол HW–OW–HW
Гармоническая силовая константа, ккал/моль·рад2 100.
Равновесное значение угла, градусы 104.52
Примечание, ссылка TIP3P water
4. Двугранные углы:
Типы атомов, образующих угол. (В правой колонке пример для "общего типа двугранного угла", где Х – любой атом) CT–CT–N –C X –CM–CM–X
Число, на которое делится высота торсионного барьера 1 4
Высота барьера, ккал/моль 0.15 26.60
Сдвиг фазы, градусы 180.0 180.0
"Минус" показывает, что в потенциале присутствует больше одной гармоники, параметры для неё берутся из следующей строки – "минус"  
Периодичность торсионного барьера 3. 2.
Примечание, ссылка phi,psi,parm94 intrpol.bsd.on C6H6
5. Псевдоторсионые углы:
Типы атомов, образующих угол (Х – любой атом) X –N2–CA–N2
Высота барьера, ккал/моль 10.5
Сдвиг фазы, градусы 180.
Периодичность торсионного барьера 2.
Примечание, ссылка JCC,7,(1986),230
6. Водородные связи (потенциал "10-12"):
0000. . 0000.
Типы атомов в атомной паре HW OW
Коэффициент при 12-й степени (A/(r12)) 0000.
Коэффициент при 10-й степени (–В/(r10)) 0000.
Примечание 4. flag for fast water
7. Эквивалентные атомные типы для параметров Ван-дер-Ваальса. Атомы, следующие после первого, определяются как эквивалентные ему: N NA N2 N* NC NB N3 NT NP NO NY
8. Параметры потенциала "6-12":
Тип атома CT
Ван-дер-Ваальсов радиус атома, Å 1.9080
Глубина потенциальной ямы, ккал/моль 0.1094
Примечание, ссылка Spellmeyer

Выделите орфографическую ошибку мышью и нажмите Ctrl+Enter

МГУ им. Ломоносова Rambler's Top100

 

Rambler's Top100