Русская Википедия:AutoDock
Шаблон:Карточка программы AutoDock — пакет программ, предназначенный для автоматизированного молекулярного докинга. В основном применяется для Шаблон:Нп5, в том числе, с учётом подвижных остатков белка. Autodock также используется для «слепого докинга», когда активный центр белка не известен.
О программе
AutoDock — один из пакетов программ, позволяющих предсказывать связывание маленьких молекул с белками известной структуры. Настоящие дистрибутивы AutoDock включают в себя два поколения ПО: AutoDock 4 и AutoDock Vina. AutoDock является свободным программным обеспечением, последняя 4-я версия которого распространяется в соответствии с открытым лицензионным соглашением GNU General Public License, AutoDock Vina доступна под Apache license[1][2].
Начиная с самой первой версии, Autodock представляет собой совокупность 2х программ: Autodock — собственно программа, проводящая докинг и Autogrid — программа, позволяющая рассчитывать сетки потенциалов. Для каждого рецептора (рецептором в докинге называется макромолекула, для которой рассчитываются сетки) достаточно рассчитать сетки потенциалов для каждого типа атомов один раз, что позволяет запускать расчеты для любого лиганда, состоящего из этих атомов (лиганд в докинге это маленькая молекула, для которой возможно изменение положения и конформации)[1].
В 2006 г. AutoDock был наиболее цитируемой программой для докинга[3].
AutoDock поддерживается и разрабатывается лабораториями The Scripps Research Institute и Olson Laboratory[1].
Механизм работы
Докинг проводится в кубическую область внутри рецептора (docking box). С помощью AutoGrid для рецептора создается набор бинарных файлов — сеток потенциалов. Они описывают для каждого атома, входящего в docking box, потенциал его взаимодействия с пробным атомом определённого химического элемента. Набор этих элементов определяется химическим составом лигандов, с которыми требуется провести докинг. На каждый химический элемент создается по 1-2 файла. Для расчета потенциала используется скоринг функция, либо основанная на физических законах, либо эмпирическая, либо смешанная. Скоринг функции в разных версиях программы могут отличаться. Сетки потенциалов используются для расчета свободной энергии[4].
Лиганд, помимо совокупности атомов, связей и зарядов, внутри программы описывается набором чисел — положением в docking box, поворотом всех активных торсионных углов. Autodock перебирает все возможные комбинации этих чисел, чтобы в итоге найти оптимальное с точки зрения свободной энергии положение лиганда в docking box. Поэтому в качестве docking box обычно выбирают куб со стороной 10-30 ангстрем таким образом, чтобы он включал в себя активный центр рецептора[4].
Полный перебор всех возможных положений в активном центре и всех конформаций лиганда — очень время- и ресурсо-затратная задача. Для оптимизации процесса в Autodock применяются алгоритмы поиска глобального минимума: Монте-Карло, имитации отжига, генетические алгоритмы: LGA (Ламаркианский генетический алгоритм)[4].
Пример работы Autodock 4.2 на основе LGA[5]:
- Генерируется популяция лигандов (размер популяции задается пользователем). Каждый лиганд случайным образом расположен в docking boх, имеет случайную конформацию и описывается набором трансляционных, ориентационных и конформационных чисел.
- Для каждого элемента популяции рассчитывается свободная энергия. Она включает в себя энергию межмолекулярного взаимодействия рецептора с лигандом, и внутримолекулярную энергию лиганда.
- Стадия размножения. Для каждого элемента рассчитывается количество потомков по формуле: <math>n=(f{w}-f{i})/(f{w}-f{mean})</math>, где <math>n</math> — количество потомков, <math>f{i}</math> — свободная энергия элемента, <math>f{w}</math> — энергия худшего элемента (максимальная), <math>f{mean}</math> — средняя энергия. После этого каждый элемент лучше среднего получает пропорциональное <math>n</math> количество потомков, которые добавляются в популяцию.
- Стадия кроссинговера: случайным образом выбираются два элемента популяции и их характеристические числа рекомбинируют, то есть элементы обмениваются некоторыми из чисел. Процент рекомбинирующих пар задается пользователем.
- Стадия мутации: к характеристическим числам элемента прибавляется случайное число, соответствующее распределению Коши. Параметры распределения и процент мутаций задаются пользователем.
- Стадия вымирания: худшие элементы популяции удаляются. Количество выживших также задается пользователем.
- Стадия оптимизации. Каждый элемент популяции оптимизируется с помощью алгоритмов локального поиска, например, имитации отжига при низких температурах, что позволяет минимизировать свободную энергию в небольших пределах. Эта стадия отличает LGA от классических генетических алгоритмов.
- Шаги 2-7 повторяются определённое большое количество раз (пока лучшая свободная энергия не перестанет изменяться, либо при достижении лимита по времени или количеству итераций).
- Вся предыдущая последовательность шагов выполняется несколько раз (независимые запуски).
- Результаты множественных запусков кластеризуются по положению в docking box с отсечкой по RMSD 1 ангстрем.
- Для всех находок в кластере считается энергия взаимодействия с рецептором. Энергией кластера считается самая лучшая в этом кластере.
- Финальная энергия рассчитывается для лучших кластеров как разность между разностями энергий перехода рецептора с лигандом из несвязанного положения в связанное[6].
История версий
Autodock 1
Создан в 1990 году. Первая версия базируется на силовом поле Шаблон:Нп5. Скоринг функция является суммой потенциала Леннарда-Джонса, электростатического потенциала и эмпирических функций энергии ковалентных связей, плоских и торсионных углов[7].
- <math>
V=\sum_\text{bonds} k_b (l-l_0)^2 + \sum_\text{angles} k_a (\theta - \theta_0)^2 + \sum_\text{torsions} \sum_n \frac{1}{2} V_n [1+\cos(n \omega- \gamma)]+\sum_{j=1} ^{N-1} \sum_{i=j+1} ^N f_{ij}\biggl\{\epsilon_{ij}\biggl[\left(\frac{r_{0ij}}{r_{ij}} \right)^{12} - 2\left(\frac{r_{0ij}}{r_{ij}} \right)^{6} \biggr]+ \frac{q_iq_j}{4\pi \epsilon_0 r_{ij}}\biggr\} </math>
В реализации доступны алгоритмы Монте-Карло и имитации отжига[8].
Autodock 2.4
Появилось много улучшений, сопутствующих программ для параллельных запусков. Новый алгоритм для улучшения поиска, в случае лигандов с большим количеством степеней свободы, основан на принципе разделяй и властвуй. Улучшен алгоритм локальной оптимизации[9].
Autodock 3
Для оптимизации поиска впервые был применен комбинированный генетический алгоритм LGA[10]. Новая полуэмпирическая скоринг функция, калибрующаяся на 30 белок-лигандных комплексах, учитывает направленные водородные связи и энергию сольватации[5].
<math> V = W_{\text{vdw}}\sum\limits_{i,j}\left(\dfrac{A_{ij}}{r_{ij}^{12}} - \dfrac{B_{ij}}{r_{ij}^{6}}\right) +W_{\text{hbond}}\sum\limits_{i,j}E(t)\left(\dfrac{C_{ij}}{r_{ij}^{12}} - \dfrac{D_{ij}}{r_{ij}^{10}}\right) +W_{\text{elec}}\sum\limits_{i,j}\dfrac{q_iq_j}{e(r_{ij})r_{ij}}+ W_{\text{sol}}\sum\limits_{i,j}\left(S_iV_j - S_jV_i\right)e^{\left(-r_{ij}^2/2\sigma^2\right)} </math>
Autodock 4, 4.2
Добавлен учёт возможной подвижности боковых цепей. Это достигнуто за счет разделения белка в два файла. Одна часть считается статичной, другая подвижной. Со статической частью работают с помощью подсчета энергии AutoGrid, с подвижной работают теми же методами, что и с лигандом. Созданы новые типы атомов, например, галогены и основные ионы металлов. Улучшена скоринг функция. Калибровка на 250 структурах из Шаблон:Нп5. Появился AutoDockTools — специальное программное обеспечение, для подготовки файлов к докингу[6].
Autodock 4.2.5
Добавлена более прозрачная опция контроля вывода программы, позволяющая делать небольшой вывод для скрининга, и выводить отчет для более глубокого анализа. Некоторые ошибки при исполнении программы, выводившие предупреждение в предыдущих версиях, теперь останавливают программу. Это сделано в ответ на нужды скрининга, при котором пользователь может не заметить появляющихся предупреждений. Учёт электростатических взаимодействий между не связанными атомами в лиганде теперь по умолчанию включен. Также включение/отключение возможно при помощи команды intelec on/off[4].
Autodock Vina
AutoDock Vina является новым поколением ПО, разработанным Molecular Graphics Lab. Показывает значительные улучшения средних показателей Шаблон:Нп5 в предсказании сайтов связывания, так же заметно увеличение скорости работы в два раза, по сравнению с AutoDock 4.1. Принципиально новая скоринг функция, основанная на алгоритме X-Score[11], которая разработана с учётом развития мультипроцессорных систем. За счет различий в погрешностях и самих используемых функций скоринга, используемых в AutoDock 4 и AutoDock Vina, программы могут показывать различные результаты на одних данных[12].
AutoDockTools
Существует ассоциированный с Autodock графический интерфейс AutoDockTools (ADT), который помогает анализировать докинг и выбирать связи в лиганде, которые будут считаться подвижными. Ниже упомянуты некоторые из функций ADT[1]:
- Видеть и вращать молекулы в формате 3D;
- Добавлять молекулы водорода, как полярные, так и не полярные;
- Ассоциировать частичные заряды атомов с лигандами и макромолекулами;
- Обозначать подвижные связи в лиганде, с использованием графической версии AutoTors;
- Настраивать DPF, GPF файлы;
- Запускать AutoGrid и AutoDock;
- Выводить и визуализировать результат работы AutoDock.
Входные файлы
Файлы с расширением .pdb являются основным форматом хранения информации о конформации и строении молекул. Такие файлы получают из экспериментальных данных полученных рентгеновской кристаллографией или ЯМР-спектроскопией, либо методами предсказания структуры молекул. Начиная с версии AutoDock 4 процедура докинга требует два файла в формате .pdbqt; один для рецептора, другой для лиганда. Если в белке необходимо учитывать подвижность некоторых аминокислот, то создается третий файл, содержащий информацию об атомах в подвижных частях белка. Преобразование файлов .pdb в формат .pdbqt возможно с помощью программы AutoDock Tools[4].
Файлы pdbqt содержат следующую информацию[4]:
- Координаты атомов,
- Полярные водороды,
- Частичные заряды на атомах,
- Тип атомов, например, есть два разных типа для алифатического и ароматического углерода,
- Сведения о подвижных связях.
Интерпретация результатов
В результате работы Autodock для одного лиганда получается dlg файл. В нём записан подробный отчет о работе программы. Он содержит в себе результаты каждого конкретного запуска с конечным положением лиганда (структура лиганда записана в формате pdbqt), рассчитанной энергией, затраченным на расчет временем[4].
Также доступен результат кластеризации: для каждого кластера показана населенность (Num in cluster), лучшая энергия (Lowest binding energy), к какому конкретно запуску она относится (Run)[4]:
CLUSTERING HISTOGRAM
____________________
________________________________________________________________________________
| | | | |
Clus | Lowest | Run | Mean | Num | Histogram
-ter | Binding | | Binding | in |
Rank | Energy | | Energy | Clus| 5 10 15 20 25 30 35
_____|___________|_____|___________|_____|____:____|____:____|____:____|____:___
1 | -3.44 | 150 | -3.44 | 2 |##
2 | -3.42 | 63 | -3.41 | 42 |#x42
3 | -3.42 | 187 | -3.40 | 83 |#x83
4 | -3.38 | 115 | -3.36 | 33 |#x33
5 | -3.32 | 128 | -3.31 | 37 |#x37
6 | -3.28 | 122 | -3.27 | 3 |###
_____|___________|_____|___________|_____|______________________________________
Собственно результатами являются энергия ΔG и положение лиганда в активном центре рецептора. Разница энергий лигандов в первом приближении показывает, насколько один лиганд лучше связывается рецептором, чем другой. Положение лиганда в активном центре позволяет предсказывать механизм связывания[13].
Области применения
AutoDock находит применение в следующих областях[1]:
- Дизайн лекарств,
- Исследования химических процессов.
Autodock широко применяется в научном сообществе как для молекулярного докинга, так и для виртуального скрининга больших библиотек соединений (например ZINC)[14].
Докинг используется также для поиска блокаторов ферментов патогенных организмов, в частности топоизомеразы I туберкулезной палочки[15].
Белок тирозинфосфатазa В Mycobacterium tuberculosis (Mtb) (MptpB) является важным фактором вирулентности для бактерии, который способствует выживанию бактерий в макрофагах. Отсутствие человеческого ортолога делает MptpB привлекательной мишенью для новых терапевтических средств для лечения туберкулеза. Ингибиторы MptpB могут быть эффективным средством для преодоления возникающей лекарственной устойчивости к туберкулезу. Использовав стратегию виртуального скрининга на основе структуры, авторы успешно идентифицировали лекарственный ингибитор MptpB на основе тиобарбитурата[16].
С помощью Autodock нашли ингибиторы ВИЧ протеазы[17]. В частности, ингибиторы аспарагиновой пептидазы ВИЧ (HIV IPs) являются хорошими кандидатами для повторного использования лекарственных средств.
Кроме того, докинг используется для поиска лигандов, взаимодействующих с транскрипционными факторами. Например, HNF-1a является транскрипционным фактором, который регулирует метаболизм глюкозы путем экспрессии в различных тканях. С помощью докинга in silico были найдены потенциальные мишени[18].
С помощью докинга были смоделированы взаимодействия двух регуляторов транскрипции, ExuR и UxuR, с субстратами и интермедиатами гликолиза, путей Эшвелла и Энтнера-Дудорова. Для UxuR были обнаружены два предпочтительных сайта связывания лиганда: один расположен в С-терминальном домене, а другой занимает междоменное пространство. Для ExuR в междоменной области был обнаружен только один предпочтительный сайт[19].
Autodock (в основном Vina) широко применяется в большом числе автоматических систем виртуального скрининга[20][21][22].
Сотрудничество с проектами
World Community Grid предлагает свою помощь в получении бесплатной вычислительной мощности для ускорения исследований, проводимых на основе AutoDock[1].
AutoDock запущен в работу на основе World Community Grid со следующими проектами:
- FightAIDS@Home от The Scripps Research Institute[23],
- Discover Dengue Drugs — Together от The University of Texas Medical Branch[24],
- Help Fight Childhood Cancer[25],
- Influenza Antiviral Drug Search[26],
- GO Fight Against Malaria[27].
Альтернативные программы
В 2016 году была проведена оценка различных программ на выборке из 2002 комплексов белка с лигандом. Оценивалась частота совпадений в найденных с помощью докинга позициях. Совпадением считались случаи, когда RMSD между найденным и нативным положением лиганда не превышало 2 Å[28][29].
Среди альтернативных академических программ выделяют LeDock, rDock, UCSF Dock, при этом первая программа показала наилучший результат (57,4 % совпадения)[29].
Коммерческие альтернативные программы показали лучший результат (59,8 % совпадения у GOLD), чем академические. Также в исследовании участвовали программы Surflex, FlexX, Glide, LigandFit, MOE-Dock, ICM_pro, MCDock, FRED.[28].
Программа | Совпадение | Программа | Совпадение | |
---|---|---|---|---|
GOLD | 59,8 % | Autodock Vina | 49,0 % | |
Glide (XP) | 57,8 % | AutoDock (PSO) | 47,3 % | |
LeDock | 57,4 % | LigandFit | 46,1 % | |
Glide (SP) | 53,8 % | MOE Dock | 45,6 % | |
Surflex-Dock | 53,2 % | UCSD DOCK | 44,0 % | |
rDock | 50,3 % | AutoDock (LGA) | 37,4 % |
Примечания
Ссылки
- ↑ 1,0 1,1 1,2 1,3 1,4 1,5 Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite doi
- ↑ 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 Шаблон:Cite web
- ↑ 5,0 5,1 Шаблон:Cite doi
- ↑ 6,0 6,1 Шаблон:Cite doi
- ↑ Шаблон:Cite pmid
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite pmid
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite pmid
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite pmid
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite doi
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite pmid
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ 28,0 28,1 28,2 Шаблон:Cite doi
- ↑ 29,0 29,1 Шаблон:Cite doi