Русская Википедия:AutoDock

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Карточка программы AutoDock — пакет программ, предназначенный для автоматизированного молекулярного докинга. В основном применяется для Шаблон:Нп5, в том числе, с учётом подвижных остатков белка. Autodock также используется для «слепого докинга», когда активный центр белка не известен.

О программе

AutoDock — один из пакетов программ, позволяющих предсказывать связывание маленьких молекул с белками известной структуры. Настоящие дистрибутивы AutoDock включают в себя два поколения ПО: AutoDock 4 и AutoDock Vina. AutoDock является свободным программным обеспечением, последняя 4-я версия которого распространяется в соответствии с открытым лицензионным соглашением GNU General Public License, AutoDock Vina доступна под Apache license[1][2].

Начиная с самой первой версии, Autodock представляет собой совокупность 2х программ: Autodock — собственно программа, проводящая докинг и Autogrid — программа, позволяющая рассчитывать сетки потенциалов. Для каждого рецептора (рецептором в докинге называется макромолекула, для которой рассчитываются сетки) достаточно рассчитать сетки потенциалов для каждого типа атомов один раз, что позволяет запускать расчеты для любого лиганда, состоящего из этих атомов (лиганд в докинге это маленькая молекула, для которой возможно изменение положения и конформации)[1].

В 2006 г. AutoDock был наиболее цитируемой программой для докинга[3].

AutoDock поддерживается и разрабатывается лабораториями The Scripps Research Institute и Olson Laboratory[1].

Механизм работы

Докинг проводится в кубическую область внутри рецептора (docking box). С помощью AutoGrid для рецептора создается набор бинарных файлов — сеток потенциалов. Они описывают для каждого атома, входящего в docking box, потенциал его взаимодействия с пробным атомом определённого химического элемента. Набор этих элементов определяется химическим составом лигандов, с которыми требуется провести докинг. На каждый химический элемент создается по 1-2 файла. Для расчета потенциала используется скоринг функция, либо основанная на физических законах, либо эмпирическая, либо смешанная. Скоринг функции в разных версиях программы могут отличаться. Сетки потенциалов используются для расчета свободной энергии[4].

Лиганд, помимо совокупности атомов, связей и зарядов, внутри программы описывается набором чисел — положением в docking box, поворотом всех активных торсионных углов. Autodock перебирает все возможные комбинации этих чисел, чтобы в итоге найти оптимальное с точки зрения свободной энергии положение лиганда в docking box. Поэтому в качестве docking box обычно выбирают куб со стороной 10-30 ангстрем таким образом, чтобы он включал в себя активный центр рецептора[4].

Полный перебор всех возможных положений в активном центре и всех конформаций лиганда — очень время- и ресурсо-затратная задача. Для оптимизации процесса в Autodock применяются алгоритмы поиска глобального минимума: Монте-Карло, имитации отжига, генетические алгоритмы: LGA (Ламаркианский генетический алгоритм)[4].

Пример работы Autodock 4.2 на основе LGA[5]:

  1. Генерируется популяция лигандов (размер популяции задается пользователем). Каждый лиганд случайным образом расположен в docking boх, имеет случайную конформацию и описывается набором трансляционных, ориентационных и конформационных чисел.
  2. Для каждого элемента популяции рассчитывается свободная энергия. Она включает в себя энергию межмолекулярного взаимодействия рецептора с лигандом, и внутримолекулярную энергию лиганда.
  3. Стадия размножения. Для каждого элемента рассчитывается количество потомков по формуле: <math>n=(f{w}-f{i})/(f{w}-f{mean})</math>, где <math>n</math> — количество потомков, <math>f{i}</math> — свободная энергия элемента, <math>f{w}</math> — энергия худшего элемента (максимальная), <math>f{mean}</math> — средняя энергия. После этого каждый элемент лучше среднего получает пропорциональное <math>n</math> количество потомков, которые добавляются в популяцию.
  4. Стадия кроссинговера: случайным образом выбираются два элемента популяции и их характеристические числа рекомбинируют, то есть элементы обмениваются некоторыми из чисел. Процент рекомбинирующих пар задается пользователем.
  5. Стадия мутации: к характеристическим числам элемента прибавляется случайное число, соответствующее распределению Коши. Параметры распределения и процент мутаций задаются пользователем.
  6. Стадия вымирания: худшие элементы популяции удаляются. Количество выживших также задается пользователем.
  7. Стадия оптимизации. Каждый элемент популяции оптимизируется с помощью алгоритмов локального поиска, например, имитации отжига при низких температурах, что позволяет минимизировать свободную энергию в небольших пределах. Эта стадия отличает LGA от классических генетических алгоритмов.
  8. Шаги 2-7 повторяются определённое большое количество раз (пока лучшая свободная энергия не перестанет изменяться, либо при достижении лимита по времени или количеству итераций).
  9. Вся предыдущая последовательность шагов выполняется несколько раз (независимые запуски).
  10. Результаты множественных запусков кластеризуются по положению в docking box с отсечкой по RMSD 1 ангстрем.
  11. Для всех находок в кластере считается энергия взаимодействия с рецептором. Энергией кластера считается самая лучшая в этом кластере.
  12. Финальная энергия рассчитывается для лучших кластеров как разность между разностями энергий перехода рецептора с лигандом из несвязанного положения в связанное[6].

История версий

Autodock 1

Создан в 1990 году. Первая версия базируется на силовом поле Шаблон:Нп5. Скоринг функция является суммой потенциала Леннарда-Джонса, электростатического потенциала и эмпирических функций энергии ковалентных связей, плоских и торсионных углов[7].

<math>

V=\sum_\text{bonds} k_b (l-l_0)^2 + \sum_\text{angles} k_a (\theta - \theta_0)^2 + \sum_\text{torsions} \sum_n \frac{1}{2} V_n [1+\cos(n \omega- \gamma)]+\sum_{j=1} ^{N-1} \sum_{i=j+1} ^N f_{ij}\biggl\{\epsilon_{ij}\biggl[\left(\frac{r_{0ij}}{r_{ij}} \right)^{12} - 2\left(\frac{r_{0ij}}{r_{ij}} \right)^{6} \biggr]+ \frac{q_iq_j}{4\pi \epsilon_0 r_{ij}}\biggr\} </math>

В реализации доступны алгоритмы Монте-Карло и имитации отжига[8].

Autodock 2.4

Появилось много улучшений, сопутствующих программ для параллельных запусков. Новый алгоритм для улучшения поиска, в случае лигандов с большим количеством степеней свободы, основан на принципе разделяй и властвуй. Улучшен алгоритм локальной оптимизации[9].

Autodock 3

Для оптимизации поиска впервые был применен комбинированный генетический алгоритм LGA[10]. Новая полуэмпирическая скоринг функция, калибрующаяся на 30 белок-лигандных комплексах, учитывает направленные водородные связи и энергию сольватации[5].

<math> V = W_{\text{vdw}}\sum\limits_{i,j}\left(\dfrac{A_{ij}}{r_{ij}^{12}} - \dfrac{B_{ij}}{r_{ij}^{6}}\right) +W_{\text{hbond}}\sum\limits_{i,j}E(t)\left(\dfrac{C_{ij}}{r_{ij}^{12}} - \dfrac{D_{ij}}{r_{ij}^{10}}\right) +W_{\text{elec}}\sum\limits_{i,j}\dfrac{q_iq_j}{e(r_{ij})r_{ij}}+ W_{\text{sol}}\sum\limits_{i,j}\left(S_iV_j - S_jV_i\right)e^{\left(-r_{ij}^2/2\sigma^2\right)} </math>

Autodock 4, 4.2

Добавлен учёт возможной подвижности боковых цепей. Это достигнуто за счет разделения белка в два файла. Одна часть считается статичной, другая подвижной. Со статической частью работают с помощью подсчета энергии AutoGrid, с подвижной работают теми же методами, что и с лигандом. Созданы новые типы атомов, например, галогены и основные ионы металлов. Улучшена скоринг функция. Калибровка на 250 структурах из Шаблон:Нп5. Появился AutoDockTools — специальное программное обеспечение, для подготовки файлов к докингу[6].

Autodock 4.2.5

Добавлена более прозрачная опция контроля вывода программы, позволяющая делать небольшой вывод для скрининга, и выводить отчет для более глубокого анализа. Некоторые ошибки при исполнении программы, выводившие предупреждение в предыдущих версиях, теперь останавливают программу. Это сделано в ответ на нужды скрининга, при котором пользователь может не заметить появляющихся предупреждений. Учёт электростатических взаимодействий между не связанными атомами в лиганде теперь по умолчанию включен. Также включение/отключение возможно при помощи команды intelec on/off[4].

Autodock Vina

AutoDock Vina является новым поколением ПО, разработанным Molecular Graphics Lab. Показывает значительные улучшения средних показателей Шаблон:Нп5 в предсказании сайтов связывания, так же заметно увеличение скорости работы в два раза, по сравнению с AutoDock 4.1. Принципиально новая скоринг функция, основанная на алгоритме X-Score[11], которая разработана с учётом развития мультипроцессорных систем. За счет различий в погрешностях и самих используемых функций скоринга, используемых в AutoDock 4 и AutoDock Vina, программы могут показывать различные результаты на одних данных[12].

AutoDockTools

Существует ассоциированный с Autodock графический интерфейс AutoDockTools (ADT), который помогает анализировать докинг и выбирать связи в лиганде, которые будут считаться подвижными. Ниже упомянуты некоторые из функций ADT[1]:

  • Видеть и вращать молекулы в формате 3D;
  • Добавлять молекулы водорода, как полярные, так и не полярные;
  • Ассоциировать частичные заряды атомов с лигандами и макромолекулами;
  • Обозначать подвижные связи в лиганде, с использованием графической версии AutoTors;
  • Настраивать DPF, GPF файлы;
  • Запускать AutoGrid и AutoDock;
  • Выводить и визуализировать результат работы AutoDock.

Входные файлы

Файлы с расширением .pdb являются основным форматом хранения информации о конформации и строении молекул. Такие файлы получают из экспериментальных данных полученных рентгеновской кристаллографией или ЯМР-спектроскопией, либо методами предсказания структуры молекул. Начиная с версии AutoDock 4 процедура докинга требует два файла в формате .pdbqt; один для рецептора, другой для лиганда. Если в белке необходимо учитывать подвижность некоторых аминокислот, то создается третий файл, содержащий информацию об атомах в подвижных частях белка. Преобразование файлов .pdb в формат .pdbqt возможно с помощью программы AutoDock Tools[4].

Файлы pdbqt содержат следующую информацию[4]:

  • Координаты атомов,
  • Полярные водороды,
  • Частичные заряды на атомах,
  • Тип атомов, например, есть два разных типа для алифатического и ароматического углерода,
  • Сведения о подвижных связях.

Интерпретация результатов

В результате работы Autodock для одного лиганда получается dlg файл. В нём записан подробный отчет о работе программы. Он содержит в себе результаты каждого конкретного запуска с конечным положением лиганда (структура лиганда записана в формате pdbqt), рассчитанной энергией, затраченным на расчет временем[4].

Также доступен результат кластеризации: для каждого кластера показана населенность (Num in cluster), лучшая энергия (Lowest binding energy), к какому конкретно запуску она относится (Run)[4]:

	CLUSTERING HISTOGRAM
	____________________

________________________________________________________________________________
     |           |     |           |     |                                    
Clus | Lowest    | Run | Mean      | Num | Histogram
-ter | Binding   |     | Binding   | in  |                                    
Rank | Energy    |     | Energy    | Clus|    5    10   15   20   25   30   35
_____|___________|_____|___________|_____|____:____|____:____|____:____|____:___
   1 |     -3.44 | 150 |     -3.44 |   2 |##
   2 |     -3.42 |  63 |     -3.41 |  42 |#x42
   3 |     -3.42 | 187 |     -3.40 |  83 |#x83
   4 |     -3.38 | 115 |     -3.36 |  33 |#x33
   5 |     -3.32 | 128 |     -3.31 |  37 |#x37
   6 |     -3.28 | 122 |     -3.27 |   3 |###
_____|___________|_____|___________|_____|______________________________________

Собственно результатами являются энергия ΔG и положение лиганда в активном центре рецептора. Разница энергий лигандов в первом приближении показывает, насколько один лиганд лучше связывается рецептором, чем другой. Положение лиганда в активном центре позволяет предсказывать механизм связывания[13].

Области применения

AutoDock находит применение в следующих областях[1]:

  • Дизайн лекарств,
  • Исследования химических процессов.

Autodock широко применяется в научном сообществе как для молекулярного докинга, так и для виртуального скрининга больших библиотек соединений (например ZINC)[14].

Докинг используется также для поиска блокаторов ферментов патогенных организмов, в частности топоизомеразы I туберкулезной палочки[15].

Белок тирозинфосфатазa В Mycobacterium tuberculosis (Mtb) (MptpB) является важным фактором вирулентности для бактерии, который способствует выживанию бактерий в макрофагах. Отсутствие человеческого ортолога делает MptpB привлекательной мишенью для новых терапевтических средств для лечения туберкулеза. Ингибиторы MptpB могут быть эффективным средством для преодоления возникающей лекарственной устойчивости к туберкулезу. Использовав стратегию виртуального скрининга на основе структуры, авторы успешно идентифицировали лекарственный ингибитор MptpB на основе тиобарбитурата[16].

С помощью Autodock нашли ингибиторы ВИЧ протеазы[17]. В частности, ингибиторы аспарагиновой пептидазы ВИЧ (HIV IPs) являются хорошими кандидатами для повторного использования лекарственных средств.

Кроме того, докинг используется для поиска лигандов, взаимодействующих с транскрипционными факторами. Например, HNF-1a является транскрипционным фактором, который регулирует метаболизм глюкозы путем экспрессии в различных тканях. С помощью докинга in silico были найдены потенциальные мишени[18].

С помощью докинга были смоделированы взаимодействия двух регуляторов транскрипции, ExuR и UxuR, с субстратами и интермедиатами гликолиза, путей Эшвелла и Энтнера-Дудорова. Для UxuR были обнаружены два предпочтительных сайта связывания лиганда: один расположен в С-терминальном домене, а другой занимает междоменное пространство. Для ExuR в междоменной области был обнаружен только один предпочтительный сайт[19].

Autodock (в основном Vina) широко применяется в большом числе автоматических систем виртуального скрининга[20][21][22].

Сотрудничество с проектами

World Community Grid предлагает свою помощь в получении бесплатной вычислительной мощности для ускорения исследований, проводимых на основе AutoDock[1].

AutoDock запущен в работу на основе World Community Grid со следующими проектами:

  • FightAIDS@Home от The Scripps Research Institute[23],
  • Discover Dengue Drugs — Together от The University of Texas Medical Branch[24],
  • Help Fight Childhood Cancer[25],
  • Influenza Antiviral Drug Search[26],
  • GO Fight Against Malaria[27].

Альтернативные программы

В 2016 году была проведена оценка различных программ на выборке из 2002 комплексов белка с лигандом. Оценивалась частота совпадений в найденных с помощью докинга позициях. Совпадением считались случаи, когда RMSD между найденным и нативным положением лиганда не превышало 2 Å[28][29].

Среди альтернативных академических программ выделяют LeDock, rDock, UCSF Dock, при этом первая программа показала наилучший результат (57,4 % совпадения)[29].

Коммерческие альтернативные программы показали лучший результат (59,8 % совпадения у GOLD), чем академические. Также в исследовании участвовали программы Surflex, FlexX, Glide, LigandFit, MOE-Dock, ICM_pro, MCDock, FRED.[28].

Результаты оценки программ[28]
Программа Совпадение Программа Совпадение
GOLD 59,8 % Autodock Vina 49,0 %
Glide (XP) 57,8 % AutoDock (PSO) 47,3 %
LeDock 57,4 % LigandFit 46,1 %
Glide (SP) 53,8 % MOE Dock 45,6 %
Surflex-Dock 53,2 % UCSD DOCK 44,0 %
rDock 50,3 % AutoDock (LGA) 37,4 %

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Добротная статья