Русская Википедия:Проект «Раковый геном»

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Прое́кт «Ра́ковый гено́м» (Шаблон:Lang-en) — исследовательский проект при Институте Сенгера, нацеленный на поиск мутаций, ведущих к развитию раковых заболеваний человека. Проект был запущен Шаблон:Нп5[1] в 2000 году, и возглавляется им и его коллегой Питером Кэмпбеллем[2]. «Раковый геном», как и аналогичный проект «Атлас Ракового Генома» (Шаблон:Lang-en) при Национальном институте рака в США, ставит своей целью усовершенствование диагностики, лечения и предотвращения опухолевых заболеваний посредством изучения молекулярных основ их развития[3].

С помощью методов высокопроизводительного секвенирования исследуется генетический материал из опухолей различных типов. Результаты публикуются в базе данных Catalogue of Somatic Mutations in Cancer (COSMIC), самой полной из имеющихся баз данных о генетических изменениях в раковых клетках[4]. По состоянию на 4 мая 2019 года, выпущена 88-ая версия от 19 марта 2019 года[5]. База обновляется раз в три месяца[4].

Совместно с Центром молекулярной терапии при Массачусетской больнице общего профиля в Бостоне, «Раковый геном» развивает базу данных Genomics of Drug Sensitivity in Cancer (GDSC), содержащую информацию о скрининге противоопухолевых препаратов. Целью коллаборации является усовершенствование лечения раковых заболеваний на основе предсказания возможной реакции организма пациента на противоопухолевый препарат[6].

Исследовательская группа, работающая над проектом «Раковый геном», публикует на портале Института Сенгера разработанные ими программы для работы с данными о раковых геномах: BioView и AutoCSA (программы для детекции мутаций), Allele-Specific Copy number Analysis of Tumors (ASCAT) и другие[7]. На странице проекта можно найти публикации исследовательской группы, большинство из которых находится в открытом доступе[8].

Система COSMIC

Шаблон:Infobox biodatabase Catalogue of Somatic Mutations in Cancer (COSMIC) — одна из самых больших и полных онлайн баз данных соматических мутаций, свойственных различным типам опухолевых заболеваний человека. Обновляется раз в три месяца. По состоянию на 4 мая 2019 года, выпущена 88-ая версия от 19 марта 2019 года[5].

Система пополняется двумя способами. Первый — ручной сбор данных курирующими экспертами; источником служат рецензируемые издания, из которых эксперты отбирают информацию и вносят её в систему. Второй — полуавтоматический сбор данных: загружаются данные по масштабному скринингу больших раковых геномов и экзомов из баз The Cancer Genome Atlas (TCGA) и International Cancer Genome Consortium (ICGC)[4].

Накопленная COSMIC информация о 2500 раковых заболеваниях человека делает возможными выводы о соответствии мутаций определённому типу опухоли. Представленные в COSMIC данные подтверждаются научными публикациями (около Шаблон:Число статей PubMed), тщательно отбираемыми кураторами (около 30 % публикаций отвергаются)[4]. Все данные, представленные в COSMIC, доступны для скачивания в нескольких форматах после регистрации на сайте[9].

История

База данных была запущена 4 февраля 2004 года и содержала информацию о четырёх генах: HRAS, KRAS, NRAS и BRAF[10]. К концу 2005 года в базе данных были представлены последовательности 529 генов из Шаблон:Число опухолей, содержащие Шаблон:Число мутацию[11]. К концу августа 2009 года COSMIC включал данные, полученные в ходе 1,5 миллионов экспериментов и описывающие более Шаблон:Число мутаций в Шаблон:Число генах почти в Шаблон:Число типов опухолей[12]. 48-ая версия COSMIC, выпущенная в июле 2010, содержала Шаблон:Число мутаций, определённых в ходе более чем 2,76 миллионов экспериментов для более Шаблон:Число типов опухолей[13]. 70-ая версия (август 2014 года), включала уже Шаблон:Число точечных мутаций в кодирующих последовательностях, определённых для свыше миллиона опухолей человека. Кроме мутаций данного типа, в 70-ой версии уже описаны более 6 миллионов мутаций в некодирующих областях, Шаблон:Число слияний генов, Шаблон:Число геномных перестроек, Шаблон:Число участков с нарушенной копийностью и более 60 миллионов случаев изменения экспрессии генов[4].

Файл:Cervix adenocarcinoma top mut.png
Гены, мутации которых наиболее характерны для аденокарциномы шейки матки (получено с помощью 72-ой версии COSMIC)

COSMIC

COSMIC предоставляет доступ ко всем данным в системе. Система включает ряд инструментов: Cancer Browser, Genome Browser, GA4GH Beacon, CONAN[9].

Cancer Browser позволяет проанализировать информацию о свыше 2500 типах раковых заболеваний. Выбрав тип ткани (44 вариантов в версии 80) и её гистологии, можно получить данные о встречаемости в них мутаций. К примеру, можно получить график, отображающий наиболее часто мутирующие гены, аннотированные в Cancer Gene Census, и частоты их мутации, определяемые как отношение числа образцов с мутациями (показано синим) к числу проанализированных образцов (показано красным)[9].

Genome Browser позволяет осуществить поиск информации о мутациях в интересующем гене. Так, для гена транскрипционного фактора p53 (TP53) в 72-ой версии COSMIC представлены данные, основанные на анализе Шаблон:Число индивидуальных образцов и Шаблон:Число из них несли мутации данного гена. Также приведены 2213 статьи PubMed с описанием и ссылками на источники[9].

GA4GH (Глобальный альянс геномики и здоровья, Шаблон:Lang-en) Beacon — это сервис для предоставления COSMIC генетических данных сообществом[9].

CONAN — инструмент для анализа вариаций числа копий генов[9].

Cancer Gene Census (CGC)

Cancer Gene Census содержит список генов (723 на май 2019, версия 88)[9], их отношение к возникновению заболевания, типы мутаций, приводящие к дисфункции гена в раковых клетках, а также типы опухолей, в которых наблюдаются данные мутации[14].

Отбор кандидатов начинается с поиска паттернов соматических мутаций, приводящих к развитию рака. Для выявления функции выбранного гена и его влияния на развитие рака далее проводится тщательный обзор литературы. На этой стадии ген классифицируется как онкоген, ген-супрессор опухоли, либо как обладающий обеими функциями. Если функция гена проявляется в результате слияния с другим геном, он обозначается как Шаблон:Нп5 (Шаблон:Lang-en)[14].

В зависимости от того, насколько хорошо доказано участие гена в онкогенезе, гены классифицируются на два «яруса» (Шаблон:Lang-en). Гены Яруса 1 (Tire 1) характеризуются паттернами мутаций, участие и функции которых в этиологии опухоли считаются прочно доказанными. Для отнесения гена к Ярусу 1 необходимо наличие как минимум двух публикаций от двух независимых групп, которые описывают соматическую мутацию гена в как минимум одном типе рака. В Ярус 2 (Tire 2) попадают гены, участие которых в развитии рака доказано на обширных литературных данных, однако информации, подтверждающей последствия мутации существует недостаточно[14].

Последняя версия CGC содержит 723 гена (576 Яруса 1, 147 Яруса 2). Из них 562 определяются как онкогены и/или онкосупрессоры, 132 гена с неизвестной функцией проявляют свою активность в результате слияния, 30 генов не были отнесены ни к одной из групп[14].

В 86-м обновлении была добавлена возможность визуализации данных об особенностях участия гена в развитии опухоли. В краткой записи приводится описание функции самого гена и его связь с десятью основными признаками рака[14].

COSMIC-3D

COSMIC-3D — интерфейс для изучения раковых мутаций по трехмерной структуре белка; впервые представлен в 80 выпуске COSMIC[5], подготовлен в партнерстве с with Astex Pharmaceuticals (Cambridge, UK). Инструмент показывает трехмерную визуализацию более чем 8000 белков, на которых отмечены мутации из базы COSMIC, а также их частота и эффект[9].

Вначале работы программы мутация картируется на последовательность белка из UniProt, затем на PDB-структуру белка при помощи SIFTS UniProt-to-PDB. Кроме того, COSMIC-3D может искать пересечения между местом мутации, приводящей к развитию рака, известными сайтами связывания низкомолекулярных веществ и сайтами связывания лекарств, предсказанных fPocket. Полученные данные могут позволить производить молекулы, специфически связывающиеся с мутированными белками[14].

COSMIC Cell Line Project

COSMIC Cell Line Project содержит информацию о полном секвенировании экзомов более чем 1015 различных раковых клеточных линий. Экзомы добавляются непосредственно после их получения, до публикации[4]. Использование COSMIC Cell Line Project позволяет осуществлять более осмысленный выбор клеточных линий для исследований и более качественную интерпретацию результатов[9].

Genomics of Drug Sensitivity in Cancer

Файл:Volcano plot .png
«Volcano plot» для цисплатина (получено с помощью 5-ой версии GDSC)
Файл:Elastic net plot.png
«Elastic net plot» для цисплатина (получено с помощью 5-ой версии GDSC)

Genomics of Drug Sensitivity in Cancer (GDSC) — дополнительный ресурс проекта «Раковый геном», содержащий информацию о чувствительности свыше 700 опухолевых клеточных линий к более чем 140 противораковым препаратам, а также предоставляющий данные о корреляции между мутациями и чувствительностью к препаратам[6]. Представленные в GDSC данные были получены высокопроизводительным скринингом, проводимым в рамках проекта «Раковый геном» Институтом Сенгера и Центром молекулярной терапии при Массачусетской больнице общего профиля в Бостоне для коллекции из свыше 1000 клеточных линий. Соединения, выбранные для скрининга, включают как препараты одобренные для применения в клинике и проходящие клинические испытания, так и препараты ещё находящиеся в разработке. Данные соединения воздействуют на целый ряд мишеней, в том числе на компоненты сигнальных путей с участием тирозин-киназных рецепторов, контроля клеточного цикла и системы ответа на повреждение ДНК[15].

Неотъемлемым свойством GDSC является интеграция информации как о раковых геномах, так и о чувствительности опухолевых клеток к препаратам. С целью выявления маркеров для предсказания ответа на препарат применяются 2 дополняющих друг друга аналитических подхода[15].

Первый поход — multivariate analysis of variance (MANOVA), разновидность метода ANOVA, используется для определения корреляции между чувствительностью к препарату (по IC50 и наклону кривой доза-эффект) и изменениями в геноме клетки (точечными мутациями, амплификациями или делециями генов и др.). При этом для каждой пары препарат-ген MANOVA определяется характер эффекта и статистическая значимость связи. Данные представляются в виде Шаблон:Нп5. Размер отображаемых кружков соответствует числу событий, взятых для анализа. Наведение на кружок позволяет узнать информацию, касающуюся размера выборки (число клеточных линий), эффект (во сколько раз чувствительность к препарату усиливается или уменьшается) и p-value[15].

Второй подход — применение штрафной функции «elastic net». Данные, анализируемые с помощью данной штрафной функции, помимо подаваемых MANOVA, включают полногеномные транскрипционные профили и типы тканей. Функция «elastic net» определяет характеристики, связанные с определённым ответом на препарат (значением IC50) той или иной клеточной линии. Данные представляются в виде «elastic net plot» — тепловой карты и гистограммы. Тепловая карта отображает мутации 20 наиболее устойчивых и 20 наиболее чувствительных к данному препарату клеточных линий. Цвета карты отображают экспрессию и копийность (синий — низкая, красный — высокая). Гистограмма показывает изменение чувствительности к препарату, соответствующее мутации (увеличение — красный, снижение — зелёный)[15].

Результаты исследований

Исследования, проводимые участниками проекта «Раковый геном», пополняют знания, накопленные о модификациях генома, ведущих к опухолевым трансформациям, позволяя усовершенствование методов предсказания, диагностики и терапии. Работы посвящены исследованию самых различных типов опухолей. Кроме того, ведётся поиск маркеров раковых заболеваний и разработка систем для проведения исследования на модельных организмах[3].

Рак молочной железы

Одним из направлений работы проекта «Раковый геном» является исследование рака молочной железы. Так, анализ соматических мутаций 21-го типа рака молочной железы выявил наличие регионов с повышенной частотой мутаций (такой регион был назван «kataegis»). Данные области колокализировались с соматическими перестройками, и замены в данных регионах практически всегда приходились на цитозин TpC динуклеотидов. За основу данного явления была предложена работа представителей APOBEC семейства цитидин деаминаз[16]. Дальнейшие исследования послужили в пользу данной гипотезы, показав, что типы рака молочной железы с делецией APOBEC3B характеризуются большим числом мутаций в регионах «kataegis»[17].

Анализ точечных мутаций и вариаций числа копий генов для 100 разновидностей рака молочной железы выявил многочисленные нарушения в геноме, в частности 9 новых генов (AKT2, ARID1B, CASP8, CDKN1B, MAP3K1, MAP3K13, NCOR1, SMARCD1 и TBX3) были ассоциированы с данным типом рака[18]. При этом мутации в генах MAP3K1, MAP2K4, MAP3K13 и AKT2 нарушают активацию сигнального пути JUN, снижение активности которого показано для более чем 50 % типов рака молочной железы[19]. Для мутаций в ряде генов (ARID1B, CASP8, MAP3K1, MAP3K13, NCOR1, SMARCD1 и CDKN1B) было выявлено усиление экспрессии укороченных изоформ белков, что предполагает, что исходные формы данных белков могут относиться к супрессорам развития трансформаций. Кроме того, была показана связь между пониженной экспрессией рецепторов эстрогена и ускоренным накоплением мутаций с возрастом[18].

Рак почки

Скрининг около 3500 генов выявил несколько новых генов, мутации которых ведут к развитию гипернефроидной опухоли почки, редкой разновидности рака почки. Данные гены включают кодирующие деметилазы UTX (KDM6A)[20] и JARID1C (KDM5C) и кодирующий метилазу ген SETD2[21]. Данные ферменты модифицируют ключевые остатки лизина гистона H3, влияя на структуру хроматина и транскрипцию генов. При этом совместно данные мутации присутствует менее чем в 15 % случаев развития гипернефроидной опухоли почки, предполагая существование ещё не выявленных генов. Более поздние эксперименты по секвенированию экзома выявили ген PBRM1, компонент комплекса SWI/SNF, отвечающего за перестройки хроматина, в качестве одного из самых важных генов, мутации которого в 41 % случаев приводят к гипернефроидной опухоли почки[22].

Рак легкого

Результаты секвенирования, проведенного для клеточной линии NCI-H209 злокачественной мелкоклеточной опухоли легкого, выявили Шаблон:Число соматических замен, в том числе 132 в кодирующих участках, ассоциированных с табакокурением. При этом для клеточной линии NCI-H209 была показана дупликация 3-8 экзонов CHD7, а для двух других линий мелкоклеточной опухоли легкого продемонстрировано слияние генов PVT1 и CHD7, в совокупности предполагая, что мутации гена CHD7 способствуют развитию заболевания[23].

Рак поджелудочной железы

Было показано, что раку поджелудочной железы свойственны разнообразные перестройки, приводящие к дисфункции теломер и нарушению контроля клеточного цикла, в частности к поломкам перехода из фазы G1 в S-фазу. Это запускает амплификацию онкогенов, что преимущественно происходит на ранних стадиях развития заболевания[24].

Рак толстой кишки

Важным направлением работы исследовательской группы является изучение одного из наиболее распространенных видов рака — рака толстой кишки (колоректальной карциномы)[8].

Число комбинаций различных генетических изменений не позволяет выявить функциональный вклад каждого потенциального гена в развитие опухоли. Поэтому, несмотря на то что определение геномных изменений в индивидуальных опухолях возможно с высокой точностью и по относительно низкой цене, эти данные сложно интерпретировать с точки зрения прогнозирования развития заболевания и поиска нужных лекарств, для этого требуется наличие модельной системы для анализа генотип-фенотипической корреляции. Такими модельными системами могут служить трехмерные органоиды. В данном исследовании с использованием Lgr5 стволовых клеток (располагаются в криптах) были получены опухолевые органоидные культуры 20 пациентов с колоректальной карциномой. Было показано, что спектр генетических изменений, а также анализ генной экспрессии в органоиде согласуется с таковыми в самой опухоли. Кроме того, органоид поддается лекарственному скринингу. В качестве примера было приведено влияние ингибитора поркупина на мутантов по гену RNF43, в результате чего рост мутанта прекращался[25].

Для выяснения природы внутриопухолевого разнообразия были охарактеризованны органоиды, полученные из множества единичных клеток из трёх различных опухолей колоректальной карциномы, а также из стволовых клеток крипт. Было показано, что во всех раковых клетках число соматических мутаций в несколько раз больше, чем в нормальных клетках, причем большинство мутаций оказались приобретены в ходе финальной клональной экспансии рака, посредством процессов, отсутствующих в нормальных клетках. Также наблюдались различия в транскриптомах и метиломах внутриопухолевых клеток. Данные различия проявляются в разной реакции даже близкородственных клеток на противораковые препараты[26].

Поиск новых биомаркеров чувствительности/устойчивости опухолей к терапии

Анализ данных, представленных в GDSC, выявил ряд потенциальных биомаркеров для терапевтического использования. В частности, было показано, что мутации TP53 коррелируют с устойчивостью к нутлину-3a, ингибитору MDM2 убиквитинлигазы p53. Амплификация CCND1 (CyclinD1) или потеря SMAD4 были ассоциированы с повышенной чувствительностью к многочисленным ингибиторам семейства EGFR, например к лапатинибу. Потеря SMAD4 сопровождалась повышенной экспрессией EGFR. Инактивация STK11, репрессора mTOR, коррерировала с повышением чувствительности к ингибитору белка теплового шока HSP90, 17-AAG. Кроме того, посредством выявления транслокации EWS-FLI1 в качестве маркера чувствительности к ингибиторам PARP, была отмечена повышенная чувствительность к соединениям данного характера клеток саркомы Юинга, что предлагает новые методы борьбы с данным заболеванием[15].

Разработка экспериментальных систем для изучения канцерогенеза

Круглый червь Caenorhabditis elegans, широко используемый модельный организм, был предложен в роли экспериментальной системы для изучения влияния канцерогенов и дефектов системы репарации ДНК. Проведено секвенирование полных геномов 183 популяций C. elegans с 17 разновидностями генетических бэкграундов (дикий тип и особи с нокаутированными генами репарации ДНК и системы ответа на повреждения ДНК), в результате чего были выявлены 1559 замен, 406 вставок и 281 геномная перестройка. Полученные результаты были сопоставлены с данными, накопленными о канцерогенезе человека[27].

Проанализировано действие таких канцерогенов, как афлатоксин B1, хлорметин и цисплатин на C. elegans. Интересно, что мутагенные свойства цисплатина наиболее проявлялись в мутантах xpf-1, предполагая важную роль данного гена в защите клеток от данного ДНК-повреждающего агента. В целом же результаты экспериментов соответствовали ранее известным данным о действии рассматриваемых канцерогенов, продемонстрировав возможность применения экспериментальной системы для изучения менее исследованных веществ. В частности, более 240 соединений рассматриваются в качестве потенциальных канцерогенов. Однако накопленной информации об их действии недостаточно, и использование экспериментальной системы представляет собой удобный способ для её получения[27].

Геномы предраковых клеток

Анализ геномов клеток эпителия пищевода показал, что некоторые мутации приводят к обогащению эпителия клонами мутировавших клеток. Так, мутанты по гену NOTCH1, который отвечает за взаимодействие контактирующих клеток, могут составлять до 80 % клеток эпителия в людях среднего и старшего возраста, а мутанты по гену TP53 — до 37 %. Подобные результаты были получены всего для 14 мутаций, участвующих в раковом перерождении. При этом частота мутантов по гену NOTCH1 у здоровых людей была больше, чем у больных раком пищевода. Это позволяет предположить, что некоторые мутации могут приводить к бурному клональному размножению, но уменьшать шанс ракового перерождения[28].

Рак простаты

Результаты секвенирования 112 первичных и метастатических опухолей простаты привели к обнаружению 22 новых генов, приводящих к развитию рака. Кроме того, было обнаружено ещё 2 не кодирующих белки участка, ассоциированных с раком простаты. Также было выяснено, в каком порядке эти мутации происходят в развивающихся опухолях. Анализ открытых и уже известных мутаций показал, что 11 из них являются мишенями имеющихся лекарств, 7 — мишенями лекарств, проходящих клинические испытания, для 13 проводятся исследования и разработка лекарств и 49 потенциально могут быть мишенями будущих препаратов[29].

CRISPRcleanR

Для того, чтобы точнее оценивать искажения, вызванные использованием системы CRISPR-Cas для анализа генов путем их нокаутирования, был создан новый алгоритм CRISPRcleanR. Было учтено систематическое недооценивание logFC для участков, содержащих много копий мишеней направляющей РНК, а также некоторые другие отклонения. Новый алгоритм уменьшает частоту ложноположительных находок, оставляя частоту истинных положительных находок на прежнем уровне[30]. CRISPRcleanR находится в свободном доступе и представлен как пакет R[31] и пакет Python[32].

Примечания

Шаблон:Примечания Шаблон:Добротная статья