Атлас генома рака - The Cancer Genome Atlas

Атлас генома рака ( TCGA ) - это начатый в 2005 году проект по каталогизации генетических мутаций, вызывающих рак , с использованием секвенирования генома и биоинформатики . TCGA применяет высокопроизводительные методы анализа генома, чтобы улучшить способность диагностировать, лечить и предотвращать рак за счет лучшего понимания генетической основы этого заболевания.

TCGA контролируется Национальным институтом рака «s центр по лечению рака геномики и Национального института генома человека Исследовательского финансируемой правительством США. Трехлетний пилотный проект, начатый в 2006 году, был сосредоточен на характеристике трех типов рака человека: мультиформной глиобластомы , рака легких и яичников . В 2009 году он расширился до фазы II, в рамках которой к 2014 году планировалось завершить геномную характеристику и анализ последовательности 20–25 различных типов опухолей. TCGA превзошла эту цель, охарактеризовав 33 типа рака, включая 10 редких видов рака. Финансирование делится между центрами характеристики генома (GCC), которые выполняют секвенирование, и центрами анализа геномных данных (GDAC), которые выполняют биоинформатический анализ.

В рамках проекта было запланировано 500 образцов пациентов, что больше, чем в большинстве геномных исследований, и использовались различные методы анализа образцов пациентов. Методы включают экспрессии генов профилирование , число копий вариации профилирование, SNP генотипирование , геном широкого метилирования ДНК профилирование, микроРНК профилирование и экзон последовательность , по меньшей мере , 1200 генов. TCGA секвенировала полные геномы некоторых опухолей, включая по крайней мере 6000 генов-кандидатов и последовательности микроРНК. Это целевое секвенирование выполняется всеми тремя центрами секвенирования с использованием технологии гибридного захвата . На этапе II TCGA выполняла секвенирование всего экзома и всего транскриптома в 100% случаев и секвенирование всего генома в 10% случаев, использованных в проекте.

Цели

Цель пилотного проекта заключалась в том, чтобы продемонстрировать, что передовые геномные технологии могут использоваться группой ученых из различных учреждений для получения статистически и биологически значимых выводов на основе созданного набора геномных данных. На пилотной фазе были исследованы два типа опухолей: мультиформная глиобластома (GBM) и цистаденокарцинома яичника. Цель Фазы II TCGA - распространить успех пилотного проекта на большее количество типов рака, предоставив большой статистически значимый набор данных для дальнейшего открытия.

Управление

TCGA находится под совместным управлением ученых и менеджеров из Национального института рака (NCI) и Национального института исследования генома человека (NHGRI). С расширением TCGA с пилотной фазы до фазы II в октябре 2009 года NCI создал программный офис TCGA. Д-р Жан Клод Зенклюзен был директором офиса с августа 2013 года. Этот офис отвечает за работу шести центров характеристики генома, семи центров анализа генома, основного ресурса биопрепаратов, центра координации данных и примерно одной трети секвенирование выполнено для проекта тремя центрами секвенирования генома. Кроме того, проектный офис TCGA отвечал за координацию сбора тканей для TCGA. Доктор Кэролайн Хаттер, менеджер проекта NHGRI, руководит двумя третями секвенирования в центрах секвенирования генома.

Проект управляется командой проекта, состоящей из членов NCI и NHGRI. Эта группа вместе с главными исследователями, финансируемыми проектом, составляет Руководящий комитет. Руководящему комитету поручено следить за научной обоснованностью проекта, в то время как проектная группа NCI / NHGRI обеспечивает достижение научного прогресса и целей проекта, выполнение проекта вовремя и в рамках бюджета, а также координацию различных компонентов проекта. проэкт.

Накопление тканей

Требования к тканям варьировались от типа ткани к типу ткани и от типа рака к типу рака. Эксперты по болезням из Рабочих групп проекта помогли определить характеристики типичных образцов тканей, которые считаются «стандартом лечения» в Соединенных Штатах, и то, как TCGA может наилучшим образом использовать ткань. Например, рабочая группа по заболеваниям головного мозга определила, что образцы, содержащие более 50% некроза , не подходят для TCGA и что 80% ядер опухоли необходимы в жизнеспособной части опухоли. TCGA следовала некоторым общим рекомендациям в качестве отправной точки для сбора образцов из любого типа опухоли. К ним относятся минимум 200  мг размером, не менее 80% ядер опухоли и соответствующий источник ДНК зародышевой линии (например, кровь или очищенная ДНК ). Кроме того, учреждения, отправляющие ткани в TCGA, должны иметь минимальный набор клинических данных, как определено Рабочей группой по заболеваниям, подписанные согласия, которые были одобрены IRB их учреждения, а также соглашение о передаче материалов с TCGA.

В 2009 году NCI удалил приблизительно 130 миллионов долларов ARRA из «Основного контракта» NCI с Science Applications International Corporation (SAIC) для финансирования накопления тканей и множества других мероприятий через NCI Office of Acquisition. 42 миллиона долларов было доступно для накопления тканей через NCI с использованием «запросов предложений» (RFQ) и «запросов предложений» (RFP) для создания заказов на поставку и контрактов, соответственно. Запрос предложений в основном использовался для сбора ретроспективных выборок из авторитетных банков, в то время как запросы предложений использовались для предполагаемого сбора образцов. TCGA завершила сбор образцов в декабре 2013 г. с почти 20 000 биопрепаратами.

Учреждения, которые предоставляют образцы в TCGA, получают оплату и имеют доступ к молекулярным данным, созданным на их образцах, при сохранении связи между уникальным идентификатором TCGA и своим собственным уникальным идентификатором. Это позволяет участвующим учреждениям связываться с клиническими данными для своих образцов и вступать в сотрудничество с другими учреждениями, которые имеют аналогичные данные по образцам TCGA, тем самым повышая эффективность анализа результатов.

Организация

TCGA имеет несколько различных типов центров, которые финансируются для сбора и анализа данных. TCGA - первый крупномасштабный проект в области геномики, финансируемый Национальным институтом здравоохранения, который включает значительные ресурсы в биоинформатические открытия. NCI выделила 50% средств, выделенных TCGA, примерно 12 миллионов долларов в год, на финансирование биоинформатических открытий. Центры характеристики генома и центры секвенирования генома генерируют данные. Два типа центров анализа геномных данных используют данные для биоинформатических открытий. Два центра финансируются для выделения биомолекул из образцов пациентов, а один центр финансируется для хранения данных. Для получения дополнительной информации об организации проекта TCGA см. Http://cancergenome.nih.gov/newsevents/multimedialibrary/interactives/howitworks .

Основной ресурс биопрепаратов

Базовый ресурс биопрепаратов (BCR) отвечает за проверку качества и количества ткани, отправляемой сайтами источника ткани, выделение ДНК и РНК из образцов, контроль качества этих биомолекул и отправку образцов в GSC и GCC. Международный консорциум геномики получил контракт на запуск BCR для пилотного проекта. В начале полного проекта NCI финансировал два BCR: Национальную детскую больницу и Международный консорциум по геномике. BCR были пересмотрены со сроком подачи предложений 4 июня 2010 г., и Общенациональная детская больница получила контракт.

Центры секвенирования генома

Три секвенирование генома Центры были софинансируемая СВК и NHGRI: в Broad Institute , McDonnell института генома Вашингтонского университета и медицинского колледжа Бейлор. Все три центра секвенирования перешли от секвенирования по Сэнгеру к секвенированию следующего поколения (NGS), хотя одновременно реализуются различные технологии NGS.

Центры характеристики генома

NCI профинансировал семь центров характеристики генома: Институт Броуда, Гарвард, Университет Северной Каролины, Онкологический центр доктора медицины Андерсона, Институт Ван Андел, Медицинский колледж Бейлора и Онкологический центр Британской Колумбии.

Координационный центр данных

Координационный центр данных является центральным хранилищем данных TCGA. Он также отвечает за контроль качества данных, поступающих в базу данных TCGA. DCC также поддерживает портал данных TCGA, через который пользователи получают доступ к данным TCGA. Эта работа выполняется по контракту учеными и разработчиками в области биоинформатики из SRA International , Inc. DCC не содержит данных о последовательностях более низкого уровня. Центр геномики рака NCI (CGHub) - это безопасный репозиторий для хранения, каталогизации и доступа к данным, связанным с последовательностями. Эта работа выполняется учеными и сотрудниками Калифорнийского университета в Институте геномики Санта-Крус .

Центры анализа геномных данных

Семь центров анализа данных генома, финансируемых NCI / NHGRI, несут ответственность за интеграцию данных во всех центрах характеризации и секвенирования, а также за биологическую интерпретацию данных TCGA. В GDAC входят Институт Броуда, Университет Северной Каролины, Орегонский университет здоровья и науки, Калифорнийский университет в Санта-Круз, онкологический центр доктора медицины Андерсона, Мемориальный онкологический центр им. Слоуна Кеттеринга и Институт системной биологии. Все семь GDAC работают вместе, чтобы разработать конвейер анализа для автоматического анализа данных.

Опухоли

Предварительный список опухолей для исследования TCGA был составлен путем сбора статистики заболеваемости и выживаемости с веб-сайта SEER Cancer Statistic. Кроме того, при выборе 25 основных типов опухолей учитывался действующий в США «Стандарт лечения», поскольку TCGA нацелена на типы опухолей, для которых резекция перед дополнительной терапией является стандартом лечения. Доступность образцов также играет решающую роль в определении того, какие типы опухолей следует изучить и в каком порядке запускаются проекты по опухолям. Чем более распространена опухоль, тем больше вероятность того, что образцы будут собраны быстро, в результате чего общие типы опухолей, такие как рак толстой кишки, легких и груди, станут первыми типами опухолей, включенными в проект, перед редкими типами опухолей.

TCGA Целевые Опухоли: легких плоскоклеточный рак , почки папиллярная карцинома , четкой клеточной карциномы почек , карциномы протоков молочной железы , почечно - клеточной карциномой , рак шейки матки (плоскоклеточный), аденокарциномы толстой кишки , аденокарциномы желудка , ректальный рак , гепатоцеллюлярной карциномы головы и шеи (устно) плоскоклеточный рак, рак щитовидной железы , мочевой пузырь уротелиальная карциномы - nonpapillary, маточный корпус ( рак эндометрия ), протоки поджелудочной железы аденокарцинома , острый миелоидный лейкоз , аденокарцинома предстательной железы , аденокарцинома легкого , кожная меланома , молочная железа очаговой карциномы и более низкий класс глиома , карциномы пищевода , яичники серозно цистаденокарцинома , плоскоклеточная карцинома легкого , адренокортикальная карцинома , диффузная большая B-клеточная лимфома , параганглиома и феохромоцитома , холангиокарцинома , карциносаркома матки , увеальная меланома , тимома , саркома , мезотелиома герпетического рака и рак яичек.

TCGA собирала образцы для всех этих типов опухолей одновременно. Когда образцы стали доступны, типы опухолей с наибольшим количеством собранных образцов были введены в производство. Для более редких типов опухолей, типов опухолей, для которых трудно собрать образцы, и для типов опухолей, для которых TCGA не может идентифицировать источник высококачественных образцов, эти типы рака вошли в «производственный конвейер TCGA» на втором году проекта. Это дало Программному офису TCGA дополнительное время для сбора достаточного количества образцов для проекта.

Публикации

Прогресс на 7 декабря 2017 г.
Тип рака изучен Финал

Число, проанализированное на оригинальной маркерной бумаге

Данные общедоступны Результаты анализа TCGA
Мультиформная глиобластома 206 Икс Подтипы GBM Классический, Мезенхимальный и Проневральный определяются мутациями EGFR , NF1 и PDGFRA / IDH1 соответственно; более 40% опухолей имеют мутации в генах-модификаторах хроматина; другие часто мутирующие гены включают TP53 , PlK3R1 , PIK3CA , IDH1 , PTEN , RB1 , LZTR1
Глиома низшей степени 293 Икс Определен три подтипа коррелирующего с результатами пациентов: IDH1 мутанта с 1p / 19q делеция, РНИТЕ мутант без 1p / 19q удаления, и IDH дикого типа; IDH дикого типа геномно похож на глиобластому.
Дольчатая карцинома молочной железы 203 Икс Дольковая карцинома, отличная от протоковой карциномы; FOXA1 повышен при лобулярной карциноме, GATA3 повышен при протоковой карциноме; лобулярная карцинома, обогащенная потерей PTEN и активацией Akt
Карцинома молочной железы 784 Икс Четыре различных геномных подтипа: базальный, Her2, просвет A, просвет B; наиболее распространенные мутации драйвера TP53 , PIK3CA , GATA3 ; базальный подтип похож на серозный рак яичников
Колоректальная аденокарцинома 276 Икс Рак толстой кишки и прямой кишки имеют схожие геномные профили; гипермутированный подтип (16% образцов), чаще всего обнаруживаемый в правой ободочной кишке и связанный с благоприятным прогнозом; новые потенциальные драйверы: ARlD1A , SOX9 , FAM123B / WTX ; сверхэкспрессия: ERBB2 , IGF2 ; мутации в пути WNT
Аденокарцинома желудка 295 Икс Выявлено четыре подтипа: EBV, характеризующийся инфекцией вируса Эпштейна-Барра, MSI (микросателлитная нестабильность), характеризующаяся гипермутацией, GS, характеризующаяся геномной стабильностью, CIN, характеризующаяся хромосомной нестабильностью; ЦИН обогащен мутациями тирозинкиназ
Карцинома пищевода 164 Икс Плоскоклеточная клетка и аденокарцинома молекулярно различаются; плоскоклеточные карциномы были подобны плоскоклеточным карциномам головы и шеи и часто имели амплификации CCND1, SOX2 и TP63; аденокарциномы были подобны хромосомно нестабильной аденокарциноме желудка и часто имели амплификации в ERBB2, VEGFA, GATA4 и GATA6.
Серозная цистаденокарцинома яичников 489 Икс Мутации TP53 произошли в 96% исследованных случаев; мутации BRCA1 и BRCA2 произошли в 21% случаев и были связаны с более благоприятными исходами
Карцинома тела матки эндометрия 373 Икс Рак эндометрия классифицируется на четыре категории: ультрамутированный ПОЛЮС, гипермутированный MSI (микросателлитная нестабильность), низкое число копий и высокое число копий; Серозные карциномы матки были подобны серозным и базальным карциномам яичников и имели менее благоприятный прогноз, чем эндометриоидные карциномы матки.
Плоскоклеточный рак шейки матки и аденокарцинома 228 Икс Выявление ВПЧ-отрицательных, эндометриоподобных форм рака шейки матки с мутациями в генах KRAS , ARID1A и PTEN ; амплификация генов иммунных контрольных точек CD274 и PDCD1LG2 ; Изменения в генах , включая MED1 , ErbB3 , Casp8 , HLA-A , и TGFBR2 и слитых с участием lncRNA BCAR4 ; почти три четверти образцов имели изменения в одном или обоих сигнальных путях PI3K / MAPK и TGF-бета.
Плоскоклеточный рак головы и шеи 279 Икс Выявленные геномные особенности рака, связанного с ВПЧ и курением: ВПЧ-положительный характер характеризуется укороченным или удаленным TRAF3 , ВПЧ-отрицательный, характеризующийся коамплификацией 11q13 и 11q22, связанный с курением, характеризуется мутациями TP53 , инактивацией CDKN2A и изменениями числа копий
Карцинома щитовидной железы 496 Икс Большинство вызвано мутациями RAS или BRAFV600E; опухоли, вызванные этими мутациями, различаются
Острый миелоидный лейкоз 200 Икс Низкое количество мутаций, в среднем всего 13 кодирующих мутаций на опухоль; классифицировал события драйверов по девяти категориям, включая слияния факторов транскрипции, мутации модификаторов гистонов, мутации сплайсосом и другие
Кожная меланома 331 Икс Установлено четыре подтипа: мутант BRAF, мутант RAS, мутант NF1 и тройной дикий тип на основе мутаций драйвера; более высокий уровень инфильтрации иммунных лимфоцитов коррелирует с лучшей выживаемостью пациентов
Аденокарцинома легкого 230 Икс Высокая нагрузка мутаций; 76% опухолей продемонстрировали активацию рецепторных тирозинкиназных путей.
Плоскоклеточный рак легкого 178 Икс Высокое среднее количество мутаций и аберраций числа копий; подобно серозной цистаденокарциноме яичника, почти все плоскоклеточные карциномы легких содержат мутацию в TP53 ; многие опухоли содержат инактивирующие мутации в HLA-A, которые могут помочь раку избежать иммунного обнаружения
Светлоклеточная почечно-клеточная карцинома 446 Икс Обычно мутировавшие гены включали VHL, участвующий в восприятии кислорода, SED2, участвующий в эпигенетических модификациях, приводящих к глобальному гипометилированию, и гены пути PI3K / AKT / mTOR; метаболический сдвиг, аналогичный «эффекту Варбурга», коррелирует с плохим прогнозом
Папиллярный рак почки 161 Икс 81% опухолей типа 1 содержали изменения MET; геномные профили опухолей типа 2 были гетерогенными, с изменениями CDKN2A, SETD2, TFE3 или повышенной экспрессией пути NRF2 – ARE; потеря экспрессии CDKN2A и фенотип метилирования CpG-островков были связаны с плохим исходом
Инвазивный уротелиальный рак мочевого пузыря 131 Икс Курение связано с повышенным риском; часто мутировавшие гены включают TP53, который был инактивирован в 76% опухолей, и ERBB2 (HER2), гены в путях рецепторной тирозинкиназы (RTK) / RAS, измененные в 44% опухолей;
Аденокарцинома простаты 333 Икс Высокая гетерогенность, 26% образцов вызваны неизвестными молекулярными изменениями; 7 подтипов, определяемых слияниями генов фактора транскрипции ETS или мутациями в SPOP , FOXA1 или IDH1 ; активные повреждения в путях репарации PI3K, MAPK и ДНК
Хромофобная почечно-клеточная карцинома 66 Икс Чрезвычайно низкое бремя мутаций; карцинома происходит из более дистальных областей почек по сравнению со светлоклеточной карциномой, которая в основном возникает из проксимальных областей; метаболический сдвиг, отличный от сдвига «эффекта Варбурга», наблюдаемого при светлоклеточной карциноме; Гены- супрессоры опухолей TP53 и PTEN часто мутировали; Промотор гена TERT часто изменялся
Адренокортикальная карцинома 91 Икс Сверхэкспрессия IGF2 , мутации в TP53 , PRKAR1A и других генах, а также изменения числа копий были общими отличительными признаками; гипоплоидия с последующим удвоением всего генома может быть движущим механизмом развития опухоли
Параганглиома и феохромоцитома 173 Икс Четыре различных подтипа: измененный Wnt, корковая примесь, псевдогипоксия и передача сигналов киназы; Ген слияния MAML3 и соматическая мутация CSDE1 определяют и определяют плохой прогноз, подтип с измененным Wnt
Холангиокарцинома 38 Икс Низкая экспрессия генов CDKN2, BAP1 и ARID1 и избыточная экспрессия генов FGFR2 и IDH1 / 2; четыре подтипа, один подтип характеризуется изменениями IDH, подавлением ARID1A и низкой экспрессией других модификаторов хроматина, а также высокой экспрессией митохондриальных генов; другой подтип, характеризующийся мутациями BAP1 и слияниями генов FGFR2; рак может существовать в непрерывном спектре с подмножеством карцином печени с мутациями IDH или FGFR
Гепатоцеллюлярная карцинома печени 363 Икс Мутации промотора TERT, выявленные в 44% опухолей, связанные с увеличением удлинения теломер и подавлением CDKN2A; TP53 обычно мутирован или недостаточно экспрессируется; CTNNBB1 значительно мутировал; многие опухоли с высоким уровнем инфильтрации лимфоцитов или сверхэкспрессией генов контрольных точек иммунитета CTLA4, PD-1 и PD-L1
Протоковая аденокарцинома поджелудочной железы 150 Икс Используется глубокое и целевое секвенирование для лучшего анализа клеточности неопластов; Мутации KRAS присутствуют в 93% опухолей; мутации в RREB1 или других участниках сигнального пути RAS-MAPK
Карциносаркома матки 57 год Икс Выявлена ​​сильная и разнообразная степень эпителиально-мезенхимального перехода; Мутации TP53 присутствуют в 91% образцов; изменения в PI3K присутствуют в половине образцов
Увеальная меланома 80 Икс Сложные мутации в BAP1; идентифицировали отдельные подразделения подтипов дисомии 3 (D3) и моносомии 3 (M3); в M3 взаимоисключающие мутации EIF1AX и SRSF2 / SF3B1 имеют разные профили метилирования и прогнозы
Тимома 124 Икс
Саркома 206 Икс TP53, ATRX и RB1 среди немногих генов, периодически мутировавших в разных типах сарком; изменения числа копий часто происходили в саркомах сложного кариотипа, влияя на клеточный цикл p53 и RB1 и другие пути; саркомы синовиальной саркомы экспрессируют слияния в SSX1 или SSX2 и TERT; Для дедифференцированной липосаркомы амплификация JUN связана с худшей выживаемостью; измененный путь PI3K-AKT-mTOR при лейомиосаркоме; недифференцированная плеоморфная саркома и миксофибросаркома могут быть вызваны изменениями в пути бегемота
Мезотелиома 87 Икс
Рак семенных клеток яичка 150 Икс

Мультиформная глиобластома

В 2008 году TCGA опубликовал свои первые результаты по мультиформной глиобластоме (GBM) в природе . Эти первые результаты опубликованы на 91 подобранной паре опухоль-нормальная. Хотя для исследования было собрано 587 биопрепаратов, большинство из них было отклонено во время контроля качества: образцы опухоли должны были содержать не менее 80% ядер опухоли и не более 50% некроза, а оценка вторичной патологии должна была согласиться с тем, что первоначальный диагноз ГБМ был точным. Последняя партия образцов была исключена, поскольку собранные ДНК или РНК не имели достаточного качества или количества для анализа на всех различных платформах, используемых в этом исследовании.

Все данные из статьи, а также данные, которые были собраны с момента публикации, находятся в открытом доступе в Координационном центре данных (DCC). Большая часть данных TCGA находится в полностью открытом доступе, за исключением данных, которые потенциально могут идентифицировать конкретных пациентов. Доступ к этим клинически контролируемым данным можно получить через приложение в Комитет по доступу к данным (DAC), который оценивает, является ли конечный пользователь добросовестным исследователем, и задает законный научный вопрос, который заслуживает доступа к данным на индивидуальном уровне. Этот процесс аналогичен процессу других программ, финансируемых NIH, включая dbGAP .

С момента публикации первой маркерной статьи несколько аналитических групп в сети TCGA представили более подробный анализ данных по глиобластоме . Анализ группа под руководством Roel Verhaak, PhD, Katherine A. Hoadley , PhD, и Д. Нил Hayes , MD, успешно коррелирует глиомы экспрессии генов подтипы с геномных аномалий. Группа анализа данных метилирования ДНК , возглавляемая доктором наук Хутаном Ноушмером и доктором философией Питером Лэрдом, выявила отдельную подгруппу образцов глиомы, которая демонстрирует согласованное гиперметилирование в большом количестве локусов, что указывает на существование фенотипа метилирования глиомы-островков CpG ( G -CIMP ). Опухоли G-CIMP относятся к пронейральной подгруппе и были тесно связаны с соматическими мутациями IDH1 .

Серозный яичник

Начиная новую эру в секвенировании генома рака, TCGA сообщила о секвенировании экзома 316 образцов опухолей высокосортного серозного рака яичников в журнале Nature в июне 2011 года.

Колоректальный рак

TCGA сообщил о секвенировании экзома и анализе экспрессии генов 276 образцов опухолей рака толстой и прямой кишки, включая полногеномное секвенирование 97 образцов, в журнале Nature в июле 2012 года . org ), объединяющие геномные и протеомные данные, относящиеся к тканям колоректального рака, из TCGA и клеточных линий.

Состояние на 2013 год: мутационный ландшафт 12 распространенных подтипов рака

В 2013 году TCGA опубликовал описание «мутационного ландшафта», определяемого как часто повторяющиеся мутации, выявленные в результате секвенирования экзома 3281 опухоли из 12 часто встречающихся подтипов рака. Двенадцать подтипы Исследовались аденокарциномы молочной железы , аденокарциномы легких , рак легких , плоскоклеточный рак , рак эндометрия , глиобластома , плоскоклеточный рак головы и шеи, рак толстой кишки , рак прямой кишки , рак мочевого пузыря , почек , рак светлоклеточный , рак яичников и острый миелоидный лейкемия .

Смотрите также

использованная литература

внешние ссылки