Метагеномика - Metagenomics

В метагеномике генетические материалы ( ДНК , C ) извлекаются непосредственно из образцов, взятых из окружающей среды (например, почвы, морской воды, кишечника человека, A ) после фильтрации ( B ), и секвенируются ( E ) после размножения путем клонирования ( D ) в подходе, называемом секвенированием дробовика . Эти короткие последовательности затем можно снова собрать вместе с использованием методов сборки ( F ), чтобы вывести отдельные геномы или части геномов, которые составляют исходный образец окружающей среды. Затем эту информацию можно использовать для изучения видового разнообразия и функционального потенциала микробного сообщества окружающей среды.

Метагеномика - это исследование генетического материала, полученного непосредственно из образцов окружающей среды . Широкая область может также называться экологической геномикой , экогеномикой или геномикой сообщества .

В то время как традиционная микробиология и секвенирование микробного генома и геномика опираются на культивируемые клональные культуры , раннее секвенирование генов окружающей среды клонировало определенные гены (часто ген 16S рРНК ) для получения профиля разнообразия в естественном образце. Такая работа показала, что подавляющее большинство микробного биоразнообразия было упущено методами культивирования.

Благодаря своей способности раскрывать ранее скрытое разнообразие микроскопической жизни, метагеномика предлагает мощную линзу для наблюдения за микробным миром, которая может революционизировать понимание всего живого мира. Поскольку стоимость секвенирования ДНК продолжает падать, метагеномика теперь позволяет исследовать микробную экологию в гораздо большем масштабе и детализации, чем раньше. В недавних исследованиях используется метод секвенирования « дробовик » или ПЦР для получения в значительной степени объективных выборок всех генов от всех членов отобранных сообществ.

Этимология

Термин «метагеномика» впервые был использован Джо Хандельсманом , Джоном Кларди , Робертом М. Гудманом , Шоном Ф. Брэди и другими и впервые появился в публикации в 1998 году. Термин «метагеном» ссылается на идею о том, что набор генов, секвенированных из Окружающая среда может быть проанализирована аналогично изучению отдельного генома . В 2005 году Кевин Чен и Лиор Пачтер (исследователи из Калифорнийского университета в Беркли ) определили метагеномику как «применение современной техники геномики без необходимости изоляции и лабораторного культивирования отдельных видов».

История

Обычное секвенирование начинается с культуры идентичных клеток в качестве источника ДНК . Однако ранние метагеномные исследования показали, что, вероятно, во многих средах существуют большие группы микроорганизмов, которые невозможно культивировать и, следовательно, невозможно секвенировать. Эти ранние исследования были сосредоточены на последовательностях 16S рибосомной РНК (рРНК), которые являются относительно короткими, часто консервативными в пределах одного вида и обычно различаются между видами. Было обнаружено множество последовательностей 16S рРНК , которые не принадлежат ни одному из известных культивируемых видов , что указывает на существование множества неизолированных организмов. Эти исследования генов рибосомной РНК, взятых непосредственно из окружающей среды, показали, что методы, основанные на культивировании, обнаруживают менее 1% видов бактерий и архей в образце. Большой интерес к метагеномике исходит из этих открытий, которые показали, что подавляющее большинство микроорганизмов ранее оставались незамеченными.

Ранние молекулярные исследования в этой области были проведены Норманом Р. Пейсом и его коллегами, которые использовали ПЦР для изучения разнообразия последовательностей рибосомных РНК. Понимание, полученное в результате этих революционных исследований, привело Пейса к предложению идеи клонирования ДНК непосредственно из образцов окружающей среды еще в 1985 году. Это привело к первому отчету о выделении и клонированию основной массы ДНК из образцов окружающей среды, опубликованному Пейсом и коллегами в 1991 году, в то время как Пейс работал на факультете биологии Университета Индианы . Значительные усилия гарантировали, что это не были ложноположительные результаты ПЦР, и поддержали существование сложного сообщества неизученных видов. Хотя эта методология была ограничена исследованием высококонсервативных генов , не кодирующих белки , она подтвердила ранние наблюдения, основанные на морфологии микробов, о том, что разнообразие было гораздо более сложным, чем было известно методами культивирования. Вскоре после этого Хили сообщил о метагеномном выделении функциональных генов из «зообиблиотек», созданных из сложной культуры организмов окружающей среды, выращенных в лаборатории на сушеных травах в 1995 году. Покинув лабораторию Пейс, Эдвард ДеЛонг продолжил работу в этой области и опубликовал свою работу. который в значительной степени заложил основу экологической филогении на основе сигнатурных последовательностей 16S, начиная с создания его группой библиотек из морских образцов.

В 2002 году Майя Брейтбарт , Форест Ровер и ее коллеги использовали секвенирование с использованием дробовика в окружающей среде (см. Ниже), чтобы показать, что 200 литров морской воды содержат более 5000 различных вирусов. Последующие исследования показали, что в стуле человека содержится более тысячи видов вирусов и, возможно, миллион различных вирусов на килограмм морского осадка , включая множество бактериофагов . По сути, все вирусы в этих исследованиях были новыми видами. В 2004 году Джин Тайсон, Джилл Бэнфилд и его коллеги из Калифорнийского университета в Беркли и Объединенного института генома секвенировали ДНК, извлеченную из дренажной системы кислой шахты . Эти усилия привели к созданию полных или почти полных геномов горстки бактерий и архей , которые ранее сопротивлялись попыткам их культивирования.

Начиная с 2003 года, Крейг Вентер , руководитель параллельного проекта « Геном человека» , финансируемого из частных источников , возглавил Глобальную экспедицию по отбору проб океана (GOS), которая совершила кругосветное путешествие и собирала метагеномные образцы на протяжении всего путешествия. Все эти образцы секвенированы с использованием дробовика в надежде, что будут идентифицированы новые геномы (и, следовательно, новые организмы). Пилотный проект, проведенный в Саргассовом море , обнаружил ДНК почти 2000 различных видов , в том числе 148 видов бактерий, ранее не встречавшихся. Вентер совершил кругосветное плавание и тщательно исследовал западное побережье Соединенных Штатов , а также завершил двухлетнюю экспедицию по исследованию Балтийского , Средиземного и Черного морей. Анализ метагеномных данных, собранных во время этого путешествия, выявил две группы организмов: одна состоит из таксонов, адаптированных к условиям окружающей среды «пир или голод», а вторая состоит из относительно меньшего числа, но более широко распространенных таксонов, в основном состоящих из планктона .

В 2005 году Стефан Шустер из Университета штата Пенсильвания и его коллеги опубликовали первые последовательности образцов окружающей среды, полученные с помощью высокопроизводительного секвенирования , в данном случае массового параллельного пиросеквенирования, разработанного 454 Life Sciences . Еще одна ранняя статья в этой области появилась в 2006 году Робертом Эдвардсом, Форестом Ровером и коллегами из Государственного университета Сан-Диего .

Последовательность действий

Блок-схема типичного проекта метагенома

Восстановление последовательностей ДНК длиной более нескольких тысяч пар оснований из образцов окружающей среды было очень трудным, пока недавние достижения в молекулярно-биологических методах не позволили конструировать библиотеки в бактериальных искусственных хромосомах (ВАС), которые предоставили лучшие векторы для молекулярного клонирования .

Метагеномика дробовика

Достижения в области биоинформатики , усовершенствования амплификации ДНК и увеличение вычислительной мощности в значительной степени помогли анализу последовательностей ДНК, извлеченных из образцов окружающей среды, что позволило адаптировать секвенирование дробовика к метагеномным образцам (известное также как дробовик целого метагенома или секвенирование WMGS). Подход, используемый для секвенирования многих культивируемых микроорганизмов и генома человека , случайным образом срезает ДНК, упорядочивает многие короткие последовательности и реконструирует их в согласованную последовательность . Секвенирование с помощью дробовика выявляет гены, присутствующие в образцах окружающей среды. Исторически для облегчения этого секвенирования использовались библиотеки клонов. Однако с развитием технологий высокопроизводительного секвенирования этап клонирования больше не нужен, и можно получить больший объем данных секвенирования без этого трудоемкого этапа узких мест. Метагеномика дробовика предоставляет информацию как о том, какие организмы присутствуют, так и о том, какие метаболические процессы возможны в сообществе. Поскольку сбор ДНК из окружающей среды в значительной степени неконтролируемый, наиболее распространенные организмы в образце окружающей среды наиболее полно представлены в результирующих данных последовательности. Для достижения высокого охвата, необходимого для полного определения геномов недостаточно представленных членов сообщества, необходимы большие выборки, часто непомерно высокие. С другой стороны, случайный характер секвенирования с дробовиком гарантирует, что многие из этих организмов, которые в противном случае остались бы незамеченными при использовании традиционных методов культивирования, будут представлены по крайней мере некоторыми небольшими сегментами последовательности.

Секвенирование с высокой пропускной способностью

Преимущество высокопроизводительного секвенирования заключается в том, что этот метод не требует клонирования ДНК перед секвенированием, что устраняет одно из основных предубеждений и узких мест при отборе проб окружающей среды. Первые метагеномные исследования, проведенные с использованием высокопроизводительного секвенирования, использовали массовое параллельное пиросеквенирование 454 . Три другие технологии, обычно применяемые для отбора проб окружающей среды, - это персональная геномная машина Ion Torrent , Illumina MiSeq или HiSeq и система Applied Biosystems SOLiD . Эти методы секвенирования ДНК генерируют более короткие фрагменты, чем секвенирование по Сэнгеру ; Система Ion Torrent PGM и пиросеквенирование 454 обычно производят чтения ~ 400 пар оснований, Illumina MiSeq производит считывания 400-700 пар оснований (в зависимости от того, используются ли варианты парных концов), а SOLiD производит считывания 25-75 пар оснований. Исторически эти длины чтения были значительно короче, чем типичная длина чтения секвенирования Сэнгера, составляющая ~ 750 п.н., однако технология Illumina быстро приближается к этому эталону. Однако это ограничение компенсируется гораздо большим числом считываний последовательности. В 2009 г. пиросеквенированные метагеномы генерируют 200–500 мегабаз, а платформы Illumina генерируют около 20–50 гигабаз, но за последние годы эти результаты увеличились на порядки.

Новый подход сочетает в себе секвенирование с дробовиком и определение конформации хромосом (Hi-C), который измеряет близость любых двух последовательностей ДНК в одной и той же клетке, чтобы направлять сборку микробного генома. Технологии долгого секвенирования, в том числе PacBio RSII и PacBio Sequel от Pacific Biosciences и Nanopore MinION, GridION, PromethION от Oxford Nanopore Technologies , являются еще одним выбором для получения длинных считываний секвенирования, которые должны упростить процесс сборки.

Биоинформатика

Схематическое изображение основных шагов, необходимых для анализа данных, полученных в результате секвенирования всего метагенома. Программное обеспечение, относящееся к каждому этапу, выделено курсивом.

Данные, полученные в результате метагеномических экспериментов, огромны и изначально зашумлены, они содержат фрагментированные данные, представляющие до 10 000 видов. Секвенирование метагенома рубца коровы дало 279 гигабаз , или 279 миллиардов пар оснований данных нуклеотидной последовательности, в то время как каталог генов микробиома кишечника человека идентифицировал 3,3 миллиона генов, собранных из 567,7 гигабаз данных последовательностей. Сбор, обработка и извлечение полезной биологической информации из наборов данных такого размера представляют собой серьезные вычислительные задачи для исследователей.

Предварительная фильтрация последовательности

Первый шаг анализа метагеномных данных требует выполнения определенных шагов предварительной фильтрации, включая удаление повторяющихся низкокачественных последовательностей и последовательностей вероятного эукариотического происхождения (особенно в метагеномах человеческого происхождения). Доступные методы удаления загрязняющих последовательностей геномной ДНК эукариот включают Eu-Detect и DeConseq.

сборка

Данные последовательностей ДНК из геномных и метагеномных проектов по существу одинаковы, но данные геномных последовательностей предлагают более широкий охват, в то время как метагеномные данные обычно не являются избыточными. Кроме того, более широкое использование технологий секвенирования второго поколения с короткими длинами считывания означает, что большая часть будущих метагеномных данных будет подвержена ошибкам. В совокупности эти факторы делают сборку считываний метагеномных последовательностей в геномы трудной и ненадежной. Неправильная сборка вызвана присутствием повторяющихся последовательностей ДНК, которые делают сборку особенно трудной из-за разницы в относительной численности видов, присутствующих в образце. Неправильная сборка также может включать комбинацию последовательностей более чем одного вида в химерные контиги .

Существует несколько программ сборки, большинство из которых может использовать информацию из парных тегов для повышения точности сборок. Некоторые программы, такие как Phrap или Celera Assembler, были разработаны для использования для сборки отдельных геномов, но, тем не менее, дают хорошие результаты при сборке наборов метагеномных данных. Другие программы, такие как Ассемблер Velvet , были оптимизированы для более коротких чтений, производимых секвенированием второго поколения с использованием графов де Брейна . Использование эталонных геномов позволяет исследователям улучшить сборку наиболее распространенных видов микробов, но этот подход ограничен небольшим подмножеством микробных типов, для которых доступны секвенированные геномы. После создания сборки возникает дополнительная задача - «метагеномная деконволюция» или определение того, какие последовательности происходят от каких видов в образце.

Прогноз генов

Конвейеры метагеномного анализа используют два подхода к аннотации кодирующих областей в собранных контигах. Первый подход заключается в идентификации генов на основе гомологии с генами, которые уже общедоступны в базах данных последовательностей , обычно с помощью поиска BLAST . Этот тип подхода реализован в программе MEGAN 4. Второй, ab initio , использует внутренние особенности последовательности для прогнозирования кодирующих областей на основе обучающих наборов генов из родственных организмов. Это подход, используемый такими программами, как GeneMark и GLIMMER . Основное преимущество предсказания ab initio состоит в том, что оно позволяет обнаруживать кодирующие области, у которых отсутствуют гомологи в базах данных последовательностей; однако он наиболее точен, когда для сравнения доступны большие участки смежной геномной ДНК.

Видовое разнообразие

Аннотации генов предоставляют информацию «что», а измерения видового разнообразия - «кто». Чтобы связать состав сообщества и функцию в метагеномах, последовательности должны быть объединены. Биннинг - это процесс связывания определенной последовательности с организмом. В биннинге на основе сходства такие методы, как BLAST , используются для быстрого поиска филогенетических маркеров или других подобных последовательностей в существующих общедоступных базах данных. Такой подход реализован в MEGAN . Другой инструмент, PhymmBL, использует интерполированные модели Маркова для назначения чтения. MetaPhlAn и AMPHORA являются методами , основанными на уникальных клады-специфических маркера для оценки относительного содержания организменного с улучшенными вычислительными характеристиками. Другие инструменты, такие как mOTU и MetaPhyler, используют универсальные гены-маркеры для профилирования прокариотических видов. С профилировщиком Motus можно профилировать виды без референсного генома, улучшение оценки разнообразия микробного сообществ. Последние методы, такие как SLIMM , используют ландшафт охвата считыванием отдельных эталонных геномов для минимизации ложноположительных совпадений и получения надежных относительных количеств. При объединении на основе композиции в способах используются внутренние характеристики последовательности, такие как частота олигонуклеотидов или систематическая ошибка использования кодонов . После объединения последовательностей можно проводить сравнительный анализ разнообразия и богатства.

Интеграция данных

Огромный объем экспоненциально растущих данных о последовательностях представляет собой серьезную проблему, которая осложняется сложностью метаданных, связанных с метагеномными проектами. Метаданные включают подробную информацию о трехмерном (включая глубину или высоту) географическом положении и особенностях окружающей среды образца, физические данные о месте отбора образца и методологию отбора образцов. Эта информация необходима как для обеспечения воспроизводимости, так и для последующего анализа. Из-за своей важности метаданные и совместный обзор и обработка данных требуют стандартизированных форматов данных, размещенных в специализированных базах данных, таких как Genomes OnLine Database (GOLD).

Было разработано несколько инструментов для интеграции метаданных и данных о последовательностях, что позволяет проводить последующий сравнительный анализ различных наборов данных с использованием ряда экологических индексов. В 2007 году Фолкер Мейер и Роберт Эдвардс и команда из Аргоннской национальной лаборатории и Чикагского университета выпустили «Быструю аннотацию метагеномики с использованием сервера подсистемной технологии» ( MG-RAST ), ресурс сообщества для анализа набора данных метагенома. По состоянию на июнь 2012 года было проанализировано более 14,8 терабаз (14x10 12 оснований) ДНК, при этом более 10 000 общедоступных наборов данных свободно доступны для сравнения в MG-RAST. Более 8000 пользователей отправили в MG-RAST в общей сложности 50 000 метагеномов. Система Integrated Microbial Genomes / Metagenomes (IMG / M) также предоставляет набор инструментов для функционального анализа микробных сообществ на основе их метагеномной последовательности, основанной на геномах эталонных изолятов, включенных в систему Integrated Microbial Genomes (IMG) и Геномную энциклопедию Проект « Бактерии и археи» (GEBA) .

Одним из первых автономных инструментов для анализа высокопроизводительных метагеномных данных был MEGAN (MEta Genome ANalyzer). Первая версия программы была использована в 2005 году для анализа метагеномного контекста последовательностей ДНК, полученных из кости мамонта. Основываясь на сравнении BLAST со справочной базой данных, этот инструмент выполняет как таксономическое, так и функциональное объединение, помещая чтения в узлы таксономии NCBI с использованием простого алгоритма наименьшего общего предка (LCA) или на узлы классификаций SEED или KEGG. , соответственно.

С появлением быстрых и недорогих инструментов для секвенирования рост баз данных последовательностей ДНК сейчас экспоненциальный (например, база данных NCBI GenBank). Необходимы более быстрые и эффективные инструменты, чтобы идти в ногу с высокопроизводительным секвенированием, потому что подходы на основе BLAST, такие как MG-RAST или MEGAN, работают медленно для аннотирования больших выборок (например, несколько часов для обработки набора данных / выборки небольшого / среднего размера ). Таким образом, недавно появились сверхбыстрые классификаторы благодаря более доступным мощным серверам. Эти инструменты могут выполнять таксономическую аннотацию с чрезвычайно высокой скоростью, например CLARK (по словам авторов CLARK, он может точно классифицировать «32 миллиона метагеномных коротких чтений в минуту»). При такой скорости очень большой набор данных / выборка из миллиарда коротких чтений может быть обработан примерно за 30 минут.

С увеличением доступности образцов, содержащих древнюю ДНК, и из-за неопределенности, связанной с природой этих образцов (повреждение древней ДНК), стал доступен быстрый инструмент, способный производить консервативные оценки сходства. По словам авторов FALCON, он может использовать ослабленные пороги и редактировать расстояния, не влияя на производительность памяти и скорость.

Сравнительная метагеномика

Сравнительный анализ метагеномов может дать дополнительное понимание функции сложных микробных сообществ и их роли в здоровье хозяина. Попарные или множественные сравнения между метагеномами могут проводиться на уровне состава последовательности (сравнение GC-содержимого или размера генома), таксономического разнообразия или функционального дополнения. Сравнение популяционной структуры и филогенетического разнообразия можно проводить на основе 16S и других филогенетических маркерных генов или - в случае сообществ с низким разнообразием - путем реконструкции генома из набора метагеномных данных. Функциональные сравнения между метагеномами могут быть выполнены путем сравнения последовательностей с эталонными базами данных, таких как COG или KEGG , и табулирования численности по категориям и оценки любых различий на предмет статистической значимости. Этот геноцентрический подход подчеркивает функциональное дополнение сообщества в целом, а не таксономических групп, и показывает, что функциональные дополнения аналогичны в аналогичных условиях окружающей среды. Следовательно, метаданные об экологическом контексте метагеномной выборки особенно важны для сравнительного анализа, поскольку они дают исследователям возможность изучать влияние среды обитания на структуру и функции сообщества.

Кроме того, в нескольких исследованиях также использовались шаблоны использования олигонуклеотидов для выявления различий между различными микробными сообществами. Примеры таких методологий включают подход относительного содержания динуклеотидов, разработанный Willner et al. и подход HabiSign Ghosh et al. Это последнее исследование также показало, что различия в паттернах использования тетрануклеотидов можно использовать для идентификации генов (или метагеномных считываний), происходящих из определенных мест обитания. Кроме того, некоторые методы, такие как TriageTools или Compareads, обнаруживают схожие чтения между двумя наборами чтения. Мера сходства они применяются на чтения основана на количестве одинаковых слов длиной к общим парам читает.

Ключевой целью сравнительной метагеномики является определение группы (групп) микробов, которые отвечают за придание определенных характеристик данной среде. Однако из-за проблем с технологиями секвенирования необходимо учитывать артефакты, как и в случае с metagenomeSeq. Другие охарактеризовали межмикробные взаимодействия между резидентными микробными группами. Графический интерфейс основанного сравнительный анализ применение метагеномного называется сообщество анализатор было разработано Kuntal и соавта. который реализует алгоритм компоновки графиков на основе корреляции, который не только облегчает быструю визуализацию различий в анализируемых микробных сообществах (с точки зрения их таксономического состава), но также дает представление о внутренних межмикробных взаимодействиях, происходящих в них. Примечательно, что этот алгоритм компоновки также позволяет группировать метагеномы на основе вероятных паттернов межмикробного взаимодействия, а не просто сравнивать значения численности различных таксономических групп. Кроме того, инструмент реализует несколько интерактивных функций на основе графического интерфейса пользователя, которые позволяют пользователям выполнять стандартный сравнительный анализ микробиомов.

Анализ данных

Обмен веществ в сообществе

Во многих бактериальных сообществах, естественных или созданных (например, в биореакторах ), существует значительное разделение труда в метаболизме ( синтрофия ), в ходе которого продукты жизнедеятельности одних организмов становятся метаболитами для других. В одной из таких систем, метаногенном биореакторе, функциональная стабильность требует присутствия нескольких синтрофных видов ( Syntrophobacterales и Synergistia ), работающих вместе, чтобы превратить сырье в полностью метаболизированные отходы ( метан ). Используя сравнительные исследования генов и эксперименты по экспрессии с помощью микрочипов или протеомики, исследователи могут собрать воедино метаболическую сеть, выходящую за пределы видовых границ. Такие исследования требуют подробных знаний о том, какие версии каких белков кодируются какими видами и даже какими штаммами каких видов. Следовательно, геномная информация сообщества является еще одним фундаментальным инструментом (с метаболомикой и протеомикой) в поисках определения того, как метаболиты передаются и трансформируются сообществом.

Метатранскриптомика

Метагеномика позволяет исследователям получить доступ к функциональному и метаболическому разнообразию микробных сообществ, но не может показать, какие из этих процессов являются активными. Извлечение и анализ метагеномной мРНК ( метатранскриптома ) предоставляет информацию о профилях регуляции и экспрессии сложных сообществ. Из-за технических трудностей (например, короткий период полураспада мРНК) при сборе РНК окружающей среды на сегодняшний день проведено относительно мало метатранскриптомических исследований микробных сообществ in situ . Изначально ограничиваясь технологией микроматриц , в исследованиях метатранскриптомики использовались технологии транскриптомики для измерения экспрессии всего генома и количественной оценки микробного сообщества, которые впервые были применены при анализе окисления аммиака в почвах.

Вирусы

Метагеномное секвенирование особенно полезно при изучении вирусных сообществ. Поскольку у вирусов нет общего универсального филогенетического маркера (например, 16S РНК для бактерий и архей и 18S РНК для эукарий), единственный способ получить доступ к генетическому разнообразию вирусного сообщества из образца окружающей среды - это метагеномика. Таким образом, вирусные метагеномы (также называемые виромами) должны предоставлять все больше и больше информации о вирусном разнообразии и эволюции. Например, метагеномный конвейер под названием Giant Virus Finder показал первые свидетельства существования гигантских вирусов в солончаковой пустыне и в засушливых долинах Антарктики.

Приложения

Метагеномика может способствовать развитию знаний в самых разных областях. Его также можно применять для решения практических задач в медицине , инженерии , сельском хозяйстве , устойчивости и экологии .

сельское хозяйство

Эти почвы , в которой растут растения обитают микробных сообществ, причем один грамм почвы , содержащей около 10 9 -10 10 микробных клеток , которые содержат примерно одной gigabase информации последовательности. Микробные сообщества, населяющие почвы, являются одними из самых сложных, известных науке, и остаются малоизученными, несмотря на их экономическое значение. Микробные консорциумы выполняют широкий спектр экосистемных услуг, необходимых для роста растений, включая фиксацию атмосферного азота, круговорот питательных веществ , подавление болезней и связывание железа и других металлов . Стратегии функциональной метагеномики используются для изучения взаимодействия между растениями и микробами посредством независимого от культивирования исследования этих микробных сообществ. Позволяя понять роль ранее некультурных или редких членов сообщества в круговороте питательных веществ и стимулировании роста растений, метагеномные подходы могут способствовать более эффективному выявлению болезней сельскохозяйственных культур и домашнего скота и адаптации усовершенствованных методов ведения сельского хозяйства, которые улучшают здоровье сельскохозяйственных культур за счет использования взаимосвязей. между микробами и растениями.

Биотопливо

Биотопливо - это топливо, полученное в результате преобразования биомассы , например, превращения целлюлозы, содержащейся в стеблях кукурузы , просо проса и другой биомассе, в целлюлозный этанол . Этот процесс зависит от микробных консорциумов (ассоциаций), которые превращают целлюлозу в сахара с последующей ферментацией сахаров в этанол . Микробы также производят различные источники биоэнергии, включая метан и водород .

Эффективность в промышленных масштабах деконструкция биомассы требует новых ферментов с более высокой производительностью и низкой стоимостью. Метагеномная подходы к анализу сложных микробных сообществ позволяют целевой скрининг из ферментов с промышленным применением в производстве биотоплива, такие как гликозид - гидролазы . Кроме того, знание того, как эти микробные сообщества функционируют, необходимо для их контроля, а метагеномика является ключевым инструментом в их понимании. Метагеномные подходы позволяют проводить сравнительный анализ между сходящимися микробными системами , такими как биогазом бродильными или насекомых травоядными , такими как грибком сад из leafcutter муравьев .

Биотехнологии

Сообщества микробов производят широкий спектр биологически активных химикатов, которые используются в конкуренции и общении. Многие из используемых сегодня лекарств изначально были обнаружены в микробах; Недавний прогресс в разработке богатого генетического ресурса некультивируемых микробов привел к открытию новых генов, ферментов и натуральных продуктов. Применение метагеномики позволило разработать товары широкого потребления и тонкой химии , агрохимикатов и фармацевтических препаратов, в которых все шире признается преимущество катализируемого ферментами хирального синтеза .

В биоразведке метагеномных данных используются два типа анализа : функционально-управляемый скрининг выраженного признака и управляемый последовательностью скрининг интересующих последовательностей ДНК. Функциональный анализ направлен на идентификацию клонов, экспрессирующих желаемый признак или полезную активность, с последующей биохимической характеристикой и анализом последовательности. Этот подход ограничен доступностью подходящего скрининга и требованием, чтобы желаемый признак был выражен в клетке-хозяине. Более того, низкий уровень обнаружения (менее одного на 1000 проверенных клонов) и его трудоемкость еще больше ограничивают этот подход. Напротив, анализ, управляемый последовательностями, использует консервативные последовательности ДНК для создания праймеров ПЦР для скрининга клонов на предмет интересующей последовательности. По сравнению с подходами, основанными на клонировании, использование подхода, основанного только на последовательностях, дополнительно сокращает объем требуемой лабораторной работы. Применение массового параллельного секвенирования также значительно увеличивает объем генерируемых данных о последовательностях, что требует высокопроизводительных конвейеров биоинформатического анализа. Подход к скринингу, основанный на последовательностях, ограничен широтой и точностью функций генов, представленных в общедоступных базах данных последовательностей. На практике в экспериментах используется комбинация как функционального, так и последовательного подходов, основанных на интересующей функции, сложности выборки, подлежащей скринингу, и других факторах. Пример успеха использования метагеномики в качестве биотехнологии для открытия лекарств иллюстрируется антибиотиками малацидином .

Экология

Метагеномика позволяет изучать микробные сообщества, подобные тем, которые присутствуют в этом потоке, получающем кислотный дренаж из поверхностных угольных шахт.

Метагеномика может дать ценную информацию о функциональной экологии экологических сообществ. Метагеномный анализ бактериальных консорциумов, обнаруженных в испражнениях австралийских морских львов, предполагает, что богатые питательными веществами фекалии морских львов могут быть важным источником питательных веществ для прибрежных экосистем. Это связано с тем, что бактерии, которые выделяются одновременно с дефекацией, способны расщеплять питательные вещества с фекалиями до биодоступной формы, которая может попадать в пищевую цепочку.

Секвенирование ДНК также можно использовать в более широком смысле для идентификации видов, присутствующих в водоеме, отфильтрованных из воздуха частицах мусора, пробы грязи или даже фекалий животных. Это может установить диапазон инвазивных видов и исчезающих видов , а также отслеживать сезонные популяции.

Восстановление окружающей среды

Метагеномика может улучшить стратегии мониторинга воздействия загрязнителей на экосистемы и очистки загрязненной окружающей среды. Более глубокое понимание того, как микробные сообщества справляются с загрязнителями, улучшает оценки способности загрязненных участков восстанавливаться после загрязнения и увеличивает шансы на успех испытаний биоаугментации или биостимуляции .

Характеристика кишечных микробов

Микробные сообщества играют ключевую роль в сохранении здоровья человека , но их состав и механизм, с помощью которого они это делают, остаются загадочными. Метагеномное секвенирование используется для характеристики микробных сообществ из 15–18 участков тела по крайней мере 250 человек. Это часть инициативы «Микробиом человека», основная цель которой - определить, существует ли основной микробиом человека , понять изменения в микробиоме человека, которые могут быть связаны со здоровьем человека, и разработать новые технологические и биоинформатические инструменты для поддержки этих целей.

Другое медицинское исследование в рамках проекта MetaHit (Метагеномика кишечного тракта человека) состояло из 124 человек из Дании и Испании, состоящих из здоровых пациентов с избыточным весом и заболеваниями раздраженного кишечника. В исследовании была сделана попытка классифицировать глубину и филогенетическое разнообразие желудочно-кишечных бактерий. Используя данные последовательности Illumina GA и SOAPdenovo, инструмент на основе графа де Брейна, специально разработанный для коротких чтений сборки, они смогли сгенерировать 6,58 миллионов контигов размером более 500 п.н. для общей длины контига 10,3 ГБ и длины N50 2,2 кБ.

Исследование показало, что два бактериальных подразделения, Bacteroidetes и Firmicutes, составляют более 90% известных филогенетических категорий, которые доминируют над бактериями дистальных отделов кишечника. Используя относительные частоты генов, обнаруженные в кишечнике, эти исследователи идентифицировали 1244 метагеномных кластера, которые критически важны для здоровья кишечного тракта. В этих группах диапазонов есть два типа функций: домашнее хозяйство и функции кишечника. Кластеры генов домашнего хозяйства необходимы всем бактериям и часто играют важную роль в основных метаболических путях, включая центральный углеродный метаболизм и синтез аминокислот. Специфические для кишечника функции включают адгезию к белкам хозяина и сбор сахаров из глобосерийных гликолипидов. Было показано, что пациенты с синдромом раздраженного кишечника имеют на 25% меньше генов и более низкое бактериальное разнообразие, чем люди, не страдающие синдромом раздраженного кишечника, что указывает на то, что изменения в разнообразии биомов кишечника пациентов могут быть связаны с этим состоянием.

В то время как эти исследования подчеркивают некоторые потенциально ценные медицинские приложения, только 31–48,8% считываний могут быть сопоставлены с 194 общедоступными бактериальными геномами кишечника человека и 7,6–21,2% - с бактериальными геномами, доступными в GenBank, что указывает на то, что для захватить новые бактериальные геномы.

В рамках проекта «Микробиом человека» (HMP) микробные сообщества кишечника были проанализированы с использованием высокопроизводительного секвенирования ДНК. HMP показал, что, в отличие от отдельных видов микробов, многие метаболические процессы присутствуют во всех средах обитания тела с различной частотой. Микробные сообщества из 649 метагеномов, взятых из семи основных участков тела 102 человек, были изучены в рамках проекта микробиома человека . Метагеномный анализ выявил вариации в изобилии конкретных ниш среди 168 функциональных модулей и 196 метаболических путей в микробиоме. К ним относятся деградация гликозаминогликанов в кишечнике, а также транспорт фосфатов и аминокислот, связанный с фенотипом хозяина (рН влагалища) в заднем своде. HMP выявил полезность метагеномики в диагностике и доказательной медицине . Таким образом, метагеномика - мощный инструмент для решения многих насущных проблем в области персонализированной медицины .

Диагностика инфекционных заболеваний

Различение инфекционных и неинфекционных заболеваний и определение основной этиологии инфекции может быть довольно сложной задачей. Например, более половины случаев энцефалита остаются невыявленными, несмотря на обширное тестирование с использованием современных клинических лабораторных методов. Метагеномное секвенирование перспективно как чувствительный и быстрый метод диагностики инфекции путем сравнения генетического материала, обнаруженного в образце пациента, с базами данных всех известных микроскопических патогенов человека и тысячами других бактериальных, вирусных, грибковых и паразитарных организмов и базами данных по последовательностям генов устойчивости к противомикробным препаратам. со связанными клиническими фенотипами.

Надзор за арбовирусами

Метагеномика была бесценным инструментом, помогающим охарактеризовать разнообразие и экологию патогенов, переносимых гематофагами (кровососущими) насекомыми, такими как комары и клещи. Метагеномика обычно используется должностными лицами и организациями общественного здравоохранения для надзора за арбовирусами.

Смотрите также

использованная литература

внешние ссылки