Как анализировать гены – по одному, все одновременно или же вид за видом?
Последовательность 16S рРНК занимает важное место в новейшей истории биологии: этот фрагмент стал стандартным инструментом первой стадии анализа микробиома. Собственно, первые работы с 16S рРНК начались еще до того, как можно было секвенировать всю последовательность. Карл Вёзе, умерший в 2012 году, давно использовал ее для того, чтобы заново нарисовать всю карту жизни. Еще в 1970-е годы он начал сравнивать последовательности коротких фрагментов РНК – олигонуклеотидов – у различных бактерий. Выстраивая взаимосвязи между микроорганизмами и «генеалогическими деревьями» этих последовательностей, в конечном счете удалось кардинальным образом пересмотреть всю структуру жизни на Земле. Вёзе обнаружил существование третьего домена (надцарства) живых организмов (входящие в него существа теперь именуются археями), довольно сильно отличающегося от двух доменов, которые уже были известны, – бактерий и эукариот (существ более крупных, имеющих клеточное ядро). Археи, как и бактерии, являются прокариотами. Раньше ученые полагали, что все прокариоты – сравнительно близкие родственники. Но археи заметно отличаются от бактерий. Поначалу их считали существами экзотическими, обитающими лишь в самых необычных местах, но теперь-то нам известно, что археи есть повсюду, в том числе в нашем микробиоме.
Добавление нового подразделения в совокупность всех живых организмов заставило переписать учебники и утвердило секвенирование 16S рРНК в качестве одного из ключевых методов микробиологического анализа. Однако первые работы Вёзе основывались на секвенировании фрагментов РНК, полученных из чистых культур. Более современный 16S-анализ идет еще дальше, позволяя исследователям отбирать ДНК-последовательности, создающие 16S рРНК, из невероятной мешанины живых организмов.
Основная идея остается той же, однако на практике осуществить ее непросто. Работа состоит из нескольких стадий: клетки образца «вскрывают», из них извлекают ДНК, затем обнаруживают все 16S-гены при помощи ДНК-праймеров, распознающих участки в начале или в конце гена, совершенно одинаковые для всех видов. Затем ДНК-фрагменты, помеченные этими праймерами, проходят циклическую обработку. Метод, изобретенный в 1980-х и названный полимеразной цепной реакцией (ПЦР), позволяет быстро и многократно копировать небольшие количества ДНК. И наконец – собственно секвенирование.
Финальная стадия – сравнение изменчивых участков генетических последовательностей 16S с уже известными нам участками (можно сравнивать как один участок, так и несколько) – сегодня отдана компьютерным программам, имеющим базы данных ДНК, где содержатся десятки тысяч таких последовательностей. То, над чем некогда мучились бесчисленные аспиранты, теперь автоматизировано (как и большинство рутинных процедур современной молекулярной генетики). Можно прикрепить небольшие отрезки многих таких последовательностей к «биочипу» – ДНК-аналогу микросхемы – и проводить сравнение непосредственно в образце. То, что некогда требовало отдельной лаборатории и усилий высококвалифицированных специалистов, теперь проделывает машина, хотя исследователям все равно требуется знать конкретные детали тех стадий, что приводят к получению результатов. Кроме того, следует знать много тонкостей: как обрабатывать пробу, как извлекать ДНК, какие именно участки последовательностей сравнивать. Ген 16S содержит в себе 9 из важнейших гипервариабельных участков ДНК; их многочисленные различия неоднородно распределены среди бактериальных видов. Поэтому от того, какие участки вы изучаете, многое зависит. Современные методы ДНК-анализа, особенно способность «размножать» сверхмалые количества ДНК, снова и снова копируя эту молекулу, имеют оборотную сторону. Эти методы чувствительны к загрязняющим компонентам, заносимым в ходе анализа, не меньше, чем к компонентам пробы, присутствовавшим в ней изначально. Это большая помеха на пути развития микробиомных исследований. Так, тщательная проверка, выполненная в 2014 году, показала, что стандартные наборы для выделения ДНК, которыми пользуются сегодня многие специалисты, зачастую не являются стерильными (вопреки рекламе). Если исходный образец взят из области с низкой плотностью микробного населения, результаты могут легко искажаться из-за микробов, невольно вносимых исследователями в процессе работы[25].
Как пишет в связи с этим журнал Nature, такая подверженность риску загрязнения «лишь усиливает озабоченность научного сообщества тем, что технология секвенирования развивается столь быстро, что в некоторых случаях она даже обгоняет возможности ученых пользоваться ею»[26]. Однако хотя получаемые данные всегда несколько расплывчаты и неопределенны, 16S-анализ всё же сообщает нам об образце «диких» (не выращенных в культуре) бактерий то, что прежде не удавалось узнать из исследования мешанины всевозможных ДНК. И хотя этот метод используется сейчас весьма широко, он – лишь первый уровень анализа. Чтобы получить более ясную картину того, что содержится в образце, не ограничиваясь грубой оценкой структуры микробной популяции, следует глубже проникнуть в ДНК.
Теперь возможно и это. В таких случаях опять же исследуются фрагменты ДНК, выделенные из «цельного» (неразделенного) образца. При таком подходе систему настраивают на секвенирование всех кусочков ДНК, какие только удастся найти. Изначально это секвенирование (так называемый «метод дробовика») применялось к отдельному виду: ученые пытались собрать воедино геномную последовательность из всех попадающихся фрагментов (какие-то повторялись, какие-то встречались лишь один раз).
Теперь же технологии настолько развиты, что мы можем позволить себе грубый силовой подход. Неважно, сколько видов в нашем образце. Просто расщепите ДНК, секвенируйте все фрагменты и посмотрите, какой смысл можно выявить в получившейся гигантской библиотеке всевозможных перепутанных последовательностей.
Всем этим как раз и занимается метагеномика. Она дает информацию обо всем генетическом составе сообщества организмов, даже если вы не знаете, какие организмы в него входят. Опять-таки пределы точности такого анализа часто определяются тем, насколько биологи, химики и компьютерщики, работая вместе, способны отделить сигнал от шума. По сути они разбираются с тысячами пазлов, которые сваливают в одну коробку и затем хорошенько встряхивают, причем никто толком не знает, на что похожи исходные картинки.
Впрочем, метагеномика предоставляет весьма перспективный метод работы с образцами, которые раньше считались бесполезными для анализа. Чем больше полных геномных последовательностей будет расшифровано и внесено в непрерывно растущие базы данных, тем эффективнее будет этот метод. Если тот или иной микробиом кажется нам заслуживающим внимания, теперь мы можем узнать, что в нем содержится, во всех подробностях. Хватило бы бюджета!