158

Вирусы: Скорее друзья, чем враги

Проект ENCODE, направленный на формирование представления о «мусорной ДНК»

Проект ENCODE, направленный на формирование представления о «мусорной ДНК»

Что происходит с 98% генома человека? 2% генома кодируют белки, а что делает оставшаяся часть, мы не знаем. Поэтому в рамках проекта «Геном человека» был инициирован проект ENCODE («Энциклопедия элементов ДНК»). Целью ENCODE является выяснение, что происходит в «пустынных участках» – так авторы проекта назвали некодирующие (нк) «пустые» пространства, расположенные между кодирующими участками. Только 2% ДНК приписываются к белкам. Большая же часть ДНК, 98%, экспрессируются как некодирующие нкРНК, которые выполняют регуляторную функцию, направленную на организацию оставшейся части РНК, экспрессию белков. Пустынные участки содержат короткие и длинные регуляторные элементы, в частности энхансеры, репрессоры, сайленсеры, с активными и неактивными сайтами, инсуляторы, промоторы, находящиеся рядом с генами, «инструкции» по процессингу (тримминг, обрезка РНК), химическим модификациям, таким как метилирование ДНК и ацетилирование хроматина (возможно также, фосфорилирование и прочие модификации) и РНК-транскрипты генов. Одним из недавних открытий стало выяснение роли «инсуляторов» (, «изолирователи»), название которых говорит само за себя и подразумевает блокировку участков, расположенных между промотором и энхансером. Как действует этот механизм, до сих пор неясно. Задача заключается в том, чтобы понять, каким образом и при каких обстоятельствах проявляется активность гена. Кроме того, будет проведен анализ интенсивности сигнала (насколько активен ген), насколько сильно он экспрессируется и сохраняется в процессе эволюции. Но это не относится к вирусам, поскольку они не консервативны, в связи с чем, вероятно, понадобятся дополнительные исследования.

В последнее время обработка огромного объема данных сопровождается астрономическими цифрами, которые упоминаются и в голландском геномном анализе. Представьте себе нагромождение бумаги высотой 15 м и длиной 35 км, исписанной только четырьмя буквами A, G, T и C в порядке, который пока никто не понимает: объем написанного – 15 Тбайт (или 15 000 Гбайт), и все это нужно понять как текст, разбить на предложения, главы, заголовки и параграфы. Общая длина генома человека 3,2?10 нуклеотидов.

Сейчас, спустя много лет после того, как в 2003 г. начался проект ENCODE, опубликовано более 2500 работ. Поразительно, но некоторые из них озадачивают. У нас всего 20 000 генов, однако в этих публикациях описываются 70 000 промоторов – исходные последовательности и регуляторные участки, расположенные перед генами. Почему же промоторов настолько больше, чем генов? Кроме того, было выявлено 40 000 энхансеров – более отдаленных от гена участков с трансграничными эффектами дальнего действия, не кодирующих белки. Похоже, на пустынных участках, где производится большое количество регуляторных нкРНК, наблюдаются мутации, приводящие к заболеваниям. Были выявлены дефектные регуляторные элементы, провоцирующие болезни. Дерегуляция (ослабление контроля) экспрессии генов часто означает рак. Действительно, как оказалось, болезни обосновываются в некодирующих областях.

В настоящее время ДНК проанализирована лишь на 10%. К концу 2014 г. 440 ученых из 32 групп, работающих со 147 типами клеток в соответствии со стандартными протоколами, провели 1648 экспериментов.

Итак, можно ли сейчас дать определенный ответ, какая доля ДНК приходится на «мусорную» часть? Нет. Как выяснилось, пустынные участки ДНК на 80% функционально активны, а 75% таких участков транскрибируется в РНК не для производства белков, а для регуляции.

Таким образом, б?льшая часть ДНК выполняет какие-нибудь функции. Многие вирусные последовательности оказываются поврежденными настолько, что похожи на «мусор», но часто они все равно выполняют какую-нибудь функцию и их ДКП ранее упоминались как остаточные последовательности, являясь промоторами для прочих генов. Другие же последовательности, возможно, находятся на пути к исчезновению и поэтому вполне могут представлять собой «мусор». Эволюция идет своим чередом и никогда не останавливается! При проведении генетической диагностики нужно иметь в виду, что геномы двух «нормальных» людей отличаются на 0,5%, что составляет 16 млн пар оснований (это число недавно увеличилось в пять раз) из общего числа генов 3,2 млрд. Исходя из этого, нужно определить последовательности, ассоциированные с заболеваниями. Какой из однонуклеотидных полиморфизмов (ОНП) указывает на заболевания, а какой ничего не значит? Этот вопрос требует решения. Чтобы преодолеть соотношение «сигнал–шум», нужно разработать новые технологии.

Вероятно, существуют рациональные способы найти ответы на все или на некоторые из этих вопросов. Крейг Вентер нашел более дешевый и быстрый способ проанализировать геном человека, сократил расходы на исследовательскую работу на несколько порядков и сэкономил человечеству лет 10 работы. Сможет ли он или кто-нибудь другой повторить его успех в рамках проекта ENCODE? Надеюсь. Все данные, получаемые в указанном проекте, становятся предметом гласности, и недавно были организованы курсы по обучению работе с этими данными. Все могут помочь – если смогут!

Похожие книги из библиотеки