Секвенирование и геном
Говоря о геноме, мы подразумеваем последовательность ДНК из 6 млрд букв А (аденин), Ц (цианин), Т (тимин) или Г (гуанин), 98,5 % которых не включает гены; наши 19 000 генов, кодирующих белки, занимают приблизительно лишь 1,5 %, состоят примерно из 40 млн букв генетического кода, и этот компонент известен как экзом12.
За последние 10 лет стоимость секвенирования генома снизилась в 100 000 раз, что значительно превосходит снижение стоимости полупроводниковых чипов, технический прогресс которых до сих пор считался самым быстрым в истории. Стоимость секвенирования человеческого генома упала с $28,8 млн в 2004 г. до менее $1500 в 2015 г.13, 14
Параллельно со стремительным падением стоимости за последние 10 лет заметно расширились наши базы знаний об основных причинах болезней. Обнаружение редких вариантов последовательности, которые объясняют наследственные болезни, основывается на этой технологии и новых знаниях о причинах редких болезней. Способность диагностировать молекулярную основу редких митохондриальных болезней возросла с 1 % до 60 %15 – весьма ощутимые темпы прогресса5. Пройдет еще немного времени, и будут определены генетические предпосылки всех 7000 менделевских заболеваний (болезней, которые наследуются по закону Менделя, следуя классическим образцам наследования, например аутосомно-доминантное или аутосомно-рецессивное наследование)5.
Даже делая успехи в решении некоторых задач, мы обнаруживаем, что наши геномы гораздо сложнее, чем мы думали. Из книги «101 ключевая идея. Генетика 101»[22] (Genetics 101) мы узнали, что у одного человека одна ДНК, что все 37 трлн клеток в нашем теле имеют одну и ту же ДНК. Впрочем, это оказалось неправильно – простой, казалось бы неизменный, архетип мутировал. Секвенирование генома отдельных клеток показало, что мы представляем собой своего рода мозаику16, 17. Например, исследователи из Института Солка секвенировали по одной клетке мозга умерших людей и обнаружили поразительные различия между клетками17. Отчасти эта мозаичность объясняется так называемыми мутациями de novo[23], которые происходят в клетках, когда они делятся на протяжении жизни человека. Мы также узнали о том, насколько разнородны раковые клетки. Поэтому движение от концептуальных рамок секвенирования ДНК отдельного человека к секвенированию клетки уже преподнесло нам некоторые бесценные уроки в отношении заболеваний.
Существуют важные ограничения, связанные с секвенированием, о которых нужно знать. Когда человек проходит секвенирование (некоторые называют его «расшифровкой генома»), обычно примерно 3,5 млн вариантов основных пар сравниваются с эталонным человеческим геномом. Но, как мы уже говорили в связи с BRCA, компанией Myriad Genetics и постановлением Верховного суда, большинство вариантов окажутся так называемыми вариантами неопределенной значимости. О них узнают после того, как пройдут секвенирование миллионы людей с различной наследственностью, с самыми разнообразными множественными заболеваниями, а также члены их семей. Наконец, мы не только представляем собой непостижимые до конца мозаики из ДНК, но мы не все из них можем секвенировать. Хотя и принято использовать термин «полногеномное секвенирование», на самом деле примерно 900 генов из 19 000 недоступны из-за их местоположения или по другим техническим причинам. Так что нам предстоит еще многое узнать о нашем геноме в будущем, и гораздо больше, чем то, чего я коснулся в этом кратком обзоре.