6.1. Структурно-функциональная организация гена
Проблема гена – центральная проблема молекулярной генетики. Она берет свое начало с работы Т. Моргана «Теория гена» (1926), в которой ген был представлен как неделимая единица мутации (ген изменяется как целое), рекомбинации (кроссинговер происходит в пределах гена) и функции (все мутации одного гена связаны с одной функцией).
С тех пор представления о гене радикально изменились. Важным этапом в развитии теории гена были работы С. Бензера в конце 1950-х гг. (Benzer S., 1961). Они показали, что ген, представляющий собой нуклеотидную последовательность, не является неделимой единицей рекомбинации и мутации. Генетические исследования бактерий и фагов, благодаря гигантской численности их потомства, позволили уловить ничтожные доли (?0,0001 %) внутригенных рекомбинаций, что подтверждало принцип дробимости гена. Единицу рекомбинации С. Бензер назвал реконом, а единицу мутации – мутоном. В дальнейшем было показано, что мутон и рекон соответствуют одной паре нуклеотидов. Единица генетической функции, которую С. Бензер назвал цистроном, совпадала с понятием ген, поэтому этот термин практически исчез из употребления (иногда термин цистрон еще употребляется в генетике как синоним понятия гена, когда хотят подчеркнуть его функциональное значение). С. Бензеру принадлежит крылатое выражение: «Гены – это атомы наследственности».
Современная теория гена сформировалась в русле нового направления, которое Дж. Уотсон назвал молекулярная биология гена (Уотсон Дж., 1978). Исследования тонкой структуры гена были проведены у вирусов, бактерий, грибов, высших эукариот. Что же показали эти исследования?
Основополагающий принцип классической генетики «один ген – один белок» подвергся серьезному пересмотру. В упрощенном виде под геном подразумевалась последовательность нуклеотидов, кодирующая одну полипептидную цепь, расположенная между старт-сигналом и стоп-сигналом. Затем были идентифицированы гены, кодирующие различные виды РНК, что потребовало уточнения в определении. Но новые открытия ставили новые проблемы. Чем дальше развивалась молекулярная генетика, тем труднее было дать четкое определение понятию «ген».
Неожиданный результат принесло изучение вирусных геномов. В 1977 г. Ф. Сэнджер у бактериофага ?Х174 обнаружил «перекрывающиеся» гены, имеющие общие нуклеотидные участки. Бактериофаг ?Х174 имеет кольцевую одноцепочечную ДНК и поражает клетки E. coli (Sanger F. [et al.], 1977). Затем «перекрывающиеся» гены выявили в геномах других организмов, включая человека. Изредка встречаются варианты, когда внутри одного гена целиком содержится другой, меньший – «ген в гене».
Необходимо отметить, что в «перекрывающихся» генах каждый нуклеотид принадлежит одному кодону, т. е. имеются различные рамки считывания с одной и той же нуклеотидной последовательности. Так, у фага ?Х174 имеется участок молекулы ДНК, который входит в состав сразу трех генов. Но соответствующие этим генам последовательности нуклеотидов прочитываются каждый в своей системе отсчета. Поэтому нельзя говорить о «перекрывании» кода.
Если у вирусов такая организация генетического материала позволяет осуществлять экономное использование небольших информационных возможностей своего генома, то значение «перекрывания» в огромных геномах эукариот до конца не понятно. Возможно, эта роль связана с регуляцией активности генов путем образования двух почти комплементарных РНК. Такие молекулы РНК способны образовывать двунитиевые структуры, что блокирует процесс трансляции. «Экономия места» имеет свои побочные эффекты, поскольку одна мутация может «выключить» сразу два или более генов.
Сенсационным открытием явилась показанная в том же 1977 г. будущими нобелевскими лауреатами Р. Робертсом и Ф. Шарпом прерывистая, «мозаичная», структура большинства эукариотических генов (Brown D., 1981). В структуре гена стали выделять экзоны – участки гена, кодирующие структуру полипептида, и интроны – участки гена, не кодирующие структуру полипептида. Термины «экзон» и «интрон» были предложены У. Гилбертом (Gilbert W., 1981). Количество интрон-экзонных переходов в пределах гена широко варьирует. В геноме человека одни гены имеют 3–10 таких переходов, другие – более сотни. Так, ген коллагена имеет 118 экзонов. Колебание размеров более характерно для интронов (например, у человека – от 14 до 150 000 п. н.). Для некоторых эукариотических генов экзоны составляют лишь незначительную часть их длины. Только единичные гены человека лишены интронов, в том числе все гены гистонов и мт-ДНК. Роль интронов до конца не ясна. Вероятно, они участвуют в процессах генетической рекомбинации, а также в процессах регуляции экспрессии.
Дальнейшие исследования в области молекулярной биологии еще больше осложнили четкость определения понятия «ген». В геноме эукариот были обнаружены обширные регуляторные области. Относить ли к гену окружающие его регуляторные области или оставить в понятии «ген» только участок транскрипции – здесь мнения генетиков разделились. Проблема осложняется тем, что регуляторные области могут лежать за пределами единиц транскрипции на расстоянии в десятки тысяч п. н. Более того, одни и те же регуляторные участки могут «обслуживать» разные гены.
В регуляторной части генома выделяют различные участки.
Промотор – небольшой участок (у человека – 75 п. н.) связывания с ДНК факторов транскрипции и образование комплекса ДНК – РНК-полимеразы для запуска синтеза РНК.
Энхансеры – усилители транскрипции.
Сайленсеры – ослабители транскрипции.
Между энхансерами и сайленсерами нет четкого «разделения труда», поскольку обычно они взаимодействуют со многими генами. Одна и та же последовательность ДНК может выступать и в роли энхансера, и в роли сайленсера, в зависимости от типа клеток. Данные последовательности представляют собой короткие участки ДНК (100–300 п. н.), являющиеся местом прикрепления регуляторных белков. Каждый энхансер или сайленсер может взаимодействовать с целым рядом регуляторных белков. Это изменяет активность генов путем изменения конформации определенного участка ДНК. В роли энхансеров и сайленсеров выступают некоторые транспозоны, что позволяет понять их генетическую роль.
Инсуляторы – короткие последовательности (300–1000 п. н.), обеспечивающие относительную независимость функций гена, блокируя взаимодействие между энхансером и промотором.
В последних моделях структурно-функциональной организации генома предполагается, что ДНК-нуклеосомная нить образует функциональные специфические участки – домены, которые представляют собой петли (обычно размером 30 000–200 000 п. н.), прикрепленную к структурам ядерного матрикса. В этих моделях инсуляторам отводится важная роль, во многом определяющая функционирование домена, который, вероятно, представляет собой единую функциональную единицу (Корочкин Л. И., 2002).
Между генами существуют особые межгенные последовательности – спейсеры.
Упрощенную структуру эукариотического гена, включающую транскрибируемые и регуляторные области, можно представить следующим образом (рис. 6.1).
Нетранслируемые области выполняют регуляторную роль в процессе трансляции.
Большинство генов бактерий представлены непрерывными участками ДНК, вся информация которой используется при синтезе полипептида. Участки ДНК между генами у прокариот весьма незначительны, а внутри оперона их нет совсем.
В организации митохондриального генома эукариот много общего с геномом прокариот, что служит веским доводом в пользу симбиотической теории происхождения митохондрий. Генымт-ДНК расположены компактно, в них практически отсутствуют интроны и спейсеры. В ряде случаев гены даже перекрываются. У человека 93 % мт-ДНК являются кодирующими. Показана значительная гомология мт-ДНК человека и мыши.
Рис. 6.1. Структура эукариотического гена:
1 – энхансеры; 2 – сайленсеры; 3 – промотор; 4 – экзоны; 5 – интроны; 6 – участки экзонов, кодирующие нетранслируемые области
Другой удивительной особенностью генома эукариот явились повторяющиеся последовательности, т. е. последовательности ДНК, присутствующие в количестве нескольких копий. По частоте в геноме эукариот можно выделить три типа последовательностей ДНК (Айала Ф., Кайгер Дж., 1988). Это уникальные последовательности, представленные одной или несколькими копиями; умеренные повторы, представленные от десятка до нескольких тысяч копий на геном; высокоповторяющаяся ДНК, представленная от нескольких тысяч до миллиона копий на геном. Большинство функционирующих генов являются уникальными последовательностями, некоторые представлены умеренными повторами. Уникальные последовательности преобладают и в межгенных участках, но именно многократно повторяющиеся последовательности этих областей и вызывают особый интерес, во многом оставаясь загадкой.
Структурно различают тандемные повторы, которые расположены вплотную друг к другу, образуя блоки (кластеры), и диспергированные повторы, которые разбросаны по геному.
Тандемные повторы образуют особую сателлитную ДНК. Число разных копий в сателлитной ДНК варьирует от сотен до миллионов. Размер единицы повторов редко превышает 200 нуклеотидов, но может состоять и из одной «буквы». Недавно были обнаружены «мегасателлиты» размером до 5000 п. н., которые повторяются 50–400 раз (Тарантул В. З., 2003). Локализована сателлитная ДНК преимущественно в гетерохроматиновых районах, особенно в области центромеры и теломеры. Только «микросателлиты», представляющие повторы единиц из 1–4 нуклеотидов, рассеяны по всему геному.
Диспергированные повторы более разнообразны и многочисленны. Их размер обычно колеблется от 100 до 10 000 п. н. Они присутствуют во всех хромосомах человека и других млекопитающих. Сложная классификация диспергированных повторов включает различные группы и подгруппы, однако границы между ними размыты. Рекордную частоту в геноме человека (более миллиона копий на геном) имеют Alu-повторы, размером около 300 п. н. Большинство диспергированных повторов относится к группе транспозонов, уникальной характеристикой которых, как уже говорилось выше, является способность перемещаться по геному.
Характеристика конкретных повторов в определенных местах генома играет важную роль в генетической идентификации личности.
Эволюционное значение повторов мы рассмотрим ниже, а сейчас отметим, что среди повторяющихся участков генома неожиданным открытием явились так называемые псевдогены – нефункционирующие последовательности ДНК, сходные с функционирующими генами (Proudfoot N., 1980). В геноме человека, например, около 20 000 псевдогенов. В частности, в семействе генов-рецепторов обоняния их почти 60 %. Псевдогены еще больше осложнили определение понятия «ген». Можем ли мы псевдогены считать генами? И что же все-таки такое ген?
Таким образом, используя термин «ген» для обозначения определенной последовательности ДНК, мы теперь вкладываем в него возможность прерывистой структурной организации, возможность участия части этой последовательности в составе другого гена, неоднозначность экспрессии этого участка, наличие генов как для белков, так и для РНК.
Подводя итог исследований молекулярной биологии гена и понимая всю сложность этой проблемы, остановимся на лаконичном определении гена, которое приводит в своей книге В. З. Тарантул: «Ген – это физическая (определенный участок ДНК) и функциональная (кодирует белок или РНК) единица наследственности» (Тарантул В. З., 2003). Размеры гена варьируют в чрезвычайно широких пределах. Так, самый маленький ген человека (МСС-7) имеет всего 21 п. н., а самый большой (ген дистрофина) – 2,2 млн п. н. (Гринев В. В., 2006).