Проект «Геном человека»

В своей книге «Gracking the Genome: Inside the Race to Unlock Human DNA» Кевин Дэвис замечает, что последовательность оснований среднего гена, записанная буквами в обыкновенной книге, каждая страница которой состоит из 3000 букв, соответствует пяти страницам текста. Последовательность оснований хромосомы занимает уже 200 томов книги, по 300 страниц каждый. Для записи расшифровки полного генома человека потребуется 4000 томов такой книги.

Однако генетики начали обсуждать именно эту устрашающую задачу. Фактически, ровно через год после опубликования полного генома вируса Эпштейна—Барра произошла встреча в Калифорнийском университете, на которой обсуждался вопрос о возможности прочтения полной нуклеотидной последовательности человеческого генома.

В течение 1986 года благодаря усилиям ряда выдающихся ученых и удивительного прогресса в технологиях выполнение этой идеи сдвинулось с места. В 1987 году комитет экспертов порекомендовал Министерству энергетики США выделить 1 млрд долларов на картирование и секвенирование генома человека в течение нескольких последующих лет. В том же году на рынок был выпущен первый автоматический прибор для секвенирования ДНК.

Первый автоматический секвенатор ДНК

Оба метода секвенирования ДНК, Зангера и Максама — Гилберта, требовали больших затрат времени и труда, кроме того, они были очень дорогими. Казалось очевидным, что процесс следует автоматизировать, что и было сделано для генетиков Лероем Худом (Leroy Hood) в 1986 году, как раз во время начала дискуссии по секвенированию генома человека

Работая с группой сотрудников. Худ, биолог Калифорнийского института технологии, улучшил метод Зангера. Зангер использовал радиоактивные метки, что приводило к ряду трудностей: метка была нестабильна, вредна для здоровья исследователей и требовала отдельных гелей для каждого из четырех оснований ДНК.

Худ разработал новый метод, в котором использовались флюоресцирующие красители различного цвета для каждого основания ДНК. С цветной кодировкой больше не приходилось проводить реакцию на четырех отдельных гелях.

Использование красителей позволило Худу автоматизировать процесс учета результатов. В первоначальном методе Зангера последовательности оснований учитывались по эффекту «авторадиограммы» радиоактивной метки различных фрагментов ДНК на фотопленке. Полученные данные исследователю приходилось вручную заносить в компьютер.

В автоматическом приборе Худа лазерный луч вызывал свечение красителей различным цветом. Оно обнаруживалось и анализировалось непосредственно компьютером.

Прибор Худа был представлен на рынке компанией Applied Biosystems Inc. в 1986 году и с тех пор был значительно улучшен. К 1999 году полностью автоматизированный прибор мог секвенировать до 150 млн пар оснований в год. Новые модели оказались еще быстрее.

В 1988 году Министерство энергетики США и Национальный институт здоровья США объединили усилия в проекте «Геном человека», директором которого был назначен Джеймс Уотсон. После бурных дискуссий, пререканий и планирования было официально объявлено, что проект начнется в октябре 1990 года.

Уотсон ушел из проекта через два года из-за споров о патентовании отдельных генов Национальным институтом здоровья. Его заменил в 1993 году Френсис Коллинс, открывший ген фиброза мочевого пузыря.

Вскоре после назначения Коллинса директором биолог Дж. Крейг Вентер (J. Graig Venter) ушел из Национального института здоровья, чтобы организовать Институт исследования геномов (The Institute of Genomic Research), некоммерческую компанию в Роквилле, штат Мэриленд. Сестринская коммерческая компания Human Genome Science была организована одновременно для коммерческого использования полученных ТИГР продуктов и результатов. Вентер шокировал ученый мир образованием новой компании, названной Celera, и заявлением, что она секвенирует геном человека за три года и потратит на это всего 300 млн долларов. Проще говоря, он верил, что обладает лучшим способом секвенирования человеческого генома.

Вентер был кровно заинтересован в ускорении процесса исследований в области генетики. Сразу после начала выполнения проекта «Геном человека» он продемонстрировал эффективный метод для поиска генов и определения их функций. Метод был назван «Метки для выражающихся последовательностей» (МВП) и был основан на открытии комплементарных ДНК (кДНК). Они представляют собой продукт «обратной транскрипции» молекул мРНК, получаемых при транскрипции генов, кДНК несут ту же информацию, что и мРНК, но преимущество этих молекул заключается в гораздо большей стабильности и долговечности.

МВП — это клонированные фрагменты молекул кДНК, которые были частично секвенированы на протяжении нескольких сот оснований с каждого конца молекулы.

В 1991 году Вентер опубликовал результаты пилотного проекта по использованию МВП. Он доказал, что МВП могут использоваться для определения новых генов и помочь в картировании хромосомных генов. Он также продемонстрировал точность новой автоматизированной технологии секвенирования ДНК.

В 1995 году Вентер с соавторами опубликовали первый полностью секвенированный геном самореплицирующегося свободно живущего организма (другими словами, не вируса), бактерии Haemophilus influenzae Rd. Ее геном в 10 раз длиннее генома любого из секвенированных геномов вирусов. Вентер использовал совершенно новый подход к секвенированию генома бактерии. Метод, названный произвольным секвенированием полного генома (но более известный как произвольное секвенирование методом дробовика), позволял собрать полный геном из частично секвенированных фрагментов ДНК при помощи компьютерной модели.

Копии ДНК бактерий были разрезаны на куски произвольной длины от 200 до 1600 пар оснований. Эти фрагменты были секвенированы частично, по несколько сот оснований с каждого конца молекулы. (Были также секвенированы и более длинные фрагменты по 15 000 — 20 000 пар основний.) Полученные последовательности были заряжены в компьютер, который их сравнивал, распределял по группам и по сходству. Первыми идентифицировались неповторяющиеся последовательности, а затем — повторяющиеся последовательности фрагментов. Длинные фрагменты помогали установить порядок часто повторяющихся, почти идентичных последовательностей. Для заполнения пробелов между последовательностями использовались различные технологии.

Секвенирование генома Haemophilus influenzae Rd заняло один год. Была определена последовательность 1 830 137 пар оснований и 1749 генов, расположенных на 24 304 фрагментах. Достигнутый успех доказал, что новая технология, произвольное секвенирование методом дробовика, может быть применима для быстрого и точного секвенирования целых геномов.

Все это значило, что заявление Вентера о быстром секвенировании генома человека и опережении проекта «Геном человека», финансируемого из общественных фондов, имеет под собой основание. Это привело к интенсификации проекта «Геном человека». В октябре 1998 года НИХ и ДОЕ установили новую цель — завершить черновой план человеческого генома в 2001 году (к тому самому времени, к которому его обещал получить Вентер), а полностью завершить проект — в 2003 году, а не в 2005, как было запланировано. Несколько месяцев спустя завершение чернового плана проекта было перенесено на весну 2000 года.

И, наконец, на церемонии в Белом доме в июне 2000 года проект «Геном человека» и компания «Селера» совместно объявили о получении черновых вариантов полной последовательности оснований генома человека. Проект «Геном человека» опубликовал рабочий вариант генома человека (выполненный на 90%) в журнале Nature в феврале 2001 года, a Celera представила результаты своего проекта в журнале Science в том же месяце. Анализ чернового варианта генома человека выявил около 30 тыс. генов у человека; но последующий анализ привел к сокращению количества до менее чем 25 тыс.

Настоящее число генов, каково бы оно ни было, гораздо меньше, чем приведено в первоначальных оценках. Тогда предполагаемое количество генов достигало 140 тыс. Считалось, что один ген кодирует один белок. Но 25 тыс. генов не хватает, чтобы обеспечить все различные белки в теле человека. Представляется возможным, что один ген может направлять синтез многих различных белков. Один ген, в среднем, может кодировать 5 — 6 белков (механизмом для такого процесса вполне может служить альтернативный сплайсинг, описанный в предыдущей главе).

Окончательный вариант полной последовательности генома человека был опубликован проектом «Геном человека» в 2003 году. Однако до сих пор некоторые элементы генома не поддаются секвенированию современными технологиями, а наши знания о геноме человека остаются неполными.


Оставить комментарий

Ваш комментарий