Проект «Геном человека»

Проект «Геном человека» (The Human Genome Project) – это международный исследовательский проект, начатый в 1990 г. Его целью было определить полную последовательность нуклеотидов в...

Print Friendly Version of this pagePrint Get a PDF version of this webpagePDF

Логотип проекта

Логотип проекта

marina-fr

Проект «Геном человека» (The Human Genome Project) – это международный исследовательский проект, начатый в 1990 г. Его целью было определить полную последовательность нуклеотидов в человеческом геноме. Основной объём работ был выполнен в университетах и исследовательских центрах США, Канады и Великобритании. Предполагалось участие и других стран, в том числе СССР, но реально их вклад оказался небольшим, несмотря на то, что в своё время именно наши исследователи были одними из инициаторов и активных участников проекта.

Общая длина линейных молекул ДНК, представляющих разные человеческие хромосомы – 3х109 пар нуклеотидов (ДНК – это двуцепочечная молекула, в которой последовательность одной нити целиком определяет последовательность другой, поэтому предпочитают говорить о парах нуклеотидов. Дополнительная проблема состоит в том, что реально хромосомы человека – парные, последовательность ДНК в каждой хромосоме из пары своя, хотя обычно и отличается незначительно. В данном проекте имелась в виду обобщённая эталонная последовательность). Технологии прочтения последовательности ДНК на момент начала проекта были существенно слабее нынешних, но главной проблемой была (и во многом остаётся) сборка цельного текста из прочтённых фрагментов.

Представьте себе, что из нескольких экземпляров «Войны и мира» вырезали определённую главу, в каждом случае нарезали эту главу на кусочки (случайным образом, так что кусочки из разных экземпляров будут перекрываться), а затем попытались снова её собрать. Затем вообразите, что собираемая книга – не «Война и мир», а какое-либо авангардное произведение, где на некоторых страницах может много раз подряд повторяться одно слово или фраза. В дополнение представьте, что нарезали вы разные издания в несколько отличавшейся авторской редакции. Теперь вам будет ясна сложность задачи.

Основной проект финансировался правительством США и британским благотворительным обществом Wellcome Trust, дотировавшими ряд институтов и университетов (3 млрд долларов). В 1998 году американский исследователь Крейг Вентер и его фирма «Celera Genomics» запустили аналогичное исследование, финансированное частным капиталом (300 млн долларов). Как Вентер, так и некоторые исследователи, принимавшие участие в государственной программе, рассчитывали на возможность патентования полученных данных. Но в марте 2000 года президент США Билл Клинтон заявил, что последовательность генома не может быть запатентована и должна быть свободно доступна для всех исследователей. В настоящий момент так оно и есть. Существуют геномные браузеры, например UCSC Genome Browser,

https://genome-euro.ucsc.edu/cgi-bin/hgGateway?hgsid=446744093_jeVqK5lqAtu5k6630TEkzBkQ5sco&redirect=manual&source=genome.ucsc.edu

пользуясь которыми можно получить открытый доступ к любой (с некоторыми оговорками) эталонной последовательности на любой из хромосом человека. Основные ограничения связаны с последовательностями ДНК конкретных лиц с их индивидуальными особенностями. Важно отметить, что новые научные результаты в этой области (эпигенетические особенности конкретных участков ДНК, генетическая изменчивость и т.д.) «привязываются» к этой эталонной последовательности и часто доступны непосредственно в браузерах.

Вентер использовал несколько более эффективные методы секвенирования (определения первичных последовательностей) и алгоритмы их сборки «на малых масштабах», но частично пользовался результатами государственной программы для сборки «на больших масштабах». То, что черновой вариант геномной последовательности человека был получен к 2000 году, а практически полный – к 2003, то есть на два года раньше, чем планировалось, обычно связывают с конкуренцией двух исследовательских групп. Однако ещё большую роль сыграл рост вычислительных мощностей и совершенствование программ для сборки генома. Развившиеся в последние годы методики секвенирования нового поколения были бы невозможны без упомянутых достижений. Программы для сборки геномов в настоящее время продолжают совершенствоваться, и большинство их находится в открытом доступе.

Тем не менее, до сих пор не полностью расшифрованы содержащие много повторов участки генома, особенно теломеры (концы хромосом) и центромеры (области, связанные с прикреплением веретена деления). С последовательностями, кодирующими белки, дела обстоят гораздо лучше, но там, где мы имеем дело с областями, где лежат рядом много похожих друг на друга генов (например, иммуноглобулиновых), проблема тоже решена не вполне.

Продолжим нашу аналогию. Даже расшифрованный геном человека похож на средневековую рукопись, где слова не отделялись друг от друга. Кодирующие белки участки (экзонов) составляют всего 3% генома и «тонут» среди интронов (участков, которые транскрибируются, но потом соответствующие им куски вырезаются из РНК) и межгенных последовательностей. Для выделения отдельных генов из генома он должен быть аннотирован. Хотя количество кодирующих белки генов у человека оказалось вполне сравнимым с таковым у других живых организмов (20-25 тыс), в правильности выделения их границ, а также в функциональности, исследователи далеко не всегда уверены. Часть аннотации, ввиду обширности задачи, была произведена с помощью машинных алгоритмов и не проконтролирована вручную. Функции более половины человеческих белков биохимически не исследованы, и судить о них приходится косвенно, по принадлежности белка к определённому семейству (группе белков, сходных по первичным последовательностям). Биохимический анализ оказался куда более дорогой задачей, чем расшифровка генома.

Тем не менее, успех проекта «Геном человека» создал для исследователей множество новых возможностей. Появилась возможность «привязать» РНК-транскрипты к тому месту генома, с которого они были синтезированы. Одним из интересных результатов было понимание того факта, что многие транскрипты в клетке не являются матричными РНК, предназначенными для синтеза белка, закодированы не в экзонах и выполняют иные функции. Примером могут быть микроРНК, участвующие в регуляции трансляции, назначение многих других подобных молекул не вполне ясно.

doc_photo.php

Стало возможным «привязать» к определённому месту генома также мутации – как точечные, то есть изменения одного нуклеотида, так и более крупные вариации. В большинстве исследований такие вариации у разных индивидов регистрируются выборочно, но и полный геном конкретного человека гораздо легче «пересобрать», имея референсный, чем собрать заново. Облегчена и сборка геномов приматов, и попытки понять, чем именно отличался от нашего геном, скажем, неандертальца.

Естественно, с появлением возможности для того, чтобы изучить генетическую изменчивость в самых разных местах генома множества людей, появились проекты, в которых пытаются связать её с определёнными человеческими особенностями, прежде всего – с предрасположенностью к тем или иным заболеваниям. Это так называемый полногеномный поиск ассоциаций (англ. GWAS, Genome-Wide Association Studies). Как известно, заболевания, связанные с мутацией одного конкретного гена, являются обычно наиболее тяжёлыми, но и наиболее редкими. Такие заболевания, как гипертония или диабет второго типа связаны со множеством факторов, в том числе наследственных. Подобные исследования столкнулись с рядом проблем, частично предсказанных Ричардом Левонтиным, но об этом – в следующий раз.

В заключение отмечу, что современную генетику продвинула не только сама расшифровка генома человека, но открытый и интегрированный характер большинства полученных данных.

 

Итоговые публикации

Итоговые публикации

Об авторе wolf_kitses