Проект «Геном человека» позволил собрать воедино только 92% ДНК — теперь ученые наконец заполнили оставшиеся 8%

Mendel third-party content placeholder. Categories: Geography & Travel, Health & Medicine, Technology, and Science

Эта статья перепечатана с сайта The Conversation по лицензии Creative Commons. Читайте оригинал статьи, которая была опубликована 31 марта 2022 года.

Когда в 2003 году проект «Геном человека» объявил о создании первого генома человека, это было знаменательным событием — впервые был раскрыт ДНК-чертеж человеческой жизни. Но в этом была и загвоздка — на самом деле они не смогли собрать воедино всю генетическую информацию, содержащуюся в геноме. Там были пробелы: незаполненные, часто повторяющиеся участки, которые было слишком сложно собрать воедино.

Благодаря развитию технологий, позволяющих обрабатывать повторяющиеся последовательности, ученые наконец заполнили эти пробелы в мае 2021 года, а 31 марта 2022 года был официально опубликован первый полный геном человека.

Я геномный биолог, изучающий повторяющиеся последовательности ДНК и то, как они формируют геномы на протяжении эволюционной истории. Я был частью команды, которая помогла охарактеризовать повторяющиеся последовательности, отсутствующие в геноме. И вот теперь, когда геном человека стал по-настоящему полным, эти нераскрытые повторяющиеся регионы впервые изучены в полном объеме.

Недостающие фрагменты головоломки

Немецкий ботаник Ганс Винклер придумал слово «геном» в 1920 году, объединив слово «ген» с суффиксом «-оме», означающим «полный набор», чтобы описать полную последовательность ДНК, содержащуюся в каждой клетке. Исследователи и спустя столетие используют это слово для обозначения генетического материала, из которого состоит организм.

Один из способов описать, как выглядит геном, — сравнить его со справочником. В этой аналогии геном — это антология, содержащая инструкции ДНК для жизни. Он состоит из огромного количества нуклеотидов (букв), которые упакованы в хромосомы (главы). Каждая хромосома содержит гены (параграфы) — участки ДНК, которые кодируют специфические белки, позволяющие организму функционировать.

Хотя каждый живой организм имеет геном, размер этого генома варьируется от вида к виду. Слон использует ту же форму генетической информации, что и трава, которую он ест, и бактерии в его кишечнике. Но нет двух совершенно одинаковых геномов. Некоторые из них короткие, как геном насекомоядной бактерии Nasuia deltocephalinicola, в котором всего 137 генов на 112 000 нуклеотидов. Некоторые, как 149 миллиардов нуклеотидов цветкового растения Paris japonica, настолько длинны, что трудно понять, сколько генов в них содержится.

Но гены в их традиционном понимании — участки ДНК, кодирующие белки, — это лишь малая часть генома организма. На самом деле, они составляют менее 2% человеческой ДНК.

Геном человека содержит около 3 миллиардов нуклеотидов и чуть менее 20 000 белок-кодирующих генов — примерно 1 % от общей длины генома. Остальные 99 % — это некодирующие последовательности ДНК, которые не производят белки. Некоторые из них являются регуляторными компонентами, которые работают как коммутатор, контролируя работу других генов. Другие — псевдогены, или геномные реликты, утратившие способность функционировать.

Более половины генома человека — это повторяющиеся гены, состоящие из множества копий практически идентичных последовательностей.

Что такое повторяющаяся ДНК?

Простейшей формой повторяющейся ДНК являются блоки ДНК, повторяющиеся снова и снова в тандеме, называемые сателлитами. Хотя количество сателлитной ДНК в геноме у разных людей различно, они часто группируются на концах хромосом в областях, называемых теломерами. Эти участки защищают хромосомы от разрушения во время репликации ДНК. Они также находятся в центромерах хромосом — области, которая помогает сохранить генетическую информацию в целостности при делении клеток.

Исследователи до сих пор не имеют четкого представления о всех функциях сателлитной ДНК. Но поскольку спутниковая ДНК образует уникальные узоры у каждого человека, судебные биологи и генеалоги используют этот геномный «отпечаток пальца» для сопоставления образцов на месте преступления и отслеживания родословной. Более 50 генетических заболеваний связаны с вариациями в сателлитной ДНК, включая болезнь Хантингтона.

Другим распространенным типом повторяющейся ДНК являются транспозируемые элементы, или последовательности, которые могут перемещаться по геному.

Некоторые ученые называют их эгоистичными ДНК, потому что они могут вставлять себя в любое место генома, невзирая на последствия. В процессе эволюции человеческого генома многие транспозируемые последовательности собрали мутации, подавляющие их способность перемещаться, чтобы избежать вредных прерываний. Но некоторые из них, вероятно, все еще могут перемещаться. Например, вставки транспозируемых элементов связаны с некоторыми случаями гемофилии А, генетического заболевания кровотечения.

Но транспозиционные элементы не только разрушительны. Они могут выполнять регуляторные функции, помогая контролировать экспрессию других последовательностей ДНК. Когда они сосредоточены в центромерах, то могут помогать поддерживать целостность генов, имеющих фундаментальное значение для выживания клеток.

Они также могут способствовать эволюции. Недавно исследователи обнаружили, что вставка транспозируемого элемента в ген, важный для развития, может быть причиной того, что у некоторых приматов, включая человека, больше нет хвостов. Хромосомные перестройки, вызванные транспозиционными элементами, даже связаны с возникновением новых видов, таких как гиббоны в Юго-Восточной Азии и валлаби в Австралии.

Завершение геномной головоломки

До недавнего времени многие из этих сложных регионов можно было сравнить с дальней стороной Луны: известно, что они существуют, но их не видно.

Когда в 1990 году стартовал проект «Геном человека», технологические ограничения не позволяли полностью раскрыть повторяющиеся участки генома. Имеющиеся технологии секвенирования позволяли считывать только около 500 нуклеотидов за раз, и для воссоздания полной последовательности короткие фрагменты должны были накладываться друг на друга. Исследователи использовали эти перекрывающиеся сегменты для определения следующих нуклеотидов в последовательности, постепенно расширяя сборку генома по одному фрагменту за раз.

Эти повторяющиеся пробелы были похожи на сборку пасмурного неба из 1000 кусочков: Когда каждый кусочек выглядит одинаково, как узнать, где начинается одно облако и заканчивается другое? Поскольку во многих местах участки почти идентично перекрывались, полное секвенирование генома по частям стало невыполнимой задачей. Миллионы нуклеотидов остались скрытыми в первой итерации генома человека.

С тех пор фрагменты последовательности постепенно заполняют пробелы в геноме человека. И вот в 2021 году консорциум Telomere-to-Telomere (T2T) — международный консорциум ученых, работающий над завершением сборки генома человека от конца до конца, — объявил, что все оставшиеся пробелы наконец-то заполнены.

Это стало возможным благодаря усовершенствованию технологии секвенирования, способной считывать более длинные последовательности длиной в тысячи нуклеотидов. Получив больше информации о местоположении повторяющихся последовательностей в общей картине, стало проще определить их место в геноме. Подобно упрощению головоломки из 1000 деталей до головоломки из 100 деталей, последовательности с длинным считыванием впервые позволили собрать большие повторяющиеся регионы.

С ростом возможностей технологии секвенирования ДНК с длинным прочтением генетики могут открыть новую эру геномики, впервые распутав сложные повторяющиеся последовательности в разных популяциях и видах. А полный, без пробелов, геном человека предоставляет исследователям бесценный ресурс для изучения повторяющихся областей, которые определяют генетическую структуру и вариативность, эволюцию видов и здоровье человека.

Но один полный геном — это еще не все. Продолжаются усилия по созданию разнообразных геномных образцов, которые бы полностью представляли человеческую популяцию и жизнь на Земле. С появлением более полных геномных эталонов «теломера к теломере» понимание учеными повторяющейся темной материи ДНК станет более ясным.

Автор — Габриэль Хартли, кандидат наук в области молекулярной и клеточной биологии, Университет Коннектикута.

Ссылка на основную публикацию