15 апреля 2021 года.
Первый проект генома человека был опубликован 20 лет назад, в 2001 году, занял почти три года и стоил от 500 миллионов до 1 миллиарда долларов США. Проект «Геном человека» позволил ученым прочитать почти от конца до конца 3 миллиарда пар оснований ДНК — или «букв», — которые биологически определяют человека.
Этот проект позволил новому поколению исследователей, таких как я, который в настоящее время является постдокторантом Национального института рака, определить новые мишени для лечения рака, создать мышей с человеческой иммунной системой и даже создать веб-страницу, на которой любой человек сможет просмотреть весь геном человека с той же легкостью, с какой вы пользуетесь Google Maps.
Первый полный геном был получен от нескольких анонимных доноров, чтобы попытаться создать эталонный геном, представляющий не только одного человека. Но это не позволило охватить все разнообразие человеческих популяций в мире. Нет двух одинаковых людей, и двух одинаковых геномов тоже нет. Если бы исследователи хотели понять человечество во всем его многообразии, потребовалось бы секвенировать тысячи или миллионы полных геномов. Сейчас такой проект находится в стадии реализации.
Понимание генетического разнообразия
Богатство генетических различий между людьми делает каждого человека уникальным. Но генетические изменения также являются причиной многих расстройств и делают некоторые группы людей более восприимчивыми к определенным заболеваниям, чем другие.
Во время реализации проекта «Геном человека» исследователи также занимались секвенированием полных геномов таких организмов, как мыши, плодовые мушки, дрожжи и некоторые растения. Огромные усилия, затраченные на создание этих первых геномов, привели к революции в технологиях, необходимых для чтения геномов. Благодаря этим достижениям, вместо того чтобы потратить годы и сотни миллионов долларов на секвенирование всего генома человека, теперь это занимает несколько дней и стоит всего тысячу долларов. Секвенирование генома сильно отличается от услуг по генотипированию, таких как 23 and Me или Ancestry, которые изучают лишь крошечную часть участков генома человека.
Благодаря технологическому прогрессу ученые получили полные последовательности геномов тысяч людей со всего мира. В настоящее время такие инициативы, как Genome Aggregation Consortia, прилагают усилия для сбора и систематизации этих разрозненных данных. На данный момент эта группа смогла собрать около 150 000 геномов, которые демонстрируют невероятное генетическое разнообразие человека. В рамках этого набора исследователи обнаружили более 241 миллиона различий в геномах людей, в среднем по одному варианту на каждые восемь пар оснований.
Большинство этих вариаций очень редки и не оказывают никакого влияния на человека. Однако среди них скрываются варианты с важными физиологическими и медицинскими последствиями. Например, некоторые варианты в гене BRCA1 предрасполагают некоторые группы женщин, например евреев-ашкенази, к раку яичников и груди. Другие варианты в этом гене приводят к тому, что смертность от рака груди у некоторых нигерийских женщин выше нормы.
Лучший способ выявить такие варианты на уровне популяции — это геномные исследования ассоциаций, в которых геномы больших групп людей сравниваются с контрольной группой. Но болезни сложны. Образ жизни человека, симптомы и время начала заболевания могут сильно различаться, и влияние генетики на многие болезни трудно различить. Прогностическая сила нынешних геномных исследований слишком мала, чтобы выявить многие из этих эффектов, потому что не хватает геномных данных.
Понимание генетики сложных заболеваний, особенно тех, которые связаны с генетическими различиями между этническими группами, — это, по сути, проблема больших данных. И исследователям нужно больше данных.
1 000 000 геномов
Чтобы удовлетворить потребность в дополнительных данных, Национальный институт здоровья США начал программу под названием «Все мы». Проект направлен на сбор генетической информации, медицинских карт и сведений о привычках, связанных со здоровьем, с помощью опросов и носимых устройств более чем миллиона жителей США в течение 10 лет. Его цель — собрать больше данных от недопредставленных групп меньшинств, чтобы облегчить изучение неравенства в области здравоохранения. Проект «Все мы» был открыт для публичной регистрации в 2018 году, и с тех пор образцы предоставили более 270 000 человек. Проект продолжает набирать участников из всех 50 штатов. В нем участвуют многие академические лаборатории и частные компании.
Эти усилия могут принести пользу ученым из самых разных областей. Например, невролог может искать генетические вариации, связанные с депрессией, учитывая при этом уровень физической активности. Онколог может искать варианты, которые коррелируют с пониженным риском развития рака кожи, одновременно изучая влияние этнического происхождения.
Миллион геномов и сопутствующая информация о здоровье и образе жизни позволят получить огромное количество данных, которые позволят исследователям выявить влияние генетических вариаций на развитие заболеваний не только у отдельных людей, но и в различных группах населения.
Темная материя человеческого генома
Еще одно преимущество этого проекта заключается в том, что он позволит ученым узнать о тех частях человеческого генома, которые в настоящее время очень трудно изучить. Большинство генетических исследований посвящено тем частям генома, которые кодируют белки. Однако они составляют всего 1,5% генома человека.
Мои исследования посвящены РНК — молекуле, которая превращает сообщения, закодированные в ДНК человека, в белки. Однако РНК, происходящие из 98,5 % человеческого генома, которые не образуют белки, сами по себе выполняют огромное количество функций. Некоторые из этих некодирующих РНК участвуют в таких процессах, как распространение рака, эмбриональное развитие или контроль над Х-хромосомой у женщин. В частности, я изучаю, как генетические вариации могут влиять на сложное складывание, которое позволяет некодирующим РНК выполнять свою работу. Поскольку проект «Все мы» включает в себя все кодирующие и некодирующие части генома, он станет самым большим набором данных, имеющих отношение к моей работе, и, надеюсь, прольет свет на эти загадочные РНК.
Первый геном человека дал толчок 20 годам невероятного научного прогресса. Я думаю, что почти наверняка огромный набор данных о геномных вариациях откроет ключи к разгадке сложных заболеваний. Благодаря масштабным популяционным исследованиям и проектам с большими данными, таким как All of Us, ученые прокладывают путь к тому, чтобы в ближайшее десятилетие ответить на вопрос, как наша индивидуальная генетика формирует наше здоровье.
Автор — Ксавье Бофилл де Рос, научный сотрудник отдела биологии РНК, Национальные институты здоровья.