База человечества

Российские эксперты в области генетики обсуждают цели и задачи секвенирования всего человечества

Компания EMC совместно с ФРИИ провела видеомост по проблемам доступа к генетической информации между экспертами из Калифорнийского университета в Санта Круз и российскими учеными, занимающимися проблемами работы с генной информацией. В основном обсуждался вопрос об организации доступа к уже полученным генетическим данным. Сейчас секвенирование ДНК становится доступной процедурой, которая стоит несколько сотен долларов. Это позволяет активно использовать эту информацию для самых разнообразных целей.

Ученые рассматривают ДНК человека прежде всего как возможность определения генетических заболеваний для применения так называемых таргетированных препаратов – лекарств, которые эффективно действуют только на строго ограниченную группу пациентов с определенными симптомами. В США таких препаратов свыше 150, а в России, по словам Валерия Ильинского, генерального директора и сооснователя компании Genotek, не больше десятка. Впрочем, генная информация может быть использована и для криминалистических задач – результаты секвенирования принимаются в судах некоторых стран в качестве доказательства. Более отдаленные перспективы применения генной информации – исследование исторической миграции населения земного шара и биометрическая аутентификация.

Однако для эффективного использования информации с секвенсеров нужно собрать достаточно большую базу ДНК разных людей с различными мутациями, чтобы можно было делать выводы о том, какие фрагменты генов могут быть полезны и для чего. В то же время сейчас, по словам Дэвида Хауссера, эксперта по биоинформатике Калифорнийского университета в Санта-Круз и одного из основателей Международного альянса по геномике и здравоохранению (Global Alliance for Genomics and Health), генетические данные собираются различными клиниками, исследовательскими институтами и другими организациями независимо, в различных форматах и снабжаются различными атрибутами. Собственно, для медицинских целей важно не только сохранить ДНК, но и зафиксировать полную клиническую картину пациента. Только такая база данных интересна для исследователей, которые пытаются обнаружить связи между фрагментами генов и болезнями.

В частности, Международный альянс по геномике и здравоохранению планирует преодолеть проблему разобщенности баз данных ДНК. Альянс разрабатывает универсальную модель данных, описывающую модель ДНК и API для доступа к таким базам данных, построенных по этой модели. Исходные тексты проекта можно найти на GitHab в разделе Альянса GA4GH. Кроме того, Альянс поддерживает проект Beacons («маячок»), с помощью которого пациент или врач, выделив отдельный фрагмент ДНК – «маячок», сможет осуществить поиск по другим базам для обнаружения аналогичной мутации. Отвечая на вопрос журнала Connect, Дэвид Хауссер оценил, что уже через пять-десять лет появится возможность секвенировать ДНК всех людей на планете.

Следует отметить, что сейчас, по словам Андрея Запария, ведущего разработчика в области биоинформатики исследовательского центра Dell EMC Россия в Сколково, результаты одного секвенирования занимают около 200–500 Гигабайт, и они плохо сжимаются по объему. «Мы еще не знаем, что именно из этого объема информации может понадобиться в дальнейшем, поэтому приходится хранить весь объем «сырых» данных, – пояснил Андрей Запарий. – Сейчас пока нет технической возможности хранить данные ДНК всех людей. Но проблема с составлением общей базы ДНК будет не техническая, а юридическая или организационная».

Действительно, в законодательстве разных стран именно медицинская информация относится к категории персональной, и информация о ДНК является таковой. Это затрудняет обмен данными и создание единого банка ДНК, поскольку далеко не все люди согласятся, чтобы именно эти сведения были публичными и общедоступными. Один из вариантов решения проблемы – использование технологии блокчейн, когда каждый житель, поместивший в такую базу данных сведения о своей ДНК, сможет точно контролировать, кому и к какому фрагменту генов разрешается доступ. Разработка такой базы уже ведется. Вполне возможно, что часть генов будет общедоступной, поскольку она будет описывать человека как вид и не содержать сведения об индивидуальности. Однако даже для выявления таких особенностей необходимо тщательное и подробное исследование на большой выборке генов. Именно этим и будут заниматься различные исследователи генома человека в ближайшие десять лет.

Валерий Коржов

Поделиться:
Спецпроект

Напряженный трафик или Современные требования к инфраструктуре ЦОД

Подробнее
Спецпроект

Специальный проект "Групповой спутниковый канал для территориально-распределенной сети связи"

Подробнее

Подпишитесь
на нашу рассылку