Антон Банкевич СПб АУ РАН
Антон Банкевич: «Попытки осуществить прочтение генома человека целиком продолжаются, но пока никто даже не приблизился к решению этой задачи»

Однако вопреки достаточно распространенному мнению, представление всего человека в виде массива данных может быть достигнуто в обозримом будущем только в фантастических рассказах. Пока даже не понятно, возможно ли оно когда-нибудь в принципе.

Несмотря на такую неопределенность, компьютерные технологии позволили биологам лучше понять, как устроены и развиваются различные организмы, а это способствует решению некоторых проблем человечества. В то же время, биоинформатика страдает от отсутствия необходимого для нее качественного программного обеспечения. Следовательно, у российских софтверных компаний, которые способны решать сложнейшие алгоритмические задачи, есть шанс сделать существенный вклад в дальнейшее изучение различных организмов (см. также «Время биоинформатики», Computerworld Россия, 18 марта 2013).

«Чтение» абстрактного

По словам Николая Вяххи, куратора образовательных программ лаборатории алгоритмической биологии Санкт-Петербургского Академического университета РАН, значительно расширить возможности в изучении человека посредством компьютерных технологий позволила реализация глобального проекта Human Genome Project стоимостью около 3 млрд долл. После его завершения в начале 2000-х мировые СМИ сообщили о прочтении генома человека. Появились даже следующие смелые утверждения: «мы стали рассматривать организм как конечный список компонентов, как своего рода периодическую таблицу».

Однако и тогда для таких заявлений не было оснований, а сейчас их, возможно, еще меньше. Сообщения о прочтении генома человека являлись сильным упрощением, искажающим действительность. На самом деле были прочитаны только фрагменты генома (как предполагается, самые важные) нескольких человек, подобранных так, чтобы было максимально охвачено разнообразие вида Homo Sapiens. Потом из этих фрагментов был собран геном абстрактного человека. Считается, что этот геном минимум на 99,9% совпадает с геномом любого землянина. «У всех, кто находится в этой аудитории, геном различается не более чем на 0,01%», — предположил Вяххи, выступая на семинаре, который прошел в главном центре разработки JetBrains, расположенном в Санкт-Петербурге.

Тем не менее, биологов чтение фрагментов с последующей сборкой, судя по всему, не устраивает, потому что они просят прочитать ДНК человека целиком (то есть, строку из 3 млрд символов). «Попытки осуществить такое прочтение продолжаются, но пока никто даже не приблизился к решению этой задачи, поскольку требуются слишком большие вычислительные мощности», — говорит Антон Банкевич, исследователь лаборатории алгоритмической биологии СПб АУ РАН.

Конечен ли человек

Существующий способ «прочтения» генома через сборку фрагментов очень сложен. «Представьте, — предлагает Банкевич, — что взорвали стопку вышедшей газеты, а потом из груды обрывков с несколькими буквами нужно восстановить то, что было написано в номере. Наша задача при сборке генома еще сложней. Если в алфавите 26 или 32 буквы в зависимости от языка, то в геноме только четыре. Когда восстанавливаем текст, то можем опираться на известные смысловые связи между словами. В геноме же большинство взаимосвязей еще не определены».

Изначально геном человека вообще представлял собой несколько сот гигабайт данных, с которыми было не понятно, что делать. Со временем ученые определили некоторые зависимости, позволяющие создавать новые антибиотики или диагностировать ряд болезней, которые никак не определялись с помощью традиционной диагностики. Однако остается очень много непонятного. Прежде всего то, как влияют особенности генома на жизнь человека. По словам Олега Шпынова, сотрудника JetBrains BioLabs, раньше считалось, что в геноме 95% сведений никакого значения не имеет и является информационным мусором. Впоследствии выяснилось, что это не так.

Какая-то информация заложена еще и в белках, а ее, в отличие от ДНК, вообще не научились читать. Поэтому в то, что организм человека в принципе можно целиком представить в цифровом виде, на данный момент можно только верить или не верить. Специалисты в области биоинформатики стараются об этом вообще не думать, ссылаясь на то, что это вопрос философский. Они сосредоточены на решении практических задач создания инструментария для получения и обработки информации, заложенной ДНК, чтобы выявить ранее неизвестные взаимозависимости.