Это направление компьютерных наук, только зарождающееся в России, представили сотрудники Санкт-Петербургского Академического университета РАН и лаборатории BioLabs. Несмотря на свою молодость и небольшой опыт работы, они уже могут похвастаться разработкой, которая отмечена публикацией в Journal of Computational Biology и используется во многих странах.

Николай Вяххи

Николай Вяххи: «Мы хотим сделать лучший в мире геномный ассемблер и получить известность в среде биологов»

Лаборатория BioLabs создана по инициативе Сергея Дмитриева, одного из основателей JetBrains. Дмитриев был главой JetBrains c момента ее основания в 2000 году и до 2012 года. В настоящее время, занимая пост президента компании, он занимается инвестициями в новые перспективные стартапы и научной деятельностью. Биологическим направлением он заинтересовался около трех лет назад и начал формировать группу специалистов, которые обладают хорошими знаниями алгоритмов и навыками программирования систем Больших Данных.

Лаборатория является скорее научным проектом, чем коммерческим. BioLabs занимается решением чисто научных проблем, а не получением прибыли. Однако не исключено, что на базе лаборатории биоинформатики когда-нибудь будет создано полноценное бизнес-подразделение.

Первые ростки

Групп специалистов, которые, как в BioLabs, профессионально занимаются биоинформатикой, в России немного, и почти все они появились в последние годы. С сентября 2011 года в СПб АУ РАН начался набор в магистратуру по программе «Алгоритмическая биоинформатика». В МФТИ кафедра биоинформатики появилась только в нынешнем учебном году. Такая же кафедра в прошлом году создана в Нижегородском государственном университете. В этом ряду выделяется МГУ, в котором уже с 2002 года существует факультет биоинженерии и биоинформатики.

В то же время, по словам Николая Вяххи, куратора образовательных программ лаборатории алгоритмической биологии СПб АУ РАН (он является также сотрудником JetBrains), во многих странах почти в каждом университете есть департамент биоинформатики, иногда больший по численности, чем все вместе взятые другие подразделения Санкт-Петербургского академического университета, которые относятся к компьютерным наукам.

«Биоинформатика начиналась с того, что биологи, изучая геном различных организмов, накапливали огромные массивы данных, с которыми не могли разобраться без компьютерной обработки. В результате они обращались за помощью к представителям Computer Science. Российские биологи по большей части такой проблемы не имели, поскольку им было сложно приобрести дорогостоящее оборудование и реагенты, необходимые для экспериментов», — рассказал Вяххи.

Относительно равные позиции

На первый взгляд может показаться, что отставание России в области биоинформатики огромно. Однако, если посмотреть на множество задач, которые предстоит решить, то все находятся примерно в одном положении — в начале пути. Биоинформатика еще очень молодая наука, которая хоть и бурно развивается в последние 10-12 лет, но пока во многом хаотична и не имеет необходимого качественного инструментария. К тому же для нее все-таки важнее знания информатики, чем биологии, а подготовка инженеров-программистов в России осуществляется на мировом уровне.

Биологи в России тоже, как правило, имеют хорошее базовое образование. Потому они готовы достаточно быстро научиться проводить эксперименты на уровне своих зарубежных коллег, если у них появится оборудование для секвенирования геномов. В последнее время положение здесь меняется — улучшилась ситуация с финансированием науки, а оборудование значительно подешевело — теперь оно стоит не миллионы, а десятки тысяч долларов.

В связи с этим можно ожидать появления в ближайшие годы огромного спроса на специалистов в области биоинформатики и такого же огромного дефицита этих специалистов. Скорее всего, проблема нехватки кадров будет мировой. Прогресс в биологии, достигнутый за прошедшее десятилетие благодаря компьютерным технологиям, не столько сужает круг задач, которые предстоит решить, сколько его расширяет. Таким образом, можно предположить, что работы хватит всем на многие годы вперед.

Для того чтобы выявить ранее неизвестные взаимосвязи в различных организмах (не только человека), во всем мире уже проводится огромное количество экспериментов. Однако, по словам Вяххи, эта работа идет во многом бездумно, хаотично и без надлежащего анализа получаемых данных. Серьезнейшей проблемой является отсутствие качественного программного обеспечения, необходимого биологам для того, чтобы разобраться в огромных массивах полученных данных. Решить эту проблему предстоит петербургским специалистам в области биоинформатики. В АУ РАН уже разработали геномный ассемблер SPAdes, предназначенный для сборки генома бактерий. Он распространяется бесплатно с исходными кодами под лицензией GPL. «Наверное, можно было его продавать, но мы стремимся к тому, чтобы сделать лучший в мире геномный ассемблер и получить известность в среде биологов», — заявил Вяххи.