Николай Вяххи СПб АУ РАН JetBrains
НИКОЛАЙ ВЯХХИ: «Мы хотим сделать лучший в мире геномный ассемблер и получить известность в среде биологов»

В Санкт-Петербурге в главном центре разработки компании JetBrains, которая специализируется на создании инструментов разработки программного обеспечения, прошел технологический семинар, посвященный биоинформатике. Это направление компьютерных наук, только зарождающееся в России, представили сотрудники Санкт-Петербургского академического университета РАН и лаборатории BioLabs. Несмотря на свою молодость и небольшой опыт работы, они уже могут похвастаться разработкой, которая отмечена публикацией в Journal of Computational Biology и используется во многих странах.

Лаборатория BioLabs создана по инициативе Сергея Дмитриева, одного из основателей JetBrains. Дмитриев был главой JetBrains c момента ее основания в 2000 году и до 2012 года. В настоящее время, занимая пост президента компании, он занимается инвестициями в новые перспективные стартапы и научной деятельностью. Биологическим направлением он заинтересовался около трех лет назад и начал формировать группу специалистов, которые обладают хорошими знаниями алгоритмов и навыками программирования систем Больших Данных.

Лаборатория является скорее научным проектом, чем коммерческим. Bio­Labs занимается решением чисто научных проблем, а не получением прибыли. Однако не исключено, что на базе лаборатории биоинформатики когда-нибудь будет создано полноценное бизнес-подразделение.

Первые ростки

Групп специалистов, которые, как в BioLabs, профессионально занимаются биоинформатикой, в России немного, и почти все они появились в последние годы. С сентября 2011 года в СПб АУ РАН начался набор в магистратуру по программе «Алгоритмическая биоинформатика». В МФТИ кафедра биоинформатики появилась только в нынешнем учебном году. Такая же кафедра в прошлом году создана в Нижегородском государственном университете. В этом ряду выделяется МГУ, в котором уже с 2002 года существует факультет биоинженерии и биоинформатики.

В то же время, по словам Николая Вяххи, куратора образовательных программ лаборатории алгоритмической биологии СПб АУ РАН (он является также сотрудником JetBrains), во многих странах почти в каждом университете есть департамент биоинформатики, иногда больший по численности, чем все вместе взятые другие подразделения Санкт-Петербургского академического университета, которые относятся к компьютерным наукам.

Относительно равные позиции

На первый взгляд может показаться, что отставание России в области биоинформатики огромно. Однако, если посмотреть на множество задач, которые предстоит решить, то все находятся примерно в одном положении — в начале пути. Биоинформатика еще очень молодая наука, которая хоть и бурно развивается в последние 10-12 лет, но пока во многом хаотична и не имеет необходимого качественного инструментария. К тому же для нее все-таки важнее знания информатики, чем биологии, а подготовка инженеров-программистов в России осуществляется на мировом уровне.

Биологи в России тоже, как правило, имеют хорошее базовое образование. Потому они готовы достаточно быстро научиться проводить эксперименты на уровне своих зарубежных коллег, если у них появится оборудование для секвенирования геномов. В последнее время положение здесь меняется — улучшилась ситуация с финансированием науки, а оборудование значительно подешевело — теперь оно стоит не миллионы, а десятки тысяч долларов.

В связи с этим можно ожидать появления в ближайшие годы огромного спроса на специалистов в области биоинформатики и такого же огромного дефицита этих специалистов. Скорее всего, проблема нехватки кадров будет мировой. Прогресс в биологии, достигнутый за прошедшее десятилетие благодаря компьютерным технологиям, не столько сужает круг задач, которые предстоит решить, сколько его расширяет.

Для того чтобы выявить ранее неизвестные взаимосвязи в различных организмах (не только человека), во всем мире уже проводится огромное количество экспериментов. Однако, по словам Вяххи, эта работа идет во многом бездумно, хаотично и без надлежащего анализа получаемых данных. Серьезнейшей проблемой является отсутствие качественного программного обеспечения, необходимого биологам для того, чтобы разобраться в огромных массивах полученных данных. Решить эту проблему предстоит петербургским специалистам в области биоинформатики. В АУ РАН уже разработали геномный ассемблер SPAdes, предназначенный для сборки генома бактерий. Он распространяется бесплатно с исходными кодами под лицензией GPL. «Наверное, можно было его продавать, но мы стремимся к тому, чтобы сделать лучший в мире геномный ассемблер и получить известность в среде биологов», — заявил Вяххи.