Bio-IT World, США

Новые области применения ИТ требуют новых решений

Объем данных, получаемых во время исследований в области наук о жизни, в том числе информация о структуре геномов и белков, постоянно растет. К тому же требуется все более детальный анализ этой информации.

Как правило, на решение любой возникающей проблемы направляются все имеющиеся ресурсы. Кроме того, по мере увеличения объема данных из-за слишком большого времени, которое уходит на управление данными и на вычисления, ученым приходится ограничивать свои исследования.

Предлагаемый Synamatix подход заключается в поиске шаблонов в последовательностях данных и в выявлении связей между этими шаблонами

Малазийская компания Synamatix предлагает иной подход, который опирается на базы данных с интеллектуальной структурой. Само название компании отражает особенности разработанной ею базы данных: слово Synamatix составлено из syntax (синтаксис) и semantics (семантика).

«Мы пытаемся определить язык биологии, создавая базы данных на основе шаблонов», — пояснил Ариф Анвар, вице-президент Synamatix по коммерческим разработкам.

Предлагаемый Synamatix подход заключается в поиске шаблонов в последовательностях данных и в выявлении связей между этими шаблонами. На основе такой информации ученые пытаются установить зависимости и определить значения различных шаблонов. Вся эта информация — шаблоны, связи между шаблонами и их значения — хранится в разработанной компанией интеллектуальной базе данных SynaBASE.

По существу, SynaBASE автоматически анализирует исходные наборы данных и выявляет в них похожие шаблоны, причем каждый уникальный шаблон сохраняется лишь единожды. Это помогает решить задачу масштабируемости (нужно хранить меньше информации) и обеспечить приемлемую скорость вычислений.

Вместе с базой данных SynaBASE применяется набор инструментальных средств SynaSuite, состоящий из нескольких приложений, созданных для поиска информации о шаблонах в SynaBASE.

Например, инструментарий, получивший название SynaMine, анализирует все шаблоны, последовательно сравнивая их с данными, хранимыми в SynaBASE, с тем, чтобы определить, с какой частотой встречается конкретный шаблон, и что он означает.

Кроме того, в состав SynaSuite входят следующие инструментальные средства.

  • приложение SynaCompare, которое позволяет сравнивать последовательность запросов с данными об организме, хромосомах или о геноме целиком, хранящимися в SynaBASE.
  • приложение SynaProbe выявляет конкретные образцы, подходящие для создания целых микромассивов генома.
  • приложение SynaMap для определения соответствия расшифрованных данных и последовательности генома, хранящейся в SynaBASE.

В состав SynaSuite входит около десятка приложений (большинство из них уже предлагается пользователям). И все приложения в составе SynaSuite, как правило, работают на одном компьютере, например, на машине с операционной системой Linux и процессором Itanium.

Большинство приложений используется во множестве различных исследовательских проектов, выполняемых в крупных научных лабораториях и организациях и посвященных изучению состава геномов и белков.

Кроме того, некоторые инструментальные средства SynaSuite предназначены для конкретных приложений. Например, FragBASE — это сверхбыстрое приложение для объединения последовательностей.

Компания Synamatix разработала серию описаний с подробными примерами, которые показывают, как ее программное обеспечение применяется для широкого круга задач, возникающих в рамках наук о жизни.

К числу этих примеров относятся сравнение хромосом человека и мыши, поиск сходства в последовательностях (в частности, в тех, которые подвергаются циклической перестановке) и поиск штаммов вируса ВИЧ при соотнесении с исходным образцом вируса ВИЧ.

Эти описания позволяют потенциальным пользователям программного обеспечения Synamatix составить представление о производительности, которой они могут добиться на определенных видах анализа.

Свои решения Synamatix предлагает пользователям на индивидуальной основе. Компания рассчитывает заявить о себе на американском рынке, открыв в этом году представительство в США.

Кроме того, в прошлом году компания после присоединения к Малазийскому центру геномных ресурсов (Malaysian Genomics Resource Centre, MGRC), начала предлагать свои приложения по схеме оплаты за объем использования. Компания выпустила бесплатное приложение SynaBLAST, которое представляет собой эквивалент BLAST, работающий на SynaBASE. В частности, MGRC выступает в роли поставщика интерактивных услуг, предусматривающих использование высокопроизводительных инструментальных средств анализа последовательностей. По словам представителей Synamatix, название службы My Genomics Research Centre свидетельствует о том, что ее услуги предназначены не организациям, а отдельным исследователям.