Пол Грабшайд: «Мы всегда рассчитывали на большие объемы разнообразных данных»
Пол Грабшайд: «Мы всегда рассчитывали на большие объемы разнообразных данных»

Эти четыре продукта образовали законченный комплект, состоящий из флагмана СУБД Cache, инструментария для разработки и быстрой интеграции Ensemble, системы для аналитики в реальном времени DeepSee и системы i.Know, предназначенной для работы с текстовыми документами с учетом семантики.

В этом году фокус мероприятия, прошедшего 18 сентября, сместился на использование названных инструментов в проектной практике. Компонентов, входящих в набор, оказывается вполне достаточно для создания приложений нового класса, названного с подачи аналитиков из Bloor Research «прорывными приложениями» (Breakthrough Application). Роли и месту этих приложений было посвящено выступление Пола Грабшайда, технического руководителя InterSystems, по традиции открывшему московский симпозиум.

Когда появляется что-то новое (в данном случае — прорывные приложения), возникает необходимость определить вещи, прежде в определении не нуждавшиеся, иначе не постичь новизны. Так вот, традиционные приложения, назовем их так, в конечном счете преследуют цель улучшить то, что уже есть, чаще всего дело сводится к автоматизации известных и существующих функций. Потребность в таких приложениях сохраняется, но уже есть альтернатива — открылась возможность создавать такие приложения, которые не просто усовершенствуют то, что есть, а позволяют радикально изменить бизнес. Прорывные приложения призваны снабжать пользователей нужной информацией вне зависимости от форматов данных и используемого оборудования.

Можно выделить три основных качества, отличающие прорывные приложения. Первое качество — массовая или, может быть, неограниченная персонализация. Под массовостью понимается доступность приложений в случае, если они соответствуют распространенным стандартам, а под персонализацией — способность адаптироваться под индивидуальные требования пользователей. Это качество напрямую обусловлено тем, что теперь пользователи диктуют ИТ свои правила. Удовлетворить новым требованиям не сложно, здесь используется обычная трехзвенная модель — интерфейс, код и данные, но есть и специфика, например, возможность использовать сенсорные экраны и другие новые технологии.

Второе качество прорывных приложений — способность работать с любыми возможными типами данных, без каких-либо ограничений: со структурированными данными, унаследованными из транзакционных систем, наиболее удобными для ответов на запросы и для поиска в них; с неструктурированными данными, то есть с текстами, фото, видео, аудио и т. д. Объемы последних на порядки больше, из них гораздо труднее извлекать контент и над ними сложнее выполнять какие-либо операции. Еще одна категория — данные о событиях, количество и разнообразие таких данных постоянно растет одновременно с развитием средств для их получения. Появление данных о событиях в системах управления бизнесом сближает их с системами АСУТП и системами обработки экспериментов.

Третье отличительное качество прорывных приложений — способность предпринимать интеллектуальные действия. Приложения должны уметь самостоятельно адаптироваться, например, к возможным изменениям во входном потоке данных, поступающих из разных источников, оптимальным образом распределяя и сохраняя эти данные, не создавая изолированных систем и полноценно распознавая контент.

Как утвержают в InterSystems, подобные приложения вполне удается создавать средствами, образующими инструментальный набор компании. Это возможно прежде всего потому, что Cache — это не только полноценная СУБД, поддерживающая двухмерную реляционную модель, но еще и система, в которой реализован объектно-ориентированный подход; она поддерживает доступ к многомерным структурам, способна хранить данные в формате XML, а iKnow обеспечивает доступ к текстам. Далее, интеграционная платформа Ensemble позволяет связать компоненты в такие инфраструктуры, как корпоративная сервисная шина (Enterprise Service Bus, ESB) или сервисная архитектура (Service Oriented Architecture, SOA). А аналитическая машина DeepSee, которая работает совместно с Cachе и Ensemble, дает возможность создавать аналитические приложения, работающие в режиме реального времени. Наконец, комбинация DeepSee с iKnow позволяет полноценно анализировать как структурированные, так и неструктурированые данные.

Грабшайд подчеркнул, что и в минувшем году InterSystems сохранила непрекращающийся с середины 70-х монотонный рост бизнеса. Численность компании возросла на 200 человек и достигла 1,3 тыс., но она по-прежнему остается частной, что позволяет проводить задуманную техническую политику самостоятельно, не испытывая давления со стороны акционеров. Компания успешна в бизнесе, не имеет кредитов и долгов.

В целом ряде проектов, связанных с необходимостью обрабатывать большие объемы информации, например при создании системы Gaia, задуманной для обработки собранных космическим телескопом Европейского космического агентства данных о звездах нашей Галактики, Cachе удалось опередить куда более крупных и известных конкурентов. Главная задача Gaia — составление подробной карты распределения звезд. Объектами наблюдения будут свыше одного миллиарда светил, по каждому будет сделано около тысячи измерений, из чего следует, что одной из важнейших составляющих проекта должна стать его информационная подсистема «Глобальное астрономическое итерационное решение» (Astrometric Global Iterative Solution). AGIS поддержит превращения триллионов записей сырых данных в осмысленную информацию. В качестве хранилища для 10 Тбайт данных была выбрана СУБД Cache, как наиболее соответствующая по производительности и стоимости; ее конкурентами были Oracle, MySQL и Postgress.

Возникает естественный вопрос, как компании, которая сохраняет верность технологическому курсу, избранному несколько десятков лет, удается поддерживать свою продукцию на совершенно современном уровне. Отвечая на него, Грабшайд сказал: «Мы начинали со специализированных систем для обработки и всегда позиционировали наши продукты как средства для разработки встроенных систем. В то время слово 'встроенные' воспринималось иначе, чем сегодня, когда практически все информационные системы становятся встроенными». Создатели классических реляционных систем, по его словам, не слишком задумывались об источниках данных. «В Intersystems всегда стояли на земле, уделяли внимание источникам и входным потокам данных, а данные, например в медицине, как хорошо известно, самые разнообразные — это и тексты, и изображения, и таблицы — все что угодно», — добавил грабшайд. Поэтому компания и оказалась настолько подготовленной к переменам последних лет как в отношении самих данных, так и появившихся новых подходов к работе с ними.

Поделитесь материалом с коллегами и друзьями