DB2 позволяет работать с данными, хранящимися в различных форматах

Джереми Бертон: «Мы в Oracle не верим в перспективы фрагментации данных»

Представляя усовершенствованный, «федеративный» подход к управлению базами данных, корпорация IBM завершает проектирование новой версии СУБД DB2 7.1 Universal Database (UDB). Возможности интерфейса DataJoiner в ней будут дополнены функциями поддержки СУБД Sybase и Microsoft SQL Server.

«Набор расширений появится в будущей версии DB2, которая должна поступить в продажу в апреле — мае, — сообщил старший менеджер группы управления данными корпорации IBM Джефф Джонс. — В соответствии с подходом, которого мы придерживаемся, новая СУБД ориентирована не на централизацию, а на создание федеративных и интегрированных систем».

Компонент DataJoiner уже сегодня позволяет подключаться к реляционной СУБД Oracle. Однако IBM соревнуется с Oracle не только в качестве технологических решений, но и в создании наилучшей концепции управления данными. Представители же Oracle придерживаются в данном вопросе прямо противоположной точки зрения относительно перспективности тех или иных технологических подходов.

«Мы не верим в перспективы фрагментации данных, — заявил старший вице-президент Oracle по маркетингу Джереми Бертон. — Можно, конечно, называть эту схему федеративной, но, по сути, фрагментация данных в ней сохраняется».

По мнению Джонса, IBM выбрала более удачный путь, предоставляя своим заказчикам возможность работы с данными, хранящимися в различных форматах, непосредственно из среды DB2. Ведь очень немногие организации устанавливают у себя программные продукты только одного производителя.

Достоинство федеративного подхода заключается в том, что пользователям не обязательно собирать информацию из различных источников (например, из унаследованных или нереляционных баз данных) в едином хранилище. Конечно, перенос небольших объемов данных не представляет особой сложности, но создание хранилища, емкость которого измеряется многими терабайтами, — это поистине титанический труд.

Вместо этого IBM предлагает подход, предусматривающий расширение сервера баз данных функциями поддержки других информационных источников (например, СУБД других производителей). Новая версия DB2 будет поддерживать реляционную СУБД Sybase, а также Microsoft SQL Server. В будущем планируется еще больше увеличить число типов источников данных, которые могут быть объединены.

Впрочем, в Oracle тоже не собираются игнорировать потребность в доступе к данным, представленным в других форматах.

«К примеру, компании, размещающие свою информацию в Internet, могли бы использовать механизм запросов к базе данных для индексирования и выборки необходимых сведений, — подчеркнул Бертон. — Организовать управление централизованными данными проще».

В то же время специалисты отмечают, что стратегия объединения данных, выбранная IBM, сочетает в себе лучшие черты обоих подходов.

Руководство Британской библиотеки, в распоряжении которой имеются различные базы данных, а также наборы нереляционных данных и неструктурированной информации, отдает предпочтение федеративному подходу.

«Библиотека, в каталоге и архиве которой содержится свыше 150 млн. единиц информации, объединяет традиционные материалы (в том числе и средневековые манускрипты, которые не так давно были оцифрованы) с богатой коллекцией информации, представленной в цифровой форме, — сказала заместитель директора по управлению библиотечным фондом Хелен Шелтон. — Доступ к электронным материалам легко можно получить через унифицированный интерфейс».

По словам Шелтон, первым шагом в реализации принципов федеративного подхода должно стать предоставление посетителям возможности поиска цифровых архивов с мониторов, установленных в библиотеке.


IBM DB2 объединяет источники данных

Пользователям, которые хотят получить доступ к информации, хранящейся в форматах популярных реляционных баз данных, через интерфейс обновленной версии DB2, необходимо учесть плюсы и минусы этого подхода.

Достоинства: при работе с большими объемами данных пользователям не обязательно переносить информацию из СУБД других производителей и из унаследованных систем; запросы к федеративной системе формируются так, как если бы использовалось только одно хранилище; пользователи DB2 могут отдать предпочтение федеративному подходу или же размещать свои данные непосредственно в базе данных IBM

Недостатки: в зависимости от физического места хранения данных скорость выполнения запросов может снижаться; при работе с небольшим суммарным объемом данных централизованный подход более оправдан; процедура управления данных при федеративном подходе по сравнению с централизованным усложняется