Picture Партнерские отношения между компаниями существуют уже более четырех лет; в период разработки модуля специалисты RedLab прошли обучение в мюнхенском отделении Informix, где они вникали во все нюансы технологии DataBlade.

Об истории создания модуля и его возможностях рассказал исполнительный директор RedLab Руслан Смелянский. Разработка модуля для морфологического анализа и построения индексов по русскоязычным текстам была вызвана необходимостью организации поиска по содержанию текстовых полей в сочетании с традиционными запросами к базе данных. А особенностью русского языка является наличие многочисленных словоформ, образованных от единой основы, что значительно усложняет задачу поиска. Решением этой задачи и занялись разработчики компании RedLab, правильно сориентировавшись на наиболее благоприятную для отечественных разработчиков программ нишу рынка - программы, направленные на поддержку особенностей русского языка. Модуль способен осуществлять поиск в документах всех словоформ заданного слова. Для достижения высокой скорости поиска применен оригинальный метод индексации, при котором размер индекса составляет от 30% исходного текста для больших документов до 90% - для небольших. Скорость поиска достигает 5 Мбайт в минуту. Запросы для поиска допускают задание логических выражений произвольной формы, использование операторов and, or, not, а также "расстояния" и "соседства" между словами. Пользователь может повысить скорость обработки запросов, определив так называемый "стоп-список", который содержит часто встречающиеся, но не используемые для запросов слова. При дальнейшей работе эти слова просто не будут учитываться. Если неизвестно точное написание нужного слова, то можно воспользоваться функцией нечеткого поиска или поиска по шаблону. Полная поддержка технологии DataBlade модулем "Русский Текст" позволяет использовать одновременно несколько модулей и проводить поиск по смешанным, например русско-немецким текстам. Ну и само собой разумеется, поиск может осуществляться по документам, представленным в различных форматах, включая издательские системы и публикации в Web.

Самой технологии DataBlade было посвящено выступление менеджера по развитию бизнеса российского отделения Informix Software Ховарда Залкина. Он подтвердил, что у пользователей все чаще возникает потребность в хранении и обработке сложных видов информации, таких как видео, звук, статичные изображения и Web-данные, или больших объемов текста. Работа с такими объектами в СУБД Universal Server ведется при помощи модулей DataBlade. Это встраиваемые модули, расширяющие возможности СУБД по поддержке данных специфического вида и приспосабливающие сервер к обработке информации, определяемой требованиями бизнеса. В настоящий момент корпорация Informix Software предлагает своим клиентам более десятка готовых DataBlade собственного производства. Но открытость системы обеспечивает возможность работы с модулями DataBlade третьих фирм, которых на сегодняшний день создано уже более 30.

Компания Informix каждый раз при создании новых модулей DataBlade по-своему строит политику с их производителями. Этот спектр взаимоотношений простирается от простой сертификации до приобретения прав на конкретный модуль. В случае с DataBlade поставки модуля производства RedLab будут проводиться по каналам как компании-производителя, так и Informix. С выходом модуля "Русский Текст" Universal Server, по словам Залкина, "станет единственной на сегодня СУБД, наиболее полно учитывающей особенности русского языка".

Поделитесь материалом с коллегами и друзьями