Очередная версия платформы интеграции данных Informatica 9.1 включает в себя модуль связи с распределенной файловой системой Hadoop (HDFS), благодаря которому Informatica может извлекать данные из кластеров Hadoop и записывать их обратно. Платформа Hadoop, разработка которой ведется под управлением фонда Apache и при активном участии компании Yahoo, предназначена для построения приложений, работающих с большими объемами данных в распределенной вычислительной системе, и распространяется под лицензией с открытым исходным кодом. Хотя первоначально Hadoop была ориентирована на задачи веб-компаний, сейчас ее начинают применять и в корпоративной среде, отмечают в компании Informatica. Помимо модулей для Hadoop, популярных реляционных СУБД DB2 и Oracle и аналитических пакетов Netezza и Teradata, для Informatica 9.1 разработаны модули, извлекающие данные с сайтов социальных сетей, в том числе Facebook, Twitter и LinkedIn. Впрочем, аналитики Forrester полагают, что связь с Hadoop не останется уникальной особенностью Informatica. Для эффективного использования Hadoop нужен стандартный набор технологий, который еще предстоит создать.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF