В Google обновили и выпустили под новым названием программную систему с открытым кодом для очистки, анализа и преобразования наборов данных. Ранее инструментарий носил название Freebase Gridworks, а новый вариант выпущен под именем Google Refine 2.0. Разработчик ПО — компания Metaweb, которую Google купила в июле. Google Refine помогает извлекать полезную информацию из наборов данных, которые могут содержать неточности. Например, приложение находит все варианты написания одного и того же слова и заменяет их на верный вариант. Преимуществом Gridworks является универсальность — система штатно поддерживает большое количество типов данных. Имеется язык выражений для анализа наборов данных.
 

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF