Аналитики Gartner отмечают, что растущая шумиха вокруг «озер данных» (data lakes), неупорядоченных хранилищ информации, поступающей из различных источников и содержащейся в исходном формате, создает путаницу: ряд поставщиков рекламируют «озера данных» как важнейший элемент инфраструктур обработки Больших Данных, но на сегодня нет ни универсального определения «озер данных», ни единого представления о том, какую пользу они приносят. Кроме того, нет возможностей определить качество данных в таком неуправляемом хранилище и проследить происхождение выводов, сделанных с использованием данных из «озера» кем-то до вас. В результате, как отмечают в Gartner, без механизмов руководства «озера» угрожают превратиться в «болота».

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF