Определение Big Data подразумевает системы, в которых имеются не только большие объемы данных, но и высокая скорость прироста вкупе с разнообразием типов данных. К наиболее выдающимся образцам подобных систем относятся все популярные онлайн-сервисы — Google, Youtube, Facebook. В обычных видах бизнеса мы можем встретить большие объемы данных в аналитических системах, в архивах киностудий и телевидения, в комплексах наружного видеонаблюдения. К таким системам уже сложно применить классические методы и «рядовые» продукты, тут требуется особый подход к дизайну системы и, конечно же, совершенно другая эксплуатация.

В нашей практике действительно большие системы встречались и семь лет назад. Например, в одной уважаемой компании мы обеспечивали внедрение и развитие комплекса биллинга и аналитики, и уже тогда объемы данных вызывали смесь восторга и удивления не только у сторонних наблюдателей, но и у непосредственных участников проекта. С тех пор эта система выросла в объеме, наверное, на порядок, но по-прежнему успешно функционирует и использует решения, созданные несколько лет назад. Таким образом, с Большими Данными мы успешно работаем уже довольно давно, успели сделать определенные выводы и выработать подходы.

Не отстают и производители — емкость систем в пересчете на единицу оборудования неуклонно возрастает, практически так же быстро, как и производительность процессоров. Сочетание этих факторов открывает нам новые возможности, такие как дедупликация, сжатие, динамическое резервирование, без которых обработка данных была бы серьезно затруднена. Современные системы хранения готовы к работе с большими объемами, а при правильном использовании — и с Big Data. В недалеком будущем мы увидим качественное изменение в индустрии хранения, и тогда уже Big Data будет не проблемой, а совершенно обычным явлением.

Роман Володин,
руководитель группы систем хранения данных,
компания «Инфосистемы Джет»