Производственные предприятия целого ряда отраслей уже сегодня сталкиваются с различными проблемами в ходе сбора, хранения и обработки больших массивов и потоков данных, причем инициатором задач, для решения которых необходимо опираться на Большие Данные, всегда выступает бизнес. В этом были единодушны эксперты, выступившие в рамках круглого стола «Большие Данные в промышленности», организованного журналом «Директор информационной службы» (CIO.ru) совместно с компанией OSIsoft в рамках ее конференции Power of Data.

Как показывает опыт самых разных отраслей, предприятия находят Большим Данным применение, когда у аналитиков отрасли складывается ощущение, что собираемые или накапливающиеся данные таят в себе бизнес-информацию, которая достойна усилий по ее извлечению, поскольку с ее помощью предприятие сможет получить заметную пользу. Как следствие, появившаяся на горизонте заманчивая цель стимулирует бизнес к поиску инструментов для ее достижения.

В производстве данных хватает, и даже с избытком: их генерируют различные цифровые приборы (датчики, контроллеры, встроенные компьютеры и пр.), входящие в состав современного промышленного оборудования. Нефтегазовая отрасль, энергетика, металлургия, химия и фармацевтика, тяжелое машиностроение, авиа- и судостроение, приборостроение — вот далеко не полный перечень отраслей и секторов экономики, где производственное оборудование является источником больших объемов и потоков данных. Среди задач, которые предприятия решают с их помощью, — управление основными фондами (в том числе техобслуживание и ремонты оборудования), отслеживание штатных и нештатных ситуаций, прогнозирование назревающих проблем, оптимизация использования производственных мощностей, управление качеством, экологический мониторинг, сбор статистики по требованию регулирующих органов и др.

«Для нашего предприятия наиболее важными являются управление качеством, техобслуживанием и ремонтами, а также оптимизация использования производственного оборудования», — отмечает Владимир Федоров, заместитель начальника цеха холодного проката екатеринбургского предприятия «ВИЗ-Сталь» (один из активов НЛМК).

Формируя понятия

Авторитетные международные аналитики, приводя определение Больших Данных, единодушно отмечают, что предприятия сталкиваются либо с большим объемом данных, либо с потребностью в очень быстрой их обработке, либо с большим количеством их форматов и протоколов. В частности, в IDC выделяют три сценария возникновения проблемы Больших Данных. Самым очевидным является очень большой объем накопленных данных, порождающий проблему их обработки. Другой распространенный вариант — необходимость очень высокой скорости обработки информации из различных источников. В этом случае требуется мониторинг и анализ данных в реальном времени, поскольку если даже немного промедлить, актуальность данных стремительно теряется. Наконец, иногда объемы данных не столь велики, но динамично растут — больше чем на 60% в год.

«Будем честны: устоявшихся определений в области Больших Данных пока нет. Мы находимся в ситуации, когда сами можем формировать их, и кто сделает это успешнее, тот станет гуру», — подчеркивает Алексей Сидоров, технический директор российского офиса компании Informatica. По его словам, объем данных и скорость их обработки — уже не проблема, это вопрос исключительно цены используемых технологий, поэтому к понятию Больших Данных эти характеристики непосредственного отношения не имеют. А вот когда руководство предприятия, пусть даже интуитивно, чувствует, что из имеющихся данных можно извлечь для себя значительную пользу, прежде недоступную, — это уже начало Больших Данных.

«Мы сами хотим как можно глубже разобраться в потребностях клиентов при обработке Больших Данных в производстве, чтобы предлагать им действительно актуальные решения», — Мартин Оттерсон, вице-президент компании OSIsoft в регионе Европы, Ближнего Востока и Африки

Различия в своем восприятии этого термина подтвердили и другие эксперты. В зависимости от сферы деятельности предприятия и стоящих перед ним задач на первый план могут выходить не только такие категории, как скорость или объем, но и многообразие форматов данных, большое количество их источников, стремительно растущие затраты на обработку данных и пр.

«Мы сами хотим как можно глубже разобраться в потребностях клиентов при обработке Больших Данных в производстве, чтобы предлагать им действительно актуальные решения», — признается Мартин Оттерсон, вице-президент компании OSIsoft в регионе Европы, Ближнего Востока и Африки.

В компании сейчас изучают несколько любопытных примеров использования разработанных ее заказчиками систем. Один из заказчиков OSIsoft — производитель строительной техники Caterpillar — планирует установить телеметрические датчики на все выпущенные машины. Очевидно, что это огромный объем географически распределенной информации, требующий анализа в режиме времени, близком к реальному. Конечной целью этой работы является более эффективное обслуживание уже проданной техники, а также совершенствование продукции, которую выпускает эта компания.

Концепции в дефиците

Отдельным направлением развития Больших Данных является нефтегазовая промышленность. По словам Игоря Колодкина, ведущего консультанта по решениям для ТЭК российского представительства корпорации Teradata, в разведку углеводородов западными нефтегазовыми компаниями вкладываются огромные средства, масштабы которых сопоставимы разве что с космическими исследованиями. Как показывает опыт Teradata и заказчиков, объемы данных геологоразведки составляют петабайты, а методы их обработки и анализа формируют самостоятельное направление в науке. Ключевые потребности бизнеса при этом предельно просты и прагматичны — решение ключевой бизнес-задачи поиска нефти, а также оценка запасов месторождений.

Как отмечает Владимир Кириллов, консультант по промышленным ИТ-системам компании «ИМС Индастриз», специализирующейся на разработке, проектировании и производстве технологического и энергетического оборудования для добычи, подготовки, переработки и транспортировки жидких и газообразных сред, проблема Больших Данных в нефтегазовом секторе появилась еще около трех лет назад, когда пришлось столкнуться с новыми требованиями разведки месторождений. При обработке данных геологоразведки эта проблема проявилась во всей красе: традиционные математические методы перестали работать, и пришлось разрабатывать другие подходы.

Стоит отметить, что даже в рамках одной отрасли объем обрабатываемых данных может различаться на порядки. В нефтесервисной компании Halliburton оценивают суммарный объем своих геологоразведочных данных в 100 Пбайт (для сравнения: объем данных в компании «ЛУКОЙЛ» составляет лишь 1–2% от этого показателя). Разумеется, большая их часть имеет низкую ценность, и лишь 20–30% могут быть использованы для задач аналитики.

Между тем в нефтепереработке на первый план выходит именно способность компаний в режиме реального времени обрабатывать потоки данных. «Производство насыщается средствами сбора данных. Вопрос — что с этими данными делать, ведь хранить их во многих случаях бессмысленно», — говорит Александр Нечай, начальник отдела поддержки и сопровождения информационных систем компании «ЕАЕ-Консалт» (она занимается поддержкой и развитием информационных систем в активах холдинга «ЛУКОЙЛ», активно использующего решения OSIsoft). Здравый смысл подсказывает, что отказываться от их обработки неправильно, но цель этих мероприятий для большинства компаний неясна.

С этой точки зрения ключевую роль играют вовсе не технологии, а концепция использования Больших Данных — не должно быть бесцельного собирательства и хранения информации. А такие концепции и методики, как показывает практика, пока в дефиците. Возможно, проблема кроется в компетенциях: очень небольшое число специалистов умеет анализировать данные, добывая из них ценную информацию.

Заказчиками подобных систем становятся люди, понимающие важность Больших Данных для компании. Когда такие люди появляются, очень часто появляются и бюджеты на решение задач, опирающихся на Большие Данные.

Владимир Федоров, заместитель начальника цеха холодного проката

«Для нашего завода наиболее важными задачами, в которых используются Большие Данные, являются управление качеством, техобслуживанием и ремонтами, а также оптимизация использования производственного оборудования»,

Владимир Федоров, заместитель начальника цеха холодного проката предприятия «ВИЗ-Сталь»

Вступление России в ВТО может стимулировать интерес к Большим Данным отечественных компаний. Конечно же, предприятиям придется корректировать качество и стоимость продукции, а иногда даже выводить их на новый уровень. Вступление в ВТО будет сопровождаться ценовой войной — одного лишь качества продукции будет недостаточно, хотя требования к нему и станут ужесточаться. Компании будут вынуждены искать дополнительные источники повышения своей эффективности.

Игроки, уже работающие на международном рынке, в целом к такому сценарию готовы. Для большинства же отечественных компаний, по словам Руслана Каримова, главного эксперта компании «Инженерный центр энергосбережения», входящей в холдинг «Сибур» (на нескольких его предприятиях также применяются решения OSIsoft), положение близко к критическому, а лекарство в виде инвестиций в новые технологии вполне может опоздать. Вступление в ВТО уже близко, и успеть сколько-нибудь серьезно изменить ситуацию будет проблематично.

Несмотря на необходимость кардинальных изменений, для предприятий по-прежнему существует замкнутый круг. Чтобы обосновать инвестиции (в том числе и в технологии Больших Данных), необходимо предугадать экономический эффект. Для этого, в свою очередь, необходим пилотный проект, также требующий инвестиций — например, в измерительное оборудование, позволяющее количественно оценить результаты. Многие проекты буксуют уже на этом этапе. Возможно, вступление в ВТО позволит компаниям действовать более решительно, пусть и рискованно.