Наиболее прогрессивные отечественные предприятия уже не просто экспериментируют с технологиями больших данных, машинного обучения и искусственного интеллекта, но и начинают понимать стратегическую значимость таких усилий. Одним из таких пионеров является Новолипецкий металлургический комбинат. Как уверен Анджей Аршавский, директор по анализу данных и моделированию НЛМК, именно применение искусственного интеллекта даст мощный толчок развитию промышленности в ближайшие несколько лет. Придя в компанию около года назад, Аршавский доказал, что средства машинного обучения действительно способны помочь в оптимизации производственных процессов. Мы поговорили с Аршавским в преддверии форума BIG DATA 2018, на котором он будет одним из основных докладчиков.

Анджей Аршавский

Послужной список: 2017 – настоящее время НЛМК, директор по анализу данных и моделированию

2014 – 2017 «Сбертех», директор Центра компетенций по супермассивам данных

2012 – 2014 «Лаборатория цифрового общества», генеральный директор

2010 – 2012 Microsoft Rus, глава разработки ПО для научных вычислений

2006 – 2010 «IBM Россия», руководитель разработки систем хранения данных, эксперт по инновациям и технологиям

Образование: МИФИ, факультет кибернетики, специальность «вычислительные машины, комплексы, системы и сети»

Какие цели были поставлены перед вами после прихода в НЛМК и с чего вы начали?

Это направление для промышленных компаний достаточно новое, и пока достоверно неизвестны достижения, которые получены благодаря методам анализа данных на производстве, особенно в сталеплавильной индустрии. Поэтому главная задача на 2017 год состояла в том, чтобы конкретными примерами доказать их принципиальную применимость. Мы начали с того, что провели обследование бизнеса НЛМК, чтобы сформировать пул инициатив, по которым имеет смысл работать. Было важно оценить их с точки зрения потенциального экономического эффекта, сложности реализации, доступности данных, определить приоритетность этих задач и решать именно те из них, которые действительно полезны для компании и наиболее быстро достижимы.

Вся наша работа объединяется под эгидой искусственного интеллекта – методов машинного обучения и продвинутой аналитики, а также инструментария Big Data, чтобы иметь возможность работать с данными большого объема. В некоторых случаях инструментарий Big Data востребован, в некоторых – нет, но по-любому он должен быть под рукой, равно как и сами данные, которые могут пригодиться для решения задач. Поэтому еще одним направлением стало построение стратегии работы с данными – Data Governance.

Естественно, производство к этому готово не было, данные для выбранных нами инициатив находились в разрозненных системах; в ряде случаев они довольно сложны для прямого доступа. И тогда мы разработали стратегию работы с данными и построили кластер, предназначенный для централизованного накопления данных с датчиков по всем переделам производства. На нем также находятся инструменты для исследователей данных, которые можно применять в своей работе. В кластере накапливаются данные, необходимые для решения текущих задач.

Что было до вас в сфере анализа производственных данных? К чему вы пришли?

Выделенной функции, направленной на решение бизнес-задач с помощью анализа данных, в компании не было. На отдельных участках производства совместно с несколькими компаниями проводился ряд экспериментов, в ходе которых пытались определить, что можно сделать посредством анализа данных и построения моделей. Но эти усилия не были системными. По сути, речь шла о нескольких пилотных проектах, самостоятельно проводимых различными подразделениями. Они подтвердили, что с помощью анализа данных можно что-то сделать, но конкретных результатов это не дало.

Все инициативы касались именно области производства. Дело в том, что основные наши расходы ложатся именно на это направление, и их оптимизация способна дать наибольший результат – здесь точно имеет смысл работать. Что касается маркетинга, продаж и кадров, то эти службы по своему потенциальному эффекту находятся где-то во втором эшелоне, и задачи, которые требуется там решать, гораздо менее масштабные, чем на производстве.

Следите ли вы за своими коллегами в других металлургических компаниях, за их успехами в этом направлении?

Да. Например, у нас есть контакты с «Северсталью», несмотря на то что это наш конкурент. Мы даже недавно провели совместный семинар с участием «СИБУРа». Как выяснилось, три наши компании инвестируют больше остальных в данное направление.

В какой-то мере это действительно уникальный опыт – обычно такие встречи с коллегами происходят лишь на крупных конференциях, устраиваемых поставщиками решений и имеющих ангажированный характер. Мы пошли другим путем, самостоятельно организовав закрытое мероприятие для компаний, желающих поделиться опытом внедрения цифровых технологий и искусственного интеллекта. Это пробный камень, я надеюсь, что у нас все получится, и по результатам, думаю, будет принято решение о расширении подобной практики.

С вашим приходом образовалось специализированное подразделение?

Сформировалась дирекция, находящаяся в подчинении старшего вице-президента, а функции направления Digital, в части методов машинного обучения и искусственного интеллекта, пока распределены между моей дирекцией и лабораторией инноваций, экспериментирующей с технологиями, которые принято относить к цифровым.

Откуда брали специалистов для формирования костяка команды? Вероятно, их сложно найти…

Да, и особенно сложно найти нужных специалистов для наших специфических задач. Искусственный интеллект в банковской сфере или маркетинге – совершенно не то же самое, что на производстве. В нашем деле приходится очень глубоко погружаться в специфику производства, вникать в суть и реалии производственных процессов, разбираться в нормативных документах. Без всего этого добиться результата, к сожалению, не получится. Поэтому нужны специалисты, способные на такое погружение. Это скорее не чистые математики, а физики – выпускники Физтеха и МИФИ, разбирающиеся и в химии, и в физике, которым производственные задачи не чужды. Мне пришлось изменить профиль требований к специалистам по сравнению с теми временами, когда я работал в Сбербанке и «Лаборатории цифрового общества». Так вот, мы нужных специалистов находим и получаем первые результаты, которые подтверждают правильность выбранной стратегии подбора персонала.

Данные вплавляя в сталь

«В нашем деле приходится очень глубоко погружаться в специфику производства, понимать суть и реалии производственных процессов, разбираться в нормативных документах. Без всего этого, к сожалению, добиться результата не получится»

А что касается вас? Имелся ли производственный опыт или пришлось учиться?

После окончания института я работал в ЦЕРН. Там много аппаратуры, и часть решаемых задач касалась как раз эффективности ее использования. Затем я довольно долго занимался разработкой автопилота для грузовых поездов, аспектов было много – от разработки драйверов до средств оптимизации и искусственного интеллекта. Ну а затем была работа в софтверных компаниях, где я занялся задачами математики и данных в чистом виде. Сейчас как раз совмещаются эти два моих предыдущих опыта, и решаемые задачи для меня крайне интересны. К счастью, удалось быстро погрузиться в специфику производственных процессов.

А опыт из других отраслей здесь вообще может быть востребован?

Безусловно, мы пытаемся применять опыт из других индустрий, где машинное обучение используется в задачах оптимизации. У нас в коллективе есть разнообразный опыт: банковский, маркетинговый, логистический и даже опыт распознавания изображений. Это часто бывает полезно, потому что задачи мы тоже решаем разнообразные.

Как вы сказали, денег больше всего «зарыто» в производстве. А где имеет смысл «копать» еще?

Действительно, в структуре затрат НЛМК производство занимает 70-80%. Но для нас еще более интересно, где именно внутри производства эти деньги зарыты. Поскольку наши методы могут применяться для решения разных задач, мы и пытаемся определить сферы их применения. С одной стороны, это экономия материалов, закупаемых для производства, – угля, руды, дорогостоящих ферросплавов. Но, с другой стороны, оптимизация производства и повышение производительности – это ведь прямое увеличение объема производства на имеющихся мощностях.

Третье направление оптимизации – повышение качества продукции, прогнозирование дефектов в металле, неметаллических включений, раскатных трещин и т. п. Число возможных дефектов измеряется десятками, они имеют различную природу. Прогноз этих дефектов и поиск корневых способов, позволяющих их «вылечить» и сократить их число, тоже важная статья сокращения расходов на производство. Четвертое направление – повышение надежности работы оборудования: прогноз выхода из строя агрегатов, их предупредительное обслуживание. Наконец, еще один важный аспект – оптимизация энергопотребления и производства энергии. Мы прикладываем активные усилия к тому, чтобы оптимизировать работу ТЭЦ с точки зрения потребления газа.

Как показывают наши расчеты, основной финансовый эффект дает экономия на закупке материалов. Далее идут производительность и качество, на четвертом месте пока стоит обслуживание оборудования. Возможно, в дальнейшем, с появлением новых данных, приоритеты изменятся.

Анджей Аршавский, директор по анализу данных и моделированию НЛМК:

«Мы исходим из предположения, что, применяя искусственный интеллект, мы сможем улучшить текущую ситуацию хотя бы на 5%. Меньшая величина находится в пределах погрешности, она несущественна. На более ощутимый эффект мы не ставим из скромности»

А какая из этих задач наиболее просто решается? Ведь быстрый результат тоже важен?

Мы начали с проектов, направленных на экономию материалов, поэтому первые результаты связаны именно с ними. Но вряд ли можно уверенно сказать, что какое-то направление проще других. В каждом существуют как относительно простые, так и сложные задачи. Выбор задач определяется не только ожидаемым экономическим эффектом или скоростью получения результата, но еще и доступностью данных. Далеко не все области производства сейчас оснащены необходимыми средствами измерения и системами управления, позволяющими влиять на процессы. Приходится взаимодействовать со службами ИТ и АСУТП, чтобы накапливать данные и дооснащать производство.

Какова численность команды, работающей над задачами?

Пока она небольшая, и мы продолжаем расти. Многие задачи решаются совместно с подрядчиками. Накопленный опыт говорит о том, что должен быть баланс между внешними и внутренними ресурсами, поскольку важно накапливать экспертизу и обеспечивать преемственность наработок, сделанных внешними командами. Созданная интеллектуальная собственность должна продолжать развитие внутри компании.

Основные инициативы направлены именно на экономию, а не на получение дополнительной выручки?

Не совсем так. Например, рост может быть получен благодаря увеличению производительности. Если взять, скажем, стан горячей прокатки, то это прямое увеличение производства металла. Повышение надежности оборудования ведет к сокращению простоев, что также дает рост производства. Сокращение дефектов не только уменьшает потери от брака, но и способствует выпуску продукции более высокого качества, которую можно продать по более высокой цене. Эффекты от решаемых задач многогранны и сильно взаимосвязаны. Даже если речь идет о такой совершенно конкретной вещи, как экономия на закупках, то это дает возможность инвестировать в новые производственные мощности.

А какую из этих историй проще продать бизнесу?

Мы считаем общий экономический эффект – бизнесу интересен именно он – и, конечно же, время достижения результата. Мы стараемся браться за инициативы, которые обещают показать эффективность используемых нами методов, убедить, что необходимо развитие этого направления. Я глубоко уверен, что именно применение искусственного интеллекта даст толчок развитию промышленности в ближайшие 10-15 лет.

Внедрение искусственного интеллекта – сначала точечное, а затем глобальное – обусловит новый рывок в производительности и эффективности производства. На первом этапе будут оптимизированы отдельные участки производства, на втором они будут объединяться и давать синергетический эффект. Чтобы все это стало реальным в обозримом будущем, надо начинать уже сейчас, иначе мы упустим стратегические возможности.

Данные вплавляя в сталь

«В некоторых случаях инструментарий Big Data востребован, в некоторых – нет, но по-любому он должен быть под рукой, равно как и сами данные, которые могут пригодиться для решения задач»

Должны возникать огромные проблемы с расчетом экономической эффективности – ведь в столь инновационных проектах зачастую сложно предугадать эффект…

Это так. Но, вообще, в любом проекте нет гарантии его полной результативности. Хотя, конечно, если речь идет о внедрении зарекомендовавшего себя на рынке решения, то рисков намного меньше.

Мы опираемся на простую и понятную логику. В каждой точке производства мы знаем оценку технически обусловленного уровня (ТОУ) и нынешние показатели – например, агрегат по своим возможностям способен производить на 20% больше продукции, чем это происходит сейчас. Задача предприятия – сократить эту разницу. Она может быть сокращена разными методами: работой с персоналом, изменением бизнес-процессов и т. п. Мы исходим из предположения, что, применяя искусственный интеллект, мы сможем улучшить текущую ситуацию хотя бы на 5%. Почему именно на 5%? Меньшая величина находится в пределах погрешности, она несущественна. На более ощутимый эффект мы не ставим из скромности. Таким образом, мы говорим, что за счет применения методов искусственного интеллекта мы отыграем 5% разницы, конвертируем ее в деньги и получим конкретную сумму.

Какой-либо из проектов уже позволил превзойти этот уровень?

Два проекта уже выходят на опытно-промышленные испытания. Мы попадаем на заявленный уровень, давая даже более 5%. Один из проектов обещает результат 20%, но он еще не проверен на практике. Еще по нескольким проектам есть предварительные результаты, они также говорят о том, что эффект будет выше 5%.

Что это за проекты?

Сейчас мы активно работаем над пятью задачами и над тремя пилотами. В ближайшее время планируем запустить еще пять задач.

Из задач, по которым первые результаты уже близки, можно выделить несколько. Две нацелены на экономию ферросплавов – дорогостоящих присадок, используемых в металлопроизводстве. Еще один проект заключается в поиске корневых причин нескольких видов дефектов. Дает эффект проект по оптимизации работы ТЭЦ. По перечисленным мной проектам видны конкретные результаты, по остальным – пока лишь промежуточные.

Насколько могут быть полезными для производственных задач внешние источники данных?

В производстве все сложнее, чем в маркетинге, продажах, закупках и HR, где польза внешних данных очевидна. Многое зависит от роли компании. Вы же понимаете, что конкуренты не будут передавать нам информацию о работе схожих агрегатов. Однако там, где промышленные мощности не эксплуатируются, а производятся, обмен данными с заказчиками имеет очень важное значение. Например, для разработки и последующей продажи клиентам решений, прогнозирующих выход из строя оборудования.

Так, производитель моторов оснащает датчиками свои изделия и продает их клиентам. Вполне естественной будет идея собирать и анализировать информацию обо всех двигателях, работающих у клиентов, выявлять правила и закономерности. Затем клиентам можно продать прогнозные модели, повышающие надежность оборудования. Эта идея не нова, большинство производителей аппаратуры подобные подходы используют. Но мы являемся потребителем и можем лишь воспользоваться результатами работы наших поставщиков.

А если говорить о непроизводственных задачах?

Да, мы исследовали и другие, «непроизводственные» бизнес-процессы, составили их перечень, ранжировали по степени экономического эффекта, по ожидаемой скорости реализации и наличию доступных данных. И нам удалось получить представление о приоритетах, может быть и не окончательное. Скажу, что наиболее интересными являются закупки, продажи, маркетинг и HR.

Задачи HR могут быть очень интересными, но однозначно прогнозировать, например, вовлеченность сотрудников очень сложно, а оценка качества модели и вовсе является почти философской задачей. Здесь явно не хватает методологии. «Вовлеченность» – почти эфемерный признак, который приходится оценивать с разных точек зрения. Кроме того, такую модель тяжело на чем-либо обучать. Скорее математические модели позволяют выявить те или иные аномалии в поведении сотрудников и решать вопросы производственной безопасности.

Как вы видите свою роль в развитии компании?

Сейчас я сосредоточен на решении практических задач с помощью искусственного интеллекта. Моя главная цель – показать эффективность этого направления в производстве. Я планирую в ближайшие несколько лет посвятить себя этой задаче и развивать свои компетенции, принося пользу компании в сфере цифровизации.

Купить номер с этой статьей в PDF