Более 30 докладов, два мастер-класса, интерактивная сессия, около 500 участников — с таким размахом прошло самое значимое событие года, посвященное большим данным, продвинутой аналитике и искусственному интеллекту, — ежегодный форум Data+AI 2025, организованный издательством «Открытые системы». Главной темой форума стало повышение эффективности бизнеса с помощью данных и искусственного интеллекта, развитие инструментов для работы с данными, а также опыт применения генеративных моделей.
О важности использования данных сегодня говорится на всех уровнях. Так, на федеральном уровне реализуется национальный проект «Экономика данных и цифровая трансформация государства», целью которого является «цифровая трансформация государственного и муниципального управления, экономики и социальной сферы за счет обеспечения кибербезопасности, бесперебойного доступа к интернету, подготовки квалифицированных кадров для ИТ-отрасли, цифрового госуправления, развития отечественных цифровых платформ, программного обеспечения, перспективных разработок и искусственного интеллекта». Как рассказал Глеб Шуклин, директор Ассоциации больших данных, в рамках нацпроекта выполняется целый ряд федеральных проектов, охватывающих множество направлений. Всего в нацпроект вовлечено 1,4 трлн руб. инвестиций, в том числе 419,63 млрд руб. внебюджетных средств.
По данным исследования уровня зрелости проектов в сфере больших данных, проведенного K2 Cloud и Arenadata, результаты которого привел Александр Фикс, менеджер продукта компании K2 Cloud, российский рынок больших данных сегодня демонстрирует ежегодный рост на 30%, в 2,5 раза опережая мировой рынок. Около 36% опрошенных компаний сообщили, что для работы с данными используют отечественные решения, 28% — зарубежные, примерно столько же опираются на решения с открытым кодом и 8% отдают предпочтение собственным разработкам. Средняя продолжительность проектов больших данных, по данным того же исследования, составляет полтора года. При этом, как выяснилось, 62% организаций не оценивают влияние больших данных на рост бизнеса.
Сергей Карпович, заместитель руководителя направления компании Т1 ИИ по продуктовому развитию, привел данные доклада НЦРИИ при Правительстве РФ «2024 Индекс готовности приоритетных отраслей экономики Российской Федерации к внедрению искусственного интеллекта». Как оказалось, среднее интегральное значение индекса в 2024 году несколько снизилось — до 3,5 баллов, тогда как в 2023 году показатель составлял 3,7 балла. Это может указывать на некоторое разочарование бизнеса результатами использования ИИ. По данным доклада, среди российских организаций, внедряющих ИИ, заметный положительный эффект уже получили 26% начинающих освоение ИИ, 40% развивающихся в этом направлении и 48% «лидеров» — тех, кто продвинулся в применении ИИ относительно далеко. Это, в частности, говорит о том, что среди «начинающих» лишь небольшая часть ощутила заметную пользу от ИИ.
![]() |
Никита Ильин: «Немалое количество вопросов, касающихся ИИ, пока остаются без внятных ответов» |
Никита Ильин, главный архитектор компании Visiology, среди тенденций применения ИИ особо выделил развитие ИИ-агентов и их встраивание в различные решения, а также рост популярности больших языковых моделей (LLM), поддерживающих возможность локального развертывания. Среди распространенных проблем, сопровождающих проекты с ИИ, Ильин назвал плохо работающие сложные логические рассуждения, ограниченный объем контекста, недостаточную достоверность ответов и риски, связанные с конфиденциальностью данных. Немалое количество вопросов, касающихся ИИ, пока остаются без внятных ответов – например, кто должен отвечать за неправильный ответ ИИ-инструмента и что делать, если в самих источниках лежат несогласованные или некорректные данные.
Владимир Озеров, генеральный директор «Кверифай Лабс»/CedrusData, привел классификацию наиболее популярных проектов с открытым кодом для работы с данными. В частности, он выделил категории фейковых продуктов с открытым кодом — тех, что развиваются вендорами (в их числе, например, Dremio, Minio, StarRocks, Delta Lake), псевдо-opensource (таких, как Trino), а также «ортодоксальных» продуктов с открытым кодом — не зависящих от конкретных вендоров (среди них, в частности, Spark и Iceberg). Две первые категории развиваются в рамках Linux Foundation, ортодоксальные — в рамках Apache Software Foundation. В качестве вполне современного стека продуктов open source для работы с данными Озеров рекомендовал выбирать Trino как наиболее функциональный и зрелый продукт для обработки данных и HDFS — для хранения данных.
![]() |
Николай Федоткин: «Особое значение имеет современная архитектура данных, поскольку правильно выбранная архитектура способна существенно повысить эффективность принятия решений» |
Николай Федоткин, технический менеджер DIS Group, предложил обсудить применение подхода Data Lakehouse для повышения эффективности систем на базе ИИ. По его мнению, сегодня особое значение имеет современная архитектура данных, поскольку правильно выбранная архитектура способна существенно повысить эффективность принятия решений. Среди актуальных тенденций Федоткин выделил синергетический эффект, получаемый благодаря совместному применению подходов Data Mesh и Data Fabric, а также подготовку данных для генеративного ИИ.
Тему Data Lakehouse продолжил Алексей Белозерский, руководитель команды Big Data Services компании VK Tech. Он привел данные Gartner, согласно которым архитектура Data Lakehouse близка к выходу на плато стабильности. Что ценно, она позволяет достаточно легко справляться с различными вызовами — как технологическими, так и бюджетными. Так, в случае сокращения бюджетов она благодаря контейнерной архитектуре позволяет уменьшить нагрузку на инфраструктуру, не разрушая общую конструкцию, а в случае роста данных дает возможность расширить инфраструктуру в рамках принятой парадигмы.
Денис Смирнов, генеральный директор компании «Денвик Аналитика», сконцентрировался на работе с разнородными источниками данных, в числе которых приложения «1С». Они становятся самыми важными и, вместе с тем, одними из самых сложных источников данных, встречающихся на российских предприятиях. Стандартные подходы к извлечению данных из «1С» связаны с различными затруднениями: трудоемкость, дороговизна, нарушение лицензионного соглашения. В поисках более эффективного инструмента «Денвик Аналитика» разработала продукт «Экстрактор 1С».
Помимо загрузки данных, аналитикам требуются их преобразование и очистка. Алексей Арустамов, директор Loginom, представил платформу Low-Code, позволяющую аналитикам самостоятельно проводить сложную трансформацию данных. Для проведения стандартизации НСИ и связывания всех данных он предложил использовать LLM.
![]() |
Игорь Галанов: «Традиционные хранилища данных не справляются с задачами, в которых требуется аналитика в реальном времени и быстрая реакция на новые данные» |
Игорь Галанов, бизнес-аналитик компании Polymatica (входит в SL Soft), обратил внимание на то, что традиционные хранилища данных не справляются с задачами, в которых требуется аналитика в реальном времени и быстрая реакция на новые данные. Для решения таких задач Галанов рекомендовал применять СУБД YDB, обеспечивающую возможность работы с витринами и триггерами реального времени и реализации различных стриминговых сценариев. Благодаря применению «тандема» из YDB и Polymatica BI удается добиться снижения времени отклика на запросы, создавать дашборды с данными реального времени без построения ETL-конвейеров и использовать аналитические решения в высоконагруженных сценариях.
Николай Тржаскал, директор по продуктам SL Soft AI и научный сотрудник Центра ИИ МГИМО, высказал уверенность в том, что поиск нужной информации в корпоративном пространстве документов и данных по-прежнему актуален. Для решения этой задачи его коллеги собрали в единую систему ИИ-инструменты Low-Code и No-Code для обработки входящих документов OCR и IDP (автоматизация обработки документов), интеллектуального поиска, ИИ-ассистенты (чаты, голос, RPA), генеративные сервисы, помогающие представить имеющуюся информацию представителям разных аудиторий с разными целями.
Александр Костюков, менеджер продукта Easy Report, развиваемого Sapiens solutions, подробно остановился на аналитическом ассистенте, который встраивается в корпоративный мессенджер и разбирает BI-запросы, сформулированные на естественном языке. Этот продукт представляет собой инструмент для самостоятельной работы с аналитическими системами, позволяющий создавать произвольные запросы «на лету», не прибегая к разработке отчетов и поиску нужных дашбордов. Он способен распознавать намерения пользователей, учитывать и интерпретировать контекст, понимать справочники, глоссарии, бизнес-термины, уточнять детали в режиме диалога.
![]() |
Антон Балагаев: «Количество ИИ-агентов, работающих с СУБД, будет расти примерно на 10% в год» |
О том, что должна представлять собой платформа данных, готовая для работы с системами ИИ (AI-Ready), порассуждал Антон Балагаев, директор Arenadata по ИИ и экспертным решениям. По его словам, одна из ключевых особенностей СУБД класса AI-Ready заключается в том, что она позволяет ИИ-агентам ориентироваться в СУБД: им достаточно получить реквизиты подключения к СУБД и название домашней схемы агентов, все остальное они смогут найти самостоятельно. По оценкам Arenadata, количество ИИ-агентов, работающих с СУБД, будет расти примерно на 10% в год.
На качестве данных сосредоточил свое выступление Дмитрий Дорофеев, главный конструктор ГК Luxms. По информации, которую он привел, различные аналитики и консультанты предлагают отслеживать от 6 до 63 показателей, характеризующих качество данных. Luxms BI практикует оценку девяти показателей: точности, доступности, полноты, согласованности, целостности, разумности, своевременности, уникальности и допустимости.
Свои рекомендации по преодолению проблем с данными в ИИ-проектах привел Станислав Лазуков, генеральный директор компании TData. По его мнению, справиться с этими проблемами в ряде случаев можно, используя ИИ-инструменты. Например, GPT поможет с написанием и оптимизацией SQL-запросов, автоматической проверкой кода, поиском готовых решений из GitHub. Используемый в «Ростелекоме» интеллектуальный помощник «Василиса» способен генерировать не только ответы на вопросы разработчика, но и создавать код, unit-тесты, скрипты CI/CD, составлять на основе кода описания алгоритмов и пр. В «Сбербанке» ИИ-инструменты применяются для прогнозирования выхода из строя узлов больших кластеров, предобработки данных, создания синтетических данных, используются в управлении жизненным циклом данных, мониторинге качества данных, описаний атрибутов с помощью LLM и пр.
![]() |
Виктор Лесников: «У большинства организаций имеются системные проблемы в работе с данными, начиная с расхождений в методологии работы с ними и заканчивая проблемами с качеством данных» |
Виктор Лесников, младший менеджер департамента стратегии данных и ИИ компании Axenix, согласился с коллегами в том, что у большинства организаций имеются системные проблемы в работе с данными, начиная с расхождений в методологии работы с ними и заканчивая проблемами с качеством данных. Применять ИИ-инструменты для их решения специалисты пытаются в таких направлениях, как автоматическая очистка и стандартизация данных, выявление аномалий и мошенничества, классификация и категоризация данных, их интеграция, маркировка и маскирование чувствительных данных, визуализация происхождения и использования мастер-данных, обнаружение и устранение дубликатов и пр. В перспективе сфера применения ИИ-инструментов для данных может расшириться, а основным барьером для этого является доверие со стороны людей.
Впрочем, как отметил Константин Артемьев, генеральный директор Sherpa Robotics, крупные компании получают ощутимый экономический эффект от применения ИИ. Так, в «Норникеле» экономический эффект от использования ИИ составил 100 млн долл. «Северсталь» с помощью ИИ смогла дополнительно произвести 65,5 тыс. тонн металлопроката. Внедрение цифрового помощника в «Трубной металлургической компании» принесло дополнительно по 1 млрд руб. в год. В портфеле Sherpa Robotics также есть ИИ-инструменты, с помощью которых создаются роботы-юристы, консультанты отдела кадров, операторы поддержки ИТ-сервисов, роботы для первичных собеседований и пр.
Возможности применения языковых моделей и GenAI в работе аналитика продемонстрировал в ходе своего мастер-класса Максим Губин, руководитель отдела развития аналитических продуктов компании Visiology. Ведущие другого мастер-класса – Дмитрий Тимаков, руководитель направления ИИ компании НОРБИТ, и его коллега Данила Псарев – сравнили преимущества и возможности известных генеративных GPT-моделей и составили промпт для решения рутинных задач руководителей.
Представители ведущих организаций страны, таких как «ОТП банк», «Сбер», «Альфа‑Банк», МТС, T2, «Газпром Интернэшнл», «Газпром нефть», «Евраз», ГК «Самолет» и других, поделились опытом совершенствования работы с данными и применения основанных на них систем в различных процессах. Ярким завершением форума стала интерактивная сессия «Спроси юриста про ИИ», в ходе которой Артем Евсеев, советник практики интеллектуальной собственности юридической компании ЭБР, обратил внимание экспертов на юридические риски использования ИИ, рассказал о способах их минимизации и представил свой взгляд на связанные с применением ИИ актуальные вопросы, волнующие представителей бизнеса и ИТ.