До недавнего времени отечественная индустрия данных и искусственного интеллекта оставалась в тени западной, шаг за шагом повторяя то, что делали глобальные лидеры рынка. Отечественным разработчикам было непросто достучаться до умов и сердец крупных заказчиков и инвесторов. После ухода западных вендоров индустрия наконец почувствовала твердую почву под ногами и обрела новые стимулы для развития. Подробный разговор о них пойдет на ближайшем форуме Data&AI 2024.

Крутой поворот

Произошедшие два года назад события привели к крутому повороту российской индустрии данных и ИИ: уход западных вендоров в сочетании с общим курсом на импортозамещение открыли перед российскими разработчиками широкие горизонты.

Сергей Галеев: «Российская ИТ-индустрия сейчас сконцентрировалась на импортозамещении, безопасности, защите данных и суверенитете технологий»

«Российская ИТ-индустрия сейчас сконцентрировалась на импортозамещении, безопасности, защите данных и суверенитете технологий. Основное внимание государства и бизнеса нацелено на развитие внутренних компетенций и инновационных решений, — делится наблюдениями Сергей Галеев, руководитель отдела backend-разработки компании SimbirSoft. — Кроме того, активизировалось развитие отечественных ИТ-продуктов, в том числе с использованием ИИ. Предполагается, что до 2030 года Правительство РФ направит около 24,6 млрд руб. на развитие технологий ИИ и машинного обучения». Вместе с тем, продолжает Галеев, для создания и внедрения сложных систем ИИ требуются особые компетенции в этой области и реальный практический опыт, которые есть только у профильных ИТ-компаний, поэтому разработка таких решений все чаще передается на аутсорсинг.

Стремление обезопасить данные в сочетании с регуляторными ограничениями на их хранение стали причинами весьма сдержанного отношения к облакам, которое сохранилось и после ухода западных ИТ-игроков. «Это обстоятельство негативно сказывается на возможности широкого применения не только вертикальных решений, в которых прикладные бизнес-кейсы жестко привязаны к системному и аппаратному стеку, но и на моделях ИИ, для обучения и дообучения которых нередко требуются большие вычислительные мощности на достаточно ограниченное время», — отмечает Антон Балагаев, директор по консалтингу Arenadata.

Алексей Цырюльников: «Основное достижение отечественной индустрии данных в том, что она у нас есть, она самостоятельна, конкурентоспособна и она развивается»

О настороженном отношении к облакам говорит и Алексей Цырюльников, заместитель генерального директора «Юниверс Дата». Также он обращает внимание на существенную проработку вопросов информационной безопасности в российских решениях, что стало особенно заметно в последние пару лет. «Зарубежные решения существенно слабее в этой части», — считает Цырюльников.

Кроме того, он считает важным разделять две индустрии — данных и ИИ: «Во-первых, потому, что ИИ служит инструментом для индустрии данных, а, во-вторых, потому что о российской индустрии ИИ на нынешней стадии ее развития можно говорить весьма условно. Как следствие, и влияние ухода вендоров было разным: на индустрии данных он отразился гораздо ощутимее».

«После ухода крупных игроков наш рынок вернулся к состоянию “честной конкуренции”: к концу 2023 года за место под солнцем боролись около 80 (!) российских BI-решений, — добавляет Михаил Греков, директор по развитию BI-системы Analytic Workspace. — А, как известно, свободная конкуренция — главный двигатель технологического прогресса. Разумеется, через пару лет на вершине мы увидим пять-шесть самых популярных решений, которые смогли развиться быстрее остальных и добиться технологического преимущества».

Опора — на импортозамещение

Развитие отечественных решений для работы с данными и замена ими закупленных в предыдущие годы систем будет в центре внимания российской индустрии данных — это подчеркивают все опрошенные нами эксперты.

Дмитрий Тимаков: «Использование зарубежных больших языковых моделей сопряжено с геополитическими рисками»

Так, по наблюдениям Дмитрия Тимакова, руководителя направления AI в компании НОРБИТ (входит в группу ЛАНИТ), сегодня почти все ведущие страны концентрируются на поддержании и усилении собственных компетенций и обучении своих специалистов. Как показали события двухлетней давности, такая стратегия более чем оправдана. В сложившейся ситуации использование, например, зарубежных больших языковых моделей сопряжено с серьезными геополитическими рисками. Кроме того, имеется немало вопросов, связанных с конфиденциальностью данных, есть и юридические ограничения. К тому же многие из созданных на Западе моделей не очень качественно работают с запросами на русском языке. «Хотя российские компании и не являются первопроходцами в генеративном ИИ, они успешно развивают свои наработки. Есть примеры, когда отечественные решения превосходят зарубежные», — отмечает Тимаков.

«В текущих реалиях необходимо сформировать фундамент для технологического рывка. Зачатки для этого есть, и намечается развитие, — добавляет Галеев. — Предстоит не только удовлетворить внутренний спрос, но и начать предоставлять решения за пределами России».

«Если говорить о Business Intelligence, то после ухода западных вендоров российские решения получили, конечно, определенный карт-бланш. Однако, во-первых, для бизнес-сектора остаются определенные возможности продолжать использовать зарубежные BI-инструменты, и во-вторых, ситуация может измениться, и западные поставщики вернутся. Непонятно, что тогда придется делать отечественным BI-вендорам, решившим создать “идеальный аналог” QlikView или Power BI?» — делится своими опасениями Греков.

Антон Балагаев: «Оригинальные подходы необходимы тогда, когда существующие понятны и хорошо исследованы. В противном случае легко наступить на чужие грабли»

Цырюльников продолжает: «Едва ли государство будет оплачивать в рамках госзаказа функции, востребованные обычными коммерческими организациями (не госкорпорациями) или задумается о потенциальных зарубежных клиентах. Понятно, что мы получим высокоэффективные инструменты, но они будут сильно “заточены” под нашу специфику».

«Если продукт, ориентированный на использование внутри страны, способен выжить, опираясь на имеющуюся ресурсную базу, то худшее, что с ним может случиться при продвижении за рубежом, — это отсутствие сверхприбыли от реализации на рынках с большей производительностью труда и меньшей эластичностью спроса, — считает Балагаев. — Если же продукт будет чисто дотационным и выход на окупаемость в обозримой перспективе не произойдет и если при этом этот продукт не будет задействован в критической инфраструктуре, то целесообразность его финансирования может оказаться спорной».

России есть чем гордиться в области работы с данными

Как отмечают эксперты, и индустрия данных, и индустрия ИИ в России сейчас находятся на подъеме. Еще очень многое предстоит сделать, но имеющиеся достижения дают веские основания для оптимизма.

Так, Балагаев уверен, что несмотря на меньшее количество доступных на рынке нишевых решений, базовые потребности отечественных организаций в инструментах для работы с данными уже в основном охвачены, при этом есть уже решения, которые превосходят западные аналоги: «Например, технологии класса In-Memory Data Grid (IMDG) у нас самые быстрые в мире, а благодаря первостепенному вниманию к безопасности и катастрофоустойчивости есть возможность предоставлять отечественным заказчикам надежные и отказоустойчивые решения даже для таких высоконагруженных массово-параллельных реляционных СУБД, как Arenadata DB. Наличием таких возможностей в стабильных релизах систем этого класса пока не может похвастаться ни один западный вендор».

Как отмечает Греков, его компания Analytic Workspace добилась больших успехов в области предиктивной BI-аналитики и прогнозирования: «Мы создали готовые автоматические блоки для прогнозирования на основе машинного обучения с предоставлением пользователям возможностей для самостоятельной работы с данными, благодаря чему такого рода прогнозирование становится доступным широкому кругу пользователей BI».

Дмитрий Романов: «Одна из самых значимых тенденций последних лет  включение в состав систем аналитики функций обработки естественного языка»

По словам Дмитрия Романова, управляющего директора «Преферентум» (входит в SL Soft), его коллеги разработали решение для создания хранилища документов, интегрированного с интеллектуальными средствами анализа и поиска текстовой информации на основе собственной оригинальной технологии обработки запросов на естественном языке (NLP) и BI-системы Polymatica: «В таком хранилище документ рассматривается не как абстрактная единица хранения, а как структурированный набор взаимосвязанных бизнес-фактов. Пользователи могут взаимодействовать с интеллектуальным хранилищем, задавая любые вопросы на естественном языке. Визуализация отчетов осуществляется с помощью BI-инструментов Polymatica».

О собственной корпоративной языковой модели Norbit GPT говорит Тимаков: «Она позволяет безопасно использовать новейшие разработки генеративного ИИ с развертыванием на локальной площадке, что дает полный контроль над данными. Решение кастомизируется под задачи клиента и особенности его бизнес-процессов, дообучаясь на его внутренней информации».

«Основное достижение отечественной индустрии данных в том, что она у нас есть, она самостоятельна, конкурентоспособна и она развивается. Немногие страны могут похвастаться чем-то подобным. По всем классам продуктов у нас есть по два-три вендора с решениями очень достойного качества. При наличии должной поддержки со стороны инвесторов или государства они вполне могут выйти на международный рынок. Впрочем, я бы не ждал каких-либо быстрых прорывов в этой области, поскольку здесь идет игра в долгую, — подчеркивает Цырюльников. — Что касается ИИ, тут немного сложнее — решений корпоративного уровня очень мало. Понятно, что крупные игроки активно инвестируют в корпоративные решения, но, по сравнению с международными “монстрами”, этого явно недостаточно. Полагаю, в этой области мы сейчас, скорее, в роли отстающих, даже не догоняющих, поэтому следует искать точки кооперации с крупными игроками из дружественных стран».

Заменять на аналоги или изобретать нечто оригинальное?

Многие российские разработчики и заказчики сегодня ориентированы именно на импортозамещение — на замену западных решений отечественными аналогами. Насколько этот путь оправдан? Не стоит ли задуматься о создании оригинальных подходов и решений для работы с данными и ИИ?

По мнению Цырюльникова, оригинальность технологий не должна ставиться во главу угла, поскольку оригинальность — это характеристика решений. Те, что внедряются взамен прежних западных, вполне могут быть оригинальными. Тем не менее, сама по себе оригинальность не так важна, как охват, серийность, тиражируемость. «Нам нужны тиражируемые решения промышленного уровня, приводящие к снижению стоимости владения одновременно с повышением КПД, — отмечает Цырюльников. — Сейчас российский рынок инструментария для работы с данными находится в стадии становления. После его насыщения настанет время оптимизации и борьбы за эффективность».

«Оригинальные подходы необходимо придумывать тогда, когда существующие понятны и хорошо исследованы, — продолжает Балагаев. — В противном случае легко наступить на чужие грабли. Сложно представить себе ученых из одной сферы науки, не читающих статей друг друга. Инновации в бизнесе — это та же наука». Кроме того, по словам Балагаева, не исключено, что развитие ряда технологий (например, больших языковых моделей) вскоре выйдет на такой уровень, что будет проще и дешевле не изобретать оригинальные продукты на их базе, а обучать специалистов правильно работать с имеющимися. К тому же надо учесть, что доля несостоятельных или непроработанных идей, не доходящих до промышленной эксплуатации, близка к 100%.

Михаил Греков: «Большие перспективы имеются у комплексных решений, хорошо учитывающих российскую организационную специфику в определенных отраслевых нишах»

Тем не менее, перспективы для оригинальных подходов и технологий есть, считает Греков. В частности, они имеются у комплексных решений, хорошо учитывающих российскую организационную специфику в определенных отраслевых нишах. Примером такого нишевого решения может послужить информационно-аналитическая система «ДатаМед», созданная специально для российского здравоохранения.

«Кулибиных у нас всегда было больше чем у кого-либо, — добавляет Цырюльников. — В центрах исследований и разработок почти всех крупных мировых ИТ-вендоров трудится очень много выходцев из нашей страны. Сил у наших ИТ-компаний тоже вполне достаточно. Вопрос в другом: оригинальные подходы и решения должны быть поддержаны покупателями, и вот здесь может быть проблема, поскольку все крупные заказчики боятся пробовать что-то новое, отдавая предпочтение проверенным на западных рынках решениям».

Вероятнее всего, оригинальные решения в области работы с данными наверняка в России появятся, но едва ли их создание будет иметь массовый характер. Большинство отечественных разработчиков пойдет по пути создания аналогов технологий ведущих глобальных игроков, тем более что во многих сегментах спрос на оригинальные решения со стороны российских заказчиков неочевиден.