Билайн и red_mad_robot: от «хаоса пилотов» ИИ к зрелым практикам

Билайн в партнерстве с red_mad_robot представили DCD Design (Domain–Collection–Document) — тиражируемый подход и продуктовую архитектуру работы с корпоративными данными и знаниями для ИИ-агентов. Это позволяет перевести корпоративных ИИ-агентов из разовых внедрений в повторяемую практику: дать компаниям не единичный чат-бот, а архитектуру знаний, которую можно многократно применять в разных доменах и организациях, сохраняя качество и управляемость. О создании решения рассказывают Олег Конорев, директор департамента развития машинного обучения и искусственного интеллекта Билайн Big Data & AI, и Алексей Жданов, директор продукта Smart Platform компании red_mad_robot — номинанты на премию Data Award.

- Как появилось решение DCD Design?

Алексей Жданов: Идея DCD Design родилась из практики множества проектов внедрения технологии генерации с дополненной выборкой (Retrieval-Augmented Generation, RAG), где каждый пилот приходилось собирать с нуля: от структуры базы знаний до настройки поиска и оценки качества. На демо «наивный» RAG работал приемлемо, но на реальных корпусах — регламенты, юридические документы, сложные инструкции — начинал терять контекст, путаться в многосоставных запросах и давать нестабильный результат.

Мы пришли к выводу, что без доменно ориентированной архитектуры знаний и управляемого сценария вокруг модели бизнесу сложно выйти за рамки «хаоса пилотов». Так появился DCD (Domain–Collection–Document): иерархия знаний и управляемый роутинг запросов, который можно переносить между заказчиками и доменами без переизобретения архитектуры.

- Почему этот подход важен?

Олег Конорев: Многие компании застревают на уровне единичных пилотов: каждый ИИ агент проектируется с нуля, архитектура знаний не формализована, а накопленный опыт сложно перенести на других заказчиков или процессы. Рынок перегрет пилотами и испытывает дефицит устойчивых тиражируемых решений. DCD Design решает именно эту проблему: он делает корпоративные знания управляемым активом — со структурой, метаданными, версиями и границами доменов — и переводит внедрение ИИ агентов в стандартизируемый процесс с измеримым качеством.

Алексей Жданов: Мы исходили из простой гипотезы: качество генерации резко растет, когда модель работает не по «плоскому» полю документов, а внутри семантически однородных областей знаний. Поэтому DCD вводит три уровня — Domain, Collection, Document — и управляемую маршрутизацию запроса сверху вниз. В результате один и тот же подход к доменам, коллекциям, подготовке текстов и маршрутизации запросов переносится между заказчиками и доменами без переизобретения.

- Какой подход к решению задачи был выбран?

А.Ж.: Мы сознательно сфокусировались не на доработке языковой модели, а на архитектуре вокруг нее — на том, как корпоративные знания организованы и как по ним проходит запрос. DCD задает трехуровневую карту знаний и управляемый маршрут обработки: сначала система определяет, в какой области знаний искать, затем — в каком тематическом срезе, и только после этого извлекает источники и формирует ответ.

Этот маршрут дополняется «умным» чанкингом (sliding window, header based, contextual/meta chunking), гибридным поиском и встроенной валидацией через Guardrails и RAGAS подходы. Если сказать проще: мы сначала «запираем» запрос в правильной области знаний, затем извлекаем релевантный контекст и только потом генерируем ответ. Это снижает риск смешения контекстов и версий документов и дает стабильный результат на сложных запросах.

О.К.: Для Билайна было принципиально, что этот подход сразу интегрируется в существующую ИИ-платформу и процессы, а не живет отдельным исследовательским проектом. DCD Design встроен в Smart Platform, которая уже использовалась для запуска ИИ-агентов: ассистентов продавцов, операторов контакт центров, аналитиков, маркетологов, ассистентов секретаря. Поэтому архитектуру изначально проектировали совместимой с on premise развертыванием, гибридным поиском и агентными сценариями.

- Какие технологии применялись при разработке?

А.Ж.: Технологический стек состоит из нескольких слоев. На уровне данных мы подключаемся к корпоративным системам (Confluence, Jira, Google Drive, реляционные СУБД и др.), забираем оттуда документы, таблицы, изображения, аудио и видео и нарезаем их на удобные для ИИ фрагменты: по скользящему окну, по заголовкам и с учетом контекста и метаданных — это сохраняет структуру и смысл даже в больших разнородных массивах.

На уровне поиска используется гибридная схема: классический полнотекстовый поиск, поиск по «смысловым» векторным представлениям текста и их комбинации с семантическим переупорядочиванием результатов; мы дополняем это приемом HyDE (сначала генерируем «гипотетический» ответ и по нему подбираем документы), расширением исходного запроса близкими формулировками и выделением ключевых сущностей (NER — имена, компании, даты, суммы и т.п.).

Поверх этого работает DCD Router — компонент, который шаг за шагом выбирает нужную область знаний и набор документов, а затем фиксирует маршрут в структурированном виде.

Отдельный слой — защитный контур Guardrails: фильтры нежелательного контента, проверки на галлюцинации и нарушения политик компании, плюс подходы RAGAS и LLM as Judge. Важно, что все эти компоненты собраны не как «витрина технологий», а как повторяемый контур качества: он одинаково применяется при запуске ИИ-агентов на новых корпусах и у новых заказчиков.

- Какой математический аппарат использован?

А.Ж.: В основе решения — современные методы векторного представления текстов, гибридного поиска и маршрутизации. Система сопоставляет запрос пользователя с релевантными фрагментами документов как по ключевым словам, так и по смыслу. DCD добавляет к этому управляемую структуру знаний: выбор домена и коллекции превращает поиск из «поиска по всему массиву» в поиск внутри правильной области — и это повышает устойчивость результата.

Для оценки качества используется подход LLM as Judge: сама модель выступает «экзаменатором» и по каждому ответу автоматически проверяет три критерия — полноту и релевантность ответа (SB ARC), правильность подбора контекста (SB CR) и фактическую точность, то есть отсутствие «выдуманных» фактов (SB FA). По сути, мы перевели в автоматический и воспроизводимый формат ту работу, которую обычно делают живые асессоры вручную.

Отдельно мы провели серию экспериментов на реальных данных, сравнив три конфигурации: базовый RAG без доменной структуры, DCD с улучшенной нарезкой документов и полный DCD с защитным контуром Guardrails. Дополнительно качество проверялось на тестовой выборке из 100 наиболее частотных и практически значимых реальных запросов, чтобы измерить вклад каждого слоя по отдельности и отделить «эффект архитектуры» от случайной настройки под один кейс.

- Какие данные используются?

О.К.: Решение рассчитано на типичный для крупных организаций ландшафт данных: регламенты, договоры, инструкции, базы знаний; Confluence, Jira и другие системы коллективной работы; файловые репозитории – документы, презентации, таблицы; реляционные базы и специализированные хранилища. В случае Билайна это десятки и сотни тысяч страниц, живущие в разных системах.

Во всех внедрениях используется один и тот же принцип: знания структурируются по доменам и коллекциям, снабжаются метаданными и версионностью, индексируются в гибридном поиске, а запрос маршрутизируется к релевантному сегменту знаний. Набор коннекторов и сценариев подготовки данных повторяется, меняются только конкретные источники и доменная разметка. Это критично для тиражируемости: мы не переписываем пайплайн под каждую новую организацию, а адаптируем уже отлаженный шаблон.

- В чем роль проекта для вашего бизнеса?

О.К.: Для Билайна DCD Design — это продуктовый фундамент. Он позволяет строить портфель ИИ-агентов по единому шаблону, снижать стоимость нового внедрения и обеспечивать предсказуемое качество. На его базе уже развернуты ИИ-агенты для корпоративных клиентов: помощники продавца, операторы контакт центров, аналитики и маркетологи — это не просто интерфейсы «вопрос–ответ», а решения, встроенные в реальные процессы.

Вместо множества уникальных проектов формируется общий стандарт: архитектура знаний, типовые настройки, единые метрики качества и контур контроля рисков. Это позволяет масштабировать решения на новые домены и поддерживать их как продукт, а не как набор разрозненных интеграций.

А.Ж.: Для нас это способ превратить накопленный инженерный и исследовательский опыт в тиражируемый продукт. Мы ушли от истории, где каждый проект — уникальный RAG-пилот, и пришли к архитектуре, проверенной на боевых сценариях. Ключевой результат здесь — предсказуемость: новые внедрения запускаются быстрее, потому что критические паттерны (структура знаний, подготовка данных, контур качества) уже упакованы и повторяются.

- Как этот подход стал тиражируемым?

А.Ж.: За первый год DCD Design был оформлен в воспроизводимый продуктовый контур внедрения. Стандартизировано то, что в большинстве проектов делается «вручную»: структура корпоративных знаний и правила подготовки данных, а также управляемый маршрут обработки запроса. Подход задает единый способ организации знаний, маршрутизацию запросов и подключение контуров генерации и валидации ответа.

При запуске у нового заказчика применяется одна и та же схема: выделяются домены и коллекции, документы готовятся по смысловой структуре и обогащаются метаданными и версионностью, настраивается гибридный поиск и защитный контур. В результате каждый новый агент создается по единому сценарию и с едиными критериями качества, а накопленный опыт переносится на новые домены и процессы без пересборки архитектуры с нуля.

О.К.: Тиражируемость закреплена не как «набор инженерных приемов», а как комплект артефактов и практик: референс-архитектура, модули пайплайна, методика доменной декомпозиции, типовые настройки и набор метрик качества, позволяющий сопоставимо оценивать результаты на разных корпусах и у разных заказчиков. Воспроизводимость подтверждается масштабом использования: более 20 организаций, более 300 активных пользователей, около 30 тыс. запросов в месяц. Фактически это «playbook внедрения»: новый домен или новый заказчик подключается по одному стандарту, а качество контролируется одинаковыми метриками.

- В чем ваш проект уникален?

О.К.: Это не просто еще одна RAG система, а формализованный доменно ориентированный дизайн, который описывает, как должны быть устроены корпоративные знания для ИИ-агентов. Уникальность именно в тиражируемости архитектуры: один и тот же подход к доменам, коллекциям, подготовке данных и маршрутизации переносится между заказчиками и доменами без переизобретения.

А.Ж.: DCD Design совмещает архитектуру корпоративных знаний, управляемый роутинг запросов и встроенный защитный контур, оставаясь при этом независимым от конкретной модели или платформы. Технология одновременно дает измеримый прирост качества и служит «шаблоном внедрения», благодаря чему ее можно использовать как базу для целой линейки ИИ-агентов разных типов. То есть тиражируется не только продукт, но и метод: как устроить знания, как измерять качество и как безопасно вводить агента в рабочий процесс.

- Каких результатов удается достичь?

А.Ж.: На производственных корпусах связка доменной иерархии и smart подготовки данных дала порядка 40% прироста релевантности ответов по сравнению с базовым методом нарезки в «плоском» RAG, особенно на сложных и содержательно насыщенных документах. В типовых сценариях переход к DCD-архитектуре обеспечивает рост точности ответов с 78% до 94% — то есть практически полное устранение критических ошибок. Средняя точность достигает порядка 92% в рабочих ассистентах и до 96% в сценариях с API-интеграциями. Экономия времени сотрудников превышает 30%, а снижение нагрузки на поддержку оценивается в 30–40%. Происходит сокращение времени до первого ответа с 17 до 5,2 секунд за счет параллельной валидации.

О.К.: Важно, что эти цифры не «под один кейс» — они воспроизводятся на разных корпусах и у разных заказчиков. В кейсе с крупным девелопером, например, точность ответов достигает 96%, нагрузка на профильные отделы снижается примерно на 30%, а среднее время ответа составляет 3,7 секунды. Это важный момент: результаты удерживаются при переносе подхода на новые домены и новые наборы знаний, а не обнуляются при каждом следующем внедрении.

- Каково значение проекта для отрасли?

О.К.: DCD Design демонстрирует готовый шаблон тиражируемого дата-подхода к ИИ-агентам: от организации знаний до сценариев валидации. Он показывает, что практику работы с корпоративными данными и ИИ можно упаковать в повторяемую архитектуру: структура знаний, правила подготовки данных, управляемый маршрут запроса и единые метрики качества. Такой подход ускоряет переход отрасли от «хаоса пилотов» к зрелым практикам, которые можно переносить между компаниями и доменами без потери результата и доверия к ответам. По сути, DCD Design превращает внедрение ИИ-агентов из набора уникальных кейсов в воспроизводимый стандарт.

- В каком направлении развивается решение?

А.Ж.: Сейчас мы развиваем DCD подход в нескольких направлениях. Во первых, углубляем интеграцию с мультиагентными системами: координаторы задач, специализированные агенты для поиска, анализа, генерации и валидации уже работают в Smart Platform и позволяют решать сложные цепочки действий, а не только сценарии «Вопрос-ответ». Во вторых, расширяем методики оценки качества: продолжаем развивать RAGAS подходы, LLM as Judge и строгие бинарные метрики, чтобы автоматически контролировать не только точность, но и устойчивость, отсутствие галлюцинаций и соответствие регуляторным требованиям.

О.К.: Со стороны Билайна фокус на двух вещах: обогащение платформы новыми кейсами и еще более тесная интеграция с управлением знаниями внутри компаний. Мы видим, как ИИ-агенты на базе DCD Design постепенно становятся штатным инструментом — от помощников продавца и операторов контакт центров до ассистентов руководителей и аналитиков. Наша цель — чтобы внедрение ИИ-агентов перестало быть разовым пилотом и стало стандартной масштабируемой практикой. Новый домен или агент — это не новый проект с нуля, а применение проверенного шаблона. В этом и есть суть зрелого тиражируемого подхода.

Билайн и red_mad_robot: от «хаоса пилотов» ИИ к зрелым практикам

Zero Trust и Data Governance: как управление данными превращает дата-каталог в ядро контура безопасности