ОТП Банк внедрил соглашение об уровне качества данных и автоматизированный контроль качества данных. Проект направлен на фундаментальную трансформацию управления данными в банке – от разрозненных процессов к единому корпоративному пространству Data Governance с автоматизированными правилами и метриками качества. О реализации проекта рассказывают Николай Шевцов, CDO ОТП Банка, и Елена Будерацкая, лидер команды Data Governance, – номинанты на премию Data Award.

- Участвуя в Data Award в прошлом году, вы рассказали об основных этапах внедрения подходов Data Governance как части корпоративной культуры. Каковы основные успехи за прошедший год, чему были посвящены основные усилия?

Николай Шевцов: За прошедший год мы сделали качественный шаг вперед – от построения фундамента Data Governance к операционализации. Если раньше фокус был на создании структуры, ролей, каталога и культуры, то в этом году мы сосредоточились на том, чтобы сделать качество данных измеримым и управляемым.

Основные усилия были направлены на внедрение соглашений об уровне качества данных (Data Quality Level Agreement, DQLA) и автоматизированных проверок качества. Мы ушли от ручного контроля и точечных инициатив к системной модели, где качество данных закреплено через SLA, владельцев и прозрачные метрики.

На сегодняшний день у нас заключено более 150 DQLA, охватывающих ключевые домены данных. И самое важное – качество данных перестало быть темой обсуждения «когда что-то пошло не так». Оно стало регулярной управляемой величиной.

- В чем суть проекта, направленного на выстраивание всеобъемлющей системы качества данных?

Елена Будерацкая: Суть проекта заключается в построении централизованной платформы Data Governance как единого источника истины: каталога данных, бизнес-глоссария, доменов, моделей и владельцев данных. При этом внедряются автоматизированные проверки качества данных (DQ Checks), которые обеспечивают контроль полноты, консистентности, уникальности и корректности значимых банковских данных на всех этапах жизненного цикла. Важный этап – разработка и внедрение DQLA – стандартизированных SLA-правил качества, которые обеспечивают измеримость и прозрачность качества данных. Конечно же, проводится интеграция с бизнес-процессами и регуляторными требованиями для автоматического мониторинга и предупреждения дефектов, влияющих на отчетность, риск-модели и клиентские сервисы.

Ключевым уникальным элементом являются не просто технические DQ-проверки, а система автоматизации качества 'by design', где аналитики могут генерировать и запускать проверки в 10 раз быстрее – в течение минут вместо часов или дней.

- Почему это важно?

Н.Ш.: Качество данных – это не техническая деталь, а критически важный бизнес-фактор. Ошибки в данных напрямую приводят к искаженным аналитическим выводам и неправильным бизнес-решениям, ошибкам в регуляторной отчетности и рискам нарушений требований ЦБ РФ, некорректному скорингу клиентов, потере клиентов и дохода, дополнительным затратам на исправление последствий ошибок. Даже небольшие неточности в данных множатся через сложные банковские процессы, приводя к значительным финансовым потерям и ухудшению клиентского опыта.

- Как выстроена платформа качества?

Е.Б.: Решение реализовано внутри корпоративной инфраструктуры ОТП Банка, с интеграцией в существующие хранилища данных, аналитические витрины, операционный и детализированный слои хранилища данных, источники транзакций и внешние системы отчетности. Их архитектура ориентирована на прозрачность, прослеживаемость и автоматизированный мониторинг качества. Инструментами выступают корпоративная платформа Data Governance с каталогом данных и метаданными, платформа контроля качества данных, интегрированная с DQLA, а также MDM-система для унификации мастер-данных и удаления дублей.

Типы данных, охваченные DQLA и авто-проверками: клиентские данные – личные, контактные, поведенческие; транзакционные данные; скоринговые данные и риск-модели; регуляторные данные и отчетность; мастер-данные и справочники; метаданные, data lineage, бизнес-глоссарий.

- Что собой представляют DQLA с практической точки зрения?

Е.Б.: С практической точки зрения DQLA – это прозрачная договоренность между владельцами и потребителями данных о том, какими должны быть данные и какой уровень качества мы считаем допустимым. Это не просто документ. Это конкретные показатели: полнота, корректность, своевременность, согласованность, зафиксированные для конкретных наборов данных. У каждого показателя есть владелец, порог допустимого отклонения и механизм контроля.

Главное, что DQLA – это часть экосистемы управления качеством данных, встроенная во фреймворк разработки данных, с возможностью контроля и мониторинга уровня соблюдения соглашения. Это значит, что требования не остаются на бумаге – они регулярно проверяются, и любые отклонения становятся прозрачными.

Фактически DQLA переводят разговор о данных из эмоциональной плоскости в управляемую: есть индикатор, есть SLA, есть ответственность.

- Были ли сложности с бизнесом в ходе внедрения DQLA?

Н.Ш.: Скорее, был этап осмысления. Когда мы начали говорить о том, что качество данных будет измеряться и закрепляться через SLA, это означало появление прозрачной ответственности. И это нормально: любой зрелый процесс требует пересмотра привычных подходов. Но принципиально важно, что мы не навязывали DQLA как техническую инициативу. Мы говорили с бизнесом на языке рисков, эффективности и доверия к аналитике. Когда становится понятно, что дефекты данных влияют на управленческие решения и финансовый результат, сопротивление сменяется вовлеченностью.

Сегодня бизнес не воспринимает DQLA как дополнительную нагрузку. Это инструмент, который помогает им доверять данным и принимать более устойчивые решения.

- Какие результаты достигнуты?

Е.Б.: В банке заключено более 150 DQLA – согласованных SLA-правил качества данных, применяемых в ключевых процессах. Произошло существенное повышение достоверности данных и снижение ошибок данных. Внедренный автоматизированный контроль качества предупреждает и предотвращает дефекты на продакшн-уровне, снижая операционные риски. Значительно ускорена разработка DQ-проверок.

- Как появление DQLA и автоматизированных проверок повлияло на качество данных? Какие показатели изменились?

Е.Б.: Самое заметное изменение – это переход от реактивного качества данных к проактивному, что несомненно ведет к снижению количества инцидентов качества данных, влияющих на отчетность и аналитику. Мы сократили время выявления инцидентов качества данных, потому что проверки теперь работают автоматически, а не запускаются вручную, и на более ранних этапах. Это означает, что проблема фиксируется практически сразу, а не через недели. Кроме того, снизилась доля повторных исправлений и ручных доработок. Аналитики стали тратить меньше времени на проверку корректности данных и больше – на анализ.

Важно и то, что уровень прозрачности вырос. Мы видим метрики качества регулярно и можем управлять ими, а не реагировать на последствия.

- А как изменение качества данных отразилось на бизнес-показателях?

Н.Ш.: Изменение качества данных напрямую влияет на устойчивость бизнеса. Когда данные стабильны и воспроизводимы, снижается риск некорректных управленческих решений, ускоряется аналитика, повышается точность моделей. Мы видим снижение операционных рисков, повышение доверия к отчетности и более быстрый цикл принятия решений. Это не всегда мгновенно выражается в конкретной цифре в отчете о прибыли и уьытках, но это фундамент, на котором строятся финансовые результаты.

- Какая метрика качества лично для вас является главной?

Н.Ш.: Если говорить о главной метрике лично для меня – это воспроизводимость. Если показатель сегодня и завтра рассчитывается одинаково, если модель дает предсказуемый результат при тех же входных данных – значит, мы контролируем качество.

Доверие к данным – вот ключевой показатель. Потому что без доверия невозможно масштабировать ни аналитику, ни ИИ, ни цифровые продукты.

- В чем роль проекта для бизнеса банка?

Е.Б.: Проект не просто технический, а стратегический для всего банка: нам удалось превратить данные в измеримый актив, повысить операционную устойчивость, снизить регуляторные риски и создать основу для инноваций на основе данных. Кроме того, за счет автоматизации и повышения качества данных банк сокращает затраты на исправление ошибок, оптимизирует процессы аналитики и маркетинга, повышает эффективность принятия решений и улучшает результаты ключевых бизнес-метрик. Достоверные данные приводят к корректным скоринговым решениям, персонализированным предложениям, снижению ошибок в коммуникациях и улучшенному клиентскому опыту, что напрямую влияет на удовлетворенность и удержание клиентов. Наконец, формирование культуры управления данными поднимает уровень дата-грамотности, снижает конфликты между подразделениями, ускоряет процессы принятия решений и создает устойчивую цифровую компетенцию банка.

Наш проект – лучший пример глубокого внедрения Data Governance и Data Quality в банковской среде, где качество данных перестало быть абстрактной метрикой, а стало реальной движущей силой эффективности, безопасности, инноваций и роста бизнеса.

- В каком направлении будет развиваться проект?

Н.Ш.: Планируем запуск MVP автоматической генерации бизнес-DQ правил, где система сама предлагает проверку для каждого типа данных, исходя из семантики – например, «паспорт», «дата рождения». Увеличим покрытие DQLA и включим в них новые домены данных. Расширим автоматизацию валидации данных на этапе первичного ввода и обработки, что дополнительно снизит количество ошибок и повышает клиентский опыт. Кроме того, необходимо более глубокое вовлечение бизнес-пользователей в аналитические процессы self-service.

Бизнес-метриками будут выступать увеличение качества аналитики в режиме реального времени и снижение стоимости принятия решений, повышение конверсии заявок и снижение доли отказов при аналитике, а также улучшенная отчетность и снижение затрат на исправление неточностей.