Управление данными из модного словосочетания переросло в целую отрасль ИТ-индустрии — в 2022 году мировой рынок Data Governance оценивался примерно в 2,6 млрд долл. с прогнозом роста около 20% в год [1]. Рост объемов и разнообразия данных побудил ведущие российские компании и предприятия задуматься над применением решений для управления этими данными. Многие корпорации уже прошли этап оценки своих текущих практик управления данными и разработки планов, сформировали стратегии развития и политики управления данными. Но образовался большой разрыв между лидерами рынка и остальными компаниями — за счет инициатив в области данных первые могут тратить до 75% меньше времени на операции, связанные с подготовкой данных для аналитики, задач ИИ и пр. [2].

Вместе с тем развитие рынка управления данными привело к появлению множества готовых коммерческих решений и систем категории Open Source, поддерживающих автоматизацию процессов ведения каталога метаданных, профилирования данных, контроля качества данных и пр. Такие системы могут быть внедрены сравнительно небольшими усилиями, а компании получают возможность расходовать на это относительно небольшие ресурсы. Однако, как и в случае с любыми системами автоматизации процессов, подобные средства лишь помогают решить проблему. Успех зависит от того, правильно ли на предприятии выстроены процессы — если они не достигли определенного уровня зрелости, внедрение системы управления данными ожидаемых плодов не принесет.

В доступном информационном поле сегодня много материалов, посвященных внедрению тех или иных информационных систем, а вот публикаций об особенностях оценки зрелости процессов компании, к сожалению, относительно мало [3].

Начало

В DMBOK (Data Management Body of Knowledge) [4] есть глава про подходы к оценке зрелости процессов управления данными. В ней предлагается, оценив уровень зрелости для каждой из областей знаний, определить пробелы и точки роста, а затем разработать дорожную карту развития. Рекомендуется проводить эту оценку поэтапно:

  • сбор информации;
  • оценка;
  • интерпретация результатов;
  • подготовка отчета.
Рис. 1. Рамочная структура управления данными DAMA-DMBOK2 (колесо DAMA) [5]

Ограниченность ресурсов требует эффективного планирования и их бережного использования. Очевидно, что управление данными проводится в организации еще до внедрения практик рамочной структуры (рис. 1) и обычно представляет собой договоренности, практики и инструменты, используемые для решения насущных задач. Часто подобные инициативы исходят от сотрудников и подразделений, чьи результаты напрямую зависят от организации работы с данными. Проводя оценку зрелости DMMA и внедряя практики рамочной структуры управления данными, полезно воспользоваться этими наработками. В нашей ситуации реализация инициатив по управлению данными осуществлялась в условиях, когда функции Data Office и CDO были переданы департаменту аналитических решений.

Сбор и оценка информации

Если у компании нет возможности начать оценку зрелости в масштабах всей организации, то DMBOK рекомендует делать локальные оценки с привлечением ограниченного круга экспертов и распорядителей данных. Они смогут точечно оценить уровень зрелости по наиболее критичным или перспективным для компании направлениям. Есть смысл задействовать архитекторов информационных систем, системных аналитиков, дата-инженеров и дата-аналитиков. Мы, например, проводили серию встреч в формате мозговых штурмов, каждая из которых была посвящена отдельной области знаний DAMA (рис. 1). Цель такого штурма — перечислить артефакты, процессы и роли, которые уже существуют в организации и относятся к управлению данными в конкретной прикладной области. Изначально никто из приглашенных специалистов не был знаком с рамочной моделью управления данными, но во всех встречах участвовали эксперты по управлению данными, которые вводили присутствующих в курс дела. Чтобы такие встречи были эффективными, с участниками проводился предварительный разбор контекстной диаграммы областей знаний (рис. 2). Кроме того, эксперт объяснял, какие из упоминаемых артефактов и процессов относятся к области знаний, которой посвящена встреча, а какие нет и почему.

Рис. 2. Контекстная диаграмма области знаний [5]

Полученные списки позволили впоследствии составить план внедрения системы управления данными и соответствующим образом ее настроить. В таблице приведен пример с результатом такой встречи по метаданным.

Как без потерь оценить актуальный уровень зрелости компании

Внимание к уже существующим на предприятии практикам позволило снизить сопротивление изменениям со стороны причастных к этим практикам департаментов и сотрудников. Когда сотрудники, задействованные в процессах по управлению данными, поняли, что рамочная модель внедряется не для кардинального слома привычных способов работы с данными, а для их улучшения, они стали больше заинтересованы в новых идеях.

Особое внимание следует уделить интервью с руководителями и экспертами бизнес-направлений, а также со специалистами сервисных подразделений, таких как служба безопасности и финансовая служба. Именно они распоряжаются ресурсом и в перспективе могут стать спонсорами изменений или даже агентами влияния. В процессе интервью определяются проблемы работы с данными, достаточность обеспечения данными и незакрытые потребности.

Данные, которые были получены в результате интервью, фильтровались:

  • проблемы, связанные с данными, отделялись от прочих;
  • проблемы с данными, относящиеся к дата-продуктам, отделялись от процессных;
  • определялись точки пересечения и конфликты требований разных подразделений;
  • выявленные потребности преобразовывались в задачи, и фиксировались зависимости.

Результатом встреч стало определение уровня зрелости по CMM [6], который отличался в разных подразделениях, а также формирование классифицированного списка потенциальных улучшений и зависимостей между ними. Преобразование в задачи позволило выявить будущих заказчиков корпоративной системы управления данными.

От мозговых штурмов и интервью был получен еще один эффект. Разъяснение принципов и методов управления данными позволило повлиять на организационную культуру, подчеркнуть важность отношения к данным как к ценному активу, добиться понимания критичности работ по управлению данными и наладить сотрудничество.

Дополнительным источником информации о потребностях организации в средствах управления данными стал анализ текущих и прошлых стратегических проектов компании, связанных с данными. Стратегические проекты направлены на реализацию наиболее перспективных и приоритетных направлений. Как правило, такая деятельность находится на особом контроле, и проблем с тем, чтобы получить информацию о ходе работы, целевых показателях и возникших сложностях, нет. Для нас ценной стала история задач в корпоративном таск-трекере (Jira). Анализ этих данных позволил выявить точки роста, связанные с данными, и конкретные подразделения, с ними связанные. Хороший признак наличия таких точек — циклически повторяющиеся ошибки и сбои, связанные с данными или ошибками в системах. Тот факт, что точки роста были связаны со стратегическими проектами, позволил упростить обоснование перед топ-менеджментом ценности инициатив по данным.

Интерпретация результатов и подготовка отчета

Проецирование практики управления данными из DMBOK на текущее состояние дел в компании позволило разработать меры по повышению уровня зрелости. Выявленные незакрытые потребности помогли определить, какие из этих мер наиболее востребованы.

Адресность опросов и определение текущих ролей, связанных с управлением данными, позволили уже на этом этапе определить, кто готов тратить ресурс на имплементацию практик управления данными именно в тех случаях, когда они могут удовлетворить актуальные потребности заинтересованных сторон.

Сформулировав пул проектов, можно переходить к продаже внутренним заказчикам услуг по разработке решений. Основная задача на этом этапе — формулировка эскиза проекта, демонстрирующего, как можно решить проблемы заказчика и вернуть потраченные ресурсы. Такой подход представлялся наиболее действенным в случае горизонтального распространения в компании практики управления данными, ориентированного на быстрый и конкретный результат. Понимая необходимость уже на первых этапах доказывать эффективность практик управления данными, мы разбили список проданных проектов по следующим критериям:

  • соответствие стратегическим целям компании;
  • вычислимость и наглядность материального результата;
  • отношение затрат к результату.

Полученный список проектов представляет собой основу корпоративной программы развития управления данными. В нее вошли проекты, связанные с четырьмя областями знаний: метаданные, качество данных, архитектура и хранение, операции с данными. Это самые востребованные направления, позволяющие добиться ощутимого результата при сравнительно небольших затратах.

Чтобы защитить программу по развитию управления данными перед руководством, ее сформировали в виде плана с подробными этапами, затрагивающими оперативный период в шесть месяцев и список конкретных задач в интересах конкретных заказчиков. Из менее приоритетных проектов была составлена дорожная карта на полтора года.

Для успешной защиты плана перед руководством компании потребовались конкретные показатели затрат и метрики оценки результатов: количество пользователей, перешедших на новые инструменты управления данными; трудоемкость задач, связанных с данными для оперативного периода, и пр.

***

Подготовка к развертыванию системы управления данными означает не только развитие соответствующей корпоративной культуры — внутренние заказчики должны осознать и сформулировать свои потребности по работе с данными. Более того, непременно найдутся заказчики, готовые активно участвовать в управлении данными и стать агентами влияния в компании. В дальнейшем их можно привлекать к регулярным встречам, например в рамках функции Data Office.

Концентрация на насущных проблемах и выход на заказчиков, готовых тратить ресурсы на развитие инструментов и практик улучшения работы с данными, позволяют сформировать программу развития управления данными и быстро перейти к конкретным шагам. Наличие метрик и оценок эффекта от инициатив дает возможность наглядно представить результаты руководству.

Системный подход к формированию пула проектов позволяет выявить взаимосвязи и соседние проблемы, что в итоге означает синергетический эффект от реализации проектов по управлению данными.

Еще один полезный вывод — при реализации функций управления данными не в выделенном Data Office, а в департаменте аналитических решений естественной оказалась именно федеративная, или сетевая, организационная структура компании.

Литература

1. URL: https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/designing-data-governance-that-delivers-value (дата обращения: 21.12.2023).

2. URL: https://www.dataversity.net/trends-in-data-governance-in-2023-maturation-toward-a-service-model (дата обращения: 21.12.2023).

3. Светлана Бова, Алексей Наталенко. Как обосновать инвестиции в качество данных // Открытые системы.СУБД. — 2023. — № 2. — С. 35–37. URL: https://www.osp.ru/os/2023/02/13057147 (дата обращения: 21.12.2023).

4. Николай Скворцов. DAMA-DMBOK2: трудности перевода // Открытые системы.СУБД. — 2020. — № 2. — С. 44–45. URL: https://www.osp.ru/os/2020/02/13055423 (дата обращения: 21.12.2023).

5. DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / Dama International [пер. с англ. Г. Агафонова]. — Москва: Олимп — Бизнес, 2020. — 828 с.: ил. ISBN 978-5-9693-0404-8

6. URL: https://www.techtarget.com/searchsoftwarequality/definition/Capability-Maturity-Model (дата обращения: 21.12.2023).

Антон Смирнов (smirnovanton@yoomoney.ru) — руководитель команды разработки BI, Евгений Виноградов (jonny@yoomoney.ru) — директор Департамента аналитических решений, компания «ЮMoney» (Санкт-Петербург).

Статья подготовлена на основе материалов выступления на форуме «Управление данными 2023».