Практически каждая организация рано или поздно сталкивается с проблемами обеспечения качества данных в своих информационных системах. Сегодня много разговоров вокруг качества данных и важности поддержки их высокого уровня качества, о том, как именно качественные данные помогают снижать риски, повышать эффективность процессов, монетизировать данные и генерировать прибыль на их основе. В большинстве случаев обсуждение аксиоматично, хотя для убедительности и сопровождается красивыми картинками и графиками. Однако проекты по повышению уровня качества данных, как правило, требуют от организации существенных инвестиций: привлечения дополнительных ресурсов для анализа инцидентов и исправления ошибок в информационных системах, доработок информационных систем автоматизации бизнес-процессов и хранилищ данных, реализации процедур контроля качества на каждом шаге трансформации данных. Кроме этого полноценное создание системы управления качеством данных не обходится без внедрения единого глоссария бизнес-терминов и разработки инструментария построения карт потоков данных.

Для обоснования руководству компании или предприятия необходимости расходов на подобные проекты специалистам в области управления данными требуется предоставить убедительные доказательства получения экономического эффекта от реализации активностей, направленных на повышение качества данных.

Руководство любого современного предприятия хорошо понимает, что данные — ценный актив, но можно ли его измерить? Какие данные более ценны: клиентские, сделочные или транзакционные? Каким образом рассчитать доходную часть бизнес-кейса, определяющую экономический эффект от улучшения качества данных конкретных атрибутов клиента (номер телефона, адрес местожительства, категория его качества) или кредитного договора (срочность, сумма основного долга, процентная ставка)? Ясно, что, с точки зрения руководства, для достижения максимального эффекта от внедрения процедур повышения качества данных необходимо в первую очередь сосредоточить усилия на данных, имеющих наибольшую ценность для компании.

Еще в 1999 году австралийские специалисты Дэниель Моуди и Питер Уолш сформулировали принципы оценки данных, отметив, в частности, что ценность данных зависит от частоты их использования. Чем больше сотрудников и подразделений организации используют одни и те же наборы данных в своих бизнес-процессах при условии отсутствия или незначительного роста стоимости их обслуживания, тем больший экономический эффект будет достигнут. При этом, согласно принципу неограниченной доступности данных для совместного использования, если вы поделитесь своими данными, то для вас их ценность не уменьшится. Также еще на заре цифровой эпохи было отмечено, что ценность данных со временем снижается — актуальные данные, как правило, имеют большую ценность. Поэтому в контексте оценки экономического эффекта важно правильно фокусировать работы по повышению качества данных, ориентируясь в первую очередь на максимально используемые в компании данные. При этом эффект от внедрения будет тем выше, чем в большем числе бизнес-процессов компании используются эти данные.

Наибольший экономический эффект принесет также исправление актуальных данных, при условии недопущения появления новых некорректных сведений в информационной системе. При этом необходимо минимизировать затраты на исправление «холодных» (редко используемых) данных. Надо добиться контроля и повышения уровня качества данных в первую очередь в мастер-системах, а уже потом в системах — потребителях данных, включая хранилища и озера данных.

Традиционно выделяют три методики оценки ценности данных (рис. 1).

Как обосновать инвестиции в качество данных
Рис. 1. Методики оценки ценности данных

Оценка по рыночной стоимости, как правило, применяется в случае, когда организация рассматривает данные как продукт, который, как и любой другой, может продаваться и покупаться на рынке: обезличенные данные о поведении водителей такси, обезличенные истории болезней, которые могут быть интересны страховым и фармацевтическим компаниям и пр. В этом случае стоимость данных зависит от себестоимости их производства, спроса и предложения (стоимости подобных данных, предлагаемых другими игроками рынка), а также выбранной компанией стратегии ценообразования. При этом повышение качества данных (качества продукта) непосредственно влияет на его конечную стоимость либо приносит дополнительную прибыль за счет увеличения объема продаж.

Оценка стоимости на основе затрат подразумевает анализ всех затрат на сбор, обработку и предоставление итогового набора данных. Данные стоят ровно столько, сколько на них потрачено, но никак не учитывается прибыль, полученная благодаря этим данным, — при этом уровень качества данных не оказывает прямого влияния на их стоимость. Эта методика в большей степени подходит для оценки стоимости данных как нематериального актива (если организация рассматривает такой подход). Международные стандарты финансовой отчетности определяют следующие характеристики нематериального актива: отсутствие физической формы, идентифицируемость (возможность разделения, продажи, передачи, лицензирования, аренды или обмена), контроль со стороны организации, наличие вероятной будущей экономической выгоды. Данные вполне удовлетворяют этим условиям, поэтому в принципе такой подход возможен, однако нецелесообразно применять его для определения ценности в контексте экономического обоснования реализации активностей по повышению качества данных.

Оценка на основе экономической ценности рассматривает данные как одну из составляющих бизнес-процессов, участвующих в получении прибыли. Чем выше прибыль, чем больше вклад данных в цепочку создания ценности, тем выше ценность самих данных. К сожалению, в отличие от других методик, оценка на основе экономической ценности, как правило, не позволяет однозначно определить стоимость данных в денежном эквиваленте. Задача справедливого распределения совместного экономического результата имеет множество разных решений, однако все они имеют существенные ограничения и часто опираются только на экспертное суждение при определении долей распределения. В компании может быть создана собственная методология определения ценности данных согласно подходу с использованием экспертной оценки вклада тех или иных данных в бизнес-результат. И далее показатели ценности данных будут использоваться для наиболее эффективного планирования активностей по повышению их качества. Именно оценка на основе экономической ценности наиболее релевантна задаче определения ценности данных и обоснования экономического эффекта реализации мероприятий по повышению качества данных.

Повышение качества данных может влиять на конечную прибыль за счет повышения эффективности бизнес-процессов — за счет снижения стоимости бизнес-процессов, повышения их результативности и снижения вероятности реализации рисков.

В качестве примера оценки влияния повышения качества данных на стоимость бизнес-процесса можно рассмотреть процесс сбора управленческой отчетности. Априори будем считать, что все ошибки в показателях отчетности, произошедшие из-за низкого качества данных, исправляются сотрудниками компании каждый раз, когда формируется отчетность. В компании нет практики «ухудшения» значения показателей отчетности из осторожности, когда некачественные данные исключаются из расчета, заменяясь оценочными показателями, сформированными исходя из парадигмы минимизации рисков. Следовательно, в каждый отчетный период предусмотрены процедуры реконсиляции (проверки целостности) данных из разных источников, исправления ошибок непосредственно в отчетности. В таком случае можно оценить трудозатраты сотрудников, другие прямые и косвенные затраты, а в итоге стоимость такого рода исправлений за расчетный период. Например, если 10 сотрудников финансового подразделения компании каждый отчетный месяц тратят два дня на исправление данных и показателей отчетности, то за год трудозатраты составят 240 человеко-дней, что через фонд оплаты труда с учетом переработок и других косвенных расходов можно представить в денежном эквиваленте. Вычитая из полученной суммы затраты на доработку информационной системы учета, позволяющей гарантировать корректное и полное заполнение необходимых атрибутов данных, можно получить экономический эффект от мероприятий по повышению качества данных за год. Конечно, при анализе необходимо максимально точно определить все бизнес-процессы компании, потенциально зависящие от конкретных данных, что позволит существенно увеличить экономический эффект.

Отдельно стоит отметить подход, согласно которому выполняется не только оценка возможности снижения текущего уровня затрат, но и формируется прогноз роста затрат в перспективе при условии увеличения масштаба компании, роста объема обрабатываемых данных при сохранении текущего уровня их качества. Иначе говоря, если каждый месяц компания тратит 240 человеко-дней на реконсиляцию данных из разных источников и исправление ошибок в отчетности, то при росте бизнеса через три года эти затраты могут вырасти уже до 1000 человеко-дней, и именно эта база используется для расчета экономического эффекта.

В качестве примера оценки влияния повышения качества данных на результативность бизнес-процесса рассмотрим пул процессов, связанных с необходимостью использования контактных данных клиентов для коммуникации с ними (маркетинговые кампании, информирование клиентов о наличии просроченной задолженности и т. д.). Результативность этих процессов, выражаемая, например, в конверсии клиентов или объеме погашенной задолженности, напрямую зависит от качества и охвата произошедшей коммуникации и, в частности, от точности и полноты клиентских данных. Имея информацию об экономическом эффекте, полученном при работе с текущим качеством данных, можно его экстраполировать на работу с более качественными данными. Так, например, оценив вклад каждой клиентской записи в итоговый бизнес-результат, можно сделать вывод, что увеличение на 10% числа корректных заполненных телефонных номеров клиентов приводит к увеличению конверсии на 3% и снижению просроченной задолженности на 0,5%.

Для иллюстрации влияния качества данных на снижение возможных рисков можно привести следующий пример. Как правило, регуляторы штрафуют компании за предоставление некачественных данных, например, законодательство предусматривает штрафы за передачу банком как источником формирования кредитной истории недостоверных сведений в Бюро кредитных историй в размере от 30 тыс. до 50 тыс. рублей за каждую запись. При большом количестве ошибок в кредитном портфеле сумма потенциально возможного штрафа становится уже чувствительной для кредитной организации. Другие виды рисков, например репутационные, требуют при оценке использования мотивированного экспертного суждения оценки вероятности реализации риска, однако такого рода оценки являются общепринятой практикой и могут быть использованы при обосновании экономического эффекта.

Как обосновать инвестиции в качество данных
Рис. 2. Последовательность действий при определении и обосновании экономического эффекта от проектов повышения качества данных

На рис. 2 приведена последовательность действий специалистов в области управления данными при определении и обосновании экономического эффекта от проектов повышения качества данных.

***

Несмотря на то, что очевидна необходимость совершенствования процессов, направленных на повышение эффективности сбора, обработки, хранения и использования данных как ценного актива, любые инвестиции требуют грамотного и детального экономического обоснования и взвешенного подхода к реализации соответствующих инициатив. При этом для достижения максимального эффекта от внедрения процедур повышения качества данных фокус соответствующих проектов должен быть сосредоточен на данных, имеющих наибольшую ценность для компании. В свою очередь, ценность данных и экономический эффект от повышения уровня их качества имеет смысл оценивать на основе экономической ценности, ориентируясь при расчетах на влияние качества данных на конечную прибыль, полученную за счет повышения эффективности бизнес-процессов.

Светлана Бова (bova@vtb.ru) – директор по данным, управляющий директор департамента ИТ-архитектуры, вице-президент, Алексей Наталенко (natalenko@vtb.ru) – директор по управлению проектами департамента ИТ-архитектуры, банк ВТБ. Статья подготовлена на основе материалов выступления на конференции «Качество данных 2023».

DOI: 10.51793/OS.2023.94.70.004