Содержание
- Данные как продукция: применение принципов обеспечения качества промышленной продукции по отношению к данным
- Информационное пространство и проблема общего понимания
- Использование социологических подходов при создании ЕИП: пограничные объекты
- Модель оценки зрелости управления данными
- DAMA-DMBOK2 как пограничный объект
![]() |
Николай Скворцов Руководитель направления методологии Компания "1С: Логика Данных" |
С начала этого года в Российской Федерации стартовал национальный проект «Экономика данных и цифровая трансформация государства», сменяющий завершившийся в прошлом году нацпроект «Цифровая экономика». Отличительной чертой экономики данных является переход к производству данных как продукции. Процесс перехода опирается на технологические и социальные результаты работ по развитию в нашей стране информационного общества и, в частности, по формированию такого важного его компонента, как информационное пространство [1].
В этой связи хотелось бы поговорить о том, как связаны понятия «информационное пространство» и «менеджмент качества» и каким образом эта взаимосвязь может способствовать повышению качества данных.
1. Данные как продукция: применение принципов обеспечения качества промышленной продукции по отношению к данным
Формирование экономики данных требует проведения в организациях изменений, связанных с переходом на управление качеством данных как продукции. И здесь на помощь приходит набор практик, наработанный в рамках исследований по обеспечению качества промышленной продукции и отраженный в известных международных стандартах на системы менеджмента качества — ИСО 9000, ИСО 9001, ИСО 9004.
В руководстве международной ассоциации DAMA1 к своду знаний по управлению данными (DAMA-DMBOK2) по этому поводу сказано [2]:
«Большинство методологических подходов к повышению качества данных позаимствованы из теории управления качеством технологического производства. В рамках такой парадигмы любые данные считаются, грубо говоря, конечным продуктом комплекса технологических процессов по переработке информационного сырья.
…
Общий подход к повышению качества данных должен предусматривать реализацию классического цикла Шухарта — Деминга в той или иной его вариации. Будучи основанным на методологии точных наук, этот четырехфазный цикл задает модель решения задачи методом последовательных приближений: планирование → реализация → контроль → доработка → планирование →…».
Связь стандартов на системы менеджмента качества со стандартами по качеству данных четко обозначена в ГОСТ Р 56214-2014/ISO/TS 8000-1:2011 «Качество данных. Часть 1. Обзор»:
«Данные — это продукция процессов бизнеса и производства. Управлять информацией следует так же как и продукцией. Поэтому общие принципы управления качеством по ИСО 9001 можно отнести к управлению качеством данных как к управлению продукцией.
ИСО 8000 не представляет новую систему управления, а уточняет информацию ИСО 9001 относительно данных, являющихся продукцией.
…
ИСО 9000, ИСО 9001 и ИСО 9004 занимаются вопросами процесса развития и повышения качества данных.
ИСО 8000 описывает характеристики данных, которые влияют на их качество и устанавливают требования для процесса обмена данными и соответствующими характеристиками качества этих данных».
ГОСТ Р ИСО 9001-2015 «Системы менеджмента качества. Требования» устанавливает семь основных принципов менеджмента качества:
1) ориентация на потребителей;
2) лидерство;
3) взаимодействие работников;
4) процессный подход;
5) улучшение;
6) принятие решений, основанное на свидетельствах;
7) менеджмент взаимоотношений.
Очевидно, что ключевым условием создания успешной системы менеджмента качества является налаживание эффективного сотрудничества ее участников. Как в этой связи проявляются особенности формируемого в нашей стране информационного общества?
Об этом можно судить по инициативам крупных промышленных корпораций, для которых задачи повышения качества неразрывно связаны с задачами улучшения взаимодействия многочисленных подразделений и отдельных работников. Например, не так давно Госкорпорация «Ростех» объявила о создании Единого цифрового пространства данных о качестве [3]. В более ранних публикациях оно называлось Единым информационным пространством в области качества.
Такая инициатива не случайна. Информационное пространство — важное средство повышения эффективности сотрудничества и обмена знаниями в информационном обществе [1]. Почему так важно создание единого информационного пространства именно в области управления качеством?
Перечисленные принципы менеджмента качества, а также структура и содержание стандартов ИСО 9000, ИСО 9001, ИСО 9004 показывают, что проблема повышения качества трансформировалась в сознании людей из технической в социально-экономическую. Изменения произошли не в инструментах управления организациями, а в моделях построения отношений между людьми. Достижение долгосрочных взаимовыгодных отношений между потребителями, сотрудниками и поставщиками, ведущих к общим целям, — суть системы менеджмента качества. Руководители и сотрудники стали хорошо понимать, что изучить клиентов, а затем настроить процессы деятельности организации на максимальное удовлетворение их нужд более выгодно и менее рискованно, чем производить продукцию без понимания потребителей в расчете на ее агрессивное продвижение с помощью рекламы. Система менеджмента качества становится неразрывно связанной с системой менеджмента организации и, по сути дела, берет на себя ее роль.
Описанные тенденции позволяют в общих чертах представить, в каком направлении будут развиваться работы по управлению данными при переходе организации к их производству как продукции. Очевидно, что будет усиливаться акцент на повышении качества данных. Соответственно, создание информационного пространства в этой области станет насущной необходимостью.
Что требуется для создания единого информационного пространства в области качества данных? Позже мы вернемся к этому вопросу, но сначала обсудим более подробно, что такое информационное пространство и зачем оно нужно.
2. Информационное пространство и проблема общего понимания
В Стратегии развития информационного общества в Российской Федерации на 2017–2030 годы информационное пространство определено как совокупность информационных ресурсов, созданных субъектами информационной сферы, средств взаимодействия таких субъектов, их информационных систем и необходимой информационной инфраструктуры [1]. Из определения видно, что существенное внимание при организации информационного пространства уделяется инфраструктурным аспектам. Однако одной инфраструктуры недостаточно. В документе отмечается, что усилия многих государств направлены на приоритетное развитие национальной информационной инфраструктуры в ущерб формированию и распространению знаний. Поэтому целью Стратегии является создание условий для формирования в Российской Федерации общества знаний, а выстраиваемое информационное пространство характеризуется как информационное пространство, основанное на знаниях (информационное пространство знаний) [1].
Из положений Стратегии следует, что информационное пространство на основе знаний — это сложная социотехническая система. И если с технической точки зрения все базовые решения хорошо известны в мировой практике и успешно реализуются (обеспечение совместного использования информации — information sharing), то с точки зрения эффективности сотрудничества различных социальных групп, основанного на общем понимании информации (shared understanding) и обмене знаниями внутри этого пространства, есть еще много вопросов для обсуждения.
В отношении обеспечения общего понимания развитие представлений об информационном пространстве в основном происходит в рамках существующей уже около 40 лет и хорошо известной за рубежом научно-технологической области исследований CSCW (Computer-Supported Cooperative Work) — Совместная работа с компьютерной поддержкой.
Одна из ключевых тем, изучаемых в CSCW, — особенности интерпретации используемых общих данных (информационных объектов) людьми, вовлеченными в совместную работу (cooperative work). Проблема состоит в том, что участники работы, как правило, входят в группы, различающиеся по видам деятельности, функциональным обязанностям, профессиям, уровням образования и т. п. Можно рассматривать их как «семантические сообщества» (semantic communities), имеющие разные точки зрения на те или иные предметы. Их участники могут общаться на разных «жаргонах», причем многое из этого общения не может быть корректно переведено на язык терминов других сообществ, поскольку отражает иной способ действий в различных ситуациях (иную онтологию). Совместно используемый информационный объект (запись в базе данных, таблица, диаграмма, текст и т. п.) с большой вероятностью будет интерпретироваться сообществами по-разному. Может возникнуть так называемый онтологический дрейф (ontological drift): значение информационного объекта искажается по мере того, как он пересекает семантические границы. Определения, используемые для объекта, могут быть вполне адекватными в рамках отдельного сообщества, но не переводятся и не передаются между семантическими областями. Вопрос заключается не в наличии адекватных определений в каждой области, а в том, как эти определения могут соотноситься друг с другом. Основная задача — интеграция действий, опирающихся на разные онтологические основания [4].
В различных исследованиях взаимодействующие рабочие группы могут называться по-разному, например: сообщества по интересам (Community of Interest, CoI) или сообщества знаний (Communities of Knowing). Мы будем использовать русскоязычный вариант одного из наиболее часто встречающихся терминов — «практическое сообщество» (Community of Practice, CoP).
В рамках CSCW, в свете описанной проблемы, для многих ситуаций выполнения совместной работы необходимым условием признается создание некоторой формы «единого информационного пространства» (Сommon Information Space, CIS) (далее — ЕИП). Значение такого пространства не только в том, что оно предоставляет общий доступ к информационным объектам, содержащимся, например, в совместно используемой базе данных. Особенно важно, что оно предполагает организацию и осуществление командой, состоящей из разных практических сообществ, деятельности по общей (единой) интерпретации объектов — интерпретационной работы (interpretation work) [4].
Какие инструменты могли бы повысить эффективность построения ЕИП?
3. Использование социологических подходов при создании ЕИП: пограничные объекты
Важную роль при создании ЕИП играет наличие информационных объектов, которые могли бы адекватно передавать заложенный в них смысл при пересечении границ практических сообществ. В этом отношении в CSCW активно применяются результаты социологических исследований, полученных в рамках развития акторно-сетевой теории (АСТ) Бруно Латура2 и связанной с ней концепции пограничных объектов.
Отталкиваясь от положений АСТ, американские ученые — социолог Сьюзан Ли Стар (Susan Leigh Star) и философ Джеймс Гриземер (James R. Griesemer) — в конце 1980 х годов предложили концепцию «пограничных объектов» (boundary objects). Пограничный объект — это особый предмет (вещь или положение дел), обладающий интерпретативной гибкостью и в силу этого опосредующий взаимодействия между различными «социальными мирами»3, которые он представляет; пограничность при этом означает возможность быть совместно используемым. Благодаря широкому применению концепции во многих предметных областях, она часто рассматривается в качестве самостоятельной теории пограничных объектов [5].
Пограничные объекты занимают определенное место одновременно в нескольких пересекающихся социальных мирах и удовлетворяют информационные потребности каждого из них. Такие объекты достаточно пластичны, чтобы адаптироваться к локальным требованиям и ограничениям использующих их сторон, и в то же время достаточно устойчивы, чтобы сохранять в отношении этих сторон общую идентичность. Они отличаются слабой структурированностью при общем использовании и приобретают четко выраженную структуру при индивидуальном использовании той или иной стороной. Объекты могут быть абстрактными или конкретными. Они имеют разное значение (смысл) в разных социальных мирах, но их структура является достаточно общепринятой для более чем одного мира, что делает их узнаваемыми и служит средством перевода. Создание пограничных объектов и управление ими являются ключевым процессом в развитии и поддержании согласованности в пересекающихся социальных мирах.
Стар и Гриземер с самого начала формирования концепции считали, что понятие «пограничный объект» может трактоваться очень широко, а перечень типов таких объектов остается открытым для дополнений и изменений. Это могут быть физические объекты, такие как документы, содержащие рабочие схемы, или виртуальные, такие как электронные базы данных. Кроме того, они содержат информацию, которая может быть явной (explicit) или неявной (implicit). Явная информация представляется непосредственно, например, на рабочей схеме или в руководстве по эксплуатации. Неявная — может быть «встроена» в продукт или изображение.
Какое место занимают пограничные объекты в устройстве ЕИП?
В первую очередь это инструменты, позволяющие согласовать взгляды (ментальные модели) взаимодействующих практических сообществ. Объекты становятся пограничными, когда они эффективно применяются для передачи и совместного использования сообществами информации c учетом ее рассмотрения в различных контекстах. Эффективность пограничного объекта напрямую связана с тем, насколько гибко передаваемая им информация может быть отделена от одного контекста и встроена в другой. Например, технический чертеж может означать разные вещи для проектировщика и производителя. Проектировщик может взглянуть на чертеж и представить, как разрабатываемый компонент сочетается с другими компонентами и функционирует совместно с ними в качестве конечного продукта. Производитель может ознакомиться с техническим чертежом и наметить этапы обработки, необходимые для изготовления компонента.
Дополнительная роль пограничных объектов заключается в том, что они выполняют функцию «мостов», устраняющих разрывы в понимании и коммуникации между взаимодействующими сообществами. Такие мосты должны разрабатываться с привлечением всех заинтересованных сторон. Чем больше сообществ должен объединять пограничный объект, тем сложнее он становится. Поэтому важно обеспечить эффективную коммуникацию между сторонами, участвующими в его разработке.
Таким образом, разработка и применение пограничных объектов являются важной частью проводимой в рамках функционирования ЕИП интерпретационной работы, о которой мы говорили выше.
Обсудив важность пограничных объектов для обеспечения функционирования ЕИП, вернемся к обозначенной нами теме создания ЕИП в области качества данных.
С течением времени появляется все больше публикаций, посвященных применению всевозможных пограничных объектов в различных сферах, в том числе непосредственно связанных с обработкой информации. В качестве таких объектов могут рассматриваться, например, артефакты архитектуры предприятия (Enterprise Аrchitecture, ЕА) — в частности, архитектуры данных, обеспечивающие согласование интересов бизнеса и представителей ИТ-служб.
Подобные артефакты могут и должны использоваться для поддержки ЕИП организации в области качества данных. Однако их культивирование предполагает определенный уровень зрелости процессов управления данными, достижение которого должны обеспечивать более фундаментальные пограничные объекты. С их рассмотрения и стоит начать. Безусловно основным кандидатом на наиболее эффективное исполнение данной роли является руководство DAMA-DMBOK2.
На чем основано это утверждение?
Прежде всего напомним основные сведения о подходах к оценке зрелости процессов управления данными.
4. Модель оценки зрелости управления данными
Модель зрелости процессов была впервые описана Филиппом Кросби4, одним из признанных в мире авторитетов в области качества, в вышедшей в 1979 году книге «Качество бесплатно: искусство обеспечения гарантированного качества» («Quality is Free: The Art of Making Quality Certain»). Смысл его подхода заключался в следующем: если на предприятии налажены производственные процессы, то уровень качества продукции повышается сам собой, без специальных затрат. Применительно к менеджменту качества Кросби описал пять эволюционных стадий зрелости процессов:
1) неопределенность (Uncertainty);
2) осознание (Awakening);
3) просвещение (Enlightenment);
4) мудрость (Wisdom);
5) уверенность (Certainty).
В конце 1980-х годов модель Кросби была адаптирована сотрудниками компании IBM для оценки зрелости процессов создания программного обеспечения. Специалисты из IBM были привлечены Институтом программной инженерии (Software Engineering Institute, SEI) для работ по заказу Министерства обороны США. В результате адаптации была предложена модель зрелости способностей (Capability Maturity Model, CMM), где под способностью (другой вариант перевода — «возможностью»5) процесса (process capability) понимается характеристика его потенциала для достижения текущих или планируемых бизнес-целей. В дальнейшем аналогичные модели появились и для других областей деятельности, в частности для области управления данными [2, 6].
Модели оценки зрелости управления данными (Data Management Maturity Assessment, DMMA) описываются в терминах продвижения по уровням зрелости, которым поставлены в соответствие характеристики процессов. Когда организация начинает понимать характеристики своих процессов, она может начать повышать их уровень зрелости и внедрять план совершенствования способностей. Она может также измерять степень продвижения и сравнивать себя с конкурентами или партнерами на основе уровней зрелости, выделенных в модели.
Типовая модель оценки зрелости управления данными отражена на рис. 1.
Освежив в памяти представления о модели оценки зрелости управления данными, вернемся к теме создания ЕИП в области качества данных. Каким образом и почему руководство DAMA-DMBOK2 может быть использовано здесь в роли базового пограничного объекта, обеспечивающего повышение уровня зрелости?
5. DAMA-DMBOK2 как пограничный объект
Стар и Гриземер — авторы концепции пограничных объектов — выделяют три ключевых аспекта, на которые следует обратить внимание применяющим ее специалистам [5].
Первый аспект — гибкость интерпретации объекта. В большинстве случаев применения концепции выделяют прежде всего этот аспект и часто им и ограничиваются.
Второй аспект касается материальной и организационной структуры пограничного объекта. Разнообразие форм его представления (в том числе в составе целых систем пограничных объектов) не вызывает сомнений, но мало кто обращает внимание на то, что главное — не форма, а производимое объектом действие. В этом отношении пограничными объектами могут быть, например, научная теория или выступление на конференции.
Наконец, третий аспект связан с пониманием процесса использования пограничного объекта. Изначально исследования авторов концепции были продиктованы желанием проанализировать природу совместной работы разнородных практических сообществ (социальных миров) в отсутствие консенсуса. Обычно считается, что для успешного сотрудничества консенсус необходим. Но во многих случаях, когда он не достигается или является очень хрупким, сотрудничество все равно продолжается и не вызывает проблем. Стар и Гриземер объясняют подобные случаи нормального взаимодействия наличием пограничных объектов.
Рис. 1. Пример модели оценки зрелости управления данными [2]
Объект, занимающий пограничное положение между сообществами и играющий роль посредника, должен быть представлен в форме с существенно упрощенной и обобщенной структурой. При необходимости он может быть доработан (адаптирован) в рамках отдельного сообщества, которое делает его более конкретным и приспособленным для локального использования. В конечном итоге локальное представление может быть окончательно отструктурировано и превращено в стандарт сообщества. В то же время объект сохраняется еще и в общей форме, отражающей его идентичность более расплывчато.
Группы, которые успешно сотрудничают без консенсуса, постоянно переключаются в ходе взаимодействия между локальной и общей формами объекта. Этот процесс лежит в основе всей концепции пограничных объектов, но на него редко обращают внимание в исследованиях, посвященных ее применению [5].
Например, на рис. 2 приведена обобщенная форма жизненного цикла данных согласно DAMA-DMBOK2, а на рис. 3 отражен жизненный цикл данных по ГОСТ Р 70889-2023 (ИСО/МЭК 8183:2023) «Информационные технологии. Искусственный интеллект. Структура жизненного цикла данных». Первое представление ориентировано на все профессиональные сообщества, участвующие в управлении данными, а второе — на локальное использование в сообществах, непосредственно связанных с работами в сфере искусственного интеллекта. Очевидно, что при использовании только второго представления специалистам из этих сообществ было бы трудно найти общий язык с профессиональными группами, отвечающими, например, за управление документами и контентом или за управление справочными и основными данными. Поэтому при межгрупповом общении они, скорее всего, будут использовать первое представление. Здесь как раз и проявляется роль пограничного объекта как «моста», о которой мы говорили выше.
Видимо, одним из первых, кто применительно к процессам организации описал динамику постепенной выработки консенсуса в ходе сотрудничества рабочих групп, был Филипп Кросби. В книге «Качество бесплатно: искусство обеспечения гарантированного качества» приведена таблица с описанием различных оценочных категорий для сравнения стадий зрелости менеджмента качества. Вот, в частности, как там охарактеризованы ситуации на каждой стадии с точки зрения категории «Подход к проблеме».
Рис. 2. Жизненный цикл данных согласно DAMA-DMBOK2 [8]
1. Неопределенность
Проблемы решаются по мере их появления; нет твердости; неадекватное определение; много шума и обвинений.
2. Осознание
Для решения главных проблем создаются команды. Долгосрочные решения не принимаются.
3. Просвещение
Установлено общение по коррективным действиям. Проблемы встречают открыто и решают методично.
4. Мудрость
Проблемы определяются в их развитии. Все функции открыты для предложения и улучшения.
5. Уверенность
За исключением самых необычных случаев, проблемы предотвращаются.
Рис. 3. Жизненный цикл данных по ГОСТ Р 70889-2023
Стар и Гриземер полагают, что сотрудничество осуществляется гораздо эффективнее, если взаимодействующие практические сообщества общаются с помощью пограничных объектов. Тогда они могут вырабатывать общее понимание, переключаясь при взаимных обсуждениях проблем со своих локальных представлений на уже сформированные общие представления.
Какой пограничный объект лучше выбрать на роль базового, для того чтобы он способствовал постепенному повышению уровня зрелости управления данными и развитию ЕИП в области качества данных?
В принципе, тут можно рассмотреть любую рамочную структуру (framework) управления данными. Основные референтные модели описаны, например, в вышедшей в 2022 году книге «Ценность ваших данных» [6]. Однако, как мы уже говорили выше, чем больше сообществ должен объединять пограничный объект, тем сложнее он становится. И здесь нужно учитывать, что в построении систем управления данными крупных и средних организаций, как правило, участвуют достаточно много взаимодействующих рабочих групп, которые в совокупности представляют полный набор областей знаний по управлению данными.
По мнению многих авторитетных специалистов, в настоящее время наиболее полные и ценные с методической точки зрения (а также не зависящие от поставщика соответствующих решений) референтные модели управления данными — это DAMA-DMBOK2 и CMMI DMM6. При этом первая ориентирована на формирование способностей организации по управлению данными, а вторая — на оценку зрелости этих способностей [6].
Нужно иметь в виду, что модели оценки зрелости направлены не столько на выработку общего понимания управления данными, сколько на оценку того, насколько хорошо оно выработано. Таким образом, для организаций, где уровень зрелости еще недостаточно высок, наиболее предпочтительным вариантом базового пограничного объекта при создании ЕИП в области качества данных является руководство DAMA-DMBOK2. Мы уже говорили о том, что информационное пространство должно быть пространством знаний, и DMBOK2 (как и следует из его названия) предоставляет для этого необходимый начальный базис.
Список источников
- Указ Президента от 9 мая 2017 г. № 203 «О стратегии развития информационного общества в Российской Федерации на 2017–2030 годы». — URL: https://base.garant.ru/71670570/
- DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / DAMA International. — М.: Олимп-Бизнес, 2020.
- «РТ-Техприемка» представила Единое цифровое пространство данных о качестве // Сообщение на сайте компании «РТ-Техприемка» (rttec.ru), 24.08.2022. — URL: https://rttec.ru/media/news/479/
- Bannon L., Bodker S. Constructing Common Information Spaces // Proceedings of the Fifth European Conference on Computer Supported Cooperative Work, 1997. — URL: https://tidsskrift.dk/daimipb/article/download/6552/5671
- Star S.L. This is not a boundary object: reflections on the origin of a concept // Science, Technology, & Human Values, 35(5), 2010. — URL: https://www.sci-hub.ru/10.1177/0162243910377624
- Кузнецов С., Константинов А., Скворцов Н. Ценность ваших данных. — М.: Альпина ПРО, 2022.
1 DAMA (Data Management Association International) (https://www.dama.org) — Международная ассоциация управления данными, действующая уже более 30 лет. В 2017 году вышло второе издание руководства DAMA к своду знаний по управлению данными (Data management body of knowledge, DMBOK), переведенное на русский язык [2].
2 Бруно Латур (Bruno Latour) — французский антрополог, философ и социолог науки. Один из основоположников (в соавторстве с несколькими коллегами) акторно-сетевой теории (АСТ) — исследовательского подхода, основывающегося на рассмотрении социальных явлений как сложных сетей, образуемых разнородными компонентами: людьми, техническими устройствами, природными объектами.
3 «Социальными мирами» Стар и Гриземер называют практические сообщества.
4 Филипп Кросби (Philip B. Crosby) — американский ученый, теоретик менеджмента, специализирующийся в сфере управления качеством. Разработал программу по управлению качеством «Ноль дефектов», которая приобрела широкую известность.
5 Особенности вариантов перевода слова capability — «способность» и «возможность» — обсуждаются в книге «Ценность ваших данных» [6].
6 CMMI-DMM — Модель зрелости управления данными (Data Management Maturity, DMM) Института моделирования зрелости способностей (Capability Maturity Model Institute, CMMI).