Качество данных

Качество данных: от стратегии к практике

Данные — топливо для систем искусственного интеллекта, сырье для аналитических алгоритмов и основа для систем автоматизации бизнес-процессов. Однако наивно ожидать, что данные изначально будут чистыми и пригодными для обработки, а если исходные данные некорректны, то и результаты будут соответствующими. Что можно сделать для устранения дефектов в данных? Как определить, что следует исправить, а что нет? Как узнать, когда надо устранить проблему, а когда лучше ничего не трогать? Иначе говоря: как управлять качеством данных?

Малое качество больших данных

Обсуждение «цифровизации» сегодня обычно вращается вокруг технологий больших данных, машинного обучения, прогнозной аналитики, но цифровизация — это не про технологии, а про управление данными, бизнес-модели и культуру работы с данными. Деньги бизнесу всегда приносили люди, а не технологии.

Как Data Science помогает повышать качество ПО

Применение методов исследования данных в процессах разработки ПО позволяет выиграть в конкурентной борьбе. Например, в программной инженерии получила распространение методика измерения характеристик программного обеспечения, однако без средств автоматизации невозможно разобраться в огромных массивах получаемых с помощью этой методики данных и учесть все их взаимозависимости.

Реструктуризация нормативно-справочной информации

Без выполнения работ по нормативно-справочной информации нельзя обеспечить эффективную трансформацию материально-технического обеспечения компании, снизить запасы, сократить неликвиды и увеличить оборачиваемость ресурсов. Тиражируемая система для нормализации основных данных KPMG Normalization System for Master Data позволяет адаптироваться к используемым на предприятиях программным платформам и системам ERP, учитывать особенности организации бизнеса и ускорить нормализацию за счет исключения рутинных операций.

Универсальная платформа управления данными

Универсальная платформа создания систем управления данными позволяет решать общие задачи обеспечения качества данных, их целостности и актуальности, а также настраивать систему для учета особенностей работы с корпоративными данными конкретного предприятия.

Руководство по управлению данными

Цифровая трансформация требует переосмысления понятия «данные» и подходов к их управлению — достижению этих целей служит руководство «DAMA-DMBOK: Свод знаний по управлению данными».

Семантический анализ в подготовке обучающих выборок

Эффективное применение технологий машинного обучения для работы с текстами невозможно без средств предварительного семантического анализа, которые в будущем должны использоваться при подготовке и разметке обучающих выборок.

Инструменты для «ковбоев»

«Выпас данных» — так можно перевести название новой специальности data wrangling, в задачу представителей которой входит подготовка больших массивов данных для последующего их анализа.