Качество данных

Данные для медицины: естественный язык vs структурированные галлюцинации

На тематической сессии юбилейного форума BIG DATA 2021 обсудили проблемы медицинских данных.

«Открытые системы» открыли новый сезон мероприятий конференцией «Качество данных — 2021»

«Качество данных — 2021. Стратегия, инструменты, практика» — единственная в России конференция, целиком сфокусированная на одной из важнейших тем цифровой эпохи — на обеспечении требуемого качества данных.

Внедрение искусственного интеллекта: Диалог и доверие

Анна Серебряникова, президент Ассоциации больших данных и управляющий партнер компании nlogic, рассказывает о возможностях искусственного интеллекта в работе с документами и актуальных задачах российской индустрии больших данных.

«Открытые системы» проведут конференцию «Качество данных — 2021. Стратегия, инструменты, практика»

25 февраля 2021 года издательство «Открытые системы» открывает новый сезон мероприятий практической конференцией «Качество данных — 2021. Стратегия, инструменты, практика».

Программная инженерия для систем аналитики данных

Создание зависимого от данных ПО отличается от разработки традиционных программ: соответствующие методы должны учитывать ошибки и в коде, и в данных. Необходимо помнить, что отладка производительности так же важна для исследователей данных, как и отладка корректности.

Большую часть времени исследователи данных по-прежнему тратят на рутину

Результаты нового опроса Anaconda показывают, что на очистку и подготовку данных они расходуют почти половину своего рабочего времени.

Бота научили обновлять устаревшую информацию в Википедии

Сейчас правки в устаревшие фактические сведения — цифры, даты, имена, географические названия и т. п. — волонтеры вносят вручную.

Качество данных: от стратегии к практике

Данные — топливо для систем искусственного интеллекта, сырье для аналитических алгоритмов и основа для систем автоматизации бизнес-процессов. Однако наивно ожидать, что данные изначально будут чистыми и пригодными для обработки, а если исходные данные некорректны, то и результаты будут соответствующими. Что можно сделать для устранения дефектов в данных? Как определить, что следует исправить, а что нет? Как узнать, когда надо устранить проблему, а когда лучше ничего не трогать? Иначе говоря: как управлять качеством данных?

Малое качество больших данных

Обсуждение «цифровизации» сегодня обычно вращается вокруг технологий больших данных, машинного обучения, прогнозной аналитики, но цифровизация — это не про технологии, а про управление данными, бизнес-модели и культуру работы с данными. Деньги бизнесу всегда приносили люди, а не технологии.

Как Data Science помогает повышать качество ПО

Применение методов исследования данных в процессах разработки ПО позволяет выиграть в конкурентной борьбе. Например, в программной инженерии получила распространение методика измерения характеристик программного обеспечения, однако без средств автоматизации невозможно разобраться в огромных массивах получаемых с помощью этой методики данных и учесть все их взаимозависимости.

Gartner: использование «умных контрактов» позволяет повысить качество данных на 50%

Внедрение смарт-контрактов увеличивает прозрачность, скорость и детализацию принятия решений, а благодаря постоянной проверке данных повышается и качество решений.

«Качество данных 2020» — горячая тема

В Москве прошла конференция «Качество данных 2020».

«Леруа Мерлен»: качество данных как залог безопасности перевозок

В торговой сети реализуется проект автоматизированной верификации информации, среди целей которого : повышение безопасности перевозок, сокращение хищений, обеспечение надежности поставок товара, выявление неблагонадежных водителей.

Реструктуризация нормативно-справочной информации

Без выполнения работ по нормативно-справочной информации невозможно обеспечить эффективную трансформацию материально-технического обеспечения компании, снизить запасы, сократить неликвиды и увеличить оборачиваемость ресурсов. Всего этого можно достигнуть с помощью тиражируемой системы для нормализации основных данных. Все подробности на конференции «Качество данных — 2020».

Реструктуризация нормативно-справочной информации

Без выполнения работ по нормативно-справочной информации нельзя обеспечить эффективную трансформацию материально-технического обеспечения компании, снизить запасы, сократить неликвиды и увеличить оборачиваемость ресурсов. Тиражируемая система для нормализации основных данных KPMG Normalization System for Master Data позволяет адаптироваться к используемым на предприятиях программным платформам и системам ERP, учитывать особенности организации бизнеса и ускорить нормализацию за счет исключения рутинных операций.

Универсальная платформа управления данными

Универсальная платформа создания систем управления данными позволяет решать общие задачи обеспечения качества данных, их целостности и актуальности, а также настраивать систему для учета особенностей работы с корпоративными данными конкретного предприятия.

Руководство по управлению данными

Цифровая трансформация требует переосмысления понятия «данные» и подходов к их управлению — достижению этих целей служит руководство «DAMA-DMBOK: Свод знаний по управлению данными».

Семантический анализ в подготовке обучающих выборок

Эффективное применение технологий машинного обучения для работы с текстами невозможно без средств предварительного семантического анализа, которые в будущем должны использоваться при подготовке и разметке обучающих выборок.

Инструменты для «ковбоев»

«Выпас данных» — так можно перевести название новой специальности data wrangling, в задачу представителей которой входит подготовка больших массивов данных для последующего их анализа.