Сегодня часто говорят, что технологии не самоцель, оборудование перестало быть основным активом, а главное — это данные. Однако в реальности на протяжении десятилетий в словосочетании «информационные технологии» акцент приходился на технологии, а сам предмет, цель существования ИТ — контент — лишь подразумевался. Такое пренебрежение к семантике данных привело к тому, что вплоть до нынешнего времени развивались исключительно инженерные методы передачи, хранения и обработки данных, а в «информационные» и поддерживающие их системы «вшивалась» заранее запрограммированная логика, применялись базы данных с жесткой структурой и сети с фиксированной адресацией. Несмотря на декларацию «данные — основа цифровой экономики», большинство автоматизированных систем ориентируются на приложения.

Такая ситуация могла бы сохраняться и дальше, если бы объемы данных не стали расти столь угрожающими темпами. А чем больше данных, тем менее гибкими оказываются бизнес-процессы. На вход корпоративных автоматизированных систем сегодня подается все больше различных сведений, и, в идеале, ожидается, что на выходе объемы информации по крайней мере не должны увеличиваться. Однако этого не происходит, а возможности человека воспринимать информацию если не фиксированы, то уж точно не растут такими же темпами, как пулы входных данных. Вполне ожидаемо, что такая организация не несет нового качества и даже не помогает человеку добывать новые знания. Как следствие, начались разговоры о проблеме сложности, развернулось обсуждение концепций Real Time Enterprise, Adaptive Enterprise, Information-Centric Enterprise и пр. Но снова, как и десятилетия назад, основное внимание уделяется корпоративным шинам, технологиям интеграции приложений, новым типам баз данных и тому подобным весьма увлекательным средствам автоматизации работы с данными как с «мешком байтов», передаваемым по протоколам Интернета.

К Сети сейчас подключено множество устройств, работающих в том числе и без участия человека. А благодаря широкому распространению беспроводных технологий, Интернет вещей уже состоит не из изолированных наборов устройств, а из их динамичных множеств, меняющихся в зависимости от решаемой задачи. Такая сеть сама должна быть динамичной и определяться данными: ее задача не сводится лишь к обмену байтами между двумя фиксированными точками, а заключается в доставке контента нужному потребителю. Современная активность пользователей и приложений требует от Сети гораздо больших возможностей, чем простое соединение двух хостов, — нужна переориентация на контент. Конечного пользователя могут, например, интересовать просмотр и пересылка видео, а не IP-адрес сервера, с которого идет видеопоток.

Информационно-центричная модель позволяет существенно повысить эффективность Сети, открывая широкие возможности для создания интеллектуальных коммуникационных систем различного назначения, способных, хотя бы отчасти, формировать свою конфигурацию самостоятельно, а не по заранее определенным адресам. Это уже сейчас важно для успешного функционирования умных городов, интеллектуальных автомобильных и медицинских систем, умных электросетей, военных инфраструктур и крупных промышленных объектов. Контент в таких сетях запрашивается не у конкретного хоста с заранее известным IP-адресом, а у Сети в целом: вместо адреса устройства, на котором может храниться копия запрашиваемого контента, используется название контента. В какой-то степени это напоминает краудсорсинг, когда предварительно неизвестно, к какому именно специалисту надо обратиться, — решение генерируется в сообществе. В информационно-центричной сети данные лишаются привязки к местонахождению и отделяются от приложений.

Ориентированная на данные архитектура позволяет корректировать бизнес-правила по ходу эксплуатации информационной системы, менять как структуру данных, с которыми работает приложение, так и логику их обработки. По мере развития бизнеса могут меняться физические хранилища, кластерная группировка и сетевая конфигурация, но приложения должны продолжать работу с требуемым контентом. Один из примеров реализации такой архитектуры — фабрика данных. Приложения работают с единым виртуальным хранилищем, информация из которого поступает на вход корпоративных приложений, которые не знают, на каких серверах, в каких базах находятся запрашиваемые ими данные и по каким сетям происходит взаимодействие — сам контент задает порядок обработки и передачи.

Большинство ИТ-директоров сегодня признаются, что автоматизация бизнес-процессов стала для них главным приоритетом: цифровая экономика хочет быстро расти. Однако часто мало кто знает, как этот рост обеспечить и куда он должен быть направлен. Как только появляется новая технология, бизнес начинает активно примерять ее на себя, забывая о том, что технология — это не то, что мы ищем, а всего лишь то, как мы ищем. Информационно-центричная архитектура позволяет вернуться к изначальному смыслу ИТ как среды, управляемой данными, а не аппаратно-программными ресурсами.

Малое качество больших данных

Слишком большой объем данных (даже хороших) может привести к плохому результату, если увлекаться лишь технологиями их обработки. Как бы ни были важны собственно технологии, они остаются пусть сложными и эффективными, но все же инструментами — пришло время перейти на уровень контента. Данные сами подскажут, кому и как с ними работать, — только тогда можно будет всерьез говорить об экономике, ориентированной на данные, о дата-центричном мире, об Интернете данных, об инновациях, продвигаемых данными. Правда, в подобном мире выживут не все. Останутся лишь динамичные предприятия, обладающие такими качествами, как интерактивность — свободный обмен информацией, идеями, сервисами; самоорганизация — наличие недетерминированной процедуры взаимодействия и принятия решений; коэволюция — эволюция вслед за изменением внешних факторов.

Дмитрий Волков

DOI: 10.26295/OS.2020.45.96.001