При работе БАК генерируется 100 Мбайт информации в секунду
Карри Манс: «Большой адронный коллайдер выходит за рамки традиционных устройств, подключаемых к сети»

Корпорация IBM выступила в качестве одного из спонсоров Европейской организации по ядерным исследованиям (ЦЕРН). Технология сетевого хранения Storage Tank будет тестироваться в лаборатории ЦЕРН с приложениями DataGrid. ЦЕРН занимается проведением экспериментов в области ядерной физики. В 2007 году планируется ввести в строй Большой адронный коллайдер (БАК) — ускоритель частиц, в котором происходит прямое столкновение протонов и ионов, сопровождающееся выбросом невиданной доселе энергии. В ходе эксперимента (его целью является воссоздание условий, которые, как предполагается, существовали на начальном этапе образования Вселенной, сразу после «большого взрыва») ежегодно будет генерироваться около 10 петабайт данных.

Однако еще больший интерес для специалистов по информационным технологиям представляет вопрос обеспечения доступа группы ученых и аналитиков к этим данным. Это предполагается сделать путем построения распределенного хранилища данных и компьютерной сети, к которой можно будет подключаться из любой точки мира. «Основная задача заключается в том, чтобы развернуть сеть, способную обрабатывать петабайты данных, которые к 2007 году начнут поступать от БАК, — отметил сотрудник вычислительной лаборатории ЦЕРНа Франсуа Грей. — Мы занимаемся исследованиями, которые пока не носят коммерческого характера, однако станут таковыми к моменту ввода его в строй».

Корпорация IBM установит дисковый массив общей емкостью 20 Тбайт (20 тыс. Гбайт), кластер из шести систем eServer xSeries, работающих под управлением операционной системы Linux, и предоставит необходимую инженерно-техническую поддержку. Общая сумма инвестиций с ее стороны составит 2,5 млн. долл. Оборудование будет полностью развернуто к концу следующего года.

Конечно, 20 терабайт для ЦЕРН явно недостаточно, но дополнительные мощности предполагается вводить и тестировать постепенно, с тем чтобы к 2005 году довести емкость системы хранения до одного петабайта. Тестовые данные планируется получать путем имитации столкновения адронов в соответствии с положениями существующей теории. Сравнение этой информации с петабайтами данных, собранными экспериментальными лабораториями, позволит ученым протестировать свои модели. Если учесть, что при работе ускорителя генерируется 100 Мбайт информации в секунду, задача управления данными представляется очень сложной.

«Это далеко выходит за рамки традиционных устройств, подключаемых к сети, — отметил Карри Манс, руководитель подразделения Storage Systems and Technology исследовательского центра IBM в Альмадене. — При получении такого объема данных вопросы организации и управления действительно превращаются в серьезную проблему. Именно здесь и должна проявить себя технология Storage Tank».

Для отслеживания местоположения информации в технологии Storage Tank используются серверы метаданных. Сетевые клиенты обращаются к серверам с запросами на поиск требуемых им данных, после чего загружают информацию непосредственно с сетевых устройств, на которых эта информация хранится. Аналогичным образом система имен доменов Internet DNS направляет клиентов на запрашиваемые ими узлы, но не вмешивается в саму процедуру пересылки данных.

В конкретном решении Storage Tank будет применяться протокол SAN iSCSI, функционирующий в сетях Ethernet с пропускной способностью 10 Гбит/с. Впрочем, архитектура Storage Tank позволяет использовать соответствующую технологию в любой сети SAN. Система построена на платформе Linux, однако в дальнейшем предлагается сделать программное обеспечение более универсальным. Это объясняется тем, что клиентское ПО необходимо интегрировать с локальной файловой системой.