Кластер Beowulf в фирменном исполнении на службе геофизики
Николай Баранский: «Кластер eServer Cluster 1350 оптимален для российских условий»

В представлении IBM eServer Cluster 1350, поставленного в московском офисе Paradigm, кроме двух упомянутых компаний, приняла активное участие еще и Intel. Ее заинтересованность вполне понятна, поскольку суть произошедшего события заключается в том, что на примере решения, реализованного в Paradigm, в очередной раз показано: вполне можно создать высокопроизводительный кластер из «потребительских» компонентов.

Новый кластер предназначен для решения одной из наиболее «жадных» на вычислительные мощности задач — обработки результатов сейсмической разведки нефтегазовых месторождений. Значение точности оценки запасов углеводородного сырья понятно любому, специфика ситуации с расчетной точки зрения в том, что сейсмическим данным присущ естественный параллелизм, они записываются по множеству каналов, каждый из которых обрабатывается независимо, поэтому с давних времен используются параллельные вычислительные системы. В СССР это были машины ПС-2000 и ПС-3000.

Пользователями специализированных вычислителей для обработки такого рода данных являются либо сами нефтегазовые компании, либо фирмы, специализирующиеся на обработке информации. Особенность мира геофизических услуг заключается в том, что он относительно невелик, на рынке действует ограниченное число компаний. Paradigm входит в мировую элиту поставщиков программного обеспечения и технологий для обработки геофизических данных. Она успешно развивается, имеет серьезную поддержку со стороны инвестиционной компании Fox Paine, за пять лет приобрела несколько фирм, технологии которых дополнили ее собственный пакет Paradigm GeoDepth для построения глубинно-скоростных моделей. Сейчас в Paradigm работает более 500 сотрудников, она имеет офисы в 19 странах мира, но при этом не отрывается от корней. По словам Николая Баранского, президента по странам СНГ, его компания уже обладала самым мощным в России центром обработки сейсмических данных, а теперь, после оснащения новым кластером, появляется возможность сократить время производственного цикла.

Ранее в Paradigm использовался компьютер с массовым параллелизмом, состоящий из 80 процессоров SGI Origin 2000, теперь он дополнен IBM Linux Cluster, модель 1350, состоящим из 34 двухпроцессорных серверов IBM eServer x335 на процессорах Xeon 2,4 ГГц. Новый кластер в шесть раз производительнее старого и при этом в шесть раз компактнее. Говоря о более высокой производительности, в данном случае допускается небольшое лукавство: SGI Origin 2000 отличается 64-разрядной адресацией, следовательно, ему доступен больший объем прямо адресуемых данных, не случайно в заокеанском центре той же Paradigm стоит еще более мощный компьютер SGI, пока его менять не собираются, по всей видимости до появления 64-битного ответа от Intel. Но, как подчеркнул Николай Баранский, стоимостное преимущество пока, безусловно, на стороне машин типа eServer Cluster 1350.

Необходимо отметить, что Linux-кластеры были представлены на мероприятии так, как будто именно Intel и IBM их придумали и предложили рынку. Например, ни разу не прозвучало название Beowulf, а ведь так уже десять лет называют кластеры, собираемые из рабочих станций на основе Alpha или Intel, где используется параллельная виртуальная машина PVM (Parallel Virtual Machine) и интерфейс между узлами на основе сообщений MPI (Message Passing Interface). Модель eServer Cluster 1350 не что иное, как современная технологическая реинкарнация старой идеи. Еще в 1993 Дональдом Бекером и Томасом Стерлингом был предложен проект CESDIS, а годом позже появился первый кластер, состоящий из 16 ПК, соединенный Ethernet-сетью. Beowulf можно считать чем-то средним между MPP-системами, такими как nCube, CM5, Convex SPP, Cray T3D, Cray T3E, и сетями рабочих станций NOW (Networks of Workstations), теперь сближающимися с grid-решениями.