Решения, реализованные в p690, позволяют говорить о новом уровне в конструировании Unix-серверов
Максим Серебряный: «eServer p690 — первый Unix-сервер класса Data Center»

В Москве знакомство с новым сервером IBM eServer p690 состоялось 4 октября. По астрономическим причинам его демонстрация прошла на несколько часов раньше, чем в Америке. В тот же день было объявлено о новой модели сервера IBM pSeries 610 на одном или двух процессорах POWER3-II с тактовыми частотами 375 и 450 МГц.

Свой самый новый, и самый мощный, и самый многообещающий, способный, по ее мнению, вызвать «экономический переворот на рынке» Unix-сервер IBM назвала Regatta, он же eServer p690. Вполне естественно, что на рекламных иллюстрациях использована в качестве символа крейсерская яхта, идущая под всеми парусами. Однако мне в голову пришло другое, может быть, не столь эффектное, но наверняка более полезное судно — уникальная по свой конструкции лодка дори, которую изобрели рыбаки на полуострове Лабрадор. От других судов она отличается схожестью кормы и носа, на ней можно изменять курс на 180 градусов без разворота. Точно так же и p690 с успехом может плыть «вперед» и «назад», то есть он может с минимальными различиями использоваться и в качестве сервера для бизнес-приложений, и как инструмент для вычислений; для решения сверхсложных научно-технических задач можно объединить серверы в суперкомпьютерные комплексы, насчитывающие в сумме свыше тысячи процессоров.

p690 может работать под управлением ОС AIX 5L и 64-разрядного варианта Linux.

Проект нового компьютера, который еще называют Data Center 690, вобрал в себя целый ряд передовых технических решений, по совокупности позволяющих говорить о качественно новом уровне в конструировании Unix-серверов. Прежде всего, близнецы — микропроцессоры IBM POWER4 и HPC POWER4, обеспечивающие двойное назначение сервера. Первый вполне закономерно называют «сервером на кристалле», поскольку в нем на одной микросхеме размещены два процессорных устройства, работающие на тактовой частоте 1 или 1,3 ГГц, имеющие общий кэш второго уровня на 1,4 Мбайт, и контроллер кэш-памяти третьего уровня (!), емкость которой может достигать 32 Мбайт. Скорость обмена данными между кэш-памятью и процессором составляет 125 Гбайт/с, что эквивалентно прокачке 25 полноформатных DVD-фильмов за одну секунду. Вычислительный процессор HPC POWER4 отличается тем, что в одном кристалле размещается одно процессорное ядро.

В остальном процессоры идентичны, в обоих реализованы все самые передовые полупроводниковые технологии, которые появились в IBM на протяжении последних лет, что выводит эти процессоры в явные лидеры по производительности; представители корпорации убеждены, что отрыв от конкурентов составляет, как минимум, год-полтора.

Новая физическая и логическая конструкция

В сервере процессоры собраны в конструктивные компоненты первого уровня, которые получили название Multi-chip Module (MCM). В них на одном основании размером с ладонь собраны максимум четыре кристалла (до восьми процессоров), причем они упакованы так, чтобы каждый соединялся с каждым проводником минимальной длины.

Из четырех модулей MCM собирается 32-процессорный сервер. В итоге весь центральный электронный комплекс (CEC) в максимальной комплектации размещается в отсеке высотой 17U, то есть занимает менее половины от общей высоты стойки 42U, заимствованной у мэйнфреймов. Оставшееся пространство позволяет здесь же разместить основной и дополнительные источники питания, отсек для накопительных устройств, основной и дополнительные блоки ввода/вывода.

Предусмотрены стандартные серверные конфигурации с разным числом MCM; возможны варианты с 8, 16, 24 и 32 процессорами. Передние слоты стойки позволяют установить до 16 дисков с горячей заменой, каждый емкостью 18,2 или 36,4 Гбайт, при этом максимальная суммарная емкость дисков на блок составляет 582,4 Гбайт. В полной конфигурации системы может быть до 8 дисковых блоков, и суммарная емкость составит 4,65 Тбайт. Еще 20 задних блоков имеют по восемь слотов PCI на один блок, всего 160 слотов PCI на систему, и имеют возможность замены адаптеров PCI без остановки системы. Любой слот PCI может быть определен для любого логического раздела.

Разумеется, имеет место деление на разделы (домены), что стало обязательным для мощных серверов последнего поколения. При представлении Regatta старательно подчеркивалась важная особенность. У конкурентов деление на разделы является физическим (Physical Partitioning — PPAR), то есть разделение контролируется интерфейсами между физическими блоками и наращивание системы возможно только физическими блоками. В отличие от этого логическое деление (Logical Partitioning — LPAR) контролируется механизмами адресации ресурсов, и наращиваемость системы осуществляется на уровне логических ресурсов. Каждый сервер p690 может допустить определение до 16 логических разделов, способных работать под управлением AIX 5L или Linux, причем сочетание операционных систем для разделов может быть любым. Сервер предоставляет самые гибкие возможности распределения ресурсов процессоров, памяти и ввода/вывода, что позволяет создавать виртуальные серверы с одним или несколькими процессорами.

Надежность, заимствованная у живой природы

Свое движение к созданию компьютерных систем с высокими надежностью, готовностью и пригодностью к обслуживанию (Reliability Availability, Serviceability — RAS) в IBM называют «путем к автономным вычислениям», включая в него четыре ключевых требования с приставкой «само», которым должна удовлетворять такая система в перспективе: самооптимизация, самоконфигурирование, самозащита, самоисцеление.

Пока реализуется только система самодиагностики, ее основным элементом является подсистема First Failure Data Capture, которая определяет статус основных параметров в реальном времени, накапливает и обрабатывает данные об ошибках, предотвращая неисправности, что позволяет устранять многие неполадки без вмешательства оператора и без остановки работы. Подсистема сама может определить вышедший из строя компонент, сделать звонок в сервисный центр и направить заказ на запчасти и ремонт в удобное для заказчика время. В p690 использованы технологии из известного проекта eLiza:

  • технология Bit steering обеспечивает динамический перенос информации с дефектного модуля памяти на запасной модуль.
  • «очистка памяти» (Soft-error scrubbing) корректирует одноразрядные ошибки в фоновом режиме для предотвращения возникновения многоразрядных ошибок IBM.

Наряду с этими авангардными методиками в Regatta для выполнения требований RAS использованы также хорошо известные и традиционные решения.