С началом коммерческого применения первых серверов аппаратное обеспечение создавалось под девизом «Быстрее, выше, сильнее». И с тех пор ничего не изменилось. Каждый раз, когда производители выводят на рынок новое поколение серверов, немедленно появляются приложения и услуги, задействующие все их ресурсы. Но с некоторых пор эта своеобразная «гонка вооружений» идет по другим правилам. Проверенная стратегия, когда единственный путь добиться максимальной мощности пролегает через высокие тактовые частоты, оказалась — по крайней мере на какое-то время — непрактичной. Хотя центральные процессоры работают быстрее с возрастанием частоты, при неизменной конструкции микросхемы потребление энергии возрастает экспоненциально. Высокая энергоемкость и охлаждение кристаллов стали проблемой, поскольку прирост мощности уже не окупает издержек.

Как следствие, производители процессоров задумались об увеличении вычислительной мощности путем организации параллельной обработки на базе нескольких процессорных ядер. Такой подход предлагает несколько преимуществ: в частности, потребление энергии заметно сокращается, поскольку уменьшается тактовая частота. Увеличение количества ядер выгодно и производителям решений виртуализации: соответствующие программы получают значительную выгоду от использования раздельных ядер, особенно если те обладают еще и расширениями для поддержки виртуализации. Компания AMD не упустила возможности и смогла отобрать у своего вечного соперника Intel заметную долю серверного рынка со своим новым экономным процессором Opteron. Intel восстановила позиции в 2006 г., выпустив многоядерный процессор.

СЕРДЦЕ СЕРВЕРА

Свой процессор Barcelona, аналог четырехъядерного процессора Intel Xeon Clovertown, AMD обещает представить лишь во второй половине года (см. Рисунок 1) (AMD начала поставки процессора в сентябре — прим. редакции). Причина такого отставания заключается в особенностях базового дизайна. В то время как Intel на одной подложке размещает два двухъядерных ядра и получает таким образом четырехъядерный процессор, AMD планирует выпустить полностью четырехъядерный процессор. Это может дать преимущества в скорости вычислений, но быстрому выводу на рынок не способствует. Марио Ривас, исполнительный вице-президент компании, недавно выразил сожаление, что AMD не скомбинировала на одной микросхеме два двойных ядра, как это сделала Intel (см. Рисунок 3). «Если бы я мог что-то изменить, то сначала организовал бы выпуск «многочипного»
модуля», — сетует Ривас.

Рисунок 1. Четырехъядерный процессор Opteron от AMD появился на рынке во второй половине года.   Рисунок 2. Серверный процессор Xeon с четырьмя ядрами производства Intel отвоевывает рынок.   Рисунок 3. Больше оперативной памяти: в свои новые серверы System x IBM устанавливает двухъядерные процессоры и втрое больше оперативной памяти.

При этом серверные процессоры AMD демонстрируют явные преимущества, и не только в отношении потребления энергии. Если Intel по-прежнему размещает на кристалле контроллер памяти отдельно от процессора, то в случае Opteron контроллер памяти является составной частью процессора. Благодаря такому решению шина Front Side Bus (FSB) перестает быть узким местом и обеспечивается очень быстрый доступ к памяти. Будет ли это заметно на практике — уже другой вопрос. Клаус Румзауэр, директор по корпоративным серверным системам и системам хранения данных германского отделения Hewlett-Packard, хорошо знаком с обеими концепциями процессоров. Компания выпускает свои серверы x86 как с процессорами AMD, так и с процессорами Intel. «Ранее AMD технически превосходила своего конкурента, — говорит Румзауэр, — но сегодня Intel ее догоняет. Выбрать процессор, наиболее подходящий для конкретной области применения, можно часто только при помощи специального теста».

Идея размещения контроллера памяти непосредственно на процессоре увлекла и Intel. Как ожидается, ее восьмиядерный процессор Nehalem появится на рынке в 2008 г. Он будет оснащен интегрированным контроллером памяти. Intel взяла на вооружение еще одну идею: последовательная коммуникация с периферией. У AMD эта концепция называется HyperTransport и предполагает наличие нескольких каналов общей пропускной способностью до 24 Гбайт/с. Intel разрабатывает свой коммуникационный интерфейс самостоятельно, он будет называться общим системным интерфейсом (Common System Interface, CSI).

AMD заметно отстает в отношении процесса производства. Barcelona будет выпускаться на базе 65-нанометровой технологии, в то время как современные процессоры Opteron все еще используют 90-нанометровую технологию. Intel уже применяет 65-нанометровую технологию и в этом году начнет выпускать многоядерные процессоры Xeon на базе 45-нанометровой технологии. Конечно, разработки ведутся и в области процессоров, отличных от x86: процессор Itanium производства Intel вскоре выходит на рынок в двухъядерном варианте, четырехъядерный вариант (под кодовым названием Tukwila) должен появиться в 2008 г.

Свой процессор RISC под названием UltraSPARC продолжает совершенствовать Sun Microsystems. Появившийся в ноябре 2005 г. процессор Niagara представляет собой второе поколение многопотоковых процессоров (Chip Multi Threading, CMT). Процессоры UltraSPARC-T1 хотя и работают с тактовой частотой всего лишь в 1,2 ГГц, но способны одновременно обрабатывать до 32 потоков и обладают встроенным контроллером памяти.

При разработке следующей модели, Niagara 2, Sun ищет новые пути. Компания отказалась от всех необязательных элементов и в результате создала очень эффективный процессор, который обрабатывает сразу несколько потоков и обладает восемью встроенными механизмами шифрования. Благодаря им данные можно шифровать в реальном времени, без задержки. Конечно, эти механизмы должны поддерживаться операционными системами и приложениями: Web-сервер Apache, к примеру, необходимо скомпилировать таким образом, чтобы механизм шифрования использовался и под управлением Solaris. Sun собирается предлагать возможность загрузки заранее скомпилированных пакетов важнейших программ с открытым исходным кодом.

Тенденция снабжения центрального процессора специализированными сопроцессорами характерна для всей отрасли. Intel использует для этого уровень абстракции приложений (Application Abstraction Layer, AAL), благодаря которому разработчики программного обеспечения смогут создавать механизмы ускорения, не зная, какое именно аппаратное обеспечение используется. Механизмы могут быть реализованы посредством PCI Express, собственной матрицы FPGA или даже в качестве составной части разрабатываемого процессора. То же самое планирует и AMD в отношении будущего процессора Torrenza. Этот проект предполагает привлечение других производителей к разработке вспомогательных процессоров, которые размещаются либо в свободном процессорном гнезде на системной плате, либо подключаются по каналу HyperTransport.

ПОТРЕБЛЕНИЕ ЭНЕРГИИ И ОХЛАЖДЕНИЕ

Концепция нескольких ядер пользуется большой популярностью из-за ожидаемого увеличения производительности, хотя имеются и другие причины. Для подразделений разработки главным стимулом является необходимость создания эффективного процессора с низким энергопотреблением при высокой вычислительной мощности, ведь известно, что рыночный сегмент модульных серверов развивается наиболее быстро. Но многим руководителям центров обработки данных постепенно становится ясно, что слишком высокая концентрация процессоров на малой площади превращается в источник проблем. Высокая мощность означает большое выделение энергии, и вычислительные центры достигают предела своих возможностей не из-за недостатка места, а из-за необходимости охлаждения всех этих систем.

Ограничиться покупкой более мощной климатической системы уже не удастся. Во-первых, помещение понадобится перестроить, а этим никто в вычислительном центре заниматься, как правило, не хочет. Во-вторых, ситуация с энергопотреблением становится все напряженнее в связи с дискуссией об изменении климата. Производители серверов, к примеру Dell, рекламируют очень экономичные модели. Системы PowerEdge 2970 и Energy Smart 2970 должны обеспечивать в два раза большую, по сравнению с традиционными серверами, вычислительную мощность на ватт потребляемого тока и расходовать на 34% меньше энергии, но и стоят они дороже. Петер Дюмиг, системный консультант компании Dell, считает, что дополнительные затраты — не проблема: «При современных ценах на электроэнергию дополнительные издержки на все системы окупаются за девять — двенадцать месяцев». Это достигается благодаря экономичным модулям оперативной памяти, блокам питания с высоким коэффициентом полезного действия и специальным процессорам.

Как AMD, так и Intel планируют выпуск процессоров с очень низким энергопотреблением. Так, четырехъядерные процессоры Xeon L5320 и L5310 от Intel потребляют всего 50 Вт вместо 80 или 120, а высокоэффективные процессоры AMD Opteron — 68 Вт. Для процессоров Barcelona предусмотрены дополнительные возможности экономии энергии: четырехъядерный процессор может управлять тактовой частотой каждого ядра по отдельности и сокращать ее, если какое-либо ядро не занято вычислениями. IBM тоже делает ставку на экономичные процессоры и предлагает как модули BladeCenter, так и серверы System x с процессорами AMD или Intel с низким энергопотреблением (см. Рисунок 3). Кроме того, в них используются очень эффективные, с точки зрения потребления энергии, блоки питания, оптимизированная система вентиляции и — на отдельных серверных модулях — флэш-накопители вместо жестких дисков. Sun придерживается иного подхода. Герхард Шлабши, директор по маркетингу продукции компании

Sun Microsystems, заявил: «Наши серверы и так отличаются эффективным использованием энергии, поэтому нам не нужно выдумывать специальных моделей ее экономии. Процессор Т1, потребляющий 70 Вт, обеспечивает такую же мощность вычисления, как два самых современных четырехъядерных процессора x86, потребляющих 140 Вт. Процессор T2 при таком же энергопотреблении имеет вдвое большую производительность. Блоки питания с высоким КПД являются серийными и продаются без наценки».

Разработчики Sun предпочитают рассматривать картину в целом: по их мнению, необходимо охлаждать весь вычислительный центр, а не отдельные серверы. Насколько этот подход эффективен в условиях ограниченного места, можно судить по концепции Blackbox, когда серверные стойки размещаются в контейнере. Охлаждающие пластины, разделяющие стойки, призваны обеспечить одинаково низкую входную температуру для каждой стойки. В качестве хладагента используется жидкость, но только между стойками, а не внутри них.

Рисунок 4. Нужен водопроводный кран: модульная стойка охлаждения производства HP эффективно охлаждает системы при помощи жидкостиHewlett-Packard относится к этому вопросу с меньшим пиететом и по-прежнему охлаждает стойки водой. Модульная система охлаждения (HP Modular Cooling System, MCS) на базе стандартной стойки HP обеспечивает мощность охлаждения до 30 кВт (см. Рисунок 4). Впрочем, и НР рассматривает вычислительный центр в более широких рамках, предусматривая в своей концепции наличие климатических зон с пунктами измерения температуры, с тем чтобы охлаждать конкретные участки, а не весь вычислительный центр. В серверах используются вентиляторы новой конструкции, функционирующие по принципу сопла и обеспечивающие более высокую пропускную способность воздуха при меньшем уровне шума.

В компании Dell к идее охлаждения серверных стоек жидкостью относятся положительно, но опасаются потенциальных проблем с совместимостью продуктов разных производителей стоек. «Общий стандарт мог бы помочь как производителям, так и пользователям», — считает Петер Дюмиг. А Герхард Шлабши из Sun напоминает, что не только экономия энергии способствует сохранению окружающей среды: «Наши корпуса состоят полностью из алюминия, к тому же мы не покрываем отдельные компоненты лаком, а начищаем их щеткой: это облегчает их утилизацию и сокращает потребление воды при производстве».

ОБЫЧНАЯ ВИРТУАЛИЗАЦИЯ

Виртуализация за последние полтора года стала повсеместной тенденцией: все большее количество поставщиков предлагают специальные решения, а производители процессоров интегрируют поддержку виртуализации в свои процессоры последнего поколения. Intel предлагает Vanderpool, AMD — свое решение Pacifica, у Sun расширения для поддержки виртуализации называются Logical Domains. Компания Sun в свою операционную систему Solaris дополнительно встроила расширение Solaris Container, при помощи которого разбиение на разделы может выполняться на программном уровне.

Концепция аппаратной поддержки развивается: в следующих поколениях процессоров речь идет уже о ее оптимизации. Intel планирует улучшить систему доступа для ввода/вывода при виртуализации. Дело в том, что порт до сих пор блокируется, когда к нему обращаются с целью выполнения операции ввода/вывода — даже если в данный момент передача данных не производится. Соответствующее расширение процессора Intel называется технологией виртуализации для управляемого ввода/вывода (Virtualization Technology for Directed I/O, VT-d), у AMD оно носит название блока отображения памяти для ввода/вывода (I/O Memory Mapping Unit, IOMMU). С его помощью можно улучшать процесс взаимной коммуникации между виртуальными машинами, которые до сих пор обмениваются данными через сетевые интерфейсы, а в будущем смогут это делать путем прямого доступа к памяти (Direct Memory Access, DMA).

Указанная тема затрагивает и область шинной системы ввода/вывода — почти везде это PCI Express (PCIe). В данный момент ответственный комитет по стандартизации PCI-SIG разрабатывает предложения о том, как должна выглядеть виртуализация ввода/вывода. Виртуализованные устройства могли бы предлагать виртуальным машинам собственные интерфейсы, которые они будут использовать для коммуникации с внешним миром.

Разработчики занимаются и безопасностью виртуализации. AMD собирается интегрировать в процессоры Barcelona технологию под названием вектор исключения устройств (Device Exclusion Vector, DEV), которая должна сообщать гипервизору, какие сегменты хранения относятся к определенной виртуальной машине и могут быть ею затребованы. У Intel есть похожая концепция, но она реализована в программном виде и поэтому работает несколько медленнее. С целью увеличения производительности AMD создала размеченный буфер быстрого преобразования адреса (Tagged Translation Look-aside Buffer, Tagged TLB). При этом данные в памяти маркируются в соответствии со своей принадлежностью к определенной виртуальной машине. Когда последняя запрашивает данные, кэш — в отличие от управления виртуальной памятью в случае процессоров Xeon — не очищается. В этом случае данные других виртуальных машин временно сохраняются. Если доступ к информации запросит еще одна виртуальная машина, данные находятся в кэше и быстро загружаются.

Хорошие новости появились и в отношении операционной системы: ядро Linux, начиная с версии 2.6.21, интегрирует интерфейс VMware поддержки виртуальных машин (Virtual Machine Interface, VMI). С его помощью ядро может взаимодействовать с гипервизором VMware. Похожая технология имеется и для Xen, однако интеграция возможна лишь для поздней версии ядра.

РЫНОК МЕНЯЕТСЯ

Успехи виртуализации сказываются на рынке серверов, пусть и не столь значительно, как опасались некоторые производители. Аналитики Gartner Dataquest полагают, что за последний год в количественном выражении продажи выросли на 6,8% в регионе ЕМЕА, и на 12,8% во всем мире, однако рост оборота в ЕМЕА составил лишь 2%. Причина более высоких темпов роста в количественном выражении может заключаться в постепенном переходе с систем RISC/UNIX на архитектуры x86 — так, во всяком случае, считает Стивен Джосселин, аналитик компании IDC.

Что же касается распределения рынка процессоров, то картина однозначна. По данным исследования компании Isuppli, только Intel в первом квартале 2007 г. отыграла у AMD 5% рынка. Таким образом, рыночная доля Intel составляет около 80%, в то время как доля AMD сократилась с 15 до 10%. Теперь все ждут появления Barcelona, но аналитики пока не уверены, сможет ли AMD с помощью нового четырехъядерного процессора вернуть своих клиентов.

ЧТО В БУДУЩЕМ?

Борьба за дальнейшую миниатюризацию компонентов при производстве микросхемы и тем самым все более и более эффективные процессоры продолжается. На экспериментальной микросхеме компании Intel под названием Polaris установлено 80 ядер на одной подложке, а мощность вычислений достигает двух терафлоп. При этом потребление энергии сравнительно мало — 200 Вт. IBM, в свою очередь, недавно объявила о том, что впервые в истории при изготовлении микросхем применен нанотехнический метод самоупорядочивания — процесс, известный как природное явление, в результате которого появляются морские раковины, снежные хлопья или зубная эмаль. Он используется компанией IBM для генерации миллиардов крошечных отверстий, которые создают изолированный вакуум в километровых проводниках нанометровой толщины на микросхемах. В лаборатории IBM исследователи уже доказали, что по сравнению с традиционными технологиями изготовления электронные сигналы на микросхемах передаются на 35% быстрее, или потребляют на 15% меньше энергии. Этот технологический прорыв позволяет увеличить производительность на величину, соответствующую двум поколениям закона Мура.

Эльмар Торок — независимый автор.


© AWi Verlag

Поделитесь материалом с коллегами и друзьями