InfoWorld, США

С прошлого года в качестве главного архитектора Sun Microsystems и старшего вице-президента по сетевым системам один из создателей корпорации занят разработкой серверов Sun Fire x64 на базе AMD Opteron, более известных под кодовым наименованием Galaxy
Энди Бехтольсхейм

Энди Бехтольсхейм, один из группы студентов Стэнфордского университета, которые основали корпорацию Sun Microsystems, изобрели рабочую станцию Sun и организовали производство множества последующих моделей компьютеров. Бехтольсхейм оставил Sun в 1995 году, чтобы создать Granite Systems, компанию сетевых технологий Gigabit Ethernet, позднее приобретенную Cisco Systems; затем он стал соучредителем компании Kealia, специализирующейся на проектировании серверов, которую в прошлом году приобрела Sun. С тех пор в качестве главного архитектора Sun и старшего вице-президента по сетевым системам Бехтольсхейм занят разработкой серверов Sun Fire x64 на базе AMD Opteron, более известных под кодовым наименованием Galaxy. Непосредственно перед выпуском Galaxy Бехтольсхейм побеседовал с руководителем испытательного центра InfoWorld Томом Ягером о проекте Galaxy, серверной стратегии Sun, архитектуре центральных процессоров, виртуализации и будущем платформы SPARC.

Что привело вас обратно в Sun? Каково происхождение проекта Galaxy?

Я оставил Sun в 1995 году, чтобы создать компанию сетевых технологий, которую позднее приобрела Cisco. В то время я был очарован сетевыми возможностями Gigabit Ethernet и не видел в этом направлении перспектив для Sun, занимавшейся серверами. Точно так же примерно год или два назад, когда я впервые услышал о процессоре Opteron, я был привлечен громадой создавшихся рыночных возможностей. Очевидно, сегодня слишком поздно начинать что-то новое в мире серверов, так что моя небольшая начинающая компания претендовала на долю вертикального рынка видеосерверов. Но было ясно, что наиболее полное использование этой технологии возможно лишь в рамках крупной «серверной» компании. Когда Sun публично объявила о своем намерении использовать архитектуру Opteron, это был подарок судьбы. Предыдущие усилия Sun в отраслевом пространстве стандартов базировались на выпуске под своей маркой «безымянных» компьютеров из Азии. Чтобы дифференцироваться или повысить потребительскую стоимость сервера, вы должны разработать кое-что получше серийного оборудования. Именно на этом мы сосредоточились после возвращения в Sun. Реальное изменение в компании — мы добавили технический отдел, чтобы заняться построением расширенных систем в отраслевом пространстве стандартов, которые стали бы оригинальными разработками Sun.

Чего вы надеялись достичь?

В системе Galaxy мы сосредоточились на производительности, и мы с гордостью сообщаем, что эти серверы имеют лучшую производительность в отрасли в рамках стандартной архитектуры. Это было достигнуто при помощи двухъядерной технологии компании AMD и высокопроизводительного чипа Opteron. Кроме того, Galaxy потребляет почти вдвое меньше энергии, чем его ближайшие конкуренты.

Этот новый CPU позволил нам при контрольных испытаниях превзойти четырехпроцессорный сервер на базе Xeon MP. Для сравнения, четырехпроцессорная система Intel в зависимости от изготовителя имеет высоту 3U или 4U. Наш сервер высотой 1U или 2U стоит вполовину дешевле и потребляет электроэнергии в три раза меньше. Я должен сказать, что сравнение Xeon MP с двухъядерным Opteron оказывается не в пользу Intel.

Почему вы отдали предпочтение дискам Serial Attached SCSI перед SATA?

Между SAS и SATA существует огромная разница в производительности, стоимости, позиции на рынке и т. д. Есть также различия между 3,5-дюймовой и 2,5-дюймовой технологиями. Емкость 3,5-дюймовых дисков SATA сегодня достигает 500 Гбайт, что существенно выше емкости дисков SCSI или SAS. Скорость вращения диска SATA достигает 7200 оборотов в минуту, среди них есть модели корпоративного класса со средним временем наработки на отказ до миллиона часов. По существу, среди 3,5-дюймовых устройств есть целая новая категория дисков, известных как SATA корпоративного класса, имеющих весьма привлекательные удельную емкость и производительность в расчете на один доллар.

Что же касается 2,5-дюймовых моделей, единственные диски SATA, доступные в 2,5-дюймовом варианте, имеют скорость вращения 5400 оборотов в минуту и в основном предназначены для мобильных компьютеров. Они никогда не разрабатывались для корпоративной среды. Наш контроллер поддерживает протокол обмена с SATA, но емкость этих дисков сегодня не превосходит 120 Гбайт, а производительность по сравнению с дисками SAS оставляет желать лучшего. В результате мы не видели интереса клиентов к 2,5-дюймовым SATA даже при том, что наблюдается большая заинтересованность в 3,5-дюймовых дисках SATA.

Компактные диски SFF SAS (Small Form Factor, SFF) в настоящее время достигают 10 тыс. оборотов в минуту, но фактически их производительность выше, чем у обычных 3,5-дюймовых дисков со скоростью вращения шпинделя 10000 оборотов в минуту. В следующем году эти диски дойдут до 15 тыс. оборотов в минуту и станут самыми быстрыми дисками на планете, потому что в 2,5-дюймовом диске головки перемещаются на меньшее расстояние, чем в 3,5-дюймовом. Сегодня их емкость от 36 до 73 Гбайт, и это не предел.

Но истинная причина, по которой мы выбрали диски SFF-SAS, состоит в том, что это позволило нам убрать дисководы из воздушного потока, охлаждающего CPU. Вся левая часть корпуса снабжена перфорацией, открывающей путь воздуху для охлаждения горячего центрального процессора. По мере перехода отрасли от одноядерных к двух- и четырехъядерным процессорам, их мощность только возрастет. Плотность рассеиваемой мощности многоядерных процессоров будет повышаться даже при том, что удельная производительность на единицу мощности удваивается при добавлении ядер.

Процессор Opteron в Galaxy потребляет 95 ватт?

Нет, фактически он потребляет 120 ватт. Сервер рассчитан на еще более мощные чипы, которые появятся в будущем. Повысив мощность, компания AMD пошла нам навстречу, поскольку мы чувствовали настоятельную потребность в повышенном быстродействии. Проведя математические расчеты с учетом потребляемой мощности, стоимости электричества в Калифорнии и других факторов, мы выяснили, что при повышении быстродействия чипа на 10% число серверов можно на 10% сократить, сохраняя общую производительность. При любых расчетах это лучше, чем наращивать парк серверов со всей их памятью, дисками, эксплуатационными расходами и общим замедлением всей системы. Другим преимуществом высокопроизводительных процессоров для потребителя является то, что не приходится приобретать лишних лицензий на программное обеспечение, лишних серверов или использовать дополнительное пространство в стойках.

Рассматриваете ли вы эту стадию развития технологии AMD как достаточную для серьезной виртуализации?

Здесь мы должны говорить о конкретном программном обеспечении. Компания VMware овладела искусством виртуализации, ее программное обеспечение прекрасно справляется с AMD Opteron, и вы можете поверх него запустить Windows, Linux и Solaris; все это будет прекрасно работать. Проект Xen с открытым кодом пока еще находится на начальном этапе. Инициативы Xen будут поддержаны дальнейшими усовершенствованиями, которые AMD и Intel внесут в процессоры в следующем календарном году. Технологии виртуализации Intel VT и AMD Pacifica облегчат для Xen достижение тех же функциональных возможностей, которые программное обеспечение Vmware предлагает сегодня.

Вы утверждаете, что сегодня Galaxy позволяет сделать ту же самую работу, сократив количество серверов на 10%. Улучшится ли существенно это соотношение с появлением Pacifica?

Это зависит от интенсивности взаимодействия прикладных программ с ядром. Однозначную количественную оценку произвести невозможно. Архитектура Pacifica делает жизнь более легкой. Легче жить станет проектам Xen и Microsoft Virtual Server, легче добиться полной функциональности и, возможно, в некоторых случаях получить какое-то преимущество в производительности перед VMware. Но дело не в повышении производительности. Сегодня, как и всегда, виртуализация позволяет получить огромный выигрыш в стоимости. И множество людей выбирают этот путь, чтобы значительно сэкономить на аппаратных средствах. Заглядывая вперед, мы можем предположить, что через год все будут предлагать виртуализацию как часть базового решения.

Виртуализация — это очень важная тема. Реальное событие на рынке — этот переход от одного ядра с двумя процессорными разъемами к двойному ядру с теми же разъемами. У AMD это есть; у Intel появится в будущем году. Исторически сложилось так, что двухразъемный рынок — двухъядерный рынок — всегда был лакомым куском. Но сегодня двухразъемная двухъядерная архитектура — фактически самая рентабельная, которая позволяет построить систему действительно с четырьмя процессорами. Чтобы использовать преимущества четырехпроцессорной машины, вы должны консолидировать на ней больше рабочих нагрузок. Но хотел бы повторить еще раз, это очень существенный сдвиг на рынке. Посмотрите на сегодняшние доли рынка: четырехпроцессорные системы составляют менее 10% всех поставляемых систем. Все остальное — однопроцессорные и двухпроцессорные системы. Через год следует ожидать, что 90% всех систем будут четырехпроцессорными.

Собирается ли Sun развивать заложенную в SPARC идею о том, что тактовая частота не имеет особого значения?

Тактовая частота сама по себе — понятие абсолютно бессмысленное. Реально имеет значение лишь объем выполненной работы. Например, у Opteron три внутренних целочисленных конвейера; Xeon имеет лишь два. Так что соотношение производительности оказывается два к трем. Вдобавок ко всему пониженная тактовая частота помогает значительно уменьшить энергопотребление. Энергопотребление линейно зависит от тактовой частоты, и 30-стадийный конвейер Xeon был в этом плане действительно плох. И конвейер Opteron, и будущие конвейеры AMD намного короче. Поэтому я думаю, что Intel со своими микроконвейерами просто пошла по неверному пути, попытавшись максимизировать тактовую частоту.

Энди Бехтольсхейм: «В системе Galaxy мы сосредоточились на производительности, и мы с гордостью сообщаем, что эти серверы имеют лучшую производительность в отрасли в рамках стандартной архитектуры. Это было достигнуто при помощи двухъядерной технологии компании AMD и высокопроизводительного процессора Opteron. Кроме того, Galaxy потребляет почти вдвое меньше энергии, чем его ближайшие конкуренты»

Но позвольте мне вернуться к тактовой частоте. Для архитектур, подобных Opteron, с увеличением тактовой частоты мы наблюдаем линейный рост производительности. Контроллер памяти находится на чипе, так что нет никакого другого элемента, подобного шине FSB, который начиная с некоторой частоты мешает росту производительности.

И контроллер памяти всегда работает с тактовой частотой процессора.

Да, и это было главным усовершенствованием для AMD. Мы сравнивали некоторые эталонные тесты с Xeon MP с кэшем 8 Мбайт, но даже большой кэш не помогает там, где память отстоит столь далеко от центрального процессора.

Или там, где связь с другими процессорами и всеми устройствами ввода/вывода осуществляется через единственный северный мост.

Точно. Производительность ввода/вывода у Opteron также очень высока. Это означает, что мы можем обслуживать большое количество адаптеров Fibre Channel или любой другой способ ввода/вывода — грядущий InfiniBand или 10-Gigabit Ethernet — со скоростью передающей среды при данной пропускной способности памяти, что значительно, так скажем, труднее в системе Intel. Повторюсь, Intel интенсивно работает над устранением недостатков, так что я не хочу превращать нашу беседу в сравнение Intel и AMD. Но мы очень довольны производительностью Opteron. На технических рынках и на любом другом рынке, где решающий критерий — производительность, Opteron, безусловно, победит без труда.

Расскажите о производительности системы в целом. Какова скорость шины HyperTransport в этом сервере?

Мы поставляем систему с гигагерцевой шиной HyperTransport. Кстати, в этом состоит конкурентное отличие. Мы заметили существенное повышение производительности по сравнению с некоторыми более ранними системами, которые работали не на полной скорости. Частота памяти 400 МГц также очень важна, особенно для операций с плавающей точкой и для прикладных программ, интенсивно использующих память.

В корпоративных системах для ввода/вывода мы всегда используем две шины HyperTransport, и это является еще одним конкурентным отличием в общей производительности ввода/вывода, которую мы можем получить. Здесь трудно говорить о пиковой производительности, или пиковой пропускной способности средств ввода/вывода, потому что она ограничена слотами PCI, но в любом случае мы не ограничены внутренней пропускной способностью шины HyperTransport.

Вы упоминали ранее о вводе/выводе со скоростью, соответствующей среде передачи данных, и интерфейсах типа InfiniBand. Насколько специализированной является ваша реализация Ethernet в терминах производительности?

Это отраслевой стандарт, но производительность Gigabit Ethernet у нас также согласована с передающей средой. Когда я говорил о InfiniBand, я имел в виду, что сегодня это специализированный рынок, но есть успешно продвигающаяся инициатива OpenIB, направленная на создание горизонтального стека, который станет частью операционной системы Linux, вместо того чтобы получать его от сторонних поставщиков. Мы думаем, что примерно через год появится устойчивый, полнофункциональный стек OpenIB, полностью поддерживаемый Linux. Мы работаем на подобным стеком для Solaris, который также должен появиться в следующем году. Тогда можно будет управлять запоминающими устройствами через InfiniBand, через кластер, через MPI. Это замечательная технология для высокопроизводительных кластеров и высокопроизводительных запоминающих устройств. Очевидно, Fibre Channel — укоренившийся интерфейс в этой области и останется таковым еще много лет. Но, честно говоря, InfiniBand имеет значительно лучшее соотношение стоимость/производительность.

Смогли бы вы построить Galaxy по технологии Intel?

Intel принадлежит 80% рынка. Множество людей занимаются перепродажей их технологий. Мы в состоянии изготовить точно такой же продукт, как и все остальные, но мы не смогли бы сделать продукт лучше. Мы стараемся выйти на рынок с непревзойденным соотношением стоимости и производительности, и AMD позволяет нам это сделать. Это не означает, что мы против Intel. Если Intel сделает чип лучше, мы рассмотрим возможность его использования. Но пока нам больше нравятся технологии AMD.

Переход к самостоятельному проектированию систем позволяет Sun усовершенствовать системную плату и придать ей уникальные характеристики, оставаясь в рамках стандартов. Вы предполагаете появление в будущем программного обеспечения Sun, которое будет опираться на преимущества ваших уникальных разработок?

Да. Это в основном относится к архитектуре преодоления сбоев и касается методов, с помощью которых сервисный процессор общается с операционной системой. В Solaris мы можем добавить больше подобных функций, чем сегодня доступно в Linux. Это не означает, что их нельзя было добавить, но кто-то должен сделать эту работу в мире Linux или на стороне Microsoft, чтобы обеспечить информационный обмен между главным процессором и управляющим процессором. Есть вещи, которые обнаруживает только операционная система, будучи операционной системой, например плохие страницы или плохие участки памяти, дисков и т. д., и управляющему процессору надо о них сообщить.

В репортажах о вашем возвращении вы рисовались рыцарем на белом коне, создавшем сервер, который спасет компанию. Нелепый вопрос, конечно, но как бы Вы охарактеризовали сегодняшнее настроение и дух компании?

В глубине основной частью бизнеса Sun продолжает оставаться SPARC. Здесь интересной является новая (многопоточная) архитектура для SPARC — между собой мы называем ее Niagara, которая обеспечит намного более высокую производительность, чем можно себе представить. Ведутся проверочные испытания, и скоро все будут приятно удивлены. Этот новый чип вновь оживит SPARC и подтвердит проектные решения в области многоядерных процессоров и многопоточности, направленные на получение невероятного выигрыша в производительности на единицу мощности.

Сегодня SPARC не может сравниться по пропускной способности потока с чипом Opteron, поэтому для технических приложений последний остается, вероятно, лучшим выбором. Но мы видим весьма положительную реакцию клиентов на новые чипы Sparc, а по удельной производительности они превосходят Opteron. Нельзя сказать, что Sparc находится в тупике. Напротив, мы сосредоточены на усовершенствовании этих многоядерных, многопоточных чипов, чтобы в дальнейшем добиться еще большей производительности. Одно из преимуществ архитектуры RISC по сравнению с общепринятой отраслевой архитектурой заключается в меньших размерах ядра, так что в процессорах SPARC можно разместить больше ядер, чем в Opteron. Это преимущество останется неизменным. Семейство SPARC живо и хорошо себя чувствует, и бизнес SPARC не только стабилизируется, но и развивается по этим направлениям.

Я думаю, настроение в Sun улучшается, но верно и то, что, если рыночная доля компании уменьшается, а ее технологии вытесняются другими, в разработке которых она не принимала участия, восторга это не вызывает. Путь, которым мы собираемся выходить из этой ситуации, — выпуск хороших продуктов в отраслевом пространстве стандартов и возрождение продуктов по линии SPARC.