Радужные перспективы процессоров Sandy Bridge были обрисованы Полом Отеллини еще в начале января в рамках их официальной премьеры на выставке CES в Лас-Вегасе. Фото: Intel

Рыночный успех процессоров на базе новой микроархитектуры под кодовым названием Sandy Bridge, официально именуемых вторым поколением Intel Core и предназначенных для мобильных и настольных ПК, в Санта-Кларе фактически сочли делом решенным, едва успев объявить о начале их поставок. И, возможно, поступили таким образом несколько опрометчиво.

В середине января финансовый директор Intel Стэйси Смит уверенно называл растущие объемы продаж этих процессоров одним из главных факторов, которые позволят корпорации в этом году даже при не самом благоприятном раскладе избежать сезонного падения оборота в начале года. Заключительный квартал 2010 года в Intel закончили с рекордным оборотом в 11,5 млрд. долл. – выше ожиданий финансовых аналитиков, и не собирались останавливаться на достигнутом. Фондовый рынок, правда, отреагировал на все это без особых восторгов. Но эта реакция так и осталась бы единственной ложкой дегтя в январском бочонке меда для Intel, если бы не проблемы c чипсетами серии Intel 6 (Cougar Point), из-за которых корпорация вынуждена была приостановить их поставки.

Впервые радужные перспективы процессоров Sandy Bridge были обрисованы генеральным директором Intel Полом Отеллини еще в начале января в рамках их официальной премьеры на выставке CES в Лас-Вегасе (см. "Отеллини ставит на Sandy Bridge", Computerworld Россия, № 1, 2011). Вслед за ним оптимизм Intel разделили и многочисленные партнеры корпорации по пресловутой "экосистеме" – от вендоров, предлагающих заказчикам готовые системы, до азиатских OEM-подрядчиков и поставщиков комплектующих для ПК. Нашлись даже производители пассивных электронных компонентов (резисторов, конденсаторов и т. д.), выразившие надежду, что их бизнес теперь пойдет в гору.

Детали реализации новой микроархитектуры впервые были обнародованы в сентябре прошлого года в рамках форума IDF в Сан-Франциско. Некоторые даже решили тогда, что это часть новой стратегии Intel – оттягивать разглашение информации о новых платформах, рассчитывая таким образом перед их формальной премьерой создать благоприятные условия для роста котировок ценных бумаг корпорации на фондовом рынке. Если это действительно так, нужно признать, что дебют новой стратегии вполне удался. Именно с сентября наметился устойчивый тренд на повышение курса акций Intel, продолжавшийся примерно до середины декабря. Далее, однако, дело застопорилось, что в экспертном сообществе признали явлением несколько неожиданным, хотя и не лишенным логики.

"Думается, шумиха вокруг планшетных ПК и смартфонов привела к тому, что инвесторы недооценивают потенциал рынка настольных ПК и ноутбуков, а также силу позиций Intel на этом рынке", – отметил в начале января аналитик Wells Fargo Дэвид Вонг.

Ближе к концу месяца, т.е. уже существенно позже CES и объявления итогов 2010 года для Intel (но еще до нынешней истории с обнаружением возможного постепенного ухудшения с течением времени работы портов Serial ATA в исходных вариантах чипсетов серии Intel 6), к аналогичным выводам пришли и аналитики Morgan Stanley. Кристофер Метли и Сиван Махадеван заявили, что фондовый рынок все еще не в состоянии адекватно оценить потенциал, который несут в себе процессоры Sandy Bridge. По их мнению, новые процессоры следовало рассматривать в числе ключевых факторов, способных сделать бизнес Intel более прибыльным в этом году. Теперь это менее очевидно – даже с учетом того, что чипсет архитектурно играет, скорее, второстепенную роль в системах на основе Sandy Bridge. Все равно это часть платформы, и "недостачей" в 300 млн. долл. вряд ли можно пренебречь абсолютно безболезненно.

Многие эксперты согласились с тем, что с технической точки зрения Sandy Bridge представляет собой значительный шаг вперед по сравнению с процессорами на базе предшествующей микроархитектуры – Nehalem. И дело тут не только в том, что Intel удалось совместить вычислительные ядра на одном кристалле с графическим контроллером. Специалисты обратили внимание на целый ряд интересных новшеств, реализованных именно на уровне вычислительного ядра. Среди них, в частности, переработанный блок предсказания ветвлений и кэш декодированных микроопераций (объемом около 1,5 тыс. записей) – их совместная работа позволяет отключать декодеры инструкций (всего их четыре) в случаях, когда во входном потоке инструкций присутствуют уже декодированные ранее, и тем самым значительно экономить энергопотребление. Кстати, многие не без удивления отметили тот факт, что в Intel решили реанимировать часть подходов, использовавшихся в, казалось бы, уже давно списанной в архив микроархитектуре NetBurst процессоров Pentium 4. К примеру, это касается упомянутого кэша декодированных микроопераций: в процессорах на основе NetBurst аналогичным образом работал так называемый кэш трассировки, являющийся частью кэш-памяти первого уровня.

Но, пожалуй, в еще большей степени микроархитектуры Sandy Bridge и NetBurst роднит между собой механизм изменения последовательности инструкций с использованием физического регистрового файла. (Примечательно, что аналогичный подход сейчас реализуется и конкурентами Intel – IBM в процессорах архитектуры Power и AMD в технологии процессорных ядер Bulldozer и Bobcat. – Прим. ред .) Работа этого механизма предполагает наличие только одной копии используемых данных и позволяет оперировать главным образом указателями, сокращая таким образом объемы пересылок. В результате можно сэкономить на площади кристалла и опять-таки энергопотреблении, а в Sandy Bridge за счет этого расширены по сравнению с Nehalem буферы загрузки, записи и переупорядочения, а также так называемая станция резервирования (буфер инструкций, ожидающих исполнения). Кроме того, как отметили в Intel, сократившиеся объемы пересылок стали одним из ключевых факторов, позволивших реализовать в Sandy Bridge поддержку векторных инструкций Intel AVX (Advanced Vector Extensions), оперирующих 256-битными данными.

Работа с операндами увеличенной разрядности также потребовала некоторого изменения исполнительных блоков. В микроархитектуре Nehalem планировщику доступны три порта для отправки инструкций на обработку исполнительными устройствами, которые в свою очередь сгруппированы в три стека (с каждым из портов при этом связаны свои устройства всех трех стеков). Первый составляют вычислители общего назначения, два других предназначены для 128-битных инструкций типа SIMD – для данных в формате с плавающей запятой (этот блок также обрабатывает обычные операции вещественной арифметики) либо целочисленных. В Sandy Bridge исполнение инструкций AVX реализуется путем объединения возможностей двух SIMD-стеков, что и позволяет расширять разрядность операндов до 256 бит. Аналогичным образом в блоке работы с памятью два 16-байтных канала, ранее (в Nehalem) использовавшихся для обслуживания запросов на загрузку данных либо запись адреса, сделаны симметричными, то есть допускающими оба варианта использования. И таким образом канал загрузки данных может расширяться до необходимых AVX-инструкциям 256 бит.

Из реализованных во втором поколении процессоров Intel Core инноваций структурного характера, выходящих за рамки вычислительного ядра, большое внимание привлекла к себе внутренняя кольцевая шина. Работая на частоте вычислительных ядер, она связывает их с другими основными функциональными модулями процессора – контроллером графики, блоком под названием "системный агент" и совместно используемой кэш-памятью L3 (см. врезку "Четыре кольца в одном"). Еще одним заметным усовершенствованием стал новый вариант технологии Turbo Boost – в состоянии простоя система накапливает так называемый "термобюджет", который с возобновлением работы трансформируется в "энергобюджет", а его расходование в свою очередь позволяет в течение некоторого короткого промежутка времени (несколько секунд) работать при повышенной частоте за счет поддержания электрической мощности выше значения TDP (Thermal Design Power). По истечении этого промежутка времени система в несколько шагов возвращается к частоте и производительности, соответствующим TDP. При этом раздельные схемы управления частотой и напряжением питания вычислительных ядер и графического контроллера позволяют по-разному распределять "энергобюджет" между ними.

В том, что с точки зрения производительности и энергоэффективности процессоры Sandy Bridge окажутся предпочтительнее своих предшественников, особенно сомневаться не приходилось. Но ведь помимо Intel, существует и другая сторона на микропроцессорном рынке – компания AMD. И этой стороне вовсе не улыбается сценарий, по которому время и усилия, потраченные на разработку технологии Fusion, окажутся малопродуктивны, а сами эти процессоры с интегрированным на кристалле графическим контроллером станут жертвой реализации исключительного потенциала Sandy Bridge.

"Первые независимые тесты подтверждают, что процессоры Sandy Bridge выглядят очень достойно на фоне других решений Intel и могут представлять определенную угрозу для позиций AMD на рынке," – отметил старший аналитик IDC Александр Загнетко.

От AMD, как правило, ждут предложений более привлекательных по цене по сравнению с продуктами Intel, и нынешний год в этом плане не является исключением. Пока сложно сказать, выиграют ли в AMD что-либо от проблем Intel с чипсетами для Sandy Bridge. Но ведь с появлением процессоров под кодовым названием Llano, разработанных в рамках проекта Fusion, еще и нивелируется одно из традиционных преимуществ Intel – более тонкий техпроцесс, используемый при выпуске продуктов топ-уровня. Впрочем, по мнению старшего аналитика Linley Group Кевина Крюэлла, это обстоятельство вряд ли сильно поможет AMD.

"Процессоры Llano основаны на старой технологии вычислительного ядра, а не на новой, известной под кодовым названием Bulldozer, поэтому едва ли от них стоит ждать большого прироста производительности. К тому же на пятки Llano будут уже наступать процессоры Ivy Bridge от Intel, спроектированные под техпроцесс с нормой 22 нм", – подчеркнул Крюэлл.

По итогам первых трех кварталов прошлого года, по данным IDC, доля AMD на мировом рынке микропроцессоров несколько снизилась – с позапрошлогодних 20,1% до 19%. Чуть лучше для AMD дела обстояли на рынке процессоров для мобильных ПК – доля компании выросла с 12,8% в 2009 году до 13,2%. В России картина носила более оптимистичный характер для компании из Саннивэйла. Доля процессоров AMD на рынке ПК по итогам первых трех кварталов, согласно данным IDC, выросла на 1,5%, на рынке ноутбуков – на 5,5%. При этом в AMD не уставали подчеркивать, что настоящим прорывом для компании может стать 2011 год, когда на рынке появятся процессоры Fusion. В Санта-Кларе, похоже, решили нанести упреждающий удар, представив процессорное семейство Sandy Bridge в самом начале нынешнего года.

По мнению Загнетко, оперативность, с которой новая платформа была подготовлена к выходу в свет, свидетельствует о том, что развитие ИТ-отрасли (в частности, индустрии пользовательских устройств – ноутбуков, планшетных ПК и т. д.) диктует очень серьезные требования к разработчикам. Поэтому скорее следует говорить о том, что рынок способствовал появлению Sandy Bridge, чем о возможном влиянии этой платформы на динамику тех или иных сегментов.

"В прогнозах IDC, разумеется, учитывается появление передовых чипсетов и платформ, но приходится признать, что и в России, и в мире сама по себе новая технология, как правило, не становится ключевым фактором, определяющим динамику рынка", – заключил аналитик.

Четыре кольца в одном

Концепцию внутренней кольцевой шины, связывающей основные функциональные части процессора, можно было встретить в материалах Intel, относящихся к проекту Larrabee (некоторое время назад выпуск коммерческих продуктов в рамках этого проекта был отложен на неопределенный срок). В процессорах Sandy Bridge кольцевой шиной (см. рисунок) объединены вычислительные ядра и графический контроллер, а также совместно используемая кэш-память L3 и "системный агент" (содержит контроллеры памяти, дисплея, шин PCI Express и DMI, блок управления питанием, а также ряд прочих модулей, которые в былые времена входили в состав северного моста чипсета). Физически расположенная на верхних уровнях металлизации, композиционно она состоит из четырех колец, представляющих собой шины данных (шириной 32 байт), запросов, подтверждений и мониторинга (для обеспечения когерентности кэш-памяти).

Кэш-память L3 в процессорах Sandy Bridge (объемом от 3 Мбайт в двухъядерных вариантах до 8 Мбайт в четырехъядерных) разделена на сегменты. Каждый из них имеет собственный интерфейсный блок, который содержит механизмы арбитража и сопряжения с шиной, а также контроллер кэша. Количество сегментов равно числу вычислительных ядер. Доступ к каждому возможен из любого полукольца кольцевой шины. Это позволяет всегда выбирать кратчайший из возможных маршрутов и таким образом минимизировать задержки при обращении к кэш-памяти.