Сеть распределенных вычислений может сэкономить вам миллионы. Она может дать вашему бизнесу конкурентное преимущество. Но чтобы иметь ее, нужно самим ее построить. Почему? Спросите поставщиков.

Вам нужна сеть распределенных вычислений. Она может сэкономить вам миллионы. Она может дать вашему бизнесу конкурентное преимущество. Но чтобы иметь ее, нужно самим ее построить. Почему? Спросите поставщиков.
Скотт Маккей, директор информационной службы Genworth Financial, настроил свое заказное приложение для работы в сети grid

Большая часть ПО время от времени испытывает недостаток вычислительной мощности, но актуарное приложение для страховщиков Скотта Маккея, работающего в компании Genworth Financial, ест, как акула: оно заглатывает все ресурсы целиком и хочет еще. Поэтому в 2003 году Маккей попробовал сделать такое, на что до настоящего времени осмеливались не многие директора информационных служб, работающие вне научной отрасли или отрасли финансовых услуг (где потребность в массовом параллелизме оказывается важнее всех остальных соображений): он настроил свое заказное приложение для работы в сети распределенных вычислений (grid) — в широком проточном бассейне вычислительной мощности, разносящем свободную память ПК и серверов компании. При таком режиме питания акуле Маккея всегда хватает пищи, и теперь она обрабатывает актуарные таблицы за 20 минут, а не за пять часов.

Маккей в восторге от grid и от того, как она экономит деньги, но он также знает, почему большинство его коллег — директоров информационных служб все еще кормят своих акул по-старому: поставщики прикладного ПО не приветствуют grid. Это означает, что директора информационных служб, желающие сэкономить миллионы на своих инфраструктурах, должны сами создавать grid-приложения, а это настоящий подвиг. «Для того чтобы заставить grid работать, нужно преодолеть ряд проблем», — предупреждает директор информационной службы и старший вице-президент по операциям компании Genworth Financial Маккей.

И первая проблема заключается (что неудивительно) в деньгах.

Золотые прииски

Grid уничтожает традиционную модель лицензирования ПО, согласно которой клиенты платят в зависимости от числа процессоров, на которых работает приложение; иными словами, одно приложение, один компьютер и одна цена. Но в grid ни один центральный процессор не связан с определенным приложением. Grid-приложение Маккея притягивает поток мощности, который может протечь через 300 ПК в день, но задержаться на каждом лишь несколько минут. До сегодняшнего дня поставщики не могли (или — будем слегка критичнее — не хотели) понять, как можно делать деньги на grid computing, давая пользователям то, что им нужно, а именно фактически неограниченную мощность центрального процессора без астрономических цен за лицензирование.

«Поставщики так и не определились, как следует лицензировать свое ПО, — заявляет главный аналитик исследовательской компании Illuminata в области ИТ Джонатан Юнис. — Вопрос о лицензировании ПО так и остается запутанным и полностью не решенным».

Согласно отчету исследовательской компании The 451 Group, в настоящее время поставщики не хотят ради процветания grid вносить изменения в свои традиционные модели лицензирования ПО «на процессор». «Сейчас ни один поставщик не предпринимает реальных действий, направленных на изменение модели лицензирования ПО», — утверждает ведущий аналитик The 451 Group Уильям Феллоус.Ситуация на этом новом горячем рынке усложняется противоречивыми заявлениями поставщиков о своих grid-предложениях, считает вице-президент компании Gartner Research Карл Клонч. Он полагает, что технология grid computing была «взята в заложники» рыночными поставщиками. «Некоторые из них даже соглашаются (имея в виду не себя), что поставщики сделали только то, что взяли grid под свой брэнд, независимо от того, хороши ли их решения, — рассказывает вице-президент направления grid computing в IBM Кен Кинг. — Из-за этого grid окружила крикливая реклама и путаница».

Среди других препятствий к созданию прочного рынка grid выделяется недостаток стандартов и высокая стоимость перенастройки стандартных клиентских и серверных приложений для работы в grid.

Но, несмотря на все эти проблемы, суматоха вокруг grid не утихает, так как перспектива экономии денег, упрощения работы (во всяком случае для директоров информационных служб) и облегчения бремени поддержки слишком заманчива. Маккей утверждает, что он сократил затраты на приобретение оборудования, избавился от лишнего ПО и добился такого времени обработки, какое и не снилось его конкурентам в индустрии страхования.

А когда страховая компания может обрабатывать свои решения быстрее, чем конкуренты, речь заходит уже не об ИТ, говорит Маккей, а о конкурентном преимуществе. «Grid — это один из факторов, который отличает нас как бизнес, а не просто как ИТ-департамент», — заявляет он гордо. Но в ближайшем будущем поставщики не согласятся на сокращение своих доходов, считает Феллоус из The 451 Group?s Fellows.

А это значит, что все больше директоров информационных служб будут почесывать головы, задаваясь вопросом: «Ну почему не я?»

Бешеное щелканье счетчика

Директорам информационных служб, не разбирающимся в нюансах grid computing, выявление стоящих предложений из груды рекламы может показаться тяжелой и напрасной работой. Большая часть того, что предлагают поставщики, — это не grid. Список мнимых grid длинен, но в него входят кластеры, utility computing и виртуализация. (Для большей ясности см. «Где grid, а где нет».)

Осознав, что инфраструктура grid computing подходит для одного или более из числа их программных приложений, директора информационных служб должны определить, какую помощь можно реально ожидать от поставщиков и сколько они согласны заплатить.

И наконец, они должны быть готовы столкнуться с ужасами лицензирования ПО. «Модель лицензирования ПО — это самая большая помеха для grid computing, — считает Клонч из Gartner Research. — Поставщики знают, что с этим у них проблемы». Согласно аналитикам, те немногие поставщики, которые попытались найти формулу установления цены на grid, сделали ее крайне запутанной. «Взгляните на официальные прайс-листы, это ведь кошмар для клиентов, — говорит Юнис из Illuminata. — Приобрести ПО, разумно лицензированное для динамичной инфраструктуры grid, очень непросто».

Тем не менее, по словам Феллоуса, были предложены альтернативные модели лицензирования. Например, модель, согласно которой деньги снимаются за фактическое использование приложения, а не за общее число центральных процессоров в grid. Но эти новые модели требуют от поставщиков новых средств мониторинга и биллинга для отслеживания использованного времени, количества пользователей в месяц или объема транзакций. Существует очень мало механизмов для определения типа приложения, использования компонентов и отслеживания лицензий, применимых для grid, хотя некоторые сейчас тестируются. Даже если эти приложения окажутся действенными, от поставщиков и клиентов потребуется глубокое взаимное доверие. Клиенты должны верить, что с них не будут взимать деньги за время, которое они не используют, а поставщики должны быть уверены, что их клиенты не скрывают от программных инструментов мониторинга центральные процессоры или пользователей. Юнис из Illuminata сообщает, что нескольким крупным компаниям, имеющим большое влияние на поставщиков, удалось договориться об особых ценах и моделях мониторинга, «но для маленьких или средних компаний об этом говорить еще рано».

Феллоус рассказывает, что директора информационных служб, с которыми он беседовал, не просят поставщиков изобретать велосипед. Их вполне устроила бы некоторая корректировка тех моделей пользования, основанных на подсчете времени, которые они уже применяют. «Если бы их поставщик постепенно вносил изменения в модели лицензирования — что-нибудь простое, вроде переноса неиспользованных минут на следующий раз или вычета минут, потраченных на просмотр результатов исполнения программ, это было бы хорошим началом, — считает Феллоус. — Им просто нужны настройки к тому, что они делают уже сейчас».

Ни один поставщик пока открыто не объявил о намерении изменить свою модель расчета цены для grid computing (по крайней мере, не в ее чистом виде), хотя некоторые из них сделали то, что Феллоус называет «детскими шажками». Например, компания SAP тестирует ПО с открытым кодом Globus Toolkit, чтобы настроить свои продукты для работы в grid, что в случае удачи может по крайней мере привести к переговорам о модели расчета цен. Как считает Феллоус, для того чтобы отнять у конкурентов крупную долю рынка, мощному поставщику ПО нужно только изменить свою модель. Отдельные приложения, разработанные внутри компании, не влекут за собой затрат на лицензию. Сюда относятся приложения для аналитики, финансовых расчетов и автоматизации разработки электронных компонентов. Они годами работают в grid ранних последователей. Но, как утверждают аналитики, вне крупных корпораций не хватает своих специалистов по grid, которые заставили бы работать эти местные решения.

Горизонты grid продолжают меняться

По мнению Феллоуса, нет никаких явных технических преград для помещения приложения в grid. «Если вам действительно этого хочется, вы можете настроить для grid все, что угодно», — заявляет он. Но если и можно найти серьезное возражение полному переходу на grid, так это то, что преобразование существующих приложений потребует огромных усилий, денег и большого числа опытных grid-разработчиков (которых сегодня очень немного). Если только приложение не потребляет большой вычислительной мощности, директора информационных служб могут не увидеть серьезных причин для перехода на эту технологию, и поставщики, пошедшие на дорогостоящие доработки своего ПО, могут остаться ни с чем. Неопределенность в отношении стоимости изменения ПО и модели лицензирования означает, согласно отчету The 451 Group, что, возможно, настроенные под grid приложения обойдутся ранним последователям слишком дорого, что в будущем замедлит распространение grid.

На сегодняшний день для grid было переписано так мало приложений (в основном относящихся к аналитическому ПО), что директорам информационных служб предстоит сделать нелегкий выбор: оказать давление на своего поставщика П, самим настроить имеющиеся приложения для работы в grid, как это сделал Маккей, или создать приложение для grid с нуля.

Перенастройка приложения для grid требует больших усилий по следующей причине: сущность grid computing состоит в доступности вычислительных ресурсов всех ПК и серверов, находящихся в вашей компании и за ее пределами. Одной из отличительных черт ранних приложений для grid computing является то, что одна задача не зависит от результата другой. (Например, в больших grid-приложениях для сложных математических расчетов вычисления разбиваются на маленькие независимые части, которые в любое время могут быть сложены.) Но многие корпоративные приложения зависимы: одно вычисление или процесс не может продвигаться до тех пор, пока не закончится другое. Как рассказывает Клонч из Gartner Research, разработчикам приходится решать, как разделить работу приложения на части (называющиеся потоками исполнения), чтобы эти приложения смогли работать параллельно. Клонч утверждает что если код не позволяет разделять свои операции на десятки, сотни, тысячи или более потоков, он не сможет масштабировать свою работу, получив многочисленные вычислительные ресурсы, которые предлагает grid. Для разделения приложения требуются усилия и нечто значительно большее, чем просто настройка существующего приложения; возможно, его придется даже полностью переписать.

По всем этим причинам директора информационных служб еще не перенесли традиционные корпоративные приложения — включая ERP и CRM — в grid, так как каждая задача зависит в них от результатов других. Это не очень подходит для grid, хотя теоретически в grid могут работать все приложения. Помещение этих приложений в том виде, в каком они написаны, в grid напоминало бы соединение ракеты «Атлас» с «Фольксвагеном». «Ваша машина расплавится», — поясняет Юнис из Illuminata. Центральные алгоритмы многих из этих транзакционных приложений также пришлось бы изменить. Эксперты сомневаются, что сегодня найдутся экономические стимулы для того, чтобы поставщики стали переделывать свою продукцию под grid computing. «Grid будет распространяться со скоростью изменения ПО, — заявляет главный аналитик Forrester Research Фрэнк Жиллет. — Ледники и то быстрее смещаются».

Притворимся, что согласны

Стандартизация методов настройки приложений для работы в grid могла бы ускорить ледниковую скорость признания grid благодаря сокращению стоимости и сложности процесса разработки. Несмотря на возникновение организаций и союзов по разработке стандартов, таких как Global Grid Forum, консорциум Enterprise Grid Alliance и организация Globus Alliance, различия в определении понятия grid, собственные технологии и укоренившаяся лояльность к поставщикам заставили их, согласно аналитикам grid, расколоться на противоборствующие фракции. «Сейчас мы приближаемся к завершению первой стадии, где все воюют, — говорит Юнис из Illuminata. — Это не самая приятная картина».

Прежде чем grid будет готова для повсеместного использования на предприятиях, остается сделать еще два серьезных шага: во-первых, различные группы должны прийти к соглашению относительно набора стандартов, во-вторых, поставщикам нужно включить эти стандарты в свои продукты.

Феллоус не уверен, что споры прекратятся на срок, достаточно долгий, чтобы сдвинуться с первой стадии. «Когда пользователи видят все большее и большее число организаций по разработке стандартов, они видят все больше и больше сложностей», — считает он.

Но освободить grid может открытый код. Globus Toolkit (теперь в своей четвертой версии) бесплатно доступен для всех. Тем не менее, по словам Юниса, набор инструментальных средств ограничен. Он достаточно хорош для эффективной работы над такими задачами, как аналитические приложения и приложения для автоматизации разработки электронных компонентов, но недостаточно — для работы над другими задачами.

Что касается его использования директорами информационных служб, кто знает? The Globus Alliance, некоммерческая группа, предлагающая этот набор инструментальных средств, мало внимания уделяет маркетингу и нестрого контролирует их использование на корпоративном уровне. Что еще хуже, специалистов по grid очень мало. Поэтому директора информационных служб предпочитают скрывать детали проектов, заставляя новичков в grid двигаться без каких-либо дорожных указателей. Несмотря на свою перспективность и экономические преимущества, grid computing может в итоге превратиться в мираж директоров информационных служб. Они все так же будут слушать, что за идеальное решение grid computing и как через 10-20 лет все будут им пользоваться (о чем уже говорят 10 лет). По словам Клонча из Gartner Research, сейчас «директора информационных служб не представляют, как преодолеть это расстояние».

У тех немногих, кто, как Маккей, сумел это сделать, дела идут очень неплохо. Его ИТ-департаменту потребовалось более двух лет, чтобы достичь нынешних результатов, но оно того стоило. «Мы работаем намного эффективнее и добиваемся больших бизнес-результатов».

Очень жаль, что у большинства директоров информационных служб нет таких результатов.


THOMAS WAILGUM. GRID HELD HOSTAGE. CIO MAGAZINE. AUGUST 1, 2005


Где grid, а где нет

Grid computing подключает память и данные, а также центральные процессоры различных систем к управляемому из центра, но гибкому вычислительному окружению. Поставщики настоящей grid предоставляют управление ресурсами гетерогенных систем, где вы можете при необходимости быстро подключать и отключать системы, независимо от их местоположения, используемой или операционной системы и их обычного назначения.

Utility computing — это один из вариантов рыночных лейблов (к ним относятся самоуправляемые компьютерные системы (autonomous computing), сервис computing-on-demand, технология адаптивного управления предприятием (adaptive enterprise)), используемых в бизнес-моделях, которые позволяют клиентам при необходимости получать дополнительные вычислительные ресурсы. Grid является базовой технологией для всех этих моделей.

Кластеры просто означают наборы компьютеров в фиксированной конфигурации, спроектированные для того, чтобы использовать их и управлять ими как одной высокоэффективной машиной. В отличие от grid компьютеры не могут при необходимости подключиться к бассейну вычислительной мощности или отключиться от него — однажды оказавшись в нем, они остаются там навсегда.


Биография Grid

1960-е годы Дальние родственники

В 1965 году разработчики операционной системы под названием Multics (Multiplexed Information and Computing Service — предка Unix) заговорили о «вычислениях как коммунальной услуге», что, согласно Web-сайту GridCafe? ЦЕРНа (Европейского центра ядерных исследований), напоминает сегодняшнюю grid computing.

1970-е годы Рождение grid

Согласно Grid. org, когда компьютеры были впервые подключены к сетям, зародилась идея использования свободных циклов центральных процессоров. В некоторых ранних экспериментах была задействована пара программ под названием Creeper и Reaper, работавших в сети ARPAnet (предшественнице Internet).

1980-е годы Усовершенствованная grid

Ученые использовали grid computing для соединения различных рабочих станций, что позволяло им решать сложные математические задачи и осуществлять компиляцию программ, используя свободные центральные процессоры для сокращения времени обработки.

1996 год Свободная grid!

Была создана организация Globus Alliance для проведения программ научных исследований и разработок технологий, стандартов и систем, формирующих grid. В конечном счете члены Alliance создали ПО с открытым кодом, на котором основывается международная научная и инженерная деятельность стоимостью около полумиллиарда долларов.

1997 год Первая в Сети

Согласно Grid. org, первой появившейся в Internet сетью общего назначения, основанной на технологии grid-computing, стала Distributed. net. Она объединила сотни людей, которые решают криптографические задачи в распределенной среде.

1999 год SETI, Phone Home

Проект SETI@home был запущен в Университете Калифорнии. Он использует подключенные к Internet компьютеры для поиска внеземных цивилизаций. Любой, у кого есть доступ к Internet и свободный центральный процессор, может стать участником этого проекта, запустив бесплатную программу, которая анализирует данные радиотелескопа. На сегодняшний день зарегистрировано более 5 млн. человек.

2001 год Еще дальше!

Проект TeraGrid, запущенный в августе национальным научным фондом США, ставит своей целью построение и развертывание крупнейшей в мире распределенной инфраструктуры для открытых научных исследований посредством соединения главных суперкомпьютерных площадок, таких как Национальный центр по использованию суперкомпьютеров в Университете Иллинойса и Центр продвинутых компьютерных исследований в Калифорнийском технологическом институте.

ИСТОЧНИКИ: GridCafe? ЦЕРН; Grid. org; Globus Alliance; SETI@home; TeraGrid Project