Время для utility computing

Джон Мэнли — ветеран исследовательской лаборатории HP в Бристоле; он начинал здесь в 1985 году с работы в области систем управления базами знаний. В последующем, эта деятельность естественным образом эволюционировала в область исследований, связанную с гетерогенными источниками информации, затем Джон перешел в группу исследований в телекоммуникационной сфере, а эта активность, в свою очередь, трансформировалась в работы, связанные с HP OpenView и с телекоммуникационными платформами. В последние два года, набрав багаж разностороннего опыта, Мэнли полностью посвятил себя исследованиям в области инфраструктур для utility computing.

По своему первому образованию Джон Мэнли химик, выпускник Бристольского университета; его докторская диссертация была посвящена молекулярной квантовой механике, а затем он продолжил свою научную работу в университетах Милана и Торонто. Некоторое время, предшествовавшее приходу в HP Labs, занимался вопросами распознавания речи в университете Сассекса.

Джон, прежде всего, скажите несколько слов о HP Labs, где вы работаете.

Лаборатория в Бристоле была открыта в 1983 году. Она расположена в западной Англии, в двух часах езды от Лондона, в центре активно развивающегося академического, культурного и промышленного сообщества, которое образуют известные компании, например, British Aerospace, Rolls-Royce, Orange, ST Microelectronics, финансовые институты, образовательные и научные учреждения. Лаборатория HP в Бристоле — одна из шести подобных лабораторий: две находятся в США, в Токио, в исследовательском центре университета Хайфы (Израиль) и в индийском Бангалоре. Наиболее мощным техническим оснащением обладают лаборатории в Бристоле и в Пало-Альто, где развернуты полномасштабные центры обработки данных (utility data center, UDC). Сейчас в составе бристольского центра насчитывается более 400 серверов (в будущем их количество может возрасти до 2 тыс.), а размер дискового пространства превышает 60 Тбайт. Все это многообразие собрано в единый виртуализованный пул, ресурсы которого можно переориентировать на решение самых разнообразных задач.

Исследования, которые проводятся в HP Labs, относятся к таким областям, как utility computing, компьютерная безопасность, Semantic Web, квантовая криптография, цифровая обработка изображений, проблемы цифровых носителей информации, мобильные технологии и технологии отображения. Создание в лаборатории мощного центра обработки данных и нынешняя волна интереса естественным образом обусловили определенный сдвиг в направлениях исследований. Сейчас в центре внимания находится все, что связано с попытками выработать собственный взгляд на идеи utility computing. Непосредственно работами, связанными с данным направлением, занято более ста человек.

Стоит особо подчеркнуть, что мы являемся исследовательским учреждением; нам предоставлена возможность самим, самостоятельно, ставить перед собой те задачи, которые мы считаем актуальными; мы не работаем по указке свыше, но, естественно, мы не можем оказаться и в положении академических затворников. Наши цели разумным образом сочетают научную новизну и практическую полезность, в том числе, и для компании в целом.

Джон, не согласитесь вы с тем, что бесчисленные разговоры о разного рода подходах к организации компьютерных систем вызывают эффект «дежа вю». Основные идеи utility computing до боли напоминают мэйнфреймы, разумеется, на другом техническом уровне?

Однозначно да. Все идет от мэйнфремов. Это были очень большие машины, на которых работы выполнялись параллельно, для чего требовалось умение резервировать ресурсы в соответствии с заданными приоритетами и освобождать их после выполнения работ. Мэйнфреймы научили нас тому, как в одной среде можно изолировать приложения — кстати, это умение становится критически важным сегодня.

Совсем недавно мне пришлось участвовать в обсуждении близкой темы с Кеном Джекобсом, выдающимся исследователем из корпорации Oracle, вице-президентом по стратегии серверных продуктов. Дискуссия была посвящена проблематике grid. Кен тоже признает, что распространение идей grid приводит к восстановлению ценностей, привнесенных в компьютерную культуру вместе с мэйнфреймами в 60-е и 70-е годы. Мэйнфреймы были первыми, за ним последовали миниЭВМ, предназначенные для работы в отделах, далее — ПК для работы на столе, клиент-серверные архитектуры связали их, наконец, пришла пора Internet, и сформировалась универсальная среда передачи данных. (Кен Джекобс — одна из наиболее ярких фигур в Oracle. Он работает в корпорации 23 года, со дня ее основания. Его табельный номер — 18; номер 1 принадлежит Ларри Эллисону, промежуточных — от 2 до 17 — нет, те, кому они принадлежали, более в Oracle не работают. Уникальность положения Джекобса дает ему право на выражение мнений, не всегда совпадающих со взглядами его босса, который, возможно, сделал более других, чтобы похоронить мэйнфреймы. — Л.Ч.)

В какой-то момент, когда некоторая среда достигает пороговой сложности, когда становится органичной и в какой-то степени подобной биологической, начинают проявляться ее собственные болезни, например, вирусы, распространяемые через сеть. Их по определению не могло не быть. И еще, среда становится настолько сложной, что не может быть описана с полной достоверностью.

Поэтому стоит напомнить еще об одном проявлении эффекта «дежа вю», относящемся к более близким временам. Мы были свидетелями множества обещаний и прогнозов относительно революционизирующего воздействия новых технологий, и лишь некоторые из них оправдались. Однако это не означает, что прогнозы были ошибочными — просто не для всего наступило время. Так, за последние два десятилетия сделано очень много по части создания распределенных систем, но далеко не все востребовано, не весь опыт использован. Нам следует обратиться назад и еще раз проанализировать сделанное. Понятно, что и grid, и utility computing когда-нибудь станут подобны телефонным сетям, где вы снимаете трубку и слышите гудок, вам доступны все заявленные услуги, и вы платите в соответствии с использованными ресурсами. При этом первоочередной проблемой оказывается надежность: бесчисленные ИТ-проекты провалились, потому что не имели достаточно надежных обеспечивающих технологий. Если этот образец «дежа вю» нас чему-то и учит, то, прежде всего, тому, что ни одна компьютерная технология не является универсальной панацеей: она оказывается полезной и дает преимущества лишь там, где действительно применима; в более широком контексте успех сомнителен или вообще невозможен. Данное опасение, прежде всего, относится к излишнему увлечению grid, спекулировать на будущих возможностях подобных инфраструктур слишком опасно. Так, в Oracle утверждают, что эффект от сочетания моделей grid и utility computing может быть получен в ближайшее время, однако, на мой взгляд, для этого потребуется более десяти лет, а пока еще ресурсы UDC далеко не исчерпаны.

Какими, на Ваш взгляд, должны быть эволюционные шаги по направлению к utility computing?

Сегодня информационные системы представляют собой плохо упорядоченный набор самых разнообразных ресурсов. Взамен их в идеале, в отдаленном будущем, должна быть создана инфраструктура потребления компьютерных услуг, которая обеспечит доступ к виртуализованному пулу ресурсов. Для этого следует пройти несколько последовательных инфраструктурных шагов. В нашей компании первым был этап, на котором были созданы виртуализуемые системы, например, сервер HP Superdome; сейчас мы находимся на втором этапе, когда создаются виртуализированные центры обработки данных; третий этап — это будущее, в котором появятся некие глобальные виртуальные структуры.

Здесь важно сделать одно уточняющее замечание. Чаще всего, говоря о utility computing, этот вид вычислительных услуг сравнивают с системами подачи воды, электричества и т.д. Все перечисленные системы снабжения относятся к категории непрерывных услуг. Но на самом деле, услуги, с которыми мы имеем дело в обыденной жизни, по большей части имеют совсем иной, разовый характер. Гораздо чаще вы обращаетесь куда-то, где по вашему требованию, в соответствии с вашим запросом, выполняется определенный набор действий, а вы получаете результат. Мы называем такие услуги словом batch (объем продукции, выдаваемый в один раз), что, кстати, тоже напоминает мэйнфреймы с их работой в пакетном режиме.

Действительно, на данном этапе мы ограничили себя только пакетными приложениями, их противоположностью являются «долгоживущие» приложения, строящиеся на транзакционных принципах. Пока, по нашему мнению, время такого рода приложений не наступило. Благодаря созданной адекватной системе поддержки (в нашем случае это UDC), для выполнения пакетного приложения из общего пула ресурсов выбираются те ресурсы, которые необходимы для решения этой задачи, и конфигурируются в соответствии с требованиями данного приложения. Приложение выполняется, и по получении результата использованные ресурсы возвращаются в пул и могут быть в дальнейшем переданы другим приложениям. Так можно решить произвольную проблему, требующую разового использования значительных вычислительных ресурсов. Если подобная задача решается традиционным путем, то ресурс этот либо должен находиться в постоянном распоряжении пользователя, что дорого, либо быть специально сконфигурирован из доступных средств, но это требует времени и тоже стоит немалых денег. В какой-то степени мы снова возвращаемся к мэйнфреймам, к системам разделения времени; в конечном счете, все сводится к оптимальному использованию ресурсов в распределенном режиме.

Вспомните историю создания одного из самых известных компьютерных анимационных фильмов, Toy Story. Тогда для рендеринга были собраны десятки и сотни серверов и рабочих станций, но потом всю конфигурацию пришлось разобрать.

То, что вы описали, очень напоминает ASP (application service providing), то есть аутсорсинг приложений, не так ли?

И да, и нет. Это, вообще говоря, новый вид бизнеса. То, что принято обозначать аббревиатурой ASP, я бы назвал старым миром, где доминирует обычная схема, которая предполагает статическое распределение ресурсов. Пакетное предоставление вычислительных услуг — это не просто размещение чужих приложений на своей площади, а более широкий класс обслуживания, причем функционирующий в условиях динамического распределения ресурсного пула. Мы можем на определенное время сконцентрировать такие мощности, которые не может предоставить ни один ASP-провайдер, а потом отдать те же ресурсы под другое приложение. В будущем в качестве поставщика такого рода услуг могут выступать специализированные компании или те большие предприятия, имеющие излишки мощности, рассчитанные на пиковые нагрузки, которые они бы хотели утилизировать в периоды недогрузки.

В качестве примера можно привести известную задачу моделирования механических конструкций методом конечных элементов. Она требует такой мощности, которая доступна только самым крупным проектным организациям. Если же она станет доступной всем, то это может серьезно повлиять на проектирование в строительстве и машиностроении. Одно из достоинств предлагаемого нами подхода — своего рода демократизация. Так, технологии проектирования, до сих пор использовавшиеся в аэрокосмической промышленности или в авиации, теперь смогут быть использованы для проектирования бытовых приборов. То же самое относится к медицине, биологии, да, собственно, к чему угодно.

Умозрительно ясно, что решение этой задачи намного проще, чем реализация аналогичных идей в отношении долгоживущих приложений. Чего же вам удалось сделать сегодня?

Сейчас мы готовы к тому, чтобы на основе имеющегося в нашем распоряжении центра HP Utility Data Center в экспериментальном порядке выступить в роли поставщика услуг. Таким образом мы могли бы проверить суть наших предложений в области пакетных приложений. На роль самого первого потребителя наших услуг мы выбрали небольшую компанию Animator 422, производящую анимационные фильмы, и предложили им бесплатно выполнить рендеринг, то есть покадровую развертку изображения. Хорошо известно, что это одна из самых ресурсоемких задач, средствами для ее решения обладают только большие студии. Вначале хозяева этой маленькой студии на нас смотрели странно — пришли какие-то люди и предлагают бесплатно сделать то, что стоит колоссальных денег. Мы поставили перед ним всего два ограничения: во-первых, делать рендеринг только с помощью предоставляемых нами услуг, во-вторых, делать так много рендеринга, как только возможно. Пятиминутный фильм был сделан, и эта работа привлекла к себе внимание более чем 30 мультипликационных студий, вполне естественно, их цикл работы не может обеспечить полноценную занятость оборудования.

На следующем этапе мы намереваемся обеспечить возможность для выполнения рендеринга сразу нескольким студиям одновременно. Эта задача для нас интересна тем, что она связана с разделением ресурсов. Следовательно, возникают вопросы информационной безопасности, сохранения авторского права и многие другие проблемы. А далее мы хотим распространить эту технологию между еще большим числом художников-мультипликаторов и в 2006 году провести международный фестиваль анимационных фильмов.

Выбор такого красивого приложения — отличный маркетинговый прием, что вы планируете предпринять в других отраслях?

Прежде всего, мы не планируем стать профессиональными поставщиками услуг — это уже дело коммерческих компаний, — мы и впредь останемся исследовательской лабораторией. Сейчас наибольший интерес к нашему подходу проявляет отделение BBC Natural History. Оно разворачивает колоссальный коммерческий проект ARKive (www.arkive.org), в рамках которого будет создано крупнейшее хранилище изображений всех возможных форм жизни на Земле. Пока им приходится развертывать свои собственные компьютерные ресурсы, что им не по силам; с нашей же помощью они смогут справиться без лишних хлопот со всем комплексом работ. Кроме того, мы связываем часть наших планов с международным физическим центром CERN в Женеве.

Сможет ли предоставление вычислительных услуг по запросу стать новым видом бизнеса?

Видимо, да. По всей вероятности, сложится открытый рынок, на котором вычислительные ресурсы будут предоставлять по запросу, и мы надеемся, что наш опыт этому поспособствует. Мы поможем бизнесу собирать ресурсы и предоставлять их пользователям по запросам. Такой подход основывается на более традиционных технологиях, чем grid. И все же это один из самых радикальных шагов к grid, потому что создаются приложения, которые не должны переписываться при изменении платформы. Со временем инфраструктуру UDC можно будет построить на принципах grid, и потребитель даже не заметит этого перехода. Но все же собственно инфраструктура grid в большей степени приспособлена для долгоживущих приложений, и эта модель, повторюсь, сможет заработать не ранее, чем через 10 лет. Мы же хотим получить положительный эффект от идеологии utility computing, не дожидаясь этого срока. Поэтому, как говорят у нас в Англии, предпочитаем начать с ходьбы, а затем перейти на бег.