уровне, поддерживая этот уровень за счет ими же заработанных денег

Некоторые отрасли науки требуют карандаша и листа бумаги - такие протянут, может, еще долго. Есть науки более "прожорливые": им нужны гигантские ускорители, начиненные сверхпроводниками, или телескопы на горных вершинах. Таким намного сложней. Но основная масса научных центров нуждается в измерительной аппаратуре и в компьютерах, которые, конечно, стоят денег, но деньги эти показались бы смешными ИТ-менеджерам банков или нефтяных компаний. Иногда для этого хватает грантов, иногда удается подработать по контрактам, случается даже, и государство неожиданно отдаст какой-то долг. Или удается купить пару ПК на доходы от арендованного каким-нибудь банком помещения.

Важнейшее научное сословие

Такие исследовательские организации - своего рода средний класс в науке - не по качеству исследований, конечно, а по бюджету. В обществе крепкий средний класс считается носителем стабильности, благополучия государства. Быть может, и в науке так? уровне, поддерживая этот уровень за счет ими же заработанных денег? А уровень во многом определяется как раз вычислительными средствами. Как пример такого представителя среднего класса науки мы взяли Институт биомедицинской химии (ИБМХ) РАМН.

Пейзаж после битвы

В последние годы компьютерный парк типичного научного института все больше напоминает экипировку офиса: ПК вытесняют остальные машины; собственно вычислительные центры просто отмирают - каждый сам себе вычисляет что ему нужно. ВЦ не исчезнут, конечно, они развиваются, о чем свидетельствует поддерживаемый Computerworld Россия список десяти мощнейших вычислительных центров страны (http://www2.osp.ru/ruc/hitech/top.html), но тенденция очевидна. Впрочем, строго говоря, переход на ПК - это не всегда переход на Wintel - в научной среде популярны Linux и другие бесплатные операционные системы, используются иногда и ОС реального времени. Кроме того, традиции еще не выветрились: если спросить научного сотрудника, что такое Sun, VAX или Alpha, он не удивится вопросу и может даже поддержать разговор на эту тему.

Найти сколько-нибудь полные данные о доле производителей компьютеров в научной сфере нам не удалось - нет централизованного учета и многие сделки не афишируются. Если просто расспрашивать деятелей науки, причастных к вычислительной технике, картина везде складывается одна и та же. Не будем останавливаться на специфических машинах, например Parsytec (не редкость в научных ВЦ), Convex (то есть уже HP) или Cray (то есть Silicon Graphics, которая уже SGI) в Гидрометцентре. Машины среднего уровня ("выше" ПК) представлены наиболее широко тремя производителями: Digital (теперь Compaq), Sun и Hewlett-Packard. "Ну и, пожалуй, SGI", - можно услышать достаточно часто.

DEC научные люди знают и любят: вспоминая поколения PDP-11 и VAX, верные пристрастиям юности, тратят гранты на рабочие станции Alpha. Процессоры Alpha по производительности операций с плавающей запятой опережают конкурирующие процессоры, поэтому для задач с большим объемом счета с Alpha трудно спорить. Это особенно относится к вычислениям, которые трудно распараллелить: в параллельных вычислениях неторопливость процессоров можно компенсировать их количеством. Для платформы VAX у нас написано немало научных приложений. Многие из них перенесены на Alpha, некоторые запускают как есть через эмуляторы или двоичные компиляторы, благо DEC, "наплодившая" целое соцветье платформ, всегда уделяла внимание переносимости.

У компьютеров Sun нет ярко выраженной ниши в науке, их можно встретить в лабораториях разной направленности, и выполнять они могут разные задачи. Sun, университетские корни которой можно отыскать даже в самом названии, всегда много энергии и денег тратила на научные и образовательные центры. Опять же ее компьютеры часто рекомендуют фонды, раздающие гранты. У Hewlett-Packard также есть веские причины "дружить" с наукой - компания производит много контрольно-измерительной техники (сейчас этим занимается HP Test & Measurement), которая часто увязана в единые комплексы с компьютерами.

Мы не назвали IBM, хотя для больших объемов вычислений во всем мире используют машины класса SP2 (соперника Гарри Каспарова), и наша страна не исключение. И все же у нас в научных лабораториях серверы или рабочие станции IBM встречаются, по нашим наблюдениям, несколько реже.

Однако в области конструирования лекарств, или - шире - молекулярного моделирования, картина несколько иная. Чтобы понять, с чем это связано, стоит бросить взгляд на "предметную область", посмотреть, как разрабатываются современные препараты.

Компьютерное конструирование лекарств

Современное лекарство - это, грубо говоря, биологически активная молекула, которая должна найти свою мишень в организме (как правило, мишенью является белок или нуклеиновая кислота) и, взаимодействуя с ней, оказывать лечебный фармакотерапевтический эффект. Соответственно можно попытаться сконструировать новые и даже принципиально новые лекарства путем компьютерного моделирования взаимодействия низкомолекулярного вещества с макромолекулой-мишенью.

Существуют методы прямого или непрямого конструирования лекарств. Прямой метод возможен, если известна пространственная структура мишени, например, молекулы белка. Таким образом сконструированы, например, ингибиторы протеазы вируса СПИД, препараты для лечения осложнений при диабете и др. Однако большинство белков находятся в клеточных мембранах, их не удается выделить в чистом виде. Существует гигантский разрыв между информацией по количеству расшифрованных первичных структур белков (аминокислотных последовательностей) и информацией об их пространственной структуре. Это разрыв в два порядка, и он не сокращается. В этом случае применяются непрямые методы. Можно собрать информацию о ряде известных низкомолекулярных соединений, которые применяются как лекарства и имеют некие свойства, похожие на искомые. Можно попытаться выяснить, что же у них общего. Это позволяет найти некие образы, которые присущи всей группе данных веществ. Тогда мишень можно заменить этим образом, что с компьютерной точки зрения означает поиск в базах данных молекул, анализ взаимосвязи их структуры и активности или структуры и функции. Специальная компьютерная программа может оценивать свойства будущих соединений до их синтеза.

За всем этим стоят деньги, и немалые. По оценкам ведущих фармацевтических мировых фирм, на разработку с нуля нового лекарства до момента, когда лекарство появится на полках аптеки, может пройти от 10 до 15 лет. А суммарные затраты могут составить от 250 до 500 млн. долларов. Поэтому все ведущие фармацевтические фирмы занимаются компьютерным моделированием лекарств, не жалея на это средств. Синтезировать новое химическое соединение намного дороже, чем смоделировать его, и времени потребуется несравнимо больше, а время - это деньги: компьютеры конкурентов не простаивают. Кроме того, огромную экономию дает снижение риска синтеза неудачного соединения.

Типичная система для лаборатории моделирования лекарств, как правило, состоит из нескольких рабочих станций SGI и одного-двух многопроцессорных серверов, на которых идут основные расчеты. В исследовательских центрах крупнейших фармацевтических компаний, таких как, например, Bayer (Германия) или Procter&Gamble (США), можно увидеть по нескольку серверов с 10-20 процессорами каждый и сотни рабочих станций. Платформа SGI доминирует в этой отрасли. Исторически это связано с тем, что визуализация сложных молекул в этой отрасли не роскошь, а необходимость. Для того чтобы рассматривать, "поворачивать" трехмерные модели молекул из тысяч атомов, нужны рабочие станции с высокопроизводительными графическими подсистемами, а в былые времена с Silicon Graphics по этой части мало кто мог состязаться. Теперь конкуренция в этом секторе более острая, но вовремя появились на рынке многопроцессорные серверы от SGI, и стало выгодно покупать готовые решения на их базе. В целом, моделирование молекул - одно из наиболее "прожорливых" (в смысле вычислительных ресурсов) применений компьютеров. Поэтому такими вещами на Западе занимаются не только, или не столько научные центры среднего класса, но, скорее, "монстры". Однако ИБМХ, неплохо оснащенный по нашим меркам, получает результаты, которые высоко ценит и (отчасти) оплачивает мировое сообщество.

Пакеты, которые используются для молекулярного моделирования, разрабатываются несколькими фирмами, специализирующимися в этой области. Такие дорогие пакеты, как Sybyl (самый, пожалуй, известный), обычно не покупаются. Если покупать пакет с правами бессрочного использования, это будет стоить многие сотни тысяч долларов. Некоторые фирмы покупают лицензию для всех своих подразделений, для всех баз данных и без ограничений количества процессоров. Цена такой лицензии назначается в процессе переговоров и, как правило, составляет свыше миллиона долларов. Цена индивидуальной лицензии зависит от количества программных модулей и типа организации. Типичная академическая лицензия стоит порядка 20-30 тыс. долл. в год на один процессор. Возможны скидки для образовательных организаций, к которым относится и ИБМХ РАМН. Уже три года здесь существует спецкурс "Биоинформатика и компьютерное конструирование лекарств" для студентов медико-биологического факультета РГМУ.

Построение системы

У ИБМХ имелись средства, полученные из различных источников: из Министерства науки и технической политики, Московского комитета по науке и технологиям, заработанные по контрактам с западными фармацевтическими фирмами и т. д. Нужно было думать об оснащении лабораторий современной вычислительной техникой. Сначала надо было выбрать платформу. Более 90% программ молекулярного моделирования написано для платформы SGI Irix - более 800 приложений. Конечно, есть приложения и для Sun/Solaris, последнее время появляется ПО под NT. Идея обойтись вообще без относительно дорогих RISC-машин многим кажется соблазнительной, однако данные, полученные на конкретных приложениях для этой отрасли, сравнивающие возможности различных архитектур, свидетельствуют о преждевременности этой затеи. Компьютеры с процессорами Intel с традиционной архитектурой ввода/вывода на основе PCI не годятся для моделирования сложных молекул с числом атомов более 2000-3000 - не столько из-за недостаточной производительности процессора, сколько из-за архитектурных особенностей и известной ограниченности графических библиотек.

Выбрали распространенный, хорошо опробованный в мировой практике вариант: пакет Sybyl компании Tripos и ISIS компании MDL Information Systems на платформе SGI. Но хотелось не просто купить компьютеры для выполнения конкретных работ, а получить систему, которую удобно будет наращивать, которая обеспечит достаточно большое число рабочих мест при разумной стоимости. Самостоятельно разработать такое решение трудно, да и не нужно.

В качестве разработчика решения и поставщика оборудования была выбрана московская компания Catalyst Silicon Solutions, работающая с техникой SGI с 1990 года и потому имевшая большой опыт. Последнее время Catalyst заключила соглашение с Siemens и предлагает теперь ПК и ПК-серверы под Windows NT. Такое сочетание позволяет строить достаточно гибкие решения: все-таки в наших условиях оснастить каждое рабочее место станцией SGI - роскошь. Система работает в архитектуре клиент-сервер.

В качестве сервера используют двухпроцессорный Origin 200. На нем работает основное серверное ПО - Sybyl, ISIS/Host, он же выступает как сервер молекулярных баз данных MDL. На нем же установлена собственная разработка - пакет DockSearch. Рабочая станция O2 используется как рабочее место Sybyl, на ней установлены пакеты Amber и DOCK, кроме того, станцию используют для расчетных задач, компиляции программ на Фортране и Си. Все это - самая дорогостоящая часть, но необходимая часть" информационной системы: она справляется с теми задачами, которые не под силу персональным компьютерам.

Остальная часть сети - Intel-машины. Три ПК Siemens Scenic плюс более двух десятков различных ПК находятся в двух лабораториях: в лаборатории молекулярно-графического конструирования лекарств и в лаборатории структурно-функционального конструирования лекарств. Они работают в локальной сети как полноценные рабочие места Sybyl - на каждой клиентской машине установлен программный эмулятор X-терминала. Сервер может обеспечить эффективную работу 10-15 таких рабочих мест. В ИБМХ эмуляцию X-терминала используют даже удаленно, по модему. Точно так же эти машины являются клиентами MDL. Кроме того, в институте есть учебный класс, с высокоскоростным подключением к Internet, оснащенный по программе соросовского "Института Открытого Общества". Установленные в этом классе ПК тоже являются клиентскими местами Sybyl и MDL.

Origin 200 работает только как сервер приложений. Помимо него в ИБМХ имеется два Web-сервера: на платформе Sun, также приобретенном при поддержке ИОО, и на ПК под Windows NT, а кроме того, файловый сервер на Siemens Scenic. Более мощная машина под Web-сервер просто пока не нужна, существующая вполне справляется, а перекладывать на сервер приложений функции файлового сервера и Web-сервера - значит нерационально использовать технику.

По соглашению с Tripos ИБМХ имеет право предоставлять дочерние пакеты Sybyl с контролем по сети на расстояние до 150 миль. Исследовательские центры, сотрудничающие с ИБМХ в рамках федеральной программы, например химфак МГУ, на свои зарубежные гранты закупили компьютер SGI, но на программные средства денег им уже не хватило. При запуске основного модуля и при загрузке любого дополнительного модуля через Internet поступает запрос на сервер ИБМХ, основной пакет проверяет лицензии и дает подтверждение на запуск.

Продукты Tripos и MDL наиболее широко используются для моделирования молекул (отнюдь не только для создания лекарств - применения могут быть самые разные: для химической промышленности, кристаллографии и т. д.).

"Особый путь" России

В СССР и в России не было и нет собственно фармацевтических фирм, подобных существующим в развитых странах. Существовало разделение труда: НИИ различного ведомственного подчинения и фармацевтические заводы. Теперь большинство фармацевтических заводов приватизировано и попало в частные руки. Их владельцы, как правило, не заинтересованы в финансировании долгосрочных научных разработок. Экономически выгоднее копировать западные препараты, нежели делать свои: денег надо вкладывать намного меньше, отдача - быстрее, риск получения отрицательных результатов практически отсутствует.

Чтобы компенсировать недостаток средств, которые в России вкладываются в фармацевтику, отечественным исследовательским лабораториям приходится искать контракты и гранты на Западе. Это не часто, но удается. Как всегда, российские специалисты достаточно умные, но бедные. Специфика фармацевтической промышленности - высочайшая конфиденциальность разработок. За границей не очень верят, что в России эта конфиденциальность будет обеспечена. Фирмы предпочитают переманивать ученых, а не давать заказы на разработки на сторону. Из-за общей экономической нестабильности крупные фирмы не решаются создавать исследовательские центры в России. Некоторым заработком для исследовательских центров могла бы стать продажа собственных программных пакетов. В мире ситуация, когда университетские компьютерные программы покупаются фирмами, не редкость. Здесь, однако, требуются разумная экономическая политика и льготное налогообложение, поощряющие инновационный процесс в университетах и научно-исследовательских институтах. У нас, похоже, об этом мало задумываются.



Владимир Поройков, заведующий лабораторией структурно- функционального конструирования лекарств ИБМХ
В ИБМХ в лаборатории молекулярно-графического конструирования лекарств разработана программа DockSearch для поиска в базах данных возможных прототипов новых лекарств по пространственной структуре белка-мишени. Она написана на ANSI C и поэтому работает на любой платформе: SGI/Irix, ПК и других. В лаборатории структурно-функционального конструирования лекарств написана программа PASS для проверки свойств сконструированных молекул. Она работает под NT, к ней имеется Web-интерфейс (http://www.ibmh.msk.su/PASS). Желающие могут через Internet послать свой файл со структурой молекулы, и сервер выдаст HTML-документ с результатами прогноза. Свыше 100 ученых из 15 стран мира уже воспользовались этой возможностью, получив прогноз биологической активности для более 1000 веществ.

Свое программное обеспечение разработано в МГУ на кафедре органической химии, возглавляемой академиком Зефировым (программа искусственных нейронных сетей NASA, генератор структурных формул GOLD и др.), в лаборатории профессора Туманяна в Институте молекулярной биологии РАН (программа молекулярной механики на ПК и др.), в лаборатории профессора Раевского из Института физиологически активных веществ РАН в Черноголовке (программа анализа водородных связей Hybot, оценки разнообразия химических структур Moldivs и др.), у профессора Финна из ВИНИТИ (программа анализа взаимосвязей "структура-свойство") и у других.

P. S.

На состоявшемся в Москве 18-23 апреля VI Российском национальном конгрессе "Человек и лекарство", проводимом ежегодно и собирающем более 20 тыс. медицинских работников, разработки российских специалистов были продемонстрированы и вызвали большой интерес участников. В заседаниях секции "Компьютерное конструирование лекарств" приняло участие свыше 150 человек из Москвы, Санкт-Петербурга, Иваново, Твери, Пятигорска и других городов России. Участие в этих заседаниях студентов и аспирантов из РГМУ, ММА им. Сеченова, МГУ и других вузов вселяет надежду, что у молекулярного моделирования в России есть будущее. Правда, за него еще предстоит побороться.

Поделитесь материалом с коллегами и друзьями