Энди Мотт SAS
Энди Мотт: «Главная технологическая новинка SAS 9.4 — возможность работать в облачной среде». Источник: SAS

На московском SAS Forum Russia 2013, прошедшем в середине сентября, эксперт британского отделения SAS Энди Мотт, отвечая на прямой вопрос, является ли очередная версия основного продукта компании действительным шагом вперед, продемонстрировал убедительные доказательства новизны SAS 9.4. Не со всеми его аргументами можно согласиться, в частности — с заявлениями о полной готовности к распараллеливанию аналитики по кластерам и гридам. В этой области вообще, не только у SAS, решенных задач гораздо меньше, чем нерешенных. Однако список новаций достаточно весом.

Система статистического анализа SAS (Statistical Analysis System), давшая название компании, была создана в Университете Северной Каролины в начале 60-х, первая коммерческая версия, SAS 71, появилась почти десять лет спустя, c тех пор вышло девять основных редакций. За это время продукт SAS из скромного по своим возможностям математического пакета превратился в многофункциональную систему бизнес-аналитики, где есть серьезный математический фундамент, передовые компьютерные технологии, а «вовне» они представлены бизнес-ориентированной надстройкой.

Для бизнес-пользователей новизна SAS 9.4 формулируется в близких им категориях: управление деятельностью предприятия (Enterprise Performance Management), процессно-ориентированное управление, составление консолидированной отчетности, финансовое планирование, анализ клиентурной базы, управление маркетинговыми ресурсами, борьба с мошенничеством, кредитный скоринг, прогнозирование спроса и т. д.

Что же касается компьютерных технологий, то на момент объявления SAS 9.4 новый функционал реализован лишь частично, на внедрение всего задуманного, как сказал Мотт, уйдет еще 18 месяцев. Прежде всего стоит отметить, что внедрены новые версии основных процедур: логистическая регрессия, нейронные сети, прогнозирование. Они отличаются теперь тем, что могут работать на современных многопотоковых процессорах, а также в памяти нескольких компьютеров, объединенных в сеть, к ним могут быть подключены специализированные аналитические компьютерные комплексы, например Teradata или Oracle Exadata, утверждается, что можно использовать внутреннюю сеть этих компьютеров, причем один и тот же код может быть использован как на единичной машине, так и в распределенной системе. В деталях схема распараллеливания не раскрывается, было лишь сказано, что воплощена схема, логически близкая к MapReduce, но реализуемая в памяти, поскольку дисковое решение типа Hadoop, работающее в пакетном режиме, оказывается слишком медленным для бизнес-приложений.

Принципиально новым можно назвать облачное решение SAS Cloud, поддерживающее в режиме самообслуживания доступ к аналитическим сервисам, предоставляемым частным облаком. Публичное облако Public Cloud Infrastructure поддерживает SAS в облаке Amazon.

Инструментарий SAS Cloud Services включает виртуальную специализированную машину SAS Virtual Applications, состоящую из одной или нескольких визуальных машин, поддерживающих среду исполнения; портала SAS App Central, предназначенного для администраторов; средства для сборки и внедрения приложений SAS App Engine; облачной платформы SAS App Works.

Облачные решения стали возможными благодаря появившемуся пару лет назад SAS Grid Manager, который управляет пулом ресурсов гридов и кластеров. SAS Grid Manager возник не на пустом месте, в его основе известные разработки канадской компании Platform Computing, специализирующейся на программном обеспечении для управления распределенными системами, в 2012 году она перешла в собственность IBM.

По полученной информации можно сделать вывод о том, что в SAS 9.4 есть некий «ускоритель Hadoop», но полноценной системы типа «грид в памяти» нет. Из более чем 11 тыс. аналитических процедур, имеющихся в арсенале SAS, далеко не все сейчас поддаются переводу в режим параллельного исполнения, постепенно число переводимых возрастет.