Компания MathSoft разработала программу S-Plus 4.0, которая призвана стать квинтэссенцией всех существующих средств добычи данных, иначе говоря, средств выделения горизонтальных и вертикальных срезов данных, выявления скрытых схем и прогнозирования.

S-Plus не заменит обычные статистические программы и программы аналитической графики. Но она представляет собой универсальное средство визуализации данных и аналитический инструмент, позволяющий с блеском проводить статистические операции и создавать диаграммы.

Многие пользователи предпочтут для выполнения обычных статистических операций другие программные пакеты, например DataDesk компании Data Description, Statistica, поставляемый Statsoft, и Systat или SPSS компании SPSS.

Однако для тех, кому приходится проводить специализированный анализ данных и решать сверхтрудные технические вопросы, S-Plus просто незаменима.

Я провел испытание последней бета-версии программы 4.0. При этом мне пришлось столкнуться с некоторыми проблемами, характерными для бета-версии, которые, впрочем, в окончательной версии должны быть решены.

Своим происхождением S-Plus обязана Unix, а также лаконичному и сложному объектно-ориентированному языку S, который был создан компанией Lucent Technologies для матричной алгебры, графического отображения данных и моделирования. По существу, S-Plus - это S в пестрой Windows-оболочке, что очень важно, так как, приобретая ее, вы не просто покупаете программный продукт, а становитесь частью сообщества технически подготовленных пользователей, которое в настоящее время активно расширяет сферу применения языка S на математические и статистические подпрограммы.

За отдельную плату компания MathSoft предлагает дополнения, предназначенные специально для экспериментального планирования, финансового анализа временных рядов, анализа географических данных и импульсных сигналов.

Программа S-Plus готова к использованию немедленно после установки. MathSoft сделала все для того, чтобы она была совместима с Microsoft Office и другими Windows-приложениями.

Программа может извлекать данные прямо из Access или Excel и, используя Ole, помещать результаты непосредственно в Word или PowerPoint.

Во время всех операций S-Plus оболочка Windows эффективно защищала меня от базовых команд S. В продукте предусмотрены отрывные меню, плавающие в рабочей области. К тому же при работе с ним можно с успехом применять правую кнопку мыши.

Для начала я импортировал данные в редактор электронных таблиц S-Plus, который работает с прямоугольными информационными файлами ASCII. S-Plus может импортировать файлы непосредственно из большинства программ баз данных и электронных таблиц, а также из различных статистических программ.

Кроме того, для получения информации из ODBC-совместимых баз данных можно использовать SQL-запросы. Редактор включает в себя обычные операции по обработке данных, их преобразованию и трансформации.

По сравнению с возможностями аналогичных графических пакетов Windows, графика S-Plus находится на хорошем, даже на очень хорошем уровне. Программа создает гистограммы, в том числе гистограммы погрешностей, элементы (pies), полярные диаграммы, контурные диаграммы, дисперсные графики, матрицы дисперсных графиков и т. д.

"Вспомогательные" диаграммы S-Plus позволяют изображать разнообразные представления одних и тех же совокупностей данных в виде таблиц и графиков, исходя из диапазона значений переменных. Так, вы можете исследовать связь между здоровьем и доходами человека, а

также изменчивость этих показателей в зависимости от уровня его образования. Мне удалось создать трехмерные графики, объединить их, а затем "привести в порядок" все точки и отобразить их в различном представлении. Это стандартные возможности любого программного пакета для исследований данных.

При работе с S-Plus можно с успехом использовать функцию буксировки, что позволяет объединять в одном окне различные таблицы. Однако я пришел к выводу, что редактирование диаграмм в ней - это палка о двух концах: панель инструментов для создания аннотаций облегчает работу по разметке таблиц, но для изменения цветов диаграмм, кеглей шрифтов и тому подобного приходится слишком долго выбирать в диалоговом окне нужные параметры.

Говоря о расширяемости S-Plus, нужно учитывать, что ее статистические возможности - это лишь верхушка айсберга. Многие из имеющихся в программе функций в моей бета-версии не действовали и даже не были документированы, но, судя по всему, их диапазон довольно широк. Среди них - итоговая статистика, кросс-таблицы и соотношения, параметрические и непараметрические тесты, а также анализ долговечности.

MathSoft включила в программу функцию анализа временных рядов, но ограничила его автокорреляцией и поэтапным вычислением авторегрессивного скользящего среднего, необходимого при прогнозировании бесформального спектрального анализа. Программа предусматривает анализ различных видов регрессий, в том числе нелинейных пошаговых регрессий, устойчивых к ошибкам. И наконец, она может осуществлять достаточно полный дисперсионный анализ.

Я с удовлетворением отметил, что в S-Plus 4.0 имеются несколько дополнительных функций, которые в наши дни распространены уже достаточно широко, - вырезка (jackknifing), самонастройка, анализ повторяемых показателей, кластерный анализ и множественные сравнения.

По замыслу MathSoft, программа S-Plus должна быть открытой и расширяемой, причем не только за счет новых функций на языке S. Компания предлагает пакет разработки программ S-Plus, позволяющий предоставлять S-Plus данные для анализа и напрямую получать результаты при помощи ваших собственных программ. А благодаря использованию продукта StatServer производства той же MathSoft рабочие группы могут делиться друг с другом данными и результатами работы S-Plus через внутрикорпоративные сети и Internet.

В качестве автономного программного пакета общего назначения для исследования данных, статистического анализа и моделирования, S-Plus, пожалуй, вряд ли подойдет по причине излишней сложности. Однако ее можно с успехом использовать в качестве базы для специализированного анализа или для специфического проектирования и решения других технических задач повышенной сложности.


Алан Дж. Фридланд - профессор психологии Калифорнийского университета. С 1976 года он вплотную занимается программными средствами статистического анализа.

Подводя черту

MathSoft S-Plus 4.0

S-Plus предназначена для добычи и сложного анализа данных; она создает диаграммы нового типа, однако использовать ее очень сложно, поэтому она подходит в основном для решения трудных технических задач.

Достоинства: дружественна по отношению к Microsoft Office; отличается открытой программируемостью.

Недостатки: стратегия поддержки напоминает мэйнфреймовскую; сложна для обучения.

Web-адрес MathSoft: http://www/mathsoft.com/.

Цена: 1495 долл; стоимость дополнительной поддеpжки - 300 долл. в год.

Платформы: Windows 3.1, Windows 95, Windows NT 3.51 и выше.

Дата выпуска: август 1997 г.

Поделитесь материалом с коллегами и друзьями