Реклама

В мае была запущена машина, вычисляющая знания (computational knowledge engine), получившая название Wolfram|Alpha (www.wolframalpha.com). Wikipedia относит эту программу к классу answer engine, то есть «машина для ответов», что формально ставит ее в одну категорию с сайтами AskMeNow, BrainBoost, DeeperWeb и True Knowledge, хотя на самом деле это ошибочно. Машина действительно предназначена для ответов, но не заготовленных заранее, а вычисляемых по запросу.

Пока еще рано выносить обоснованное суждение о возможностях машины, но складывается впечатление, что Wolfram|Alpha действительно умеет извлекать знания, правда при этом на первых порах особым богатством интеллектуального багажа не отличается. Говорить о том, что она может составить конкуренцию Google, преждевременно, да и неправильно – это продукт совершенно иного класса. Wolfram|Alpha не ищет страницы по ключевым словам, а отвечает на вопросы. Если вы ее спросите о погоде в Москве, то она предложит вам не список метеосайтов, а текущий прогноз и справку о московском климате.

Стивен Вольфрам родился в 1959 году в интеллигентной еврейской семье, эмигрировавшей в 1933-м из Германии в Британию. Его отец – малоизвестный писатель, а мать была преподавателем философии в Оксфорде. Вольфрам был настоящим вундеркиндом, в детстве его даже называли «маленьким Эйнштейном», и эту честь он оправдал еще в юности, написав свою первую книгу по экспериментальной физике в возрасте четырнадцати лет, а первую серьезную научную статью, опубликованную в журнале Nuclear Physics, – в семнадцать, наконец, научную степень он получил в двадцать лет. Однако физиком Вольфрам не стал и последующие три десятилетия своей научной карьеры почти полностью посвятил клеточным автоматам (КА), предложенным Джоном фон Нейманом. Упрощенно клеточный автомат можно представить как множество ячеек, каждая из которых, или элементарный автомат, способна принимать одно из конечного набора значений (скажем, 0 и 1), это состояние может изменяться по определенным правилам, в зависимости от состояния соседних ячеек и времени. По всей видимости, КА – одно из лучших средств для моделирования жизни, не случайно наиболее известными примерами клеточных автоматов являются самые разнообразные игры, от «крестиков-ноликов» до шахмат. Вообще любую игру, происходящую на поле с клетками, следует признать клеточным автоматом; в науке же наибольшую известность получил автомат «Жизнь», предложенный Джоном Конвеем.

СТИВЕН ВОЛЬФРАМ: «Alpha – не поисковая машина, а машина, дающая ответы на заданные ей вопросы»До 1986 года Вольфрам работал в Институте передовых исследований (Institute for Advanced Study, IAS) – том самом учреждении, которое в Соединенных Штатах специально создано в конце 40-х годов в качестве прибежища для ученых эмигрантов, среди которых были Альберт Эйнштейн, фон Нейман, Роберт Оппенгеймер и другие представители европейской науки. Это место удивительных встреч и пересечения судеб, нет ничего удивительного в том, что здесь Вольфрам вместе с Ричардом Фейнманом моделировал физические процессы методами клеточных автоматов. Материальной базой служил компьютер CM-1, выпускавшийся компанией Thinking Machines. Этот компьютер можно считать первым примером реализации архитектуры с массовым параллелизмом SIMD; число процессоров в CM-1 могло быть доведено до 65536 (впрочем, этому показателю особенно удивляться не стоит – процессоры были простейшими, однобитовыми).

После ухода из Института передовых исследований Вольфрам изменил академической карьере и в 1987 году основал существующий по сей день междисциплинарный научный журнал Complex Systems («Сложные системы»), где освещаются различные системные аспекты биологии, компьютерной науки, физики и математики. Годом позже он создал компанию Wolfram Research, поставляющую популярный математический пакет Mathematica, конкуренцию которому составляют три продукта – Maple, Mathcad и MATHLAB. С тех пор Вольфрам успешно сочетает бизнес с наукой. С ноября 2008 года его компания выпускает версию Mathematica 7, а также три дополняющих ее продукта Wolfram Workbench, gridMathematica и webMathematica. Штаб-квартира компании расположена в Великобритании, есть исследовательское подразделение в Японии, имеется свой издательский бизнес. Среди книг есть «главная», изданная в 2002 году и написанняа самим Вольфрамом. Ее весьма претенциозное издание A New Kind of Science («Новый класс науки») провозглашает, что грядет научная революция, вызванная прогрессом клеточных автоматов. Звучит странно, но: «Революция кажется абсолютно невозможной 'до' и абсолютно неизбежной 'после'». Этот огромный том, объемом более 1200 страниц, до сих пор занимает видное место на прилавках американских магазинов, правда, сейчас он подешевел вдвое. Должен признаться, что я cам неоднократно держал его в руках, но от покупки сдерживал размер, вес и форма изложения, изобилующая чудовищным количеством рисунков. Книга, получившая собственный ник NKS, заслужила разные, зачастую полярные отзывы, но, согласимся, автор с послужным списком Вольфрама заслуживает к себе вдумчивого отношения.

В условиях абсолютной таинственности, над разработкой Computational knowledge engine работало более сотни человек в течение пяти лет. Утверждается, что система Wolfram|Alpha основана на работе с естественными языками и для извлечения знаний и подготовки ответов использует библиотеку алгоритмов, построенных на подходах, описанных в NKS. Один из пионеров Semantic Web Нова Спивак после беседы с Вольфрамом утверждал: «... Wolfram|Alpha не менее значительна, чем Google, но это не 'убийца Google', у нее другая функция, Alpha не поисковая машина, а машина, дающая ответы на заданные ей вопросы». В отличие от всех остальных поисковиков система Wolfram|Alpha действительно отвечает на заданные ей вопросы, она не возвращает документы с ответами, как Google и другие, не является огромной базой знаний как Wikipedia, или механизмом для доступа к этой базе на естественном языке, как система Powerset. Ближе всего к Wolfram|Alpha библиотека знаний Сyc.

Нет ничего удивительного, что Дуглас Ленат, создатель Cyc, специалист в области искусственного интеллекта и директор компании Cycorp, был одним из первых, кому Вольфрам продемонстрировал свое создание, после чего Ленат в своем блоге приоткрыл покров таинственности. Сам Вольфрам публично не распространяется о технологиях вычисления знаний, поэтому приходится доверять интерпретации тех, кто получил сведения о них из первых рук. По Ленату, в сердцевине находится представление знаний в форматах, используемых в Mathematica, то есть созданных вручную записях, аккумулирующих в себе сведения из определенной области знаний, например тех или иных данных из экономики, собранных в самой Wolfram|Alpha. В отличие от Semantic Web, который перенаправляет запрос на сторонний источник информации, который он выбирает, здесь используется исключительно «опора на собственные силы». Следовательно, Wolfram|Alpha является логическим продолжением Mathematica, расширяя предметную область, которая раньше охватывала только математические понятия, а теперь включает реалии из внешнего мира. Общим же является то, что Wolfram|Alpha не извлекает какие-то данные, а выполняет над ними вычисления и представляет результаты в текстовой, табличной и графической форме. Таким образом, перекрывается пространство потенциальных запросов. Для вычисления ответов на вопросы в системе есть встроенная модель, состоящая из отдельных полей, наборов данных и алгоритмов, в которой воплощено знание о реальном мире, например свод знаний из физики или химии. По вопросу и по модели производится вычисление. Область знаний не ограничена наукой, в нее может входить музыка, кулинария, бизнес, все, что угодно. В любом случае создается формальная система знаний, из нее по запросу извлекаются ответы, которые и предлагаются в неформальном виде.

По форме запросы можно уподобить DWIM (Do What I Mean) или DWIMM (Do What I Might Mean), то есть «сделай то, что я имею в виду» – или «то, что я мог бы иметь в виду». Так когда-то называли наивные попытки непосвященных заставить компьютер делать не то, что он может, а то, что хочется. Но в данном случае подход работает например, если вы введете gdp (gross domestic product), то в зависимости от того, в какой стране вы находитесь, будут выданы цифры и динамика валового внутреннего продукта. Хотя утверждается, что запросы можно формулировать на естественном языке, это не совсем так. Нет строгого синтаксиса и словаря, но уметь задавать вопросы нужно и нужно знать потенциал Wolfram|Alpha.

Сравнивая Wolfram|Alpha с Google и Cyc, Ленат делает следующий вывод. Поисковая система Google передает данные, не вникая в них, основываясь на формальном соответствии. Система с искусственным интеллектом Cyc сможет дать глубокий ответ, если вы, в свою очередь, сможете ей задать вопрос и при этом попадете в ту область, которую она знает. Wolfram|Alpha представляет собой нечто среднее. Грядущие перспективы системы в сильной степени зависят от того, насколько продуктивным окажется идея формирования базы знаний силами самой компании, удастся ли с подобным сугубо проприетарным подходом противостоять открытому редактированию, принятому в Wikipedia и других сетевых энциклопедиях.


Библиотека знаний Сyc

Во всех хрониках работ по искусственному интеллекту можно найти упоминания о проекте Cyc, который нередко сравнивают с компьютером HAL, описанным Артуром Кларком в «Космической одиссее 2001 года», а теперь библиотека знаний Cyc доступна всем и, возможно, привлечет к себе гораздо большее внимание.