IBM работает над совершенствованием «взаимопонимания» человека и машины

Дейв Кунс: «Не нужно двигать мышь рукой — за вас это сделают ваши глаза. Остается лишь щелкнуть по пиктограмме»

В научно-исследовательском центре Almaden Research Center корпорации IBM, расположенном у подножья гор, возвышающихся над Кремниевой Долиной, участники группы USER (User Sciences and Experience Research — «исследование теории и практики работы пользователей») вот уже два с половиной года занимаются серией проектов BlueEyes, направленных на совершенствование взаимодействия человека с компьютером. Недавно этот коллектив, куда входит около 40 исследователей, предложил ряд прототипов компьютерных систем, которые смогут предвосхищать потребности своих пользователей в информации и даже их самочувствие.

Речь идет, в частности, о двух проектах: Magic (Manual Acquisition with Gaze-Initiated Cursor — «доступ к информации с помощью курсора, управляемого взглядом») Pointing и Suitor (Simple User Interest Tracker — «средство отслеживания интересов пользователя»); эти разработки призваны обогатить возможности пользователя за счет функций, реагирующих на взгляд — точнее, на его направление.

Оба проекта основаны на технологии скрытого слежения (например, с помощью видеокамер и микрофонов) за действиями пользователя, которая позволяет получать важную информации о том, куда он смотрит и что хочет выразить своими жестами.

Проект Magic Pointing объединяет технологию ввода и технологию наблюдения за движениями зрачка. «Не нужно двигать мышь рукой, — за вас это сделают ваши глаза. Остается лишь щелкнуть по кнопке или пиктограмме», — говорит Дейв Кунс, один из участников проекта.

Современные технологии наблюдения за движениями зрачка обладают ограниченной точностью — порядка полдюйма на обычном экране; пользователи не могут полностью положиться на подобные механизмы.

«Во-первых, взгляд перемещается рывками, — объясняет Кунс, — во-вторых, людям будет трудно воспринимать и тем более выполнять, скажем, такие правила: ?если моргнуть один раз, это будет означать щелчок мышью, если моргнуть два раза — двойной щелчок?. Все же существуют какие-то вещи, которые нельзя сделать глазами — уместнее воспользоваться руками».

Второй проект, Suitor, — это средство сбора информации о текущей работе, выполняемой пользователем. Suitor знает, куда пользователь глядит, с какими приложениями работает и какие Web-страницы может просматривать.

«Предположим, в бегущей строке в нижней части монитора идет объявление о конференции, — рассказывает Кунс. — Когда вы на него смотрите, на экране ?всплывает? сопутствующая информация, например список соответствующих действий, перечень Web-страниц, относящихся к конференции, карта района, в котором расположен центр проведения конференции, и т. д.».

То же самое произойдет с заголовками новостей: «При беглом взгляде на них в окне браузера откроется соответствующий Web-сайт, а когда вы станете читать новости, появится дополнительная информация, связанная с данной темой».

Создатели Suitor видят его задачу в том, чтобы предупредить потребности пользователя, руководствуясь тем, куда он смотрит. «Если в вашем календаре записано, что вы должны позвонить Джейн, и вы посмотрите на эту запись, — продолжает Кунс, — Suitor немедленно выполнит соединение, не уточняя фамилии Джейн и номера ее телефона».

При работе с представленными прототипами, оборудованными средствами Magic Pointing и Suitor, пользователь должен синхронизировать свой взгляд с компьютером, чтобы тот мог «распознавать» его взгляд. Для этого исследователи разработали специальную технологию — Pupil Finder.

На мониторе перед пользователем устанавливается длиннофокусная камера, и затем пользователь с помощью специального приложения выполняет «калибровку» своего взгляда, принимаемого камерой.

Сейчас группа USER ведет работы над системой, не требующей калибровки: пользователь сможет свободно двигать головой.

Подобные решения могут попасть на рынок через пару лет. «У нас уже есть работающие образцы, — рассказывает Кунс. — Надо просто дождаться, пока камеры достаточно подешевеют, — скажем, когда модели с низким разрешением будут стоить 10 долл.».

Участники проектов BlueEyes рисуют самые смелые картины будущего: обычные бытовые устройства — телевизоры, холодильники, микроволновые печи — будут выполнять нужные операции, повинуясь взору и приказам человека.

Телевизор технологии BlueEyes включится в результате зрительного контакта с пользователем и по его приказу переключится на другой канал. Если телевизор «увидит», что пользователь улыбнулся или кивнул, он поймет, что просьба удовлетворена. Если пользователь нахмурится, телевизор попросит уточнить требование.

Представленные опытные образцы могут послужить прототипами устройств, которые в значительной степени облегчат взаимодействие с компьютером для людей с ограниченной трудоспособностью.

«Мы видим задачу нашей лаборатории в совершенствовании пользовательского интерфейса, — объясняет Дэниел Расселл, старший менеджер лаборатории USER в исследовательском центре Almaden. — Мы стараемся разрабатывать устройства, ?заботящиеся? о своих пользователях и способные предугадывать их потребность в информации».


Интерфейсы ОС Linux

По мере роста популярности Linux как операционной системы для настольных компьютеров возникает все большая потребность в мощных и удобных в работе графических пользовательских интерфейсах. И KDE и Gnome предоставляют свободно распространяемую стандартную среду, которая допускает настройку в соответствии с предпочтениями конкретного пользователя, в то же время поддерживая совместимость с другими системами. Суть в том, что обе системы предоставляют возможность настройки.

Достоинства: и Gnome и KDE предлагают пользователям удобные возможности настройки рабочего стола Linux; многие популярные приложения поддерживают одну или обе эти среды; обе системы поставляются в исходных текстах, что позволяет строить на их основе свои собственные решения

Недостатки: предназначены только для систем с X Window; приложения, созданные для одной системы, часто выглядят не лучшим образом при работе в другой среде