Структурированные данные собраны в Internet в больших объемах, однако Google пока не может их все предоставить своим пользователям. Речь идет о так называемом «невидимом Web» (deep Web), примером могут служить базы данных, лежащие в основе сайтов Cars.com или Realtor.com. Автоматически генерируя данные для заполнения HTML-форм на этих сайтах, Google делает к ним запросы, а результирующие Web-страницы включаются в поисковый индекс.

Одной из целей Google является объединение найденных данных в группы по свойствам. Идея перекликается с работой метапоисковой машины Kosmix, которая, например, на запрос «Вьетнам путешествие» выдаст результаты, разбитые на группы: обзоры ресторанов из «Нью-Йорк таймс», изображения из Yahoo! и Flickr, потребительская информация из Shopping.com, общие сведения из Google. В Google работают над выдачей ответов в едином поиске без привязки к источникам -- для этого необходимо научиться анализировать информацию.

Поделитесь материалом с коллегами и друзьями