Реальное число Web-страниц гораздо больше, однако поисковая машина Google отыскивает и удаляет из своего индекса как повторы страниц, так и одинаковые страницы с разными адресами. Также поисковый робот автоматически отличает генерируемые страницы от настоящего пользовательского контента.

Понятно, количество занесенных в поисковую базу Google страниц несравненно меньше триллиона. По оценкам аналитиков, Google в настоящий момент осуществляет поиск по более чем 40 млрд Internet-страниц. А искомый триллион адресов был найден системой проверки ссылок, которая лишь помогает искать новые сайты для индексации, но не заносит их в поисковую базу сразу же.

Согласно Google, пополнение данных о Web-страницах осуществляется непрерывно, а весь поисковый индекс обновляется несколько раз в сутки.

Для сравнения, «Яндекс» в настоящее время осуществляет поиск по 4,5 млрд Web-страниц.

Поделитесь материалом с коллегами и друзьями