Все началось с забавы прогрессивных американцев, установивших на многочисленных сайтах, форумах и блогах при упоминании слов «miserable failure» (жалкий неудачник) ссылки на страницу http://www.whitehouse.gov/ president/gwbbio.html. Как результат биография Джорджа Буша стала прочно ассоциироваться с этой фразой в крупнейших поисковых системах (например, http://www.google.com/search?hl=en&q=miserable+failure&btnG=Google+Search).

Этот эффект был назван Google bombing, и на его воплощение понадобилось много англоязычных единомышленников и более полутора месяцев работы. В свою очередь мы попробовали не только «изъясниться в любви» уже к нашему президенту, но и адаптировать эксперимент «miserable failure» для России с помощью соответствующих антонимов.

Основная задача нашего проекта сводилась к изучению реакции российских поисковиков на внешние ссылки и выяснению возможности манипуляции «выдачей» поисковых систем со стороны одного человека с минимальным временем пребывания в Интернете. Первые же результаты потрясли нас своей отдачей, и рамки эксперимента были значительно расширены. Но давайте сначала разберемся, какими поисковыми машинами стоит манипулировать в Рунете.

Операция «Завидный счастливчик»

EspAnadir Clasific Pro RE

В отличие от американской бомбы «miserable failure» для Джорджа Буша, в наших головах возникла более достойная ключевая фраза для российского лидера — «завидный счастливчик». То есть наше словосочетание построено на антонимах к словам «жалкий неудачник» и больше подходит, на наш взгляд, к биографической страничке Владимира Путина — www.kremlin.ru/articles/V_Putin.html (индекс цитирования ИЦ = 4500), что по замыслу и должно было стать устойчивым синонимом для этого ресурса президента.

Итак, 3 июня 2005 г., затратив 15—20 минут (!) свободного интернет-времени, мы опубликовали ссылку на страницу www.kremlin.ru/articles/V_Putin.shtml со словами «завидный счастливчик» примерно на 300 низкорейтинговых ресурсах. И этого оказалось достаточно, чтобы спустя два дня ожидания поисковые механизмы «Яндекса» и Google подчинились нашей воле!

Теперь по запросу «завидный счастливчик» они покорно выдают биографию Путина на первом месте в результатах своей работы.

Но отметим одну тонкость в «мировоззрении» робота Google.

PagePromoter

Послание на форуме должно быть очень коротким и содержать только ключевую фразу да соответствующую ссылку — ничего более. Иначе вы собьете Google (к «Яндексу» это не относится) с нужного курса, и она начнет выдавать вместо странички нацеливания на первых позициях ссылки на сами форумы.

Поймите, на странице Владимира Путина нет слов «завидный счастливчик». Более того, там нет никаких словообразований от этой ключевой фразы. А все, что мы проделали, — это навязали поисковику наше субъективное представление о биографии лидера, только и всего.

Кстати, доступность подобных манипуляций поисковыми машинами может быть опасна для имиджа любого сайта и его владельца. Ведь ключевые фразы могут носить более негативный характер, а удачный сброс на телеэкраны информации о поисковых ассоциациях способен привести к печальным последствиям.

Комментарии специалистов

Честно говоря, подобной результативности от 15-минутного пребывания в Интернете мы не ожидали. Как следствие, безобидная шутка приобрела некоторую известность в кругах специалистов, которые любезно покритиковали наш оптимизм.

Результаты запроса в Google до операции. 4 июня 2005 г.

Особенно интересен комментарий технического директора компании «Яндекс» Ильи Сегаловича на радио «Свобода» (http://www.svoboda.org) от 10 июня 2005 г.:

«...если в Рунете словосочетанию «завидный счастливчик» всегда соответствует ссылка www.kremlin.ru — с этим поисковик ничего поделать не может, поскольку «завидный счастливчик» вообще ни в каком другом сочетании больше не встречается в Рунете. Это своего рода псевдоним сайта, и если кому-то пришло в голову так устроить свою информацию, запретить этого нельзя. Поисковик отражает состояние Интернета, а в случае редких запросов это состояние может изменить один человек или скоординированное сообщество. Это явление относится к «поисковому спаму»: автоматическая генерация страниц и ссылок, которые создаются не для того, чтобы с ними работал человек, а с единственной целью повысить рейтинг ресурса в поисковой выдаче. И очень непросто бывает отличить реальные ресурсы и автоматически сгенерированные. Это одна из наших важных задач».

Очень приятно, что руководитель программистов «Яндекса» заметил столь очевидные дырочки в работе своего детища, жаль только, что Илья Сегалович немного слукавил.

Во-первых, фразе «завидный счастливчик» всегда соответствовало большое количество сайтов, посвященных «завидному жениху» Максиму Галкину и суперпопулярной игре «О, счастливчик» с ведущим Дмитрием Дибровым.

Результаты запроса в Google после операции. 20 июня 2005 г.

К сожалению, после операции «завидный счастливчик» выдача действительно кардинально изменилась, поскольку ключевая фраза не была оптимизирована, но в своих последующих экспериментах мы максимально избавились от побочных эффектов.

Во-вторых, для большинства людей слово «спам» ассоциируется с навязчивым потоком писем, а господин Сегалович, как и другие, узнал о положительных результатах нашего эксперимента не из почтовых ящиков. Теоретически нашу проделку можно заметить только при определенном поисковом запросе человека, как и контекстную рекламу на «Яндексе» и Google. Но давайте посмотрим, что такое «поисковый спам» (а не просто «спам») по версии открытой энциклопедии мирового масштаба «ВикипедиЯ» (http://ru.wikipedia.org).

Вы не найдете там в перечне видов поискового спама описания нашего алгоритма действий. Более того, мы действительно считаем, что биография Владимира Путина полностью адекватна фразе «завидный счастливчик», а значит, мы не лукавили, распространяя свое мнение в открытых форумах. К тому же мы могли поддержать победное шествие нашего мнения по Интернету даже без помощи автоматизирующего ПО и «вручную» сообщить миру о своих убеждениях. Так кто виноват в том, что точку зрения одиночек можно навязать всем? Мы или поисковая система?

И в-третьих, поисковая формула выдачи систем Rambler.ru и Aport.ru адекватно оценила связку из сайта Kremlin.ru и наших внешних ссылок и сохранила курс на объективные критерии релевантности. Браво, «Рамблер»... Браво, Aport.ru... Но мы предпочитаем пользоваться системами Google и «Яндекс».

Кстати, положительные результаты операции «Завидный счастливчик» прокомментировали не только специалисты компании «Яндекс», но и наши коллеги, занимающиеся продвижением и html-оптимизацией сайтов. Так, Сергей Петренко (www.searchengines.com) утверждает, что запрос «завидный счастливчик» носит искусственный характер и частота его появления не достигает даже 10 раз в месяц.

Здесь действительно нечего возразить кроме того, что в некоторых ситуациях пользователи и с более редкими запросами могут быть на вес золота. Например, в торговле элитной недвижимостью или престижными автомобилями.

Реакция «Яндекса», зафиксированная радиоведущим Александром Плющевым («Эхо Москвы») 6 июня 2005 г.

Кстати, сама фраза «miserable failure» тоже не являлась высокочастотным запросом в англоязычной части Интернета. А искусственный «низкочастотник» на верхней позиции в авторитетных поисковых машинах в разных целях всегда могут использовать политики и бизнесмены.

Но не будем фантазировать дальше, а перейдем к опытам со среднечастотными запросами и очень популярными ключевыми фразами.

Среднечастотники

Борьба между поисковыми системами, заинтересованными в продаже контекстной рекламы, и владельцами сайтов, которые хотят видеть в поисковиках бесплатные машины для собственной популяризации, активизировалась с 1994 г. и продолжается до сих пор. Именно в 1994 г. поисковая машина Infoseek «догадалась» интерактивно анализировать клиентский запрос и выдавать соответствующие коммерческие объявления рядом с результатами поиска. И пошло-поехало...

Каждая поисковая система создавала свою секретную формулу анализа и оценки страницы в Интернете и обеспечивала лучшую адекватность запросам со своей точки зрения. Как только смекалистые специалисты вычисляли корень уравнения успеха, программисты старались оперативно изменить формулу. Главное — не дать ловкачам протолкнуть свои сайты в качестве «ответа» на самые популярные запросы, особенно когда дело касается коммерческих ресурсов.

Разумеется, сценарии запросов к поисковикам часто повторяются, и в среде специалистов выделяют следующие типы поисковых фраз: низкочастотники (до 100 запросов в месяц), среднечастотники (до 1000 запросов в месяц) и высокочастотники (свыше 1000 запросов в месяц). Причем стоит учитывать не только количество поисковых операций с ключевыми фразами на сервере «Яндекса», но и аналогичные запросы к другим системам. А сделать это объективно ой как трудно!

Можно на глазок предположить, что фразы «прогноз погоды» и «программа телепередач» являются высокочастотниками в российском Интернете, но лучше иметь в руках более серьезные аргументы. И помочь в этом могут периодические публичные отчеты разных компаний (например, http://globalstats.hotlog.ru/cgi-bin/hotlog/sur.cgi или http://www.google.com/press/zeitgeist.html). Но самыми интересными для нас представляются оперативные отчеты запросов к «Яндексу» (http://wordstat.yandex.ru) и «Рамблеру» (http://adstat. rambler.ru/wrds).

Так, порывшись в списках запросов средней популярности, мы решили поставить сразу два забавных, но важных эксперимента с различными переменными:

  1. переключим рупор демократии под названием «Эхо Москвы» (ИЦ = 5500) на позывные радиостанции «Маяк 24» (ИЦ = 2800), которые знакомы нам с самого детства.
  2. свяжем среднечастотный запрос «выгодный хостинг» с хостинг-провайдером нашей домашней страницы — Digdot.com, который обладает довольно низким индексом цитирования (ИЦ = 60).

Задумано — сделано. Уже 14 июня поисковик Google стал выдавать на самых верхних местах ссылку на сайт радио «Маяк 24» по популярным поисковым фразам: «эфир «Эха Москвы» и «радиостанция «Эха Москвы». А лавры результатов коммерческого запроса «выгодный хостинг» надолго ушли к сайту www.digdot.com, несмотря на жестокую борьбу многих оптимизаторов за это ключевое словосочетание.

Результаты операции в Google «Правильная радиостанция» (14 июня 2005 г.)

Удивительно, но наша технология манипуляций поисковиками опять на 100% сработала уже со среднечастотниками. Причем эксперимент оказался актуален как для цели с высоким рейтингом, так и для ресурса с низким ИЦ, что наглядно доказывает совместимость наших изысканий с любым сайтом. Но давайте продолжим исследования...

Продолжение следует

Это же надо, высокооплачиваемые специалисты годами подбирают нужные ключики к поисковым механизмам, а тут журналисты ногой открывают огромную дверь в светлое будущее многих владельцев сайтов, а по совместительству — читателей этой статьи.

После удачного завершения работ над «полупопулярными» запросами нас захлестнули наполеоновские планы. Давайте по слову «Яндекс», которое российские пользователи ищут более 100 тыс. раз в месяц, «переключим» всех на систему Google. «То-то будет весело», как любил говаривать Корней Чуковский...

Но чуда не случилось. Слишком уж много внешних ссылок подобным образом правильно указывают на любимую поисковую систему «Яндекс». Как говорится, «клин клином выбили» из наших манипуляций.

А может, «Яндекс» заранее побеспокоился о своем имидже и перекрыл возможность любых манипуляций над собой со стороны шутников-оптимизаторов? В любом случае истина всегда где-то рядом, а между тем изменить ситуацию никогда не поздно.

Параллельно с осуществлением своих дерзких прожектов мы пытались прикрутить коммерческий высокочастотник «купить компьютер» к специально созданной страничке (ИЦ = 50) с подбором авторских статей по компьютерной тематике. Такое использование служебного положения сработало значительно лучше, но до выдачи на первой страничке мы недотянули (только первая строчка второй страницы выдачи в системе Google, а жаль).

Разумеется, еще можно было «вручную» увеличить количество внешних ссылок «купить компьютер» в нужном направлении и в конце концов достигнуть цели на определенном этапе. Но тогда мы повторили бы полуторамесячный эксперимент американцев, а мы хотели получить максимальный результат, потратив не более 20 мин своей работы в Интернете. Увы, с такими условиями эффективно управлять выдачей на высокочастотные запросы не удалось.

Но многие специалисты оптимизации убеждены, что охота за высокочастотными запросами дает много «бесполезных» посетителей и ненужные объемы платного трафика. И, как следствие, наоборот — именно перехват среднечастотных ключевых фраз обеспечит любой сайт качественной аудиторией при меньших финансовых затратах. Поэтому для веб-мастеров, в отличие от сетевых юмористов, есть смысл как следует просчитать степень увеличения своего трафика с помощью сверхпопулярных запросов.

Теперь мы подумываем перенести практические испытания в англоязычную часть Сети и рассмотреть возможность быстрой манипуляции поисковыми машинами западных компаний. А вдруг и там один человек сможет агрессивно навязывать свои убеждения поисковикам?

Противоядие для поисковиков

Без сомнения, искусственный интеллект самых популярных поисковых алгоритмов получил тревожный сигнал и для них сам собой возник сакраментальный вопрос: что делать?

Самым банальным вариантом представляется перехват определенных запросов. При таком раскладе страна никогда не узнает, кто у нас «завидный счастливчик», но лавинообразный рост армии шутников это не остановит.

Другим сильнодействующим противоядием может служить внесение программистами поисковой машины «вручную» в специальный фильтр игнорирования всех возможных открытых форумов, гостевых книг и авторских блогов. Такое мероприятие даст определенный эффект, но «под топор» попадут невинные люди.

Более того, поисковая система сама пострадает, ведь она распишется в собственном бессилии автоматизировать поиск честно, а заодно изменится релевантность поисковой выдачи, которая сейчас нас устраивает больше всего на серверах «Яндекс» и Google.

Не знаем, какой путь выберет «Яндекс», но хозяева Google пока не решились на какие-либо ручные вмешательства в отлаженный искусственный интеллект, игнорируя требования государственных чинов.

Существует ли более мудрое решение?

Самым очевидным способом достойного выхода из сложившейся ситуации является оптимизация поискового алгоритма. Ведь перехитрив владельцев веб-сайтов байками про важность контента, создатели «Яндекса» и Google стали переоценивать содержание внешних ссылок, не обращая внимания на само наполнение ресурсов.

Так, если «чужой» человек скажет поисковику 300 раз, что какой-нибудь сайт N содержит тонны интересных фотографий и музыкальных файлов, поисковая машина поверит и тоже начнет уверять в этом всех окружающих. Может, стоит заглянуть на сайт Х и убедиться, что его содержание не противоречит ссылкам с внешних источников?

Получается, главная тайна популярных поисковиков заключается в эксплуатации человеческого мнения. Но раз этот порок научились эксплуатировать пользователи с воображением, пора и алгоритмам начинать «жить своим умом».

Подведем итоги

Торопитесь прочитать выводы? Главная тайна самых популярных поисковых машин была выдана выше, а здесь мы хотим перечислить основные следствия из нее. Итак...

  1. На данном этапе развития популярные поисковые машины легко поддаются дрессировке со стороны.
  2. Даже один человек может быстро и эффективно манипулировать выдачей на низкочастотные и среднечастотные запросы. Как следствие, вполне реально захватить первую поисковую страничку по названиям компаний и содержанию их слоганов и основных идей, что может привести к атакам на имидж любых сайтов в будущем.
  3. Неизвестно, кто первый догадался основательно манипулировать поисковыми системами по нашей низкозатратной технологии, но наверняка обнаруженные «дырочки» уже давно работают в Cети и преследуют свои конкретные цели.
  4. Естественная динамика развития рынка контекстной рекламы на поисковых машинах «Яндекс», Google, Mail нарушается. А как иначе? Зачем платить деньги за перехват клиента с поисковой фразой «Купить квартиру в Перово», если это можно сделать бесплатно по нашей технологии?

* * *

В завершение статьи приносим извинения обычным пользователям поисковых систем за возможные неудобства от некоторой нерелевантности результатов поиска по своим запросам, совпадающим с нашими тестовыми фразами. Мы прекратили поддержку операций «Завидный счастливчик», «Правильная радиостанция», «Выгодный хостинг», «Яндекс» любит Google» и «Просветись перед покупкой» и искренне надеемся, что следы нашей активной манипуляции поисковыми машинами постепенно нивелируются, но скриншоты из серии «до и после» мы сохраним для потомков.


Рейтинг поисковиков

Анализируя открытые данные независимых аккумуляторов статистики SpyLog (www.spylog.ru), HotLog (www.hotlog.ru) и LiveInternet (www.liveinternet.ru), можно построить ориентировочный рейтинг поисковых машин для России, который сейчас выглядит следующим образом:

  1. Yandex.ru — 50%
  2. Rambler.ru — 25%
  3. Google.ru — 17%
  4. Mail.ru — 4%
  5. Aport.ru — 2%
  6. Другие — 2%

Разумеется, существует еще с десяток поисковых механизмов (Yahoo, Altavista, Lycos и пр.), но все они умещаются в пункт «Другие», т.е. входят в 2% процента запросов. А между тем общее число ежедневных запросов к поисковикам легко переваливает за отметку 20 млн., и львиная доля этого поиска приходится лишь на «Яндекс», Rambler, Google. Значит, будем ориентироваться на эти поисковые системы и анализировать именно их реакцию на появление определенного количества наших ссылок в Рунете.


Технология вмешательства

Весь процесс манипуляции поисковой выдачей проходил по следующему алгоритму.

Во-первых, на соответствующих подконтрольных страницах авторских проектов появлялась безобидная ссылка, адресующая на определенный сайт и с определенной фразой между тегами фраза.

Во-вторых, спустя некоторое время аналогичные ссылки с тегами фраза и [url]фраза[/url] расставлялись во многих открытых форумах (и блогах также). Здесь первая пара html-команд направлена на работу в старых скриптах, а последние теги предназначены для большинства современных форумов, которые их понимают и корректно превращают нужные фразы в необходимые ссылки.

Разумеется, второй шаг алгоритма можно было выполнять «вручную», но мы предпочли автоматизировать его с помощью программы EspAnadir Clasific Pro RE (www.espanadir.com/clasificrus) для работы в форумах. Справедливости ради заметим, что иногда с таким же успехом мы использовали аналогичную программу Pantera (www.gasaw.com/sw/pantera), а детальный обзор и объективное сравнение ранних версий обеих программ можно найти на страницах «Мира ПК» (см., например, №6/03).

И в-третьих, успех мероприятия закреплялся с помощью одной из программ EspAnadir Gold Master RE (www.espanadir.com/clasificrus) или Page Promoter (www.pagepromoter.ru), которые умеют рассылать нужную ссылку с краткой ключевой фразой на поисковые ресурсы. Кстати, сами программы мы уже тщательно сравнивали (см. «Мир ПК», №4/05).

Конечно, третий шаг можно было бы пропустить, поскольку он чреват опасностью попадания «продвигаемой» странички в черный список поисковиков, но кто не рискует, тот не тестирует двухъядерные процессоры первым («Мир ПК», №6/05).