В России разрабатывается поисковая система на основе технологии нейронных сетей

В подмосковном городе Сергиев Посад разрабатывается поисковая система на основе технологии нейронных сетей, которая может стать реальной альтернативой сегодняшним лидерам рынка. В то, что это возможно, поверили маститые венчурные капиталисты из Mangrove Capital Partners, в свое время удачно вложившиеся в Skype. Недавно они согласились уже на второй раунд инвестиций, чтобы поддержать российскую компанию.

В настоящее время поиск в Internet работает в пилотном режиме. Собственного индекса у Quintura нет, и поэтому она анализирует выдачу других поисковых систем: Yahoo — в международной и Yandex — в русской версии сайта. При обработке поискового запроса она получает 100 аннотаций от внешней поисковой системы, на основе которых строит карту, или облако из ключевых слов, связанных с поисковым запросом, которые позволяют пользователю уточнить параметры поиска.

При наведении курсора на ключевое слово в карте Quintura отправляет еще один запрос и анализирует теперь уже только 20 первых аннотаций из выдачи, на основе которых предлагает пользователю дополнительные ключевые слова, связанные с выбранным понятием. Разработчики утверждают, что система не зависит от языка, на котором ведется поиск.

В настоящее время поиск в Internet работает в пилотном режиме. Собственного индекса у Quintura нет, и поэтому она анализирует выдачу других поисковых систем: Yahoo — в международной и Yandex — в русской версии сайта. При обработке поискового запроса она получает 100 аннотаций от внешней поисковой системы, на основе которых строит карту, или облако из ключевых слов, связанных с поисковым запросом, которые позволяют пользователю уточнить параметры поиска

В работе поисковой системы используются принципы нейронных сетей, описанные во второй половине прошлого века, применить которые на практике стало возможно теперь с ростом мощности вычислительной техники. В данном случае слова являются узлами в нейронной сети, связям между ними присваиваются коэффициенты. Чем сильнее связь, тем ближе находится ключевое слово на карте к заданному понятию.

В настоящее время анализ связей между ключевыми словами производится каждый раз заново, и результаты работы поисковика в таком режиме не всегда точны. Если бы у системы был собственный индекс, то связи между разными словами хранились бы в нем и результаты были бы более релевантными, но это требует еще более существенных вычислительных ресурсов. После запуска собственного индекса система станет самообучаемой, она начнет добавлять коэффициенты связей между понятиями, взятые с карты, построенной в ответ на пользовательский запрос, к общей карте (пока это происходит только в рамках пользовательской сессии), и, таким образом, через полгода все нерелевантные результаты с нее исчезнут.

Построение собственного индекса — следующий этап развития системы, а пока примером более точной работы может служить сервис Quintura for Kids — специализированный поисковик, в котором проиндексированы не аннотации, а полное содержимое ограниченного количества (порядка 25 тыс.) страниц со специально отобранных детских сайтов.

Классифицировать поисковую систему и причислить ее к той или иной категории довольно сложно. Одни говорят, что это вариант визуализации поиска, другие относят ее к кластеризаторам поисковых результатов. Сами разработчики утверждают, что система уникальна. Сооснователь и президент компании Quintura Яков Садчиков говорит, что целью на ближайшие четыре-пять лет является создание реальной альтернативы Google.

Для этого у новинки должно быть принципиальное конкурентное преимущество. Quintura планирует бороться с Google по трем направлениям: создать визуальный пользовательский интерфейс на основе облака-карты, предложить владельцам Web-сайтов инструмент поиска на этой же основе и, как уже было сказано, создать собственный индекс, чтобы стать независимой от кого бы то ни было.

Городом, где ведутся разработки новой поисковой системы, оказался подмосковный Сергиев Посад, откуда родом основатели компании. Место, не связанное с информационными технологиями наличием профильных вузов или исследовательских организаций, на поверку оказалось богатым талантами, готовыми работать на Internet-экономику. Это выпускники местных школ и гимназий, получившие хорошее образование в столице, но не желающие там оставаться. «Мой друг работает в Москве, а я в Посаде. Платят нам одинаково. Когда я вечером смотрю футбол, он едет в электричке» — звучит реклама с экрана телевизора в местной маршрутке. В настоящее время в компании трудится уже около 30 человек.

Несмотря на российское происхождение, компания зарегистрирована в США, где работают юристы, которые занимаются патентной защитой. Вполне возможно, что в скором времени откроется полноценный офис в Нью-Йорке или Сан-Франциско, чтобы обеспечить маркетинговую активность. Американская «прописка» — это во многом требование инвесторов, которые вложились в компанию. Их состав — отдельный предмет гордости для Quintura.

Первые полгода Quintura жила на средства Садчикова. Вложенных им 100 тыс. долл., полученных от продажи другого проекта, хватило на то, чтобы компания могла развиваться с января по июль 2005 года, когда в ней работало десять человек. Но для того, чтобы идти дальше, потребовалось внешнее финансирование. Все началось со знакомства основателей с Ратмиром Тимашевым (вместе с Андреем Бароновым они основали венчурный фонд ABRT) летом 2005 года, в тот момент деньги у Садчикова уже были на исходе. В общей сложности фонд ABRT вложил в компанию 500 тыс. долл. Более серьезные деньги пришли позже, когда к кругу инвесторов подключился фонд OpenView Venture Partners, а главное — Mangrove Capital Partners, более известный как фонд, который вложился в Skype. О завершении первого раунда инвестиций было объявлено в ноябре 2006 года, их размер не сообщается, но обычно в таких случаях речь идет о миллионах долларов. В июне текущего года было объявлено о завершении второго раунда инвестиций, это еще несколько миллионов долларов. Теперь они были получены уже целиком от Mangrove.

Инвесторы принимают активное участие в жизни компании. Совет директоров собирается несколько раз в год, кроме того, есть человек, который контактирует с компанией на ежедневной основе.

Бизнес-модель, которую предлагает Quintura, будет строиться на рекламе, как и модель Google. Однако, в отличие от поискового гиганта, главный упор будет сделан на графическую рекламу, которая будет размещаться прямо на карте ключевых слов. Пока же количество посетителей на сайте Quintura небольшое, и реклама будет лишь раздражителем, полагает Садчиков. Ожидается, что к концу года, месячная аудитория сайта вырастет до 500 тыс. человек, сейчас она ежемесячно увеличивается на 20%. В компании считают, что рекламу можно будет запускать только тогда, когда количество посетителей перевалит за эту отметку.