ГлавнаяНаукаВсе новости раздела
 

"Яндекс" запустил новую версию поиска

Корреспондент.net, 24 мая 2001, 18:01
0
3

23 мая в 12.00 "Яндекс" запустил новую версию своей поисковой машины. Повысилась точность и скорость поиска, улучшилась обработка запросов на естественном языке. Значительно точнее "Яндекс" стал искать сайты компаний и сайты, связанные с персоналиями. Внедрены новые методы борьбы с поисковым спамом. "Яндекс" сохранил лидерство по объему проиндексированной базы - она включает сейчас 38 миллионов документов.

Предыдущую версию поисковой машины компания анонсировала год назад - 6 июня 2000 года, сообщает «Нетоскоп».

Тогда в "Яндекс" были добавлены синтаксический анализ (вдобавок к имеющемуся изначально морфологическому), поисковик стал отслеживать не только веб-страницы, но и базы данных (в которых используются скрипты), появилась интеграция с каталогом, поиск новостей, параллельный поиск товаров и услуг. 19 июня 2000 года у "Яндекса" появился "аскетический" вариант - по адресу www.ya.ru, приобретающий все большую популярность у пользователей.

В октябре 2000 года было объявлено об усовершенствовании результатов поиска. Тогда были произведены улучшения в интерфейсе выдачи запросов. В ноябре был запущен "Яндекс.Бар" - дополнительная панель инструментов к браузеру, облегчающая процесс поиска через "Яндекс". В ноябре же был запущен сервис "Яндекс.Товары". В рамках этого сервиса осуществляется поиск по товарным предложениям, в первую очередь, предложениям интернет-магазинов.

Сейчас в новую версию поисковика внесены следующие изменения: улучшения коснулись обработки запросов на естественном языке, повысилась точность и скорость поиска.

Теперь "Яндекс" будет корректировать запросы пользователя для большей точности выдачи результатов поиска. Будет осуществляться орфографическая коррекция запроса, перед обработкой вопросы будут перефразироваться (например, запрос "что такое Интернет" перефразируется в "Интернет - это..."). Пока покрыты только определенные типы вопросов, но со временем правил будет больше. Поисковик начал работать и с альтернативной лексикой. Третьей ссылкой при поиске на слово "мастдай" теперь выдается "microsoft.com". а на слово "искалка" - ссылки на российские поисковые машины, хотя это слово сами поисковики по отношению к себе не употребляют.

Улучшился поиск ссылок. Если теперь набрать в поисковом окошке слово "Волож", первой ссылкой можно увидеть yandex.ru, слову "Ханов" соответствует rambler.ru, а слову "Хайтина" - netoscope.ru. Это касается, безусловно, не только персоналий, но и названий компаний. Проблема найти сайт компании по ее названию (в случае его наличия) практически разрешена.

В борьбе за лучшую релевантность результатов поиска большой проблемой для разработчиков является так называемый поисковый спам - действия авторов страниц и рекламщиков, которые приводят к размещению не самых значимых с точки зрения потребителей сайтов на верхние позиции в результатах поиска по определенным словам. Эту проблему "Яндекс" пытается разрешить использованием в ранжировании ссылок "Индекса цитирования", но поскольку и этот параметр поддается "накрутке", учитывается "авторитетность" сайтов, на которых размещены ссылки. Эта методика получила название "взвешенный индекс цитирования".

Илья Сегалович, руководитель отдела разработчиков "Яндекса", считает, что рынок услуг по повышению релевантности сайтов в поисковиках, достаточно большой. Сегалович оценивает его размер в 10 процентов от общего оборота рекламных услуг, связанных с поисковиками. И борьба с такого рода деятельностью - задача крайней сложности.

И последнее - скорость. Часть алгоритмов переписана разработчиками на ассемблере, облегчена выдача - убраны таблицы, произведен аппаратный апргейд. Все эти меры дали очередной выигрыш по скорости поиска. Меры эти были актуальны, так как "Яндекс" обрабатывает сейчас около миллиона запросов в день (до 20 в секунду).

"Яндекс" уже в течение нескольких лет удерживает лидерство среди российских поисковиков по объему индексируемой базы. Сейчас в этой базе - 38 миллионов документов ("Рамблер" "видит" 7,5 миллионов документов). Настоящий объем Рунета неизвестен - никаких исследований на эту тему не существует. Зато существуют любопытные цифры по объему мирового Интернета. На октябрь 2000 года в мире насчитывалось 2,5 миллиарда статических страниц, индексируемых поисковыми машинами, и 550 миллиардов (!) недоступных динамических страниц.

Если Илья Сегалович рассказывал на пресс-конференции о технических деталях поиска, то Аркадий Волож - глава компании - сделал основной акцент на том, что нынешние крупные российские порталы уже представляют собой привлекательные рекламные площадки.

Если переводить на язык традиционных медиа, то такой портал, как "Яндекс", имеет недельный "тираж" - 1 миллион в неделю. Этот тираж пока сложно сравнивать с "тиражом" самого крупного медиа - телевидения, но вот уже с тиражами радиостанций и офлайновой прессы - вполне. Такой же тираж - миллион в неделю - имеет крупный компьютерный издательский дом (все издания совокупно). Но если тот же издательский дом имеет годовой рекламный оборот - 5-10 миллионов долларов, то оборот всего рынка интернет-рекламы в Рунете в 2000 году составил, по разным оценкам, 3-5 миллионов долларов.

Тот факт, что реклама в Интернете зачастую выгоднее (по соотношению цена/качество), чем реклама на радио и в крупных офлайновых изданиях, просто еще не вошел в обыденное сознание. И крупные интернет-площадки пока не могут продать все свои рекламные позиции. А это, соответственно, приводит к текущим операционным убыткам.

Если вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter, чтобы сообщить об этом редакции.
powered by lun.ua
Loading...

Корреспондент.net в cоцсетях