С Яндексом по стране

Внимание пассажиров тура “Магадан-Москва”, объявляется посадка на рейс Магадан-Находка, просьба пройти на регистрацию. Генеральный спонсор полета - компания Яндекс.

Весьма примечателен тот факт, что с декабря 2007 уже произошло 4 изменения/обновления поискового алгоритма Яндекса. В скором времени ожидает еще один. Таким образом, в среднем каждые 2 месяца Яндекс проводит обновления. Причем в декабре мы увидели лишь 8-ю версию поискового алгоритма. Т.е. до этого, за 10 лет было разработано и внедрено лишь 7. А сейчас за неполный год мы увидим уже 3. Пользователи не успевают привыкнуть к одной версии, как ее сменяет другая. Спрашивается - почему такая гонка, какой в этом смысл? Зачем тратить столько сил и времени на разработку 8-й версии или Магадана и их обновление, если через считаные месяцы они канут в небытие. Ведь можно было сразу разрабатывать Находку и сделать это быстрее, направив на нее все усилия. Но имеем то, что имеем, а значит в этом есть свой смысл. Попробуем его понять.
Отличительной особенностью новых поисковых алгоритмов является технология машинного обучения (о которой не без гордости говорит Яндекс), когда алгоритм формирования поисковой выдачи настраивается по параметрам выборки релевантных сайтов и донастраивается с учетом обратной связи пользователей. Т.е. если раньше поисковый алгоритм ассоциировался с некой фиксированной математической моделью, то сейчас он подобен живому, развивающемуся организму. Потенциально такой подход позволяет учитывать на порядок большее число факторов ранжирования, что мы и наблюдаем. Но подобное усложнение имеет и обратную сторону - возможная непредсказуемость результатов. Выражается это появлением в выдаче некачественных или низкорелевантных сайтов. Именно поэтому внедрение, отладка и развитие технологии может поисходить только поэтапно, с постепенным наращиванием числа факторов ранжирования. Именно эти этапы, в виде версий поискового алгоритма мы и наблюдаем.

Здесь немаловажным будет упомянуть о том, что классическая формула релевантности, предложенная Сергеем Людкевичем, фактически уже перестала работать, стала частью истории. Хотя большинство оптимизаторов в своем анализе изменений по прежнему пытаются рассуждать о “смещении” приоритетов в сторону контента или ссылочного. Пора об этом забыть, все факторы теперь работают во взаимосвязи. Абсолютистская роль ссылочного тоже уходит в прошлое, хотя даже товарищи из небезизвестной всем оптимизаторской конторы почему-то об этом не задумываются. Но Находка все расставит на свои места.

Но это все в общем-то на поверхности, видно невооруженным глазом. Куда интереснее ответить на вопрос - какова конечная цель развития этой технологии? И думаю неслучайно первая “городская” версия была названа Магаданом, так ведь, Александр? ;) Рискну предположить, что следующие географические версии выберутся наконец с Дальнего востока, пройдя транзитом через Сибирь и Урал доберутся наконец до столицы. Сколько на это потребуется времени? Дайте угадаю… два года? Но нас в общем-то интересует не географическая цель, а алгоритмическая.
Прежде всего новая модель обучения должна позволять обрабатывать и строить модели релевантности на тысячах факторов. И вполне очевидно, что Яндекс именно на это ориентируется. Но из классических моделей можно получить лишь несколько сотен факторов, не думаю, что больше. Возникает резонный вопрос - где получить еще? Ответ напрашивается сам собой: в глубине и многообразии естественного языка. Именно это видится конечной целью “путешествия” Яндекса через всю Россию - внедрение семантического(смыслового) анализа содержания сайта и запросов пользователей. Причем в первую очередь приоритет будет отдан анализу содержания сайтов.

Чем это грозит оптимизаторам? Прежде всего… впрочем, это тема для отдельной статьи.

В заключение хочу отметить интересный факт, что сама технология машинного обучения заимствована из технологий искусственного интеллекта. А в прошлом году об исследованиях в этой сфере говорил Google. Что-то мне подсказывает, что сейчас идет напряженная гонка со временем, кто первый придет на финиш - получит все.

5 Responses to “С Яндексом по стране”

  1. Дмитрий пишет:

    Мне кажется, пока существует живой язык с его многозначностью, адекватного поиска добиться будет сложно.
    Вводит пользователь Opel Zafira. Что он хочет? Цены узнать, посмотреть отзывы или почитать про краш-тест?
    Единственный вариант - выводить пользователю ссылки на разные сайты, где в одном говориться про одно, в другом - про другое.

  2. aka352 пишет:

    Дмитрий, согласитесь, ситуация, когда пользователь прямо не сообщает о том, что ищет - ненормальна. Изменение поискового поведения пользователей - еще одна большая задача и думаю Яндекс ею также будет заниматься, когда придет время.

  3. Дмитрий пишет:

    Мне кажется, в условиях все ускоряющегося ритма жизни пользователю будет не до изучения Яндекса и языка поисковых запросов в частности :)
    А вообще да - с самим пользователем тоже надо работать

  4. StalkeR пишет:

    бредятина это всё

    а если я хочу получить 50 сайтов с ценами чтобы их сравнить? с каждой страницы нужно будет выбирать по 1-му результату?

  5. Sento пишет:

    Дмитрий, развиваться нужно не только поисковым системам, но и людям ;)
    Вводите “Опель зафира купить”
    “Опель зафира краш-тест”
    И т.д. Учитесь правильно работать.
    По теме - Магадан-2, как по мне, был куда лучше находки.

Оставить комментарий