Яндекс представил новую технологию ранжирования подсказок
Представители Яндекса рассказали о запуске новой технологии, которая позволяет ранжировать поисковые подсказки таким образом, чтобы они с максимальной эффективностью отвечали текущим интересам пользователей.
В частности, в обычные дни по запросам, начинающимся на «по», людей чаще всего интересует запрос [погода], а в канун 8 марта популярностью пользуются запросы [подарки] и [поздравления]. Совершенно очевидно, что перед 8 марта список подсказок должен быть иным, чем в обычные дни.
Помимо этого, актуальность подсказок зависит от эффективности предугадывания того, о чем пользователи будут спрашивать завтра. Каждый день Яндекс обрабатывает сотни миллионов поисковых запросов. Затем на основе сложных математических моделей происходит автоматический анализ востребованности тех или иных подсказок на следующий день. Для того чтобы сформировать прогноз для всех подсказок (а их общее количество превышает десятки миллионов) Яндекс применяет вычислительные мощности нескольких сотен машин.
Прогноз поисковых подсказок на следующий день формируется при помощи регрессионного анализа, который позволяет вычислить будущее значение величины, основываясь на массиве данных за прошлый период.
Для каждого запроса, который присутствует в базе подсказок, Яндекс строит кривую, отражающую то, как менялась частота запроса за прошлый период. После этого система подбирает функцию, которая максимально точно соответствует построенной кривой. В конечном итоге формируется специальная формула, которая позволяет вычислить, с какой частотой пользователи зададут этот же запрос в ближайшие дни:
На представленном графике видно, что действующая система довольно точно прогнозирует плавные изменения в динамике запросов и немного сглаживает резкие взлеты и падения. С целью достижения максимально высокой точности, Яндекс продолжает постоянные исследования и эксперименты с различными методами прогнозирования.
Напомним, что актуальные поисковые подсказки появились в поиске Яндекса в августе нынешнего года. С тех пор механизм обновления «свежих» поисковых подсказок основывается на статистике - если большое количество пользователей задают один и тот же поисковый запрос, он попадает в список подсказок.
Комбинация действующего статистического механизма с новой технологией ранжирования поисковых подсказок, основанной на регрессионном анализе, позволит пользователям поисковой системы Яндекса сэкономить время на вводе запроса. Поисковик во многих случаях самостоятельно завершит вводимый пользователем запрос до верного.