Не так давно Google опубликовал шесть новых заявок на патенты, которые связаны с персонализацией и предоставляют способы сбора информации от пользователя поисковой системы. Информация эта призвана упростить предоставление результатов поиска, в большей степени соответствующих нуждам пользователя, чем при неперсонализированном поиске. Вот ссылки на эти документы:
Заявки на патенты детально рассматривают работу системы персонализации, и если вы обратитесь к
Персонализированному Поиску Google (Google’s Personalized Search), то обнаружите в действии некоторые процессы, обсуждаемые в этих патентах. Однако о некоторых аспектах процессов, описываемых в патентах, довольно сложно сказать наверняка – введены ли они в действие, или еще нет.
В лучшем случае, общение пользователя с компьютерным поиском может быть улучшено:
- если предоставить ему возможность наблюдать результаты своей предыдущей поисковой и навигационной деятельности, и
- если позволить ему использовать предоставленную информацию для улучшения результатов поиска
Не вдаваясь в детали упомянутых патентов, я остановлюсь на двух наиболее интересных аспектах – типы собираемой и используемой в системе информации, и каким образом эта информация может быть использована для пересчета ранкинга поисковых результатов.
Типы собираемых данных и их использование
Рассматриваемая система собирает и хранит информацию в пользовательской базе данных, и может включать в себя следующие типы данных:
- отправленные поисковые запросы
- клики на страницах с результатами поиска
- клики на объявлениях, показанных на страницах с результатами поиска
- другие информационные единицы, выбранные на страницах с результатами поиска
- история навигации
- клики на объявлениях, размещенных на просматриваемых страницах
- просмотр обзоров продуктов и другая навигационная деятельность, или
- другая деятельность во время использования:
- службы мгновенных сообщений
- чат-комнат
- e-mail
- создания и редактирования документов
- любые стандартные действия с файловой системой - в данном документе мы будем называть их «первостепенными действиями»
Из собранной подобным образом информации можно получать некоторые дополнительные сведения, путем создания так называемой «производной» информации. К примеру, если отмечалась дата посещения страницы пользователем, и вы посчитали количество дней, прошедших с момента посещения до настоящего времени - это количество дней будет самой настоящей «производной» информацией.
Историческую и производную информацию можно рассматривать под разными углами, используя их для изменения эффективности поиска и навигации.
Один из моментов, на который я обратил внимание – это использование прошедших действий для предсказания будущих намерений. Например, предпочтения пользователя в отношении веб-сайтов и документов в сети.