Из гугла утекло руководство для асессоров, которые, опираясь на этот 125-страничный документ, рассматривают результаты поиска по разным запросам и определяют, насколько тот или иной сайт релевантен и необходим для пользователей.
Полный текст
Оценка сайтов ассесорами
Первые страниц 30 не представляют особого интереса – там приводятся основы работы поиска и некоторые примеры для асессоров для оценки ресурсов. Из этого текста полезной может оказаться только следующая информация:
Асессоры оценивают страницы (обратите внимание, именно страницы, а не домены), а затем присваивают им определенный рейтинг, который зависит от качества этих страниц, а именно, сайту могут присвоить одно из значений рейтинга:
•Vital – особая категория рейтинга, присваивается страницам в специальных ситуациях. Используется в тех случаях, когда поисковый запрос может иметь несколько значений, причем одно из значений заметно преобладает над другими. Только в этих случаях страницам может быть присвоен рейтинг «Vital». К примеру, англоязычный запрос apple может иметь как минимум 2 значения – яблоко и компания apple. Но люди гораздо чаще, вводя этот запрос, имеют в виду компанию, а не фрукт. Вот таким страницы и получают это значение рейтинга.
•Useful – релевантная страница, которая может быть полезна для большинства посетителей, попавших на эту страницу из поиска по конкретным запросам.
•Relevant – релевантная страница, которая может быть полезна для многих или некоторых пользователей.
•Slightly Relevant – слегка соответствующая страница. Страница, которая не очень полезна для большинства пользователей, но немного связана с запросом. Некоторые пользователи могут найти в ней необходимую информацию.
•Off-Topic (Useless) – нерелевантная/бесполезная страница. Она полезна слишком малому количеству людей, либо никому.
•Unratable – страница, которую нельзя оценить. Такой рейтинг могут получить страницы, которые не загрузились при посещении асессором, на которых есть вредоносное ПО и программное обеспечение об этом преджупреждает, либо страницы на языке, с которым асессор не знаком.
Кроме одного из этих значений, особым типам страниц могут быть присвоены различные метки:
1. Спам-метки
•Spam – если страница имеет признаки спама, то ей присваивается эта метка.
•Not Spam – если вы видите, что страница выглядит вполне адекватно и не имеет признаков спама, то ей присваивается эта метка.
•Maybe Spam (Возможно, спам) – если асессор сомневается при выборе одной из меток этого типа и есть подозрения, что это спам-страница, то он присваивает ей эту метку.
2. Порно-метки
Все страницы, содержащие порно-контент любого типа (изображения, текст, видео, всплывающие окна, текст) считаются порнографическими. Но асессоров просят обращать внимание на особенности культуры определенных стран – в одной стране что-то может считать порнографией, а в другой нет. Каждой странице по особым запросам присваиваются метка «Porn» или «Not porn».
Clear Non-Porn Intent (очевидные не порнографические запросы). Эти страницы с порно-контентом все получают метку «Porn», если пользователь попадает на нее по очевидным не порно запросам. В качестве примера приводится запрос «фотографии автомобилей». Если на фото будет изображена голая/обнаженная девушка на капоте автомобиля, то этой странице поставят метку «порно», хотя на картинке есть машина. Называются 2 причины:•Пользователь искал явно не порно, поэтому этот результат можно рассматривать как бесполезный.
•Многие пользователи считают наличие порно в выдаче по не порно запросам показателем плохого качества поиска.
Possible Porn Inten (возможные порно запросы). Некоторые запросы имеют порно и не-порно интерпретации. К примеру, в следующих англоязычных запросах, возможно, могут иметь место порно-намерения: [girls], [gay], [thong], [breast], [sex], [spanking]. Такие запросы называются Possible Porn Inten. Асессоры в подобных запросах должны считать не-порно намерения преимущественными и помечать страницы с порно-контентом меткой «Porn».
Clear Porn Inten (очевидные порно запросы). Явные порнографические запросы обязательно оцениваются по шкале релевантности (которую я приводил в начале), но все равно все получают метку «Porn». Страницы с вредоносным ПО в любом случае должны иметь низкие позиции, даже если на них есть релевантный контент – это задача для асессоров.
Reporting Illegal Images (жалобы на незаконные изображения). На все страницы, на которых содержится детская порнография/зоофилия и др. виды извращений от асессоров поступают жалобы своим работодателям. Все сцены, в которых особое внимание обращается на половые органы или есть откровенные сексуальные моменты, при этом асессору трудно определить, есть ли ребенку 18, считаются детским порно.
3. Метки вредоносности•Страницам присваивается метка «Malicious» если:
•Вы вынуждены закрыть браузер из-за всплывающих окон, которые не закрываются. Если после нескольких попыток не получается закрыть всплывающее окно страница получает метку «Malicious».
•Была обнаружена попытка загрузки вредоносных программ.
Обратите внимание, что страницам, на которых появилось окошко браузера с предупреждением о вредоносных программах, не присваивается флаг «Malicious». Эти страницы получают рейтинг Unratable (страница не загрузилась).
Ранжирование по гео-зависимым и гео-независимым запросам
Основные тезисы:•Полезные для пользователей страницы по гео-зависимым запросам должны иметь более высокие позиции.
•Страницы, которые могут быть полезны пользователям по гео-независимым запросам должны также иметь высокие позиции.
•По запросам, в которых пользователи ищут определенные местные объекты (предприятия, организации, школы) официальные сайты/страницы этих объектов будут получать наивысшее значение рейтинга.
•Если сложно определить, является ли запрос гео-зависимым, то страницы ранжируются как гео-независимый.
Типы поисковых запросов
•Большинство запросов могут быть классифицированы как информационные и навигационные, но есть и другие виды запросов.
•Именные запросы - когда пользователи ищут какую-то информацию по именам и названиям объектов: знаменитых людей, географические места, компании и бренды, книги, события и т.д.
•Транзакционные запросы – вводя подобные запросы пользователи хотят что-то сделать, к примеру, скачать, посмотреть, купить, играть в онлайн-игры, распечатать что-то и т.д.
•Информационные запросы – при вводе подобных запросов пользователи хотят найти информацию, хотят узнать что-то.
•Запросы, в которых ищут списки. Часто, лучшими результатами в выдаче на эти запросы могут стать страницы со списками полезной для пользователей информации. Вот примеры подобных запросов: банки, курсы валют, велосипеды, отели и т.д.
Руководство по поисковому спаму
Страницы, нахождение на которых раздражает, у которых контент низкого качества, которые имеют большое количество всплывающих окон и рекламы не обязательно являются спамом.
Наличие меток «Спам» не зависит от релевантности контента запросу. Страница может быть полезной для пользователей, но на ней используются приемы поискового спама. Это значит, что по шкале оценки сайтов ее можно оценить как «релевантная», но метку «спам» в любом случае необходимо присвоить.
Метка «спам» присваивается страницам, которые созданы только для заработка денег, а пользователям не несут никакой полезной информации.
Виды спама и технические признаки:•Скрытый текст и скрытые ссылки. Признаки: невидимый невооруженным глазом текст, текст, который имеет цвет фона, текст, размещенный за пределами области просмотра (к примеру, могут быть большие пробелы между основным контентом и контентом для поисковых систем).
•Чрезмерное содержание ключевых слов. Признаки: ключевые слова повторяются много раз на странице, немного неверное написание ключевых слов, частое повторение фраз, связанных с ключевыми словами. Метку «Спам» могут получить страницы, на которых, по мнению асессора, слишком частое употребление ключевых слов, которое может отвлекать или раздражать пользователей.
•Скрытое перенаправление. Перенаправление с одной страницы одного домена на другой домен – это плохо, такие сайты надо помечать как «спам». Перенаправление в пределах одного домена – это нормально.
•Клоакинг с перенаправлением через JavaScript и 100% фреймы. Один из методов спамеров по маскировке контента. Пользователям и поисковым системам показывается разный контент. Помечать меткой «Спам».
Отличия между спам и не-спам страницами
Если страница полезна для пользователей и содержит объявления PPC – это не спам.
Примеры полезного для пользователей контента:•Сравнение цены и технических характеристик товара. Некоторые сайты сравнивают параметры товаров, в частности, его цену. Даже если пользователю нужно кликнуть по партнерской ссылке, чтобы разместить заказ, такие страницы не являются спамом. Сравнение цены – это всегда полезная информация.
•Отзывы о продуктах. Реальные отзывы людей о каких-то товаров, которые помогут пользователям принять решение о покупке или об отказе от нее – также полезная информация.
•Текст, цитаты пословицы. Если страницы предназначены для того, чтобы помочь пользователям найти тексты песен, стихов – это не спам.
•Контактная информация. Страницы, которые содержат реальные контактные данные компаний не являются спамом.
•Купоны, скидки. Этот тип контента также является полезным для посетителей.
Страницы с копированным контентом и PPC-объявлениями
Даже если вебмастера, которые скопировали контент с других сайтов, ссылаются на первоисточники, это все равно считается копированным контентом. Если страница с копированным контентом создана для того, чтобы заработать на рекламных объявлениях, то ее нужно помечать как «Спам».
Страницы с PPC-объявлениями и контентом из RSS
Страницы, на которых содержится только контент с открытых RSS лент и размещены PPC-объявлениями считаются спамом.
Блоги-фейки, фейковые доски-объявлений
Блоги-фейки, фейковые доски-объявлений, созданные для того, чтобы заработать на рекламе – это спам.
Внимание, просьба к асессорам:
Цитата:
Мы не хотим наказывать блоги и доски, на которых кто-то опубликовал спам. Если вы видите, что блог/доска хорошая, то, пожалуйста, не отмечайте их меткой «Спам».Признаки качественных сайтов с рекламой•Страницы хорошо структурированы. Объявления могут быть, но они расположены в удобных местах и не отвлекают от чтения контента.
•Если проверить страницу на уникальность, к примеру, проверив одно предложение в поиске, то, как правило, качественный сайт будет на первой позиции по этому запросу.
•Страница полезна и интересна для пользователей.
•На популярных сайтах к статьям есть большое количество комментариев – это хороший признак качественного сайта.