Реклама на сайте Advertise with us
Новости
Статьи
Поисковые системы
Дизайн и Юзабилити
Законы / Финансы
Маркетинг
Порно контент
Ниши и психология
Партнерские Программы
Траффик-Менеджмент
Сервисы
Программинг
Софт и Скрипты
Хостинг / Железо
Интервью
Веб камеры
Путешествия
История секса
Форум
FAQ
Каталог
Опросы
Участники

CТАТЬИ Статьи

Раздел: Поисковые системы

Версия для печати

Патент Google: Ранжирование блог-документов. Часть 2



Отрицательные индикаторы качества блог-документа определяются на этапе «шаг 630». Это может быть частота добавления новых постингов в блог-документ, содержание постингов в блог-документе, размер постингов в блог-документе, распределение ссылок блог-документа и наличие рекламных объявлений в блог-документе. Допустимо использование и других индикаторов.

Частота добавления новых постингов в блог-документ может использоваться в качестве отрицательного индикатора качества этого блог-документа. Обычно фиды содержат только самые последние постинги в блог-документ. Спаммеры генерируют новые постинги пакетами (т.е., множество новых постингов появляется в течение короткого промежутка времени) или в течение предсказуемых интервалов (один постинг в 10 минут, или постинг каждые 3 часа на 32 минуте). Оба сценария связаны с недобросовестными намерениями, и могут использоваться для обнаружения потенциальных спаммеров. Таким образом, если частота добавления новых постингов в блог-документ вписывается в предсказуемый алгоритм, это может стать отрицательным индикатором при оценке качества блог-документа.

Контент постингов в блог-документе может стать отрицательным индикатором качества этого блог-документа. Фид обычно содержит некоторую часть или весь контент нескольких постингов из данного блог-документа. Сам блог-документ также содержит контент постингов. Спаммеры могут помещать одну из версий своего контента в фид, чтобы улучшить его ранкинги в результатах поиска, при этом сам блог-документ будет содержать другую версию контента (к примеру, ссылки на нерелевантные объявления). Несоответствие (между фидом и блог-документом) может стать отрицательным индикатором качества блог-документа.

В некоторых случаях контент может дублироваться в нескольких постингах блог-документа, в результате чего в нескольких фидах будет содержаться один и тот же контент. Подобное дублирование свидетельствует о низком качестве/спамовости фида и может стать отрицательным индикатором качества блог-документа.

Слова/фразы, используемые в постингах блог-документа, также могут стать отрицательным индикатором качества этого блог-документа. К примеру, из коллекции блог-документов и фидов, которые были оценены редакторами как спам, может извлекаться список слов и фраз (биграмм, триграмм, и т.д.), которые часто появляются в спам-контенте. Если блог-документ имеет высокое содержание слов или фраз из этого списка, подобное может стать отрицательным индикатором при оценке качества блог-документа.

Размер постингов в блог-документе может стать отрицательным индикатором качества блог-документа. Зачастую автоматические генераторы постингов создают многочисленные постинги одинаковой или очень мало различающейся длины. В результате распределение размеров постингов может использоваться как надежный критерий для оценки спамовости. Когда блог-документ содержит множество постингов одинаковой или очень схожей длины, это может стать отрицательным индикатором при оценке качества блог-документа.

Распределение ссылок в блог-документе может стать отрицательным индикатором качества блог-документа. Как указывалось ранее, некоторые постинги создаются для увеличения PageRank отдельного блог-документа. В некоторых случаях, большой процент всех ссылок с постинга или с блог-документа указывают на отдельную веб-страницу или на отдельный сторонний сайт. Если количество ссылок на сторонний сайт превышает некоторый предел, это может отрицательно сказаться на качестве блог-документа.

Наличие рекламных объявлений в блог-документе может стать отрицательным индикатором качества блог-документа. Если блог-документ содержит большое количество объявлений, это может отрицательно сказаться на качественной оценке этого блог-документа.

Блог-документы, обычно, содержат три типа контента: контент в виде недавних постингов, блог-лист, и блог-метаданные (т.е., данные об авторе, другая уместная информация о блог-документе и его авторе). Рекламные объявления, если таковые присутствуют, обычно размещаются в разделе метаданных блога, или возле раздела блог-ссылок. Наличие объявлений в разделе недавних постингов может стать отрицательной характеристикой блог-документа.

05.05.07
Источник: uspto.gov.
Автор: Google. Перевод: Seva.

Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us