С нами с 02.01.04
Сообщения: 1246
Рейтинг: 54
|
Добавлено: 08/11/06 в 21:33 |
Работаю c СЕ.. как я знаю в основном все используют джаваредирект на дорах, ну там зашифрованный, в другом файле, и т.п.. я как то старался этого избегать, обычно в ифрейме показываю рекламу, или так пишу скриптом хтмл, баннеры..
Видел несколько топиков что гугл и яху начали читать скрипты, и вроде как редиректы.. и они им особенно не нравятся.
Вопрос возник, как сейчас с этим? Кто нибудь замечал нечто подобное (по идее бан дожнен быстрей происходить), или все пока по старому?
Всем как положено рейтинг
|
|
|
|
С нами с 07.04.03
Сообщения: 139
Рейтинг: 91
|
Добавлено: 08/11/06 в 21:44 |
скрипты поисковики давно уже умеют читать... как думаешь, почему их шифруют?? и уж за редирект по головке особо не погладят...
|
|
|
|
A good rest is half the work
С нами с 09.10.04
Сообщения: 1167
Рейтинг: 602
|
Добавлено: 08/11/06 в 22:01 |
Всё что умеет читать эксплорер, не может быть секретом для гугли. Тут имхо просто мощностей не хватит чтобы ещё и по яваскриптам ползать и по полочкам их разбирать. Скриптов дохрена и если тупо искать чтото похожее на редирект, то в баню отправятся вместе с дорами половина белых сайтов.
|
|
|
|
1К13!
С нами с 07.05.04
Сообщения: 7721
Рейтинг: 2428
|
Добавлено: 08/11/06 в 22:24 |
пока всё ровно
|
|
|
|
С нами с 21.04.01
Сообщения: 666
Рейтинг: 436
|
Добавлено: 08/11/06 в 23:30 |
что касается жавы, далеко ходить не буду,
это код с моего ЛЛ
Код: |
<script type="text/javascript" language="javascript">
<!--
function Rate(id,rating)
{
window.open('/rat'+'e.php?id='+id+'&r='+rating,'','width=10,height=10,toolbars=no,status=no');
self.focus();
alert('Your vote has been added. Thanks.');
return false;
}
function AddFav(id)
{
window.open('/add_favor'+'ite.php?id='+id,'',"width=10,height=10,toolbars=no,status=no");
self.focus();
alert('This link will appear on your personal favorites page. Thanks.');
return false;
}
function Report(rpt,id)
{
desc=window.prompt("What criminal in this link?");
if (desc)
{
window.open('/repo'+'rt.php?id='+id+'&report='+rpt,'',"width=10,height=10,toolbars=no,status=no");
self.focus();
alert('Thanks for helping keep this list clear.');
}
else
alert("Sorry, no reports without description accepted");
return false;
}
-->
</script>
|
гугл в sitemap этого сайта показывает что не может найти
следующие урлы:
хttp://www.omega-porn.com/repo
хttp://www.omega-porn.com/rat
хttp://www.omega-porn.com/add_favor
а теперь посмотрите откуда он это взял.
-------------
доры он банит по редиректу, а не по тому как он организован.
|
|
|
|
С нами с 02.01.04
Сообщения: 1246
Рейтинг: 54
|
Добавлено: 08/11/06 в 23:57 |
Eklmn писал: | что касается жавы, далеко ходить не буду,
гугл в sitemap этого сайта показывает что не может найти
следующие урлы:
хttp://www.omega-porn.com/repo
хttp://www.omega-porn.com/rat
хttp://www.omega-porn.com/add_favor
а теперь посмотрите откуда он это взял.
-------------
доры он банит по редиректу, а не по тому как он организован. |
т.е. он через тулбар определил что редирект? или какой вывод то, не понял че то
|
|
|
|
1К13!
С нами с 07.05.04
Сообщения: 7721
Рейтинг: 2428
|
Добавлено: 09/11/06 в 00:23 |
тулбар тут ни при чём.
гугля глянул в скрипт, увидел простые конструкции и попытался дёрнуть ссылки, которые видит, но так как видит он также, как ботаник без очков, то попытался дёрнуть ссылки типа /rat
|
|
|
|
С нами с 05.10.03
Сообщения: 35
Рейтинг: 20
|
Добавлено: 09/11/06 в 07:41 |
benzole писал: | но так как видит он также, как ботаник без очков, то попытался дёрнуть ссылки типа /rat |
Да нормально он все видит, и по 5 раз шифрованные скрипты разбирает, на юмаксе есть длиннющий топ по этому поводу.
Другое дело, что пока разбор явы никак не влияет на бан.
|
|
|
|
С нами с 21.04.01
Сообщения: 666
Рейтинг: 436
|
Добавлено: 09/11/06 в 10:04 |
бан идет в первую очередь из-за редиректа, определяет скорее всего по тулбару, а если точнее,то по разнице во времени между переходом
с одного урла на другой.
у меня все доры которые без редиректа или с таким редиректом
Код: | <img src="c:\pohuy_shto_tut_budet.gif" onerror="window.open('http://kuda_nado.com/','_top')"> |
целы, так как у постеднего задержка в 1-2сек.
|
|
|
|
www.awm-tools.com
С нами с 28.01.04
Сообщения: 2941
Рейтинг: 3056
|
Добавлено: 09/11/06 в 10:33 |
Ну народ, Вы юмакс почитать не можете? Или мои мессаги еще и здесь запостить?
Там все разжевано по полной. И про выполнение JS пауками и про тулбар.
|
|
|
|
С нами с 05.10.03
Сообщения: 35
Рейтинг: 20
|
Добавлено: 09/11/06 в 11:38 |
Никто не ценит твои труды, к сожалению
|
|
|
|
Милитарист
С нами с 13.01.06
Сообщения: 677
Рейтинг: 569
|
Добавлено: 09/11/06 в 11:40 |
A d u l t писал: | Ну народ, Вы юмакс почитать не можете? Или мои мессаги еще и здесь запостить?
Там все разжевано по полной. И про выполнение JS пауками и про тулбар. |
А скинь, пожалуйста, ссылку! Я чего-то сходу не нашел...
|
|
|
|
С нами с 02.01.04
Сообщения: 1246
Рейтинг: 54
|
Добавлено: 09/11/06 в 15:37 |
A d u l t писал: | Ну народ, Вы юмакс почитать не можете? Или мои мессаги еще и здесь запостить?
Там все разжевано по полной. И про выполнение JS пауками и про тулбар. |
Ага, кинь ссылку пож-ста, тоже не могу найти..
|
|
|
|
www.awm-tools.com
С нами с 28.01.04
Сообщения: 2941
Рейтинг: 3056
|
Добавлено: 09/11/06 в 16:57 |
Топики:
http://www.umaxforum.com/topic/12/16661/
http://www.umaxforum.com/topic/17/15785/
Цитата: | есть страница с примерно следующим ява-кодом.
Code Sample
<script>
crypted = "LJKHDes97856rasdfh ... ru9A8YDWE45W98FWE";
js = decrypt1(decrypt2(decrypt3(decrypt4(decrypt5(crypted)))));
document.write("<script>"+js+"</script>");
function decrypt1(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом1 и возвращающий строку из матрицы)
}
function decrypt2(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом2 и возвращающий строку из матрицы)
}
function decrypt3(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом3 и возвращающий строку из матрицы)
}
function decrypt4(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом4 и возвращающий строку из матрицы)
}
function decrypt5(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом5 и возвращающий строку из матрицы)
}
</script>
В итоге на экран выводится ссылка в виде картинки размером 1x1 на страницу типа http://url/test.php?flag=KS7fysdSAFH9s (flag формируется специальным образом на основе IP адреса). Поверх картинки выводится лейер с текстом.
Скрипт test.php кладет базу все запросы.
Параметр flag сделан для того, чтобы отлавливать глюк с гуглбаром: Если пользователь случайно все-же попадет по этой ссылки, то в параметре flag будет зашифрован его IP, Соответственно потом гугл (взяв инфу из гуглбара) запросит этот адрес с параметром flag, в котором зашифрован IP адрес посетителя. В результате получим несовпадение IP адреса, с которого запрос и IP адреса, зашифрованного в flag. Значит гугл взял ссылку из гуглбара, иначе гугл нашел ссылку сам.
Все алгоритмы дешифрования строятся не только на простых арифметических действиях, но и на работе с объектами(Например в JS создаем текстовое поле, из которого читаем некоторое значение в следующей функции дешифрования. Неверная работа приводит к некорректному дешифрованию).
На страницу с данным яваскриптом ставилась одна ссылка с одного ресурса с пр2.
В итоге из живых людей на странице с яваскриптом и на странице с test.php никого небыло, из ботов на странице с яваскриптом был много кто, на странице test.php с корректным совпадением IP и flag - были Google и MSN.
С некорректным совпадением IP и flag никого небыло.
Период тестирования - 2 недели. |
Цитата: | Google Bot IP: 66.249.65.71, 66.249.66.135, 66.249.66.203
MSN Bot IP: 131.107.0.96 |
Цитата: | Общая теория определения типов сайтов(дорвей/белый/etc) выглядит так:
Существует некий коэффициент, который включает в себя многие параметры.
Например(не факт):
- бонусность хостинга
- доменная зона
- whois-данные
- страна расположения хостинга
- количество бэков
- процентное соотношение бэквордов в бэках
- процент ключевых слов
- процентное соотношение тэгов в документе
- исходящие ссылки документа
- как часто кликают пользователи в выдаче гугла по этому сайту
- как часто пользователи с гугл-баром посещают данный сайт
- тематическая направленность контента на странице
- коммерческая направленность сайта (например хомепага дяди Васи с соседней квартиры - 0%, а сайт amazon.com - 100%)
- и т.д.
Вообщем математиков у гугла достаточно, чтобы грамотно формировать этот коэффициент (помните объявление гугла о наборе на работу в виде математической формулы?)
Затем на основе этого коэффициента идет разложение сайтов по полкам.
Например есть интервал значений коэффициента, который соответствует белым сайтам, дорам и т.д. Ошибки конечно не исключены, но благодаря стараниям математиков они приблизились к 90%-95%(например) точности.
А вообще скорее всего это выглядит так:
К, примеру, 99% сайтов лежат в определенном интервале коэффициентов, тогда как 1% сильно отличается от этого. Специалисты гугла специально интересуются необычными сайтами. Они делают это специально для поиска новых и необычных решений, для отлаживания механизма и т.д. В этот 1% попадают также наши дорвеи, поэтому поиск и бан дорвеев - это побочный продукт деятельности этой команды специалистов.
В результате бан дорвеев - это неожиданная полезная находка для гугла. Вышло так же, как и с песком для новых доменов, когда сами специалисты гугла случайно столкнулись с таким поведением поисковой машины - как песок и решили его оставить.
PS: На традиционный вопрос "Что делать" - отвечу: делать дорвеи такими же, как и обычные сайты. Тоесть модернизировать генераторы. |
Цитата: | Что же касается гугл-бара, то всю свою информацию он отсылает и получает по HTTP протоколу, поэтому словить ее не составляет труда.
Специально для параноиков:
Ставим прогу ETHEREAL (снифер траффика на компе), далее запускаем и слушаем траффик, отсылаемый гугл-баром. Те, кто обладает хоть какими-то знаниями в области TCP протоколов, сразу увидят, что отсылает гугль-бар.
А отсылает он следующее:
1. Каждый раз, когда в адресной строке меняется адрес, гугл-бар отсылает запрос на получение PR'а. В этом запросе указан URL сайта, взятый из адресной строки. Тоесть гугль знает, где ходит пользователь и с каим интервалом перемещается по сайтам.
2. Периодически отправляется запрос на сервер гугля за новой версией тулбара.
ЭТО ВСЕ. БОЛЬШЕ НИЧЕГО НЕ ОТПРАВЛЯЕТСЯ.
В данной ситуации вполне может быть, что гугль берет статистику посещений пользователей с тулбарами по конкретному сайту и видит, что пользователи на данном сайте долго не задерживаются - это один из факторов того, что это может быть дорвей. |
|
|
|
|
С нами с 21.10.05
Сообщения: 55
Рейтинг: 64
|
Добавлено: 10/11/06 в 05:55 |
Eklmn писал: |
...
-------------
доры он банит по редиректу, а не по тому как он организован.
|
прям. сделай доры без редиректа, вообще без всего, без ифрейма, фрейма и всяческих аффилейт ссылок - и потом делай такие строгие выводы. а то сказал - как отрезал. только не в тему =)
джаваскрипт читает, согласен, тесты показали - вполне себе переходит. не факт что читает бот, а например не тулбар, но факт остается фактом. что делать дальше ? думать =) на то СЕ всегда и было самой замороченной специальностью из всех, что подразумевает генерацию трафика.
|
|
|
|
Злостный выхухоль
С нами с 07.04.03
Сообщения: 4636
Рейтинг: 3207
|
Добавлено: 11/11/06 в 07:49 |
separtners писал: | прям. сделай доры без редиректа, вообще без всего, без ифрейма, фрейма и всяческих аффилейт ссылок - и потом делай такие строгие выводы. а то сказал - как отрезал. только не в тему =) |
Во-во. +1
|
|
|
|