Реклама на сайте Advertise with us

Как своими скриптами детесктить ботов?

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:

📈sflash.biz

С нами с 03.11.12
Сообщения: 3913
Рейтинг: 4447


Передовик Master-X (16.04.2018) Передовик Master-X (16.07.2018) Передовик Master-X (16.12.2022) Передовик Master-X (01.01.2023)
Ссылка на сообщениеДобавлено: 08/04/16 в 19:08       Ответить с цитатойцитата 

Имеется ввиду хотябы поисковых ботов, всякого рода граберы тумб тех же CJ скриптов и прочих?

0
 

www.phpdevs.com

С нами с 24.10.02
Сообщения: 16633
Рейтинг: 16105


Передовик Master-X (01.09.2005) Передовик Master-X (16.09.2005) Передовик Master-X (01.10.2005) Передовик Master-X (16.08.2006) Передовик Master-X (16.10.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 08/04/16 в 21:24       Ответить с цитатойцитата 

Куки от javascript не хватают. Ну большая часть в общей мере.

Пишу на php/mysql/django за вменяемые деньги.
Обращаться в личку.

8
 



С нами с 16.06.12
Сообщения: 8470
Рейтинг: 313

Ссылка на сообщениеДобавлено: 09/04/16 в 02:56       Ответить с цитатойцитата 

в плане SE ботов, чекеров, парсеров, краулеров и граберов тумб, можно проверять на
no images
no cookie
no js
no flash
HTTP_ACCEPT_LANGUAGE смотреть у se бота наверное один язык там. я предполагаю.
так же не думаю, что рефы, такие боты передают, хотя bind высвечивается, только только скрипт установишь и диз натянешь, уже появляется, в гугль то же браузер стучит.
ну и в user agent - искать соответствующие маркеры, выдающие поисковик.
Если бы был большой пул, данных по поисковым ботам, которые можно, по $_server снять, можно было бы выявить закономерность.
Ну и блексео в помощь, должны в открытом доступе, клоак скрипты быть, где можно, много идей позаимствовать.

8
 

💀💀💀

С нами с 31.05.10
Сообщения: 4689
Рейтинг: 728

Ссылка на сообщениеДобавлено: 09/04/16 в 05:44       Ответить с цитатойцитата 

для сео ботов есть отличнейший класс:
https://github.com/JayBizzle/Crawler-Detect

8
 



С нами с 06.07.15
Сообщения: 110
Рейтинг: 171

Ссылка на сообщениеДобавлено: 10/04/16 в 13:33       Ответить с цитатойцитата 

правильные боты загрузят только указанный .css icon_cool.gif

Последний раз редактировалось: IgorZ (17/01/18 в 11:57), всего редактировалось 1 раз

8
 



С нами с 16.06.12
Сообщения: 8470
Рейтинг: 313

Ссылка на сообщениеДобавлено: 10/04/16 в 14:35       Ответить с цитатойцитата 

gcc: а как мониторить загрузку .css файлов? в какую сторону копать? jquery? Так то при таком варианте, достаточно знать будет ip и домен с которого пришел этот ip. И уже по % ip загрузивших нужный file1.css выделять хороших трейдеров или по % загрузивших оба или не загрузивших не одного, относительно к общему кол. трафа с этого домена выявлять % ботов так я понял?

0
 



С нами с 06.07.15
Сообщения: 110
Рейтинг: 171

Ссылка на сообщениеДобавлено: 10/04/16 в 15:36       Ответить с цитатойцитата 

Int13h: Я добавлял в .hatccess флаг php для конкретно контрольных css. Можно их и постфактум в логах считать при ротации например.

Остальное прмерно так, да.

Цитата:
загрузивших оба или не загрузивших не одного, относительно к общему кол. трафа с этого домена выявлять % ботов


Метод 10-летней давности если что icon_smile.gif но работает и сейчас частично..

9
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »