Реклама на сайте Advertise with us
Тема: Гугл парсит <form> Расширенный поиск по форуму
 
Внимание! В связи с устареванием топика эта страница была взята из кэша.
Автор Сообщение
Информация о пользователе bleed


Зарегистрирован: 19.02.03
Сообщения: 282
Ссылка на сообщениеДобавлено: 31/03/04 в 07:43     

Сабж.
знаю, что яндекс парсит тэг форм, т.е. идет по урлу в поле action и подставляет дефолтные значения переменным,
а гугл так делает? пока по логам не видел, но все ровно очь интересно знать

K началу

 
Информация о пользователе Gary


Зарегистрирован: 25.12.99
Сообщения: 664
Ссылка на сообщениеДобавлено: 31/03/04 в 11:56     

нет, нету в гугле такого

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 31/03/04 в 12:14     

скажем так пока нету.
У них какой-то тестовый бот новый. Х/З чего он делает.

K началу

 
Информация о пользователе Erotix


Зарегистрирован: 19.04.03
Сообщения: 956
Ссылка на сообщениеДобавлено: 31/03/04 в 18:02     

bibigon писал:
скажем так пока нету.
У них какой-то тестовый бот новый. Х/З чего он делает.


а у меня впечатление , что у него несколько ботов ... один листит .... другой банит ... третий картинкаи балует ... и т.д.

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 31/03/04 в 18:32     

ботов то однозначно несколько.
Один жрет, другой проверяет изменения, третий собирает картинки, четвертый проверяет по адвордсам какую-то хуету..

а вот что за гуглебот "тест" новый Х/З

K началу

 
Информация о пользователе Xrenoder


Зарегистрирован: 14.09.00
Сообщения: 634
Ссылка на сообщениеДобавлено: 31/03/04 в 20:12     

Совершенно 100% парсит. Чистый эксперимент специально ставился.

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 31/03/04 в 22:07     

Xrenoder
о как! не знал, спасибо.

Есть у меня еще подозрения, что он даже и из явы-скрипт выкусывает урлы. Причем, возможно, что даже из вынесенных из страницы в отдельный файл.
На одном домене не так давно бот нарисовася. А на него ссылок нет иных, хотя может и по логам чьим-нибуть добрался.. кароче Х/З

K началу

 
Информация о пользователе Gary


Зарегистрирован: 25.12.99
Сообщения: 664
Ссылка на сообщениеДобавлено: 31/03/04 в 22:14     

bibigon писал:
..
На одном домене не так давно бот нарисовася. А на него ссылок нет иных, хотя может и по логам чьим-нибуть добрался.. кароче Х/З

у тебя гуглбар стоит? есть подозрение что он также через него адреса страничек собирает.. или через dns на новые домены выходит..

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 31/03/04 в 22:21     

Gary
как же без бара то? icon_smile.gif
Согласен со всеми твоими мыслями, меня они тоже посещали.

Яховский бот жрет ява-скрипт тока так. Неуверен про кодированный, но вот вынесенный в отдельный файл легко!

K началу

 
Информация о пользователе pornovoyager


Зарегистрирован: 23.03.03
Сообщения: 46
Ссылка на сообщениеДобавлено: 31/03/04 в 23:10     

bibigon писал:
Xrenoder
о как! не знал, спасибо.
Есть у меня еще подозрения, что он даже и из явы-скрипт выкусывает урлы. Причем, возможно, что даже из вынесенных из страницы в отдельный файл.
На одном домене не так давно бот нарисовася. А на него ссылок нет иных, хотя может и по логам чьим-нибуть добрался.. кароче Х/З


Да урлы выкусывает и даже ПР передает

K началу

 
Информация о пользователе bleed


Зарегистрирован: 19.02.03
Сообщения: 282
Ссылка на сообщениеДобавлено: 01/04/04 в 05:18     

bibigon писал:

Яховский бот жрет ява-скрипт тока так. Неуверен про кодированный, но вот вынесенный в отдельный файл легко!
А как бот та называется, чтобы в логах за ним поноблюдать?
и яву он хорошо знает? если я урл перехода так замучу не просто как window.location('http://url.com') а как нибуть покруче интересно пролезет? icon_smile.gif

K началу

 
Информация о пользователе bleed


Зарегистрирован: 19.02.03
Сообщения: 282
Ссылка на сообщениеДобавлено: 01/04/04 в 05:51     

Хотя что то не вериться что яваскрипт берут, просто если подумать все это геморно для бота, нагрузки большие, да и ява скрипты разные по навороченности бывают...
да и про тег форм пока точно не уверен, по логам смотрю, форму никто не сабмитил из ботов.

Просто надо сделать линки с сайта на внешние урлы, чтобы гугл их не воспринял, тепеерь думаю может на флэше сделать, там та точно пока 100% уверенность, хотя флэш наверное не у всех юзеров покатит.

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 01/04/04 в 09:59     

Флеш гугла как раз уже дааавно считает, как и линки с него.

K началу

 
Информация о пользователе bleed


Зарегистрирован: 19.02.03
Сообщения: 282
Ссылка на сообщениеДобавлено: 01/04/04 в 22:18     

bibigon писал:
Флеш гугла как раз уже дааавно считает, как и линки с него.

вот здесь просто так не соглашусь, врятли гугл парсит сам swf файл, это большой гемор для него, да и никогда не видел в логах чтобы гугл обращался к нему.
Да, он берет линки которые есть во флэше но не из swf а из самого хтмл-я, вот в кач примера сделал тестовый мувик во флэше (кнопка с сылкой на яндекс) при компиляции флэш создает хтмл:
Код:

<!-- URL's used in the movie-->
<div align="center"><A HREF=http://www.yandex.ru></A>
<!-- text used in the movie-->
<!--Loading... www.yandex.ru fucking search engine -->
<OBJECT classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=5,0,0,0" WIDTH=640 HEIGHT=320>
<PARAM NAME=movie VALUE="intro.swf">
<PARAM NAME=quality VALUE=high>
<PARAM NAME=bgcolor VALUE=#FFFFFF>
<EMBED src="intro.swf" quality=high bgcolor=#FFFFFF  WIDTH=640 HEIGHT=320 TYPE="application/x-shockwave-flash" PLUGINSPAGE="http://www.macromedia.com/shockwave/download/index.cgi?P1_Prod_Version=ShockwaveFlash">
</EMBED>
</OBJECT>
</div>
так вот есть ссылки после
Код:
<!-- URL's used in the movie-->
их та и берет гугл.
а то что он берет swf файл, запускает его, в это трудно поверить, просто флэш технология быстрыми темпами развивается, и гулу обработка флэша большой гемор.

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 01/04/04 в 23:13     

http://www.google.com/search?hl=en&lr=&ie=UTF-8&oe=UTF-8&c2coff=1&q=link%3Ahttp%3A%2F%2Fwww.novatim.ro%2F&btnG=Search

K началу

 
Информация о пользователе Mauser


Зарегистрирован: 10.01.03
Сообщения: 319
Ссылка на сообщениеДобавлено: 02/04/04 в 02:10     

как и скрипты. парсить то он парсит, но выпарсывает не все. Простейшие конструкции выгрызает.

K началу

 
Информация о пользователе bleed


Зарегистрирован: 19.02.03
Сообщения: 282
Ссылка на сообщениеДобавлено: 02/04/04 в 07:20     

bibigon писал:
http://www.google.com/search?hl=en&lr=&ie=UTF-8&oe=UTF-8&c2coff=1&q=link%3Ahttp%3A%2F%2Fwww.novatim.ro%2F&btnG=Search
не верю icon_smile.gif
http://www.google.com/help/faq_filetypes.html

K началу

 
Информация о пользователе bibigon


Зарегистрирован: 21.10.03
Сообщения: 1058
Ссылка на сообщениеДобавлено: 02/04/04 в 10:09     

bleed писал:
не верю icon_smile.gif
>http://www.google.com/help/faq_filetypes.html


ну и что? может там тоже админы ленивые. smail102.gif

K началу

 
Информация о пользователе bleed


Зарегистрирован: 19.02.03
Сообщения: 282
Ссылка на сообщениеДобавлено: 02/04/04 в 15:41     

bibigon писал:
ну и что? может там тоже админы ленивые. smail102.gif

короче без бутылки как всегда не разберешся, по любому мы можем тока предполагать а как там на самом деле, знает тока гугл smail44.gif

K началу

 
Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!
Внимание! В связи с устареванием топика эта страница была взята из кэша.

Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »