Реклама на сайте Advertise with us

Скрипт обхода всех страниц сайта рекурсивно

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:

📈sflash.biz

С нами с 03.11.12
Сообщения: 3913
Рейтинг: 4447


Передовик Master-X (16.04.2018) Передовик Master-X (16.07.2018) Передовик Master-X (16.12.2022) Передовик Master-X (01.01.2023)
Ссылка на сообщениеДобавлено: 23/05/16 в 15:00       Ответить с цитатойцитата 

Подскажите скрипт-бот, чтоб обойти все страницы сайта рекурсивно? Интересует только открывание страниц эмулируя браузер (можно без дотошной эмуляции, не обязательно быть похожим на десктопный) без каких либо действий над оными страницами.
wget вроде умеет рекурсивно, но он закачивать будет, а это лишнее..

0
 



С нами с 19.11.02
Сообщения: 95
Рейтинг: 218

Ссылка на сообщениеДобавлено: 23/05/16 в 16:49       Ответить с цитатойцитата 

wget можно в /dev/null направить, и пусть выкачивает...

9
 

127.0.0.1

С нами с 26.04.06
Сообщения: 1092
Рейтинг: 557

Ссылка на сообщениеДобавлено: 24/05/16 в 19:50       Ответить с цитатойцитата 

wget -r --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" --delete-after урл

9
 



С нами с 06.07.15
Сообщения: 110
Рейтинг: 171

Ссылка на сообщениеДобавлено: 27/05/16 в 15:59       Ответить с цитатойцитата 

Для краулинга мне httrack больше нравится.

httrack -p0 http://domain.com

Цитата:

pN priority mode: (* p3) (--priority[=N])
0 just scan, don't save anything (for checking links)


и еще много интересных опций.

9
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »