+ + +
С нами с 26.03.05
Сообщения: 487
Рейтинг: 46
|
Добавлено: 31/05/07 в 01:03 |
Щас попробую сформулировать что ищю, если такое вообще есть в природе, сильно не пинайте если начну тупить... нужен скрипт который проверял какие-либо изменения на чужом сайте. т.е. хочу сделать сайт №1 похожий на сайт №2 но что-бы вовремя делать изменения сайте №1 вслучае каких-либо изменений на сайт №2 нужен такой вот скрипт который ежеднево просматривал странички сайта №2 и если есть какие-то изменения сигнализировал об этом, а если-бы этот скрипт еще и сам вносил изменения на сайте №1 было-бы вообще чудесно. есть-ли что-то подобное?
|
|
|
|
С нами с 30.05.07
Сообщения: 209
Рейтинг: 276
|
Добавлено: 31/05/07 в 03:49 |
Все зависит от структуры Сайта 2, если у него нету РСС фида то поидее универсального скрипта быть не может.
|
|
|
|
С нами с 03.05.07
Сообщения: 801
Рейтинг: 825
|
Добавлено: 31/05/07 в 07:11 |
Есть. Хотя бы http://newsgrabber.info/ + Видел ещё пару.
Для сложноструктурированных сайтов пишутся специализированные парсеры, если сайты не предоставляют какого-либо рода фиды.
|
|
|
|
С нами с 12.12.06
Сообщения: 871
Рейтинг: 381
|
Добавлено: 31/05/07 в 09:13 |
Скажи что грабить надо? Но обычно для таких целей пишуться свои парселки как это уже говорилось выше.
|
|
|
|
С нами с 21.06.05
Сообщения: 1788
Рейтинг: 1579
|
Добавлено: 31/05/07 в 14:44 |
Сайт №2 в курсе происходящего на Сайте №1?
http://www.herfirstlesbian.net/clon.php типа такого? чтобы обрабатывались ссылки - лень было сделать
ADULT VALLEY CASH писал: | Все зависит от структуры Сайта 2, если у него нету РСС фида то поидее универсального скрипта быть не может. |
Может:
1) проверка размера страницы
2) дата изменения страницы в заголовках ответа сервера
3) сравнивать md5 содержимого страницы. работать немного дольше будет, но почувствует замену даже одной буквы. в п. 1 будет замечаться только изменение числа букв
|
|
|
|
+ + +
С нами с 26.03.05
Сообщения: 487
Рейтинг: 46
|
Добавлено: 31/05/07 в 19:55 |
samedi писал: | Сайт №2 в курсе происходящего на Сайте №1?
http://www.herfirstlesbian.net/clon.php типа такого? чтобы обрабатывались ссылки - лень было сделать
Может:
1) проверка размера страницы
2) дата изменения страницы в заголовках ответа сервера
3) сравнивать md5 содержимого страницы. работать немного дольше будет, но почувствует замену даже одной буквы. в п. 1 будет замечаться только изменение числа букв |
впринципе мне ненужно что-бы скрипт клонировал сайт мне на хост, нужна просто проверка на изменения, т.е. скрипту даю урлы страниц которые необходимо проверять, он переодически через крон запускался и делал проверку, если есть какие-либо изменения в странице (текст, картинка) он как-то об этом сообщал.
З.Ы. в таком варианте то-же интересно , скрипт сможет клонировать небольшие сайты (как пример фришник) изменяя ссылки где нужно на свои и вставляя свои элементы дизайна?
|
|
|
|
С нами с 21.06.05
Сообщения: 1788
Рейтинг: 1579
|
Добавлено: 31/05/07 в 20:26 |
icq в профиле.
|
|
|
|
С нами с 21.09.03
Сообщения: 7329
Рейтинг: 2144
|
Добавлено: 31/05/07 в 21:13 |
А не называется ли такой "скрипт" очень много лет именем wget?
Другой варинат тоже называется много лет rsync.
|
|
|
|
С нами с 21.06.05
Сообщения: 1788
Рейтинг: 1579
|
Добавлено: 31/05/07 в 22:31 |
молодец, знаешь столько английсих слов... (с) xreload
напомнил тему
|
|
|
|
Текстовая реклама в форме ответа Заголовок и до четырех строчек текста Длина текста до 350 символов Купить рекламу в этом месте! |