С нами с 24.03.04
Сообщения: 10716
Рейтинг: 3949
|
Добавлено: 29/05/07 в 11:55 |
собссно вот сабж есть такой:
как грамотно реализовать проверку геста на возможность сделать в нем запись?
интересует ваще принцип. какие мысли у кого есть?
рейтингом не обижу - все ответы кроме тупых +8
|
|
|
|
С нами с 01.04.07
Сообщения: 4378
Рейтинг: 2970
|
Добавлено: 29/05/07 в 12:01 |
не понял: ты свою гостевуху хочешь проверять ли чужую?
|
|
|
|
С нами с 24.03.04
Сообщения: 10716
Рейтинг: 3949
|
Добавлено: 29/05/07 в 12:04 |
чужую, ясен пень. скрипт проверять будет
|
|
|
|
Милитарист
С нами с 13.01.06
Сообщения: 677
Рейтинг: 569
|
Добавлено: 29/05/07 в 12:06 |
Да на 100% выяснить - кроме как сделать запись - никак.
|
|
|
|
просто кросавчег
С нами с 15.11.04
Сообщения: 11768
Рейтинг: 7461
|
Добавлено: 29/05/07 в 12:08 |
сделать запись и проверить потом на наличие линки
|
|
|
|
С нами с 01.04.07
Сообщения: 4378
Рейтинг: 2970
|
Добавлено: 29/05/07 в 12:08 |
тогда единственная возможность: сделать запись и проверить, появилась ли она.
Самая надежное.
Если какой-то конкретный скрипт, заточить под него. Иногда достаточно получить заголовок, чтобы понять, что запись сделана.
А вообще, вопрос не совсем ясен. Поразвёрнутей, товарищ.
|
|
|
|
Милитарист
С нами с 13.01.06
Сообщения: 677
Рейтинг: 569
|
Добавлено: 29/05/07 в 12:11 |
Причем хохма в том, что сделав запись - еще не всегда можно определить где она появится.
|
|
|
|
С нами с 01.04.07
Сообщения: 4378
Рейтинг: 2970
|
Добавлено: 29/05/07 в 12:13 |
универсальных спамолок нет и наверно не будет, все затачивается под определённые скрипты
|
|
|
|
С нами с 25.03.07
Сообщения: 134
Рейтинг: 70
|
Добавлено: 29/05/07 в 12:26 |
сначала пусти пробную запись, если пройдет - пускай запись с сылкой
|
|
|
|
С нами с 01.04.07
Сообщения: 4378
Рейтинг: 2970
|
Добавлено: 29/05/07 в 12:28 |
какая разница?
Может получиться, что пробная пройдёт, а ссылка - либо не отобразится правильно, либо заблокируется
|
|
|
|
С нами с 25.03.07
Сообщения: 134
Рейтинг: 70
|
Добавлено: 29/05/07 в 12:36 |
пробную запись можна сделать со ссылкой на гугл
|
|
|
|
С нами с 01.04.07
Сообщения: 4378
Рейтинг: 2970
|
Добавлено: 29/05/07 в 12:39 |
опять же - а смысл?
ну пройдёт ссылка на гугл, абузить админ не будет.
Сделаешь со своей, получишь по полной.
|
|
|
|
Милитарист
С нами с 13.01.06
Сообщения: 677
Рейтинг: 569
|
Добавлено: 29/05/07 в 12:42 |
chubaka писал: | пробную запись можна сделать со ссылкой на гугл |
Да не надо заморачиваться. Стрелять - так стрелять. Хотя конечно от задачи все зависит, если просто "собрать базу", можно и Гуглъ.
|
|
|
|
С нами с 25.03.07
Сообщения: 134
Рейтинг: 70
|
Добавлено: 29/05/07 в 12:43 |
согласен, сдаюсь
|
|
|
|
С нами с 01.04.07
Сообщения: 4378
Рейтинг: 2970
|
Добавлено: 29/05/07 в 12:50 |
по теме:
получал спам в каталог 10-20 ссылок в сутки, все удалял.
Пару дней назад одну ссылку случайно принял. удалять было лень, решил оставить.
Теперь спам прёт по 100-200 сылок.
Может и совпадение.
|
|
|
|
+ + +
С нами с 21.05.07
Сообщения: 342
Рейтинг: 220
|
Добавлено: 29/05/07 в 12:56 |
После сабмита смотреть ответ сервера и записывать в лог то, что появилось на след. страничке после нажатия кнопки сабмит (success, спасибо за ваше сообещение и т.д.)
Потом по словарю отсеивать плохие и мертвые гвесты, но 100% результата конечно же не будет, но все же это лучше чем ничего
|
|
|
|
С нами с 18.01.06
Сообщения: 322
Рейтинг: 487
|
Добавлено: 29/05/07 в 13:17 |
Ну вообще задача не тривиальная, но можно составить несколько правил
1. Анализировать тип гесты (возможно это уже проверенный ранее тип гостевухи, в которую можно сделать сабмит), сделать это по анализу имени файлов, имени полей в форме и т.п.
2. Проверять наличие капчи (с капчей шансы успешного поста уменьшаются), сделать это можно анализируя наличие <img> в форме и специфичных полей в форме 3. Когда анализируются кнопки сабмита, передавать именно ее имя, а не имя например кнопки предварительного просмотра или ресета формы (опять таки анализ формы) 4. Анализировать какие дополнительные возможности требуются: наличие определенного рефера, определенного броузера, языка, наличие кукисов (на это следует уделить особое внимание, так как часто куки используются в связке с капчей) 5. Отдельно про куки, как открывается геста, надо анализировать куки, которые ставит скрипт гесты с hidden полями в форме сабмита, как правило есть закономерности и не случайные совпадения
Вроде на первый взгляд все написал, если еще что интересно, можешь в аську стукнуть, пообщаемся на эту тему
|
|
|
|
С нами с 24.03.04
Сообщения: 10716
Рейтинг: 3949
|
Добавлено: 29/05/07 в 15:20 |
CxDx писал: | После сабмита смотреть ответ сервера и записывать в лог то, что появилось на след. страничке после нажатия кнопки сабмит (success, спасибо за ваше сообещение и т.д.)
Потом по словарю отсеивать плохие и мертвые гвесты, но 100% результата конечно же не будет, но все же это лучше чем ничего |
вроде вот как самое оно. спасибо добрый чел и рейтингу тебе
|
|
|
|
С нами с 24.03.04
Сообщения: 10716
Рейтинг: 3949
|
Добавлено: 29/05/07 в 15:23 |
proc3nt писал: | Ну вообще задача не тривиальная, но можно составить несколько правил
1. Анализировать тип гесты (возможно это уже проверенный ранее тип гостевухи, в которую можно сделать сабмит), сделать это по анализу имени файлов, имени полей в форме и т.п.
2. Проверять наличие капчи (с капчей шансы успешного поста уменьшаются), сделать это можно анализируя наличие <img> в форме и специфичных полей в форме 3. Когда анализируются кнопки сабмита, передавать именно ее имя, а не имя например кнопки предварительного просмотра или ресета формы (опять таки анализ формы) 4. Анализировать какие дополнительные возможности требуются: наличие определенного рефера, определенного броузера, языка, наличие кукисов (на это следует уделить особое внимание, так как часто куки используются в связке с капчей) 5. Отдельно про куки, как открывается геста, надо анализировать куки, которые ставит скрипт гесты с hidden полями в форме сабмита, как правило есть закономерности и не случайные совпадения
Вроде на первый взгляд все написал, если еще что интересно, можешь в аську стукнуть, пообщаемся на эту тему |
вот тоже конкретные советы. и тебе спасибо и +8
все кто пишет поставить и проверить - подумайте, сколько времени уйдет на сбор базы, ессли каджую гостевую парсить по два раза - первый на наличие формы, а второй - на наличие линки. + где то возможно публикуеццо с задержкой + у кого то хуй знает где, но полюбому парсить все.
всем +7 (чтоб челов не обидеть кого ответы наиболее ценны для меня - им по +8)
|
|
|
|
+ + +
С нами с 21.05.07
Сообщения: 342
Рейтинг: 220
|
Добавлено: 29/05/07 в 16:09 |
slonic писал: | вроде вот как самое оно. спасибо добрый чел и рейтингу тебе |
Пожалуйста
Так кстате хрумер делает, удобно при "сабмите" в блоги и форумы, иногда сразу линку свою можно опознать или например увидеть сообщение "you ip banned", различить nofollow и т.д..
Других простых и универсальных вариантов вроде нет, можно конечно придумать, но слишком сложно найти свой урл после сабмита, особенно в засранных страничках.
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 29/05/07 в 17:17 |
у меня сабмитится левый текст и в нем фраза типа nmJV4FdiFUHi6rm (что бы небыло совпадений)
потом проверяется на наличие фразы на странице поста, или же на странице куда был редирект после поста.
Причем я так делаю каждый раз через некоторое время - время конечно отнимает - зато базы (почти ) чистые.
Анализировать просто ответ тоже не очень хороший вариант, так как некоторые скрипты пишут ОК, а пост не добавляют.
А лучше всего совокупность методов
Если ответ бэд - тогда килять урл, Если ответ гуд - тогда идти и проверять наличие фразы на странице.
Так можно добиться некоторой экономии ресурсов и и увеличить полезность базы.
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
8
|
|
|
+ + +
С нами с 21.05.07
Сообщения: 342
Рейтинг: 220
|
Добавлено: 29/05/07 в 18:33 |
Lamagro: +1 часто замечаю что многие так постят. +10 за совокупность.
Правда все эти ухищрения добавляют работы серверу + кушается немерянно трафика при парсинге страниц. Хотя если один раз отсеять из 100к всего 5-15к хороших ресов, то я думаю трафа по любому можно съэкономить (10-20 раз).
|
|
|
|
С нами с 24.03.04
Сообщения: 10716
Рейтинг: 3949
|
Добавлено: 29/05/07 в 18:41 |
дык в идеале базу нужно постоянно обновлять. так что "одним разом" не органичиццо
|
|
|
|
♥♥♥
С нами с 28.08.04
Сообщения: 7098
Рейтинг: 5671
|
Добавлено: 29/05/07 в 21:17 |
Lamagro писал: | у меня сабмитится левый текст и в нем фраза типа nmJV4FdiFUHi6rm (что бы небыло совпадений)
потом проверяется на наличие фразы на странице поста, или же на странице куда был редирект после поста.
|
не всегда редиректит на твой пост... но пожалуй это самый верный способ
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 30/05/07 в 10:35 |
CxDx писал: | Правда все эти ухищрения добавляют работы серверу + кушается немерянно трафика при парсинге страниц. Хотя если один раз отсеять из 100к всего 5-15к хороших ресов, то я думаю трафа по любому можно съэкономить (10-20 раз). |
Да кстати я плохие тоже оставляю в базе с пометкой бэд и при очередном плановом чеке/сборе базы эти урлы сразу отбрасываются при проверке. Правда реакция на разные ошибки разная. Если было 404 - тогда снова проверить. А если сразу пост и не найдено - тогда в бэд навеки В результате наблюдается экономия - так как "пропощиваемых" в общей куче действительно немного.
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
8
|
|
|