С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 13:51 |
Наконец таки написал, как мне кажется, вполне профессиональный парсер сразу нескольких поисковых систем(google,msn,yahoo)
Основной упор был сделан на создании такого алгоритма, которому бы соответствовало максимально возможное качество парсинга и одновременно высокая его скорость.
Скрипт может парсить выдачу сразу нескольких поисковых систем под различными прокси адресами, различными зонами, на любую(уместную) глубину запроса.
Также введен алгоритм, благодаря которому можно определить с высокой долей вероятности, будет ли являться результат следующего запроса аналогичным(на сколько близким вы задаете сами – параметр “эпсилон окрестность”) к результату текущего запроса. На основании этих данных парсер сам решает парсить ли ему этот киворд дальше, и если да, - то по каким параметрам, чтобы получившийся результат был максимально отличен от текущего, а значит наиболее результативным.
Встроен чекер прокси, благодаря которому, парсинг может пройтись всего лишь при использовании нескольких проксей. Скрипт считает любого рода погрешности для каждого из соединений, а дальше циклическим методом "ищет выход" - подбирает работоспособные параметры для текущего киворда опять же, с целью достижения максимальной результативности.
Еще одна приятная вещь: процесс парсинга запускается в фон , то есть вы можете подготовить интересующие вас киворды, нажать на кнопку “Поехали))” и отправляться спать.Параллельно этому будет вестись подробный лог файл. При желании можно указать свой почтовый ящик. На него будут сразу же посланы результаты парсинга .
Вообщем я перечислил одни из основных возможностей парсера, которые вы можете и сами в принципе заметить. Дальше идет жестокая мат. часть.
Посмотреть на сам парсер вы можете пока здесь
– там же описание и характеристики.
Тестовый логин: lynx
Пароль: demo
(Поставил некоторые ограничения в demo версии, чтобы любители халявы не повесили мне сервер)
Ps.Золотое правило: скорость парсинга прямо пропорциональна качеству проксей – не забывайте об этом!
И еще,если часто появляется надпись may be repeit - то просто поставьте эпсилон поменьше.
Итак окончательная цена парсера: 20 $
ася здесь:262-948-112
|
|
|
|
С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010
|
Добавлено: 25/02/06 в 14:46 |
так он парсит только урлы... а тайтлы, дескрипшны где?
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 14:48 |
А нужны? Для меня написать это не проблема-добавить пару строчек,просто изначально цель была другая.
|
|
|
|
С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010
|
Добавлено: 25/02/06 в 14:54 |
Lуnx писал: | А нужны? Для меня написать это не проблема-добавить пару строчек,просто изначально цель была другая. |
А в чем тогда его привлекательность по сравнению с другими?
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 15:01 |
ibiz писал: | А в чем тогда его привлекательность по сравнению с другими? |
Я что зря распинался тут
На самом деле я не видел других парсеров,поэтому затрудняюсь тебе ответить на этот вопрос.
Могу лишь привести итог его работы.Через 20 или 30 минут по почте получил 21713 уникальных урл на три кейворда.Собственно ради этого и старался.
|
|
|
|
+ + +
Nobody is perfect...
С нами с 06.09.04
Сообщения: 2955
Рейтинг: 1841
|
Добавлено: 25/02/06 в 15:03 |
ibiz писал: | так он парсит только урлы... а тайтлы, дескрипшны где? |
А зачем?
|
|
|
|
С нами с 25.02.06
Сообщения: 1
|
Добавлено: 25/02/06 в 15:22 |
потерто
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 15:24 |
Да вот тоже думаю зачем...это же не дор.генератор)
|
|
|
|
SEOшник
С нами с 20.10.02
Сообщения: 5375
Рейтинг: 1798
|
Добавлено: 25/02/06 в 16:56 |
а для чего он ???
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 17:30 |
шутки не уместны
---------------------------------
если нужен парсер мета тегов и заголовков...пожалуйста,но за отдельную плату
|
|
|
|
С нами с 13.04.04
Сообщения: 301
Рейтинг: 133
|
Добавлено: 25/02/06 в 18:03 |
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 18:13 |
Нет ни баг. На Рунет парсер не заточен, тобишь кириллицу свою подальше)
А вообще выдача улыбнула
|
|
|
|
С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010
|
Добавлено: 25/02/06 в 18:16 |
Lуnx писал: | Нет ни баг. На Рунет парсер не заточен, тобишь кириллицу свою подальше)
А вообще выдача улыбнула |
А в чем проблемы кирилицу передать гуглю?
|
|
|
|
Мир принадлежит тебе...
С нами с 09.10.05
Сообщения: 1858
Рейтинг: 1104
|
Добавлено: 25/02/06 в 18:19 |
ibiz писал: | А в чем проблемы кирилицу передать гуглю? |
Он расчитан на енг работу, видимо.
Ру кейворды парсить в Яше лучше...
|
|
Chili Media - глобальная система конвертации траффика.Coming soon...
|
0
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 18:20 |
Я никому не собираюсь ничего доказывать,те кому надо - уже купили скрипт.
Спасибо,тему можно считать закрытой!
|
|
|
|
С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010
|
Добавлено: 25/02/06 в 18:30 |
Оффтопик: ...тоже чтоль начать всякую куйню продавать по 20 баков
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 18:33 |
ibiz писал: | Оффтопик: ...тоже чтоль начать всякую куйню продавать по 20 баков |
не флуди: для тебя КУЙНЯ, а для другого полезная вещь в хозяйстве
|
|
|
|
С нами с 13.04.04
Сообщения: 301
Рейтинг: 133
|
Добавлено: 25/02/06 в 19:48 |
Lуnx писал: | Нет ни баг. На Рунет парсер не заточен, тобишь кириллицу свою подальше)
А вообще выдача улыбнула |
уже догадался, но яху на кириллические киворды ничего не выводит. Следовательно, ничего и скрипт не должен парсить, а парсит остальное. Только каким раком туда попали cars.com, adobe.com и пр.?
Вот сам введи в яху "asian porn", и там такого не будет
|
|
|
|
С нами с 24.02.06
Сообщения: 23
Рейтинг: 1
|
Добавлено: 25/02/06 в 19:54 |
Andryxa писал: | уже догадался, но яху на кириллические киворды ничего не выводит. Следовательно, ничего и скрипт не должен парсить, а парсит остальное. Только каким раком туда попали cars.com, adobe.com и пр.?
Вот сам введи в яху "asian porn", и там такого не будет |
Ты какие параметры вводил.Я только что пропарсил яху на 800 ссылок по самым порнушным кивордам,какие только могли прийти мне вголову,никаких белых сайтов там и близко не было! Проверь внимательно,плиз,настройки
|
|
|
|
С нами с 13.04.04
Сообщения: 301
Рейтинг: 133
|
Добавлено: 25/02/06 в 23:11 |
Not Found
я не упрекаю в том, что что-то не так. Просто обрати внимание. На тот момент было 2 киворда: "знакомства" и "asian porn". И выдал такие результаты
|
|
|
|