Подскажите по парсингу

Расширенный поиск по форуму

Новая тема

Автор

Поиск в теме:

Lexikon

Люблю то, что делаю!

С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418

Добавлено: 01/08/13 в 09:05

цитата

как спарсить что то одно я знаю как, но вот если нужно спарсить то что повторяется несколько раз на сранице, к примеру:
<div id="text"><p>text1</p></div>
<div id="text"><p>text2</p></div>
<div id="text"><p>text3</p></div>
и мне нужно выдернуть то что находится в <p></p>
как это зациклить не соображу.

за ранее благодарен.

Lexikon

Люблю то, что делаю!

С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418

Добавлено: 01/08/13 в 09:32

цитата

и еще такой момент, есть сайты которые не дают парсить, отображается страница с просьбой включить куки.

как обойти?
Я паршу не Курлом, а прочтением страницы в строку, а там уже достаю что нужно
по типу

Код: [развернуть]

Yacc

С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538

Добавлено: 01/08/13 в 09:54

цитата

Lexikon писал:

отображается страница с просьбой включить куки. как обойти?

Очевидно нужно послать куки: http://php.net/manual/ru/function.stream-context-create.php

Lexikon

Люблю то, что делаю!

С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418

Добавлено: 01/08/13 в 10:02

цитата

я подключил класс Snoopy.class.php
всё заработало, сейчас гляну что по ссылке.
теперь остается вопрос как пройтись и вытащить всё что находится в <div id="text"><p>text1</p></div>

freeek

С нами с 05.05.05
Сообщения: 1913
Рейтинг: 1134

Добавлено: 01/08/13 в 11:06

цитата

Код:

$text = '<div id="text"><p>text1</p></div>
<div id="text"><p>text2</p></div>
<div id="text"><p>text3</p></div>';

preg_match_all('%(?<=div id="text").*<p>([^>]*)</p>%isU', $text, $match);

echo '<pre>', print_r($match[1], true), '</pre>';

или парсер https://code.google.com/p/ganon/

Smarty

С нами с 03.07.07
Сообщения: 481
Рейтинг: 862

Добавлено: 01/08/13 в 12:50

цитата

Я вот такой "браузер" для парсинга часто использую -довольно удобно
simpletest.org/en/browser_documentation.html

Новая тема

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!

Перейти:

Спонсор раздела

Подскажите по парсингу

Опросы