Люблю то, что делаю!
С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418
|
Добавлено: 01/08/13 в 09:05 |
как спарсить что то одно я знаю как, но вот если нужно спарсить то что повторяется несколько раз на сранице, к примеру:
<div id="text"><p>text1</p></div>
<div id="text"><p>text2</p></div>
<div id="text"><p>text3</p></div>
и мне нужно выдернуть то что находится в <p></p>
как это зациклить не соображу.
за ранее благодарен.
|
|
|
|
Люблю то, что делаю!
С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418
|
Добавлено: 01/08/13 в 09:32 |
и еще такой момент, есть сайты которые не дают парсить, отображается страница с просьбой включить куки.
как обойти?
Я паршу не Курлом, а прочтением страницы в строку, а там уже достаю что нужно
по типу
Код: [развернуть] | $dataPage = file_get_contents($urlContent); |
|
|
|
|
С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538
|
Добавлено: 01/08/13 в 09:54 |
|
|
|
|
Люблю то, что делаю!
С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418
|
Добавлено: 01/08/13 в 10:02 |
я подключил класс Snoopy.class.php
всё заработало, сейчас гляну что по ссылке.
теперь остается вопрос как пройтись и вытащить всё что находится в <div id="text"><p>text1</p></div>
|
|
|
|
С нами с 05.05.05
Сообщения: 1913
Рейтинг: 1134
|
Добавлено: 01/08/13 в 11:06 |
Код: | $text = '<div id="text"><p>text1</p></div>
<div id="text"><p>text2</p></div>
<div id="text"><p>text3</p></div>';
preg_match_all('%(?<=div id="text").*<p>([^>]*)</p>%isU', $text, $match);
echo '<pre>', print_r($match[1], true), '</pre>'; |
или парсер https://code.google.com/p/ganon/
|
|
|
|
С нами с 03.07.07
Сообщения: 481
Рейтинг: 862
|
Добавлено: 01/08/13 в 12:50 |
|
|
|
|
Текстовая реклама в форме ответа Заголовок и до четырех строчек текста Длина текста до 350 символов Купить рекламу в этом месте! |