Реклама на сайте Advertise with us

Подскажите по парсингу

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:

Люблю то, что делаю!

С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418


Передовик Master-X (16.12.2014) Передовик Master-X (16.02.2017) Передовик Master-X (01.03.2017) Передовик Master-X (16.03.2017) Передовик Master-X (01.09.2017) Ветеран трепа Master-X (16.09.2017)
Ссылка на сообщениеДобавлено: 01/08/13 в 09:05       Ответить с цитатойцитата 

как спарсить что то одно я знаю как, но вот если нужно спарсить то что повторяется несколько раз на сранице, к примеру:
<div id="text"><p>text1</p></div>
<div id="text"><p>text2</p></div>
<div id="text"><p>text3</p></div>
и мне нужно выдернуть то что находится в <p></p>
как это зациклить не соображу.

за ранее благодарен.

0
 

Люблю то, что делаю!

С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418


Передовик Master-X (16.12.2014) Передовик Master-X (16.02.2017) Передовик Master-X (01.03.2017) Передовик Master-X (16.03.2017) Передовик Master-X (01.09.2017) Ветеран трепа Master-X (16.09.2017)
Ссылка на сообщениеДобавлено: 01/08/13 в 09:32       Ответить с цитатойцитата 

и еще такой момент, есть сайты которые не дают парсить, отображается страница с просьбой включить куки. icon_confused.gif
как обойти?
Я паршу не Курлом, а прочтением страницы в строку, а там уже достаю что нужно
по типу
Код: [развернуть]

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 01/08/13 в 09:54       Ответить с цитатойцитата 

Lexikon писал:
отображается страница с просьбой включить куки. как обойти?

Очевидно нужно послать куки: http://php.net/manual/ru/function.stream-context-create.php

0
 

Люблю то, что делаю!

С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418


Передовик Master-X (16.12.2014) Передовик Master-X (16.02.2017) Передовик Master-X (01.03.2017) Передовик Master-X (16.03.2017) Передовик Master-X (01.09.2017) Ветеран трепа Master-X (16.09.2017)
Ссылка на сообщениеДобавлено: 01/08/13 в 10:02       Ответить с цитатойцитата 

я подключил класс Snoopy.class.php
всё заработало, сейчас гляну что по ссылке.
теперь остается вопрос как пройтись и вытащить всё что находится в <div id="text"><p>text1</p></div>

0
 



С нами с 05.05.05
Сообщения: 1913
Рейтинг: 1134

Ссылка на сообщениеДобавлено: 01/08/13 в 11:06       Ответить с цитатойцитата 

Код:
$text = '<div id="text"><p>text1</p></div>
<div id="text"><p>text2</p></div>
<div id="text"><p>text3</p></div>';

preg_match_all('%(?<=div id="text").*<p>([^>]*)</p>%isU', $text, $match);

echo '<pre>', print_r($match[1], true), '</pre>';



или парсер https://code.google.com/p/ganon/

0
 



С нами с 03.07.07
Сообщения: 481
Рейтинг: 862

Ссылка на сообщениеДобавлено: 01/08/13 в 12:50       Ответить с цитатойцитата 

Я вот такой "браузер" для парсинга часто использую -довольно удобно
simpletest.org/en/browser_documentation.html

0
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »