SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 11/09/08 в 18:32 |
в общем стою на асфальте я лыжи обутый ... ночью и туплю бля
Пишу регулярку нужно выдернуть из страницы все залинкованные картинки в которых есть слово thumb - неполучается. И хуй бы с ним завтра точно напишу, но хочется запустить скрипт на ночь
Код: | preg_match_all("/<a\s+href\s*=.*?<img\s+src\s*=\s*[\",\'](.*?\.jpg|jpeg)[\",\']/is",$Page,$img); |
это выдергивает все залинкованные пиксы как приделать сюда thumb?
p.s. скрипт php-шный
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
С нами с 25.07.06
Сообщения: 207
Рейтинг: 229
|
Добавлено: 11/09/08 в 18:47 |
Код: | preg_match_all("/<a\s+href\s*=.*?<img\s+src\s*=\s*[\",\'](.*?thumb.*?\.jpg|jpeg)[\",\']/is",$Page,$img); |
try this
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 11/09/08 в 19:01 |
я так делал - ниработает нифига
точнее работает, но пути где нету thumb в массив попадаю вот в таком виде:
Цитата: | ./sdffsdsdfsdsdf/16.jpg" width="120" height="150" border="1"></a>
<a href="./pic/image_10.jpg"><img src="./thumb/10.jpg |
то есть выбирается все до следующей тумбы
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
Гражданин планеты Земля
С нами с 30.03.03
Сообщения: 7217
Рейтинг: 2185
|
Добавлено: 11/09/08 в 19:08 |
Код: | preg_match_all("/<a.*?<img[^>]+src\s*=\s*[\"\']?\s*([^\'\"\s]*thumb[^\'\"\s]*\.(?:jpg|jpeg))\s*[\"\']?[^>]+>.*?<\/\s*a\s*>/is",$Page,$img); |
а так?
Последний раз редактировалось: wMaster (11/09/08 в 19:12), всего редактировалось 3 раз(а)
|
|
|
|
С нами с 25.07.06
Сообщения: 207
Рейтинг: 229
|
Добавлено: 11/09/08 в 19:09 |
Код: | preg_match_all("/<a\s+href\s*=.*?<img\s+src\s*=\s*[\",\']([^>]*?thumb[^>]*?\.jpg|jpeg)[\",\']/is",$Page,$img); |
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 11/09/08 в 19:26 |
вери биг сэнкс!
оба варианта работают - только до конца не пойму как
[^>] - это как работает?
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
Гражданин планеты Земля
С нами с 30.03.03
Сообщения: 7217
Рейтинг: 2185
|
Добавлено: 11/09/08 в 19:42 |
Эм, я бы сказал это метод описания от противного. Т.е можно либо описать что включать, либо же наоборот, что не включать, как в этом случае. [^>]* - означает учитывать любой символ до первого >.
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 11/09/08 в 20:05 |
супер! спасибо!
век живи век учись
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
С нами с 27.09.03
Сообщения: 5454
Рейтинг: 2506
|
Добавлено: 13/09/08 в 05:23 |
да ну, тут надо минимум 2 прегмача - сначала выдрать все линки, потом проверить в каждой thumb.
Код: | $Page = " <a href='http://google.com'></a><img src='thumb1.jpg'><a href='http://google2.com>sss</a>"; |
валятся оба данных кода на таком хтмле.
.*? будет искать до тега img, а тем временем тег A уже может закрыться.
|
|
|
|
Гражданин планеты Земля
С нами с 30.03.03
Сообщения: 7217
Рейтинг: 2185
|
Добавлено: 13/09/08 в 05:32 |
grozny, это потому что у тебя необходимый формат хтмл вообще совершенно неверный!
формат должен быт такой <a href=""><img src="" /></a> ... тумба-ссылка!
|
|
|
|
С нами с 27.09.03
Сообщения: 5454
Рейтинг: 2506
|
Добавлено: 14/09/08 в 21:29 |
не вижу где ТС написал что формат хтмла именно такой.
я только понял что нужно выдрать именно такие линки, но исходный хтмл-то любой может быть...
пример - тгп галеры, если там будет любая графика кроме тумбов со словом thumb, твой прегматч выдаст левую инфу.
я просто делал грабер галер, и одним прегмачем не обошелся)
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 15/09/08 в 06:02 |
Lamagro писал: | нужно выдернуть из страницы все залинкованные картинки в которых есть слово thumb |
2grozny
Здесь четко определено условие
Для универсальности конечно нужно более сложную регулярку.
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 15/09/08 в 06:11 |
Я кстати когда то писал универсальный - не смог кое где обойтись без полуавтомата, счас уже понимаю что был не прав
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
С нами с 17.09.08
Сообщения: 1
|
Добавлено: 17/09/08 в 20:55 |
Не могу создать новую тему, поэтому отпишусь здесь, надеюсь ТС не против
Мне нужно написать парсер страницы с видео, чтобы выдергивалось название, тэги и код embeded. Естественно за $
пишите в аську 610пятьвосемь07
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 18/09/08 в 06:59 |
сутки уже наверное прошли - иди новую создавай
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|
С нами с 18.08.04
Сообщения: 6376
Рейтинг: 4430
|
Добавлено: 18/09/08 в 07:32 |
Да я уже почти сделал, чего создавать то
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 18/09/08 в 11:22 |
dDan писал: | Да я уже почти сделал, чего создавать то |
c тебя причитается всетаки заказ в моем топике взял
|
|
Submit your blog to the sex blogs list. PR=3 Quickly approve! 10 posts min. Ping every 6 hour!
|
0
|
|
|