С нами с 01.05.06
Сообщения: 215
Рейтинг: 74
|
Добавлено: 19/01/07 в 02:50 |
Сграбил тут один сайтег, хочется содрать нужный контент и закидать в БД. В программе RegexBuddy написал регулярное выражение
(?!<br>Текст.*песни)(?<=<br>Текст.песни).*(?<=[^</font></td>])
написал на Python небольшую тестовую програмку
Код: | # -*- coding: windows-1251
import re
file = "/path/to/file"
f = open(file)
text = f.read()
result = re.findall(r"(?!<br>Текст.*песни)(?<=<br>Текст.песни).*(?<=[^</font></td>])", text)
print result |
Все работает, находит то что надо, подсовывыю в php вот это
preg_match('%(?!<br>Текст.*песни)(?<=<br>Текст.песни).*(?<=[^</font></td>])%', $text) ничего не находит. Подскажите где накосячил
|
|
|
|
С нами с 19.07.05
Сообщения: 318
Рейтинг: 401
|
Добавлено: 19/01/07 в 06:54 |
Кодировки у питона и пхп совпадают?
|
|
|
|
С нами с 01.05.06
Сообщения: 215
Рейтинг: 74
|
Добавлено: 19/01/07 в 14:24 |
Да, действительно косяк был в этом, прописал
Код: | <?php header('Content-Type: text/html; charset=windows-1251'); ?>
<meta http-equiv="content-type" content="text/html; charset=windows-1251" /> |
все что надо нашлось.
Спасибо
|
|
|
|
Текстовая реклама в форме ответа Заголовок и до четырех строчек текста Длина текста до 350 символов Купить рекламу в этом месте! |