Curl и cp1251

Расширенный поиск по форуму

Новая тема

Автор

Поиск в теме:

Sterx

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Добавлено: 10/07/09 в 01:11

цитата

имеем курл запрос
возвращает заголовок+тело страницы
обращаемся к яндексу - получаем кракозябры
ставим CURLOPT_HTTPHEADER=>"Accept-Charset: utf-8"
или CURLOPT_HTTPHEADER=>"Accept-Charset: cp1251"
возвращает нормальный текст
однако, при работе preg_match_all
в результирующем массиве снова кракозябры
что не так?

крипта на ByBit

allchange

С нами с 03.03.06
Сообщения: 202
Рейтинг: 144

Добавлено: 10/07/09 в 01:24

цитата

у меня подобное было помогало что-то вроде этого $result = iconv ('CP1251','UTF-8',$result);

оплата Paypal | предоплаченные карты Visa US

Sterx

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Добавлено: 10/07/09 в 01:55

цитата

ага
привожу к виду таким образом
но выражения из БД
с полученным текстом отказываются сравниваться
должно быть чтото еще

это только на некоторых хостах такое

крипта на ByBit

Sterx

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Добавлено: 10/07/09 в 02:28

цитата

то есть cp1251
и преобразованная utf-8 в cp1251(iconv)
разные.

точно также и полученная с помощью правильного хидера
также разные

вывод одинаков, а хеш разный

крипта на ByBit

flying

С нами с 15.03.08
Сообщения: 33
Рейтинг: 96

Добавлено: 14/07/09 в 14:17

цитата

Как оценивалась "нормальность" текста? Например вывод текстов в шестнадцатиричном дампе дает разные результаты?

Вообще для дальнейшего анализа было бы хорошо получить примеры текстов. Проблема явно в том что из разных источников приходят данные в разных кодировках (при этом с Яндекса по-идее все идет в utf-8).

Да, и еще один момент: попробуй использовать "windows-1251" вместо "cp1251", это все-таки стандартное именование данной кодовой таблицы.

Sterx

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Добавлено: 14/07/09 в 14:32

цитата

спасибо разобрался уже
страницы на разных хостах принимались курлом в разных кодировках
cp1251 всегда и использовал

крипта на ByBit

Новая тема

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!

Перейти:

Спонсор раздела

Curl и cp1251

Опросы