Реклама на сайте Advertise with us

Curl и cp1251

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Ссылка на сообщениеДобавлено: 10/07/09 в 01:11       Ответить с цитатойцитата 

имеем курл запрос
возвращает заголовок+тело страницы
обращаемся к яндексу - получаем кракозябры
ставим CURLOPT_HTTPHEADER=>"Accept-Charset: utf-8"
или CURLOPT_HTTPHEADER=>"Accept-Charset: cp1251"
возвращает нормальный текст
однако, при работе preg_match_all
в результирующем массиве снова кракозябры
что не так?

крипта на ByBit

0
 



С нами с 03.03.06
Сообщения: 202
Рейтинг: 144

Ссылка на сообщениеДобавлено: 10/07/09 в 01:24       Ответить с цитатойцитата 

у меня подобное было помогало что-то вроде этого $result = iconv ('CP1251','UTF-8',$result);

оплата Paypal | предоплаченные карты Visa US

0
 

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Ссылка на сообщениеДобавлено: 10/07/09 в 01:55       Ответить с цитатойцитата 

ага
привожу к виду таким образом
но выражения из БД
с полученным текстом отказываются сравниваться
должно быть чтото еще

это только на некоторых хостах такое

крипта на ByBit

0
 

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Ссылка на сообщениеДобавлено: 10/07/09 в 02:28       Ответить с цитатойцитата 

то есть cp1251
и преобразованная utf-8 в cp1251(iconv)
разные.

точно также и полученная с помощью правильного хидера
также разные

вывод одинаков, а хеш разный

крипта на ByBit

0
 



С нами с 15.03.08
Сообщения: 33
Рейтинг: 96

Ссылка на сообщениеДобавлено: 14/07/09 в 14:17       Ответить с цитатойцитата 

Как оценивалась "нормальность" текста? Например вывод текстов в шестнадцатиричном дампе дает разные результаты?

Вообще для дальнейшего анализа было бы хорошо получить примеры текстов. Проблема явно в том что из разных источников приходят данные в разных кодировках (при этом с Яндекса по-идее все идет в utf-8).

Да, и еще один момент: попробуй использовать "windows-1251" вместо "cp1251", это все-таки стандартное именование данной кодовой таблицы.

0
 

programmer

С нами с 08.12.02
Сообщения: 7613
Рейтинг: 5760

Ссылка на сообщениеДобавлено: 14/07/09 в 14:32       Ответить с цитатойцитата 

спасибо разобрался уже
страницы на разных хостах принимались курлом в разных кодировках
cp1251 всегда и использовал

крипта на ByBit

0
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »