Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757
Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737 Форумы портала PHP.SU :: Проблема с CP1251/CP1252
Покинул форум
Сообщений всего: 239
Дата рег-ции: Дек. 2009
Помог: 0 раз(а)
Пытаюсь распарсить страничку bash.im, сайт в кодировке Windows-1251, сам скрипт в кодировке UTF-8. При простом выводе строки текста на экран получаю получаю:
Декодер Лебедева на первую строку говорит, что для читабельности преобразовал CP1252 → CP1251? что у меня также не особо заработало...
Подскажите, как правильно провести конвертацию кодировки в данном случае? Пример кода под спойлером:
отображает нормально страницу, она в юникоде, получается, то, что парсер HTML преобразует этот юникод в нечто непонятное, которое обратно не преобразуется... (Добавление)
Плюнул на гордость и сделал файл в кодировке Windows-1251, поменял в хидере тип кодировки, однако после применения xPath получается всё равно кривая строка:
Цитата:
Ïåðåïèñêà â ãðóïïå êëà ГГ WoT.
Наверное дело в самом domDocument, который использует где-то внутри настройки юникода, а получает Windows-1251 и ошибается...
Ts.Saltan
Отправлено: 18 Мая, 2015 - 19:52:12
Посетитель
Покинул форум
Сообщений всего: 384
Дата рег-ции: Дек. 2013 Откуда: Belarus
Покинул форум
Сообщений всего: 239
Дата рег-ции: Дек. 2009
Помог: 0 раз(а)
Нет, тоже самое...
В общем ладно, решил свою проблему поиском нужного блока регулярным выражением, оно работает замечательно в данном простом случает. Возможно какой-то баг DOMDocument или же я не полностью разобрался в его настройке...
Все гости форума могут просматривать этот раздел. Только зарегистрированные пользователи могут создавать новые темы в этом разделе. Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.