Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: DOMDocument портит кодировку

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: не знаю почему
Bio man
Отправлено: 26 Сентября, 2014 - 14:50:24
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




PHP:
скопировать код в буфер обмена
  1. var_dump(mb_detect_encoding($mapHTML)); // UTF-8
  2.  
  3. $dom = new \DOMDocument();
  4. $dom->loadHTML($mapHTML);
  5.  
  6. var_dump(mb_detect_encoding($dom->saveHTML())); // ASCII
  7.  


Далее использую DOMXpath
PHP:
скопировать код в буфер обмена
  1. $xPath = new \DOMXPath($dom);
  2. $nodeList = $xPath->query('//div[@class="place free"]');
  3.  
  4. $result = \DOMHelper::toArray($nodeList, function($node) {
  5.     $attributes = $node->attributes;
  6.     $place = $attributes->getNamedItem("data-section-name");
  7.  
  8.     var_dump(mb_detect_encoding($place->value)); // UTF-8 но значение выводится иероглифами (РŸР°С€С‚РµС€)
  9.  
  10.     return $place->value;
  11. });


DOMHelper::toArray - из NodeList делает массив применяя callback для каждой итерации, на данные никак не влияет.

Как быть с кодировкой?
(Добавление)
Пример из другого парсера, рабочего.

PHP:
скопировать код в буфер обмена
  1. var_dump(mb_detect_encoding($data)); // UTF-8
  2.  
  3. $dom = new \DOMDocument();
  4. $dom->loadHTML($data);
  5.  
  6. var_dump(mb_detect_encoding($dom->saveHTML())); // UTF-8


значит что то в исходном тексте, что это может быть?
 
 Top
Panoptik
Отправлено: 26 Сентября, 2014 - 15:09:12
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2493
Дата рег-ции: Нояб. 2011  
Откуда: Одесса, Украина


Помог: 131 раз(а)




а что в этом закодировано?
Цитата:
РŸР°С€С‚РµС€

не очень похоже на кракозябры. больше как результат htmlentity

(Отредактировано автором: 26 Сентября, 2014 - 15:12:46)



-----
Just do it
 
 Top
Bio man
Отправлено: 26 Сентября, 2014 - 15:10:51
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




Panoptik пишет:
а что в этом закодировано?
Партер
(Добавление)
Не такие кракозябры, такие - ПартеÑ
 
 Top
Panoptik
Отправлено: 26 Сентября, 2014 - 15:17:52
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2493
Дата рег-ции: Нояб. 2011  
Откуда: Одесса, Украина


Помог: 131 раз(а)




это должно помочь
PHP:
скопировать код в буфер обмена
  1. $dom->loadHTML(mb_convert_encoding($data, 'HTML-ENTITIES', 'UTF-8'));


-----
Just do it
 
 Top
Bio man
Отправлено: 26 Сентября, 2014 - 15:19:56
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




Panoptik, спасибо! сработало
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Кодировки и все смежное »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB