Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Сайт странно отдает кодировку...
Форумы портала PHP.SU » PHP » Программирование на PHP » Сайт странно отдает кодировку...

Страниц (1): [1]
 

1. webbaster - 08 Апреля, 2011 - 20:17:20 - перейти к сообщению
Народ, помогите плз.

Сайт http://ermispb[dot]ru

Делаю так:

CODE (htmlphp):
скопировать код в буфер обмена
  1.  
  2. $url_text=file_get_contents("http://ermispb.ru");
  3. echo mb_detect_encoding($url_text);
  4.  


Отдает UTF-8, хотя сайт работает на windows-1251

Подскажите, что не так на сайте? И как можно избежать подобных несоответствий при определении кодировки текста в php, т.к. если скрипт определяет UTF-8 и перекодирует его в win функцией iconv то отдает пустую переменную ((

Спасибо.
2. valenok - 08 Апреля, 2011 - 20:38:30 - перейти к сообщению
фишка заключается в том, что mb_detect_encoding принимает вторым параметром список кодировок из которых он и выбирает самую похожую на кодировку текста. Если его нет, использует список кодировок по умолчанию.
И работает он по принципу элиминации. Тоесть ищет в тексте символ не сущесвтующий в этой кодировке. Тоесть проходится по всем символам строки и проверяет есть ли такой символ в кодировке utf-8. Если все нашлись - значит это и есть кодировка.

Вопрос в том, что вам надо.
Определить utf-8 ли это?
Или определить какая кодировка это из списка?
3. Champion - 08 Апреля, 2011 - 20:45:38 - перейти к сообщению
Редирект форума якори у ссылок отрезает.
4. webbaster - 08 Апреля, 2011 - 20:54:05 - перейти к сообщению
Делаю следующее.
1. Граблю в массив тексты с сайтов и очищаю от html тегов. (file_get_contents, strip_tags)
2. Определяю кодировку каждого элемента и записываю в переменную
3. С помощью оператора switch переключаю на соответствующую функцию перекодирования.
Именно с п.3 проблемы, т.к. если кодировка сграбленного текста определена не правильно, как в случае с сайтом http://ermispb[dot]ru (реально кодировка windows-1251, а определяется как UTF-8), то попадая на функцию
CODE (htmlphp):
скопировать код в буфер обмена
  1. $url_text_processed=iconv("UTF-8", "windows-1251", $text_url);

переменная $url_text_processed оказывается пустая ((
5. valenok - 09 Апреля, 2011 - 10:00:41 - перейти к сообщению
http://uk2.php.net/manual/en/fun...coding.php#89944
6. webbaster - 09 Апреля, 2011 - 13:43:12 - перейти к сообщению
Спасибо, буду пробовать.

 

Powered by ExBB FM 1.0 RC1