Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Сайт странно отдает кодировку...

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: Работает на win-1251, а отдает UTF-8
webbaster
Отправлено: 08 Апреля, 2011 - 20:17:20
Post Id



Новичок


Покинул форум
Сообщений всего: 24
Дата рег-ции: Март 2011  
Откуда: Санкт-Петербург


Помог: 0 раз(а)




Народ, помогите плз.

Сайт http://ermispb[dot]ru

Делаю так:

CODE (htmlphp):
скопировать код в буфер обмена
  1.  
  2. $url_text=file_get_contents("http://ermispb.ru");
  3. echo mb_detect_encoding($url_text);
  4.  


Отдает UTF-8, хотя сайт работает на windows-1251

Подскажите, что не так на сайте? И как можно избежать подобных несоответствий при определении кодировки текста в php, т.к. если скрипт определяет UTF-8 и перекодирует его в win функцией iconv то отдает пустую переменную ((

Спасибо.
 
 Top
valenok Модератор
Отправлено: 08 Апреля, 2011 - 20:38:30
Post Id



Здесь могла бы быть ваша реклама


Покинул форум
Сообщений всего: 4574
Дата рег-ции: Июль 2006  
Откуда: Israel


Помог: 3 раз(а)




фишка заключается в том, что mb_detect_encoding принимает вторым параметром список кодировок из которых он и выбирает самую похожую на кодировку текста. Если его нет, использует список кодировок по умолчанию.
И работает он по принципу элиминации. Тоесть ищет в тексте символ не сущесвтующий в этой кодировке. Тоесть проходится по всем символам строки и проверяет есть ли такой символ в кодировке utf-8. Если все нашлись - значит это и есть кодировка.

Вопрос в том, что вам надо.
Определить utf-8 ли это?
Или определить какая кодировка это из списка?


-----
Truly yours, Sasha.
 
My status
 Top
Champion Супермодератор
Отправлено: 08 Апреля, 2011 - 20:45:38
Post Id



Активный участник


Покинул форум
Сообщений всего: 4350
Дата рег-ции: Авг. 2008  
Откуда: Москва


Помог: 57 раз(а)




Редирект форума якори у ссылок отрезает.
 
 Top
webbaster
Отправлено: 08 Апреля, 2011 - 20:54:05
Post Id



Новичок


Покинул форум
Сообщений всего: 24
Дата рег-ции: Март 2011  
Откуда: Санкт-Петербург


Помог: 0 раз(а)




Делаю следующее.
1. Граблю в массив тексты с сайтов и очищаю от html тегов. (file_get_contents, strip_tags)
2. Определяю кодировку каждого элемента и записываю в переменную
3. С помощью оператора switch переключаю на соответствующую функцию перекодирования.
Именно с п.3 проблемы, т.к. если кодировка сграбленного текста определена не правильно, как в случае с сайтом http://ermispb[dot]ru (реально кодировка windows-1251, а определяется как UTF-8), то попадая на функцию
CODE (htmlphp):
скопировать код в буфер обмена
  1. $url_text_processed=iconv("UTF-8", "windows-1251", $text_url);

переменная $url_text_processed оказывается пустая ((
 
 Top
valenok Модератор
Отправлено: 09 Апреля, 2011 - 10:00:41
Post Id



Здесь могла бы быть ваша реклама


Покинул форум
Сообщений всего: 4574
Дата рег-ции: Июль 2006  
Откуда: Israel


Помог: 3 раз(а)






-----
Truly yours, Sasha.
 
My status
 Top
webbaster
Отправлено: 09 Апреля, 2011 - 13:43:12
Post Id



Новичок


Покинул форум
Сообщений всего: 24
Дата рег-ции: Март 2011  
Откуда: Санкт-Петербург


Помог: 0 раз(а)




Спасибо, буду пробовать.
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Программирование на PHP »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB