Форумы портала PHP.SU » » Кодировки и все смежное » двойная кодировка символов

Страниц (1): [1]
 

1. wa5ab1 - 24 Апреля, 2012 - 15:50:14 - перейти к сообщению
Есть два текста:
первый: Рю.РЁР?Р№РіС?: Р?С?ишлР? РІС?РµР?С? РїР?казатС?, Р?Р° чтР? Р?С? С?РїР?С?Р?Р±Р?С
второй: Сообщение о факельном горении из магистрального газопровода в Федоровском районе поступило около 12:20 мск. Сей
Оба в ютф-8, но первый два раза. mb_detect_encoding возвращает ютф-8 как в первом так и во втором случае, как различать их? просто регуляркой не получается, т.к. в первом варианте тоже есть русские буквы, а отличать эти два текста друг от друга надо.
2. nagrizolich - 25 Апреля, 2012 - 00:05:03 - перейти к сообщению
есть мнение, что никак. А откуда вы эти строки берете? Почему они в разных кодировках?
3. OrmaJever - 25 Апреля, 2012 - 00:37:40 - перейти к сообщению
А что значит "2 раза в utf"? Это как? Если в utf значит на странице с utf должно вывести корректно.
4. wa5ab1 - 25 Апреля, 2012 - 11:07:36 - перейти к сообщению
дабл энкодинг ту ютф8 фром цп1251, это консольная утилита мне говорит, данные берем из одного истичника, и при таком сбое у них - сбой соответственно и у нас, а это не хорошо. Пока лучше проверки на читаемость с помощью регулярки ничего не придумал.

 

Powered by ExBB FM 1.0 RC1