Путь конвертации файлов (я справа):
utf8(I don't known) -> cp1251(windows) -> utf8(Linux)
Люди подскажите пожалуйста ord()'ы от BOM'ов!!! Вырезать бы мне их из текстовых файлов...
(Добавление)
Или рыгулярочкой поделитесь...
(Добавление)
1. При открытии файла в gedit в кодировке utf-8 вся кириллица отображается нормально (неужели utf-8???).
2. При открытии там же в cp1251 - отказывается показывать (знать в наличии непечатаемые символы)
3. При file_get_contents(этого файла), отправке заголовка header('Content-Type: text/html; charset=utf-8'), и выдаче в браузер вместо текста вопросы в ромбиках.
4. При отправке заголовка header('Content-Type: text/html; charset=windows-1251'), стандартные такие кракозяблы...
Сделал такую фишку:
Выводит с заголовком utf-8:
0 - 208 - �
1 - 144 - �
2 - 208 - �
3 - 187 - �
4 - 208 - �
5 - 181 - �
6 - 208 - �
7 - 186 - �
8 - 209 - �
9 - 129 - �
///////////////////////
Выводит с заголовком windows-1251:
0 - 208 - Р
1 - 144 - ђ
2 - 208 - Р
3 - 187 - »
4 - 208 - Р
5 - 181 - µ
6 - 208 - Р
7 - 186 - є
8 - 209 - С
9 - 129 - Ѓ
(вопросики и кракозяблы вставились - щас еще посмотрю как они тут на форуме отобразятся)
Что-то мне ord'ы не нравятся - помоему они не от utf-8...
|