1. Pavelbeginner - 19 Января, 2012 - 16:56:45 - перейти к сообщению
Работаю с xml файлом. Кодировка windows-1251. Использую метод DOMDocument->load() и дальше работаю с DOM. После некоторых манипуляций вывожу данные xml файла на сайт. Сайт также в кодировке windows-1251. В итоге на сайте кракозябры. Поменял кодировку в браузере на utf-8 - стало нормально. Из-за чего меняется кодировка с windows-1251 на utf-8? Я и после того, как подгружаю содержимое xml файла, проверяю какая кодировка в DOM, выводит, что windows-1251. Почему тогда на сайт попадает utf-8???
2. sKaa - 19 Января, 2012 - 17:28:24 - перейти к сообщению
Сами файлы могут быть сохранены в другой кодировке
3. Pavelbeginner - 19 Января, 2012 - 17:29:25 - перейти к сообщению
sKaa пишет:
Сами файлы могут быть сохранены в другой кодировке
Проверял - в ansi. Создавал отдельно файл и снуля писал, не помогло.
4. sKaa - 19 Января, 2012 - 17:35:20 - перейти к сообщению
Я хз что такое ansi. Откройте файл каким нибудь notepad++ или чем нить похожем, там можно будет сменить кодировку файла, если у вас сайт windows-1251 то и файлы нужно сохранить в этой кодировке
5. Bio man - 19 Января, 2012 - 17:39:24 - перейти к сообщению
в самой первой строчке XML файла какая кодировка указана?
(Добавление)
и почему в ANSI? ANSI !== windows-1251
(Добавление)
и походу ANSI == UTF-8 без BOM, по крайне мере так notepad++ говорит
(Добавление)
и почему в ANSI? ANSI !== windows-1251
(Добавление)
и походу ANSI == UTF-8 без BOM, по крайне мере так notepad++ говорит
6. sKaa - 19 Января, 2012 - 17:44:53 - перейти к сообщению
Bio man пишет:
Попробуй теперь сохранить в ANSI обычным блокнотом.
notepad++
7. snikers987 - 19 Января, 2012 - 17:47:35 - перейти к сообщению
Цитата:
ANSI == UTF-8 без BOM
Да неужили?
8. Мелкий - 19 Января, 2012 - 18:02:55 - перейти к сообщению
Пресекая дальнейший холивар вокруг ANSI:
фактически, это стандартизирующая организация.
Относительно кодировок - это ANSI X3.4, тупой 7-битный ASCII. Который неизменным образом входит в cp1251, UTF-(любой), KOI8R и огромную кучу прочих кодировок.
В ASCII, само собой, никакой кириллицы нет. И в какой кодировке сохраняются остальные 128 значений - знает только редактор.
фактически, это стандартизирующая организация.
Относительно кодировок - это ANSI X3.4, тупой 7-битный ASCII. Который неизменным образом входит в cp1251, UTF-(любой), KOI8R и огромную кучу прочих кодировок.
В ASCII, само собой, никакой кириллицы нет. И в какой кодировке сохраняются остальные 128 значений - знает только редактор.
9. Pavelbeginner - 19 Января, 2012 - 18:41:15 - перейти к сообщению
В самом xml файле кодировка windows-1251. Если взять и сделать
То всё отлично!
А после использования метода DOMDocument->load() на выходе получаем - UTF-8, хотя смотрю в какой кодировке узлы DOM, выводит, что windows-1251.