Есть файл xml вида:
<?xml version="1.0" encoding="windows-1251"?>
<!DOCTYPE InfoPacket SYSTEM "http://xml.bullion.ru/dtd/UIF.dtd">
< текст>
Извиняюсь за бестолковость, но когда я начинаю читать файл - то мне сразу выводится вторая строчка. Как прочитать тип кодировки средствами php ?
Когда обрабатываю не зная кодировки - вылетает ошибка о неверном символе.
Использую стандартный парсер (xml_parser_create и т.д.)
Другие парсеры не подходят, т.к. формат файла не соответствует стандартам и не парсится.
1. Bazila - 19 Октября, 2009 - 11:16:13 - перейти к сообщению
2. valenok - 19 Октября, 2009 - 12:16:26 - перейти к сообщению
Покажи пожалуйста как именно ты читаешь файл.
Кроме того
Попробуй просто взять готовую функцию отсюда.
http://il2.php.net/manual/en/fun...on.xml-parse.php
Кроме того
Цитата:
Starting from PHP 5, the input encoding is automatically detected, so that the encoding parameter specifies only the output encoding
Попробуй просто взять готовую функцию отсюда.
http://il2.php.net/manual/en/fun...on.xml-parse.php
3. Bazila - 19 Октября, 2009 - 12:47:47 - перейти к сообщению
читаю через xml_parser_create, вставляя рекурсивно куски файла полученные через fread (file, 4096) и проверяя "вручную" к какому блоку они принадлежат. Структура файла нестандартная ![Недовольство, огорчение Недовольство, огорчение](./im/emoticons/dry.gif)
Для каждой кодировки я вынужден делать конверсию (кроме умолчальной UTF-8).
Причем если пытаюсь считать "неправильную" кодировку - то скрипт вылетает с ошибкой.
Вопрос то не про xml, а про то как прочитать заголовок файла.... Нагуглить ничего толкового не могу.
Приведенная функция помочь не должна т.к. xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, 'UTF-8');
А мне нужно get ;)
![Недовольство, огорчение Недовольство, огорчение](./im/emoticons/dry.gif)
Для каждой кодировки я вынужден делать конверсию (кроме умолчальной UTF-8).
Причем если пытаюсь считать "неправильную" кодировку - то скрипт вылетает с ошибкой.
Вопрос то не про xml, а про то как прочитать заголовок файла.... Нагуглить ничего толкового не могу.
Приведенная функция помочь не должна т.к. xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, 'UTF-8');
А мне нужно get ;)
4. valenok - 19 Октября, 2009 - 13:56:24 - перейти к сообщению
Если честно, я не очень понимаю в чем проблема.
Прочитать первую строку файла можно стандартным ифункциями чтения fread, file_get_contents , но зачем парсеру передавать xml по кускам, когда он может его сам читать из файла, сам распознавать его кодировку и сам все делать - я не понимаю.
На всякий случай, для наглядности, привидите пожалуйста свой код и пример того, что получается и что должно получиться.
Прочитать первую строку файла можно стандартным ифункциями чтения fread, file_get_contents , но зачем парсеру передавать xml по кускам, когда он может его сам читать из файла, сам распознавать его кодировку и сам все делать - я не понимаю.
На всякий случай, для наглядности, привидите пожалуйста свой код и пример того, что получается и что должно получиться.
5. Viper - 20 Октября, 2009 - 07:47:54 - перейти к сообщению
прочитайте кусок файла и регуляркой выдерните encoding.
6. Bazila - 20 Октября, 2009 - 09:05:11 - перейти к сообщению
Народ, а вы точно пробовали читать файл xml через fread?
Я же написал, что он почему то читается со второй строчки.
Это мой локальный пеолтергейст (сам кстати удивился) или как то специфически его читать надо?
Я же написал, что он почему то читается со второй строчки.
Это мой локальный пеолтергейст (сам кстати удивился) или как то специфически его читать надо?
7. Champion - 20 Октября, 2009 - 10:30:59 - перейти к сообщению
Bazila пишет:
Для fread не важно, xml, txt, mp3... Не может он читаться со второй строчки. Просто ты, наверное считываешь ее где-то отдельно от всего основного и теряешь.
Народ, а вы точно пробовали читать файл xml через fread?
8. Viper - 20 Октября, 2009 - 13:30:26 - перейти к сообщению
в первой строке приезжает