Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Как узнать кодировку файла xml?

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Bazila
Отправлено: 19 Октября, 2009 - 11:16:13
Post Id


Новичок


Покинул форум
Сообщений всего: 3
Дата рег-ции: Окт. 2009  


Помог: 0 раз(а)




Есть файл xml вида:
<?xml version="1.0" encoding="windows-1251"?>
<!DOCTYPE InfoPacket SYSTEM "http://xml.bullion.ru/dtd/UIF.dtd">
< текст>

Извиняюсь за бестолковость, но когда я начинаю читать файл - то мне сразу выводится вторая строчка. Как прочитать тип кодировки средствами php ?
Когда обрабатываю не зная кодировки - вылетает ошибка о неверном символе.
Использую стандартный парсер (xml_parser_create и т.д.)
Другие парсеры не подходят, т.к. формат файла не соответствует стандартам и не парсится.

(Отредактировано автором: 19 Октября, 2009 - 11:32:05)

 
 Top
valenok Модератор
Отправлено: 19 Октября, 2009 - 12:16:26
Post Id



Здесь могла бы быть ваша реклама


Покинул форум
Сообщений всего: 4574
Дата рег-ции: Июль 2006  
Откуда: Israel


Помог: 3 раз(а)




Покажи пожалуйста как именно ты читаешь файл.
Кроме того
Цитата:
Starting from PHP 5, the input encoding is automatically detected, so that the encoding parameter specifies only the output encoding


Попробуй просто взять готовую функцию отсюда.
http://il2.php.net/manual/en/fun...on.xml-parse.php


-----
Truly yours, Sasha.
 
My status
 Top
Bazila
Отправлено: 19 Октября, 2009 - 12:47:47
Post Id


Новичок


Покинул форум
Сообщений всего: 3
Дата рег-ции: Окт. 2009  


Помог: 0 раз(а)




читаю через xml_parser_create, вставляя рекурсивно куски файла полученные через fread (file, 4096) и проверяя "вручную" к какому блоку они принадлежат. Структура файла нестандартная Недовольство, огорчение
Для каждой кодировки я вынужден делать конверсию (кроме умолчальной UTF-8).
Причем если пытаюсь считать "неправильную" кодировку - то скрипт вылетает с ошибкой.

Вопрос то не про xml, а про то как прочитать заголовок файла.... Нагуглить ничего толкового не могу.
Приведенная функция помочь не должна т.к. xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, 'UTF-8');

А мне нужно get ;)

(Отредактировано автором: 19 Октября, 2009 - 12:49:49)

 
 Top
valenok Модератор
Отправлено: 19 Октября, 2009 - 13:56:24
Post Id



Здесь могла бы быть ваша реклама


Покинул форум
Сообщений всего: 4574
Дата рег-ции: Июль 2006  
Откуда: Israel


Помог: 3 раз(а)




Если честно, я не очень понимаю в чем проблема.
Прочитать первую строку файла можно стандартным ифункциями чтения fread, file_get_contents , но зачем парсеру передавать xml по кускам, когда он может его сам читать из файла, сам распознавать его кодировку и сам все делать - я не понимаю.

На всякий случай, для наглядности, привидите пожалуйста свой код и пример того, что получается и что должно получиться.


-----
Truly yours, Sasha.
 
My status
 Top
Viper
Отправлено: 20 Октября, 2009 - 07:47:54
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




прочитайте кусок файла и регуляркой выдерните encoding.


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
Bazila
Отправлено: 20 Октября, 2009 - 09:05:11
Post Id


Новичок


Покинул форум
Сообщений всего: 3
Дата рег-ции: Окт. 2009  


Помог: 0 раз(а)




Народ, а вы точно пробовали читать файл xml через fread?
Я же написал, что он почему то читается со второй строчки.
Это мой локальный пеолтергейст (сам кстати удивился) или как то специфически его читать надо?
 
 Top
Champion Супермодератор
Отправлено: 20 Октября, 2009 - 10:30:59
Post Id



Активный участник


Покинул форум
Сообщений всего: 4350
Дата рег-ции: Авг. 2008  
Откуда: Москва


Помог: 57 раз(а)




Bazila пишет:
Народ, а вы точно пробовали читать файл xml через fread?
Для fread не важно, xml, txt, mp3... Не может он читаться со второй строчки. Просто ты, наверное считываешь ее где-то отдельно от всего основного и теряешь.
 
 Top
Viper
Отправлено: 20 Октября, 2009 - 13:30:26
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




PHP:
скопировать код в буфер обмена
  1. $file = 'something.xml';
  2. $handle = fopen($file, 'rb');
  3. $contents = fread($handle, filesize($file));
  4. fclose($handle);
  5.  
  6. echo $contents;


в первой строке приезжает
CODE (text):
скопировать код в буфер обмена
  1. <?xml version="1.0" encoding="windows-1251"?>


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
Champion Супермодератор
Отправлено: 20 Октября, 2009 - 13:34:50
Post Id



Активный участник


Покинул форум
Сообщений всего: 4350
Дата рег-ции: Авг. 2008  
Откуда: Москва


Помог: 57 раз(а)




А еще мысль. Может быть, автор считывает в массив и забывает, что нумерация элементов массива начинается с 0 ?
 
 Top
fenume
Отправлено: 25 Января, 2010 - 06:15:11
Post Id


Новичок


Покинул форум
Сообщений всего: 1
Дата рег-ции: Янв. 2010  


Помог: 0 раз(а)




По-моему вы зря все это городите - скорее всего у человека сохранен xml файл в utf8+BOM. вот этот BOM и дает неверный символ об который спотыкается парсер. Или кодировка файла не соответствует указанной в хмл
 
 Top
JustUserR
Отправлено: 25 Января, 2010 - 12:57:26
Post Id



Активный участник


Покинул форум
Сообщений всего: 8715
Дата рег-ции: Июнь 2009  


Помог: 17 раз(а)




Bazila Читайте именно fread-ом как вам советовали выше - потому что эта функция не смотрит на всякие спецсимволы и читает некоторое число байт - таким образом вы гарантированно получить первую строчку
Если вы открывали файл равнее то сделайте fseek($file,0,0) и еще так как у вас файл может быть юникодный то установить соответствующую локаль


-----
Сделать можно все что угодно - нужно только старание, терпение и хороший поисковик Улыбка
Безлимитный web-хостинг от 15 рублей за 40 МБ дискового пространства - http://ihost[dot]oks71[dot]ru/
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Программирование на PHP »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB