Я не большой специалист в парсинге. Кинулся юзать Dom.
Пример запроса ниже.
Но столкнулся со следующим:
Парсер показывает 3 узла:
Uzel 0 : Source=
NewsBox
Uzel 1 : Time=
23.01.2009 16:57:18
Uzel 2 : InfoItem=
"ЦБ повысил с 24/01 учетную цену золота до 923,22 руб дубльБиржи Банки ФондыСитуация и прогноз....... текст весь что есть в этом блоке без всяких <> заканчивая[B] ....... Департаментом внешних и общественных связей ЦБ РФ".
[b]Т.е. узел InfoItem не распарсилсяна вложенные в него подузлы! Зато исчезли теги таблиц
Как правильно сделать или хотя бы в каком направлении думать. Пож-ста. Сложность еще в том, что кодировка файла не UTF-8
Нужно чтобы работало на PHP5.
Наверняка есть команды или варианты обхода и вложенных узлов... Но что то пример нагуглить не могу. Да и 90 % почему то варианты нерабочие на PHP5 скачиваю...
Пропали в выводе теги вложенной таблицы. Их бы тоже сохранить как
PHP:
скопировать код в буфер обмена
скопировать код в буфер обмена
- <?PHP
- $dom = new DOMDocument();
- $dom->load("primer.xml");
- echo "<br>new<br>";
- $root = $dom->documentElement;
- $nodeList = $root->childNodes;
- echo "Total: $nodesList->lenght";
- echo $nodeList->lenght;
- echo $x->childNodes;
- echo $root->childNodes->lenght;
- echo "<br>";
- $i=0;
- for ($child=$root->firstChild; $child; $child=$child->nextSibling)
- {
- $child = $nodeList->item($i);
- echo "Узел $i : ";
- echo "=";
- $i++;
- }
- ?>