Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Оптимизация str_get_html (парсинг)

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
bombording
Отправлено: 21 Ноября, 2013 - 08:32:12
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Нояб. 2013  


Помог: 0 раз(а)




Добрый день. Имеется скрипт, который парсит html страницу.
PHP:
скопировать код в буфер обмена
  1. require_once('simple_html_dom.php');
  2. $url = "http://site/export?file=2013-11-18";
  3. $html = file_get_contents($url); // получаем экспортируемый файл с html
  4. $html = str_get_html($html);
  5.     foreach($html->find('table tr') as $a){
  6.         if (@$a->find('td',0)->plaintext) {
  7.              echo $a->find('td',1)->plaintext . '<br>';
  8.         }
  9.     }


Сам файл html кода, который доступен по ссылке http://site/export?file=2013-11-18 представляет собой табличку <table><tr><td> и занимает около 500 кб.
file_get_contents отрабатывает мгновенно.
А вот str_get_html - обрабатывается подка 3-х минут.

Вопрос:
Возможно ли как то оптимизировать код, что бы парсинг страницы происходил быстрее?

(Отредактировано автором: 21 Ноября, 2013 - 08:34:48)

 
 Top
_Dark_
Отправлено: 21 Ноября, 2013 - 18:48:49
Post Id


Частый гость


Покинул форум
Сообщений всего: 231
Дата рег-ции: Окт. 2011  


Помог: 5 раз(а)

[+]


Использовать phpQuery.
 
 Top
armancho7777777 Супермодератор
Отправлено: 21 Ноября, 2013 - 19:01:01
Post Id



Активный участник


Покинул форум
Сообщений всего: 4526
Дата рег-ции: Февр. 2011  
Откуда: Москва


Помог: 221 раз(а)




Не знаком с самой реализацией либы simple_html_dom, но порекомендую простое и быстрое решение.
Что будет не ясно, спросите в той теме.

(Отредактировано автором: 21 Ноября, 2013 - 19:02:07)

 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB