Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: PHP Simple HTML DOM Parser не получается спарсить Яндекс.

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
1000047
Отправлено: 07 Июня, 2012 - 13:59:51
Post Id


Новичок


Покинул форум
Сообщений всего: 12
Дата рег-ции: Апр. 2011  


Помог: 0 раз(а)




Всем привет. Что я не так делаю?
PHP:
скопировать код в буфер обмена
  1.  
  2. function pr($var){
  3.         echo "<pre>";
  4.                 print_r($var);
  5.         echo "</pre>";
  6.         return $var;
  7. }
  8.  
  9. require_once 'simple_html_dom.php';
  10.  
  11. $url = file_get_html("http://yandex.ru/yandsearch?text=%D1%82%D0%B5%D1%81%D1%82&lr=22");
  12.  
  13. $ret = $url->find('b[class="b-serp-item__number"]');
  14.  
  15. pr($ret);
  16.  


На выходе получаю пустой массив. Почему так? Ведь на странице есть b с классом b-serp-item__number.
 
 Top
GeeMTee
Отправлено: 07 Июня, 2012 - 14:16:52
Post Id



Новичок


Покинул форум
Сообщений всего: 14
Дата рег-ции: Янв. 2011  
Откуда: Беларусь, Минск


Помог: 0 раз(а)




Яндекс не возвращает то, что тебе нужно.
Это защита от ботов. Посмотри, какой ответ тебе он отдаёт. Точно, что не страница с результатами поиска.

Копай в сторону передачи нужных ему кук курлом, чтобы яндекс не думал, что ты бот
(Добавление)
И ещё.. На локальном сервере simple_html_dom может некорректно работать..


-----
<?php echo 'Hello, World' ; ?>
 
 Top
Мелкий Супермодератор
Отправлено: 07 Июня, 2012 - 14:44:05
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




У яндекса хорошая защита от парсеров, это точно скажу.

Возможно, для ваших целей подойдёт http://xml[dot]yandex[dot]ru/


-----
PostgreSQL DBA
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Работа с сетью »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB