Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: парсер яндекса

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: не частый вопрос...
Алекс2011
Отправлено: 31 Марта, 2011 - 11:26:50
Post Id


Новичок


Покинул форум
Сообщений всего: 5
Дата рег-ции: Март 2011  


Помог: 0 раз(а)




Приветствую

много прочел про парсеры выдачи поисковика, но у меня вопрос другой - парсинг яндекс-карт, а именно вывода организаций, расположенных по апределенному адресу.
т.к. я новичек, проблем много - подскажите, куда смотреть?
1) file_get_contents ничего не получает с адреса http://maps[dot]yandex[dot]ru/
2) введение поискового запроса в поля поиска никак не меняет этот адрес - http://maps[dot]yandex[dot]ru/ . Как формировать запрос из парсера?
3) яндекс выдает ссылку на результатты поиска в виде http://maps[dot]yandex[dot]ru/-/CBQAm2Nq
но в исходном коде этой ссылки нет, она формируется только при запросе в соответствующем поле... как ее получить? Т.е. как парсером сформировать клик на определенном поле?


много хочу, я понимаю Улыбка Но если хотя бы один ответ на один вопрос решит - поделюсь результатом со всеми.

Спасибо!
 
 Top
AdMeen
Отправлено: 31 Марта, 2011 - 11:42:02
Post Id



Посетитель


Покинул форум
Сообщений всего: 370
Дата рег-ции: Сент. 2009  
Откуда: Воронеж


Помог: 1 раз(а)




я так понимаю, что яндекс совершает асинхронные запросы к серверу. отслеживайте их и курл вам в помощь
 
 Top
Viper
Отправлено: 31 Марта, 2011 - 11:44:24
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




Алекс2011 смотрите api карт. честно говорю запаритесь парсить без него результаты.

1) file_get_contents ничего и не получит т.к.
1а) нужно отправлять координаты либо адрес
1б) отсылать API ключ. т.к. без него геокодер не даст вам ничего
2) И не будет, т.к. обратно вы получите jsonp
3) Несколько непонятно, но скорее всего после $_POST и перезагрузки страницы

AdMeen в обратку он получит тайлы карты.

(Отредактировано автором: 31 Марта, 2011 - 11:47:33)



-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
AdMeen
Отправлено: 31 Марта, 2011 - 12:00:39
Post Id



Посетитель


Покинул форум
Сообщений всего: 370
Дата рег-ции: Сент. 2009  
Откуда: Воронеж


Помог: 1 раз(а)




Viper пишет:

AdMeen в обратку он получит тайлы карты.


Я всего лишь предположил Закатив глазки
 
 Top
JustUserR
Отправлено: 31 Марта, 2011 - 20:35:55
Post Id



Активный участник


Покинул форум
Сообщений всего: 8715
Дата рег-ции: Июнь 2009  


Помог: 17 раз(а)




Алекс2011 В качестве возможного варианта для осуществления решения предполагаемой задачи, заключающеся в проведении анализа и эффективного действенного извлечения объектов клиентской web-страницы, размещение которых производится в совмещенном пониженном базовом элементном уровня трактования относительно реального потока исполнения, допустимо использование технологии HTA основанной на платформе браузера Internet explorer, которая позволяет осуществлять внедрения предшествующий управляющих функциональных объектов в сопоставленные группированные базовые элеметные уровни трактования, на основании которого допустимо выполнения приоритетного действенного анализа целевой web-страницы


-----
Сделать можно все что угодно - нужно только старание, терпение и хороший поисковик Улыбка
Безлимитный web-хостинг от 15 рублей за 40 МБ дискового пространства - http://ihost[dot]oks71[dot]ru/
 
 Top
pasha237
Отправлено: 31 Марта, 2011 - 22:58:33
Post Id


Новичок


Покинул форум
Сообщений всего: 9
Дата рег-ции: Июнь 2010  
Откуда: Донецк


Помог: 0 раз(а)




А смысл в парсере Яндекса? Когда-то парился, парился. Плюнул скачал уже готовый парсер - программу. Ну, запустил, ну напарсил несколько сот килобайтов с горячего эфира Яндекса. Но, всё это ничего не даёт!
 
 Top
evgenijj
Отправлено: 01 Апреля, 2011 - 01:03:28
Post Id



Участник


Покинул форум
Сообщений всего: 1212
Дата рег-ции: Авг. 2006  
Откуда: Москва


Помог: 10 раз(а)




Поскольку желающих парсить выдачу Яндекса очень много (причем -- в корыстных целях), поисковик защищается. Чтобы получить выдачу (и извлечь нужную информацию) надо "замаскироваться" под браузер. Выдавать с помощью CURL разный User-Agent, разные IP (с помощью прокси-серверов) и т.п. В этом тебе поможет плагин для браузера, позволяющий просматривать заголовки. Твоя задача -- скопировать эти заголовки полностью. Твои запросы из скрипта не должны отличаться от запросов, которые задает обычный пользователь. Не части, маскируйся, будь типичным пользователем -- и Яндекс к тебе потянется...
Когда научишься обманывать Яндекс -- приходи (спроси разрешения у модераторов форума), задавай вопрос, как извлечь нужную информацию...
P.S. Отвечая на твой вопрос, я, скорее всего, заработаю (бан) неодобрение от модераторов forum.php.su (во всяком случае, на SQL.RU мне за подобные советы навешали ...)
P.P.S. Будет на твоей совести Улыбка
 
 Top
OrmaJever Модератор
Отправлено: 01 Апреля, 2011 - 01:32:46
Post Id



Активный участник


Покинул форум
Сообщений всего: 7540
Дата рег-ции: Янв. 2010  
Откуда: Чернигов


Помог: 299 раз(а)




evgenijj пишет:
будь типичным пользователем -- и Яндекс к тебе потянется...

Класная цытата! Подмигивание
А вобще сложно боротся с тем чего не знаешь. Если бы знать по каким имено критериям тот же яндекс различает пользователяот бота. А гадать сложновато.

(Отредактировано автором: 01 Апреля, 2011 - 01:33:19)



-----
Если вы хотя бы 3-4 раза не решите всё выкинуть и начать заново - вы явно что-то делаете не так.
 
 Top
evgenijj
Отправлено: 01 Апреля, 2011 - 01:41:37
Post Id



Участник


Покинул форум
Сообщений всего: 1212
Дата рег-ции: Авг. 2006  
Откуда: Москва


Помог: 10 раз(а)




OrmaJever пишет:
Если бы знать по каким имено критериям тот же яндекс различает пользователя от бота.

Хм... Знал бы прикуп -- жил бы в Сочи Улыбка (Русская пословица)

(Отредактировано автором: 01 Апреля, 2011 - 01:45:38)

 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Программирование на PHP »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB