1. RinaFolk - 13 Ноября, 2014 - 11:41:33 - перейти к сообщению
.
2. RinaFolk - 13 Ноября, 2014 - 12:07:44 - перейти к сообщению
Здравствуйте!
возникла проблема в парсинге яндекса.
парсер xml уже есть, теперь нужен парсер в лоб.
не получается отправить запрос на решение captcha, в ответ приходит, что страница не найдена.
буду рада помощи
листинг:
возникла проблема в парсинге яндекса.
парсер xml уже есть, теперь нужен парсер в лоб.
не получается отправить запрос на решение captcha, в ответ приходит, что страница не найдена.
буду рада помощи
листинг:
PHP:
скопировать код в буфер обмена
скопировать код в буфер обмена
- $user_agent="Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36";
- "numdoc"=>$results_per_page,
- "lr"=>$region_utf8);
- $setopt_url='http://yandex.ru/yandsearch?text='.$search['text'].'&p='.$j.'&numdoc='.$search['numdoc'].'&lr='.$search['lr'].'';
- $output=$this->get_curl_info($setopt_url);
- {
- $addur=new addurl;
- $key=getTag('<input type="hidden" name="key" value="','">',$output);
- $retpath=getTag('<input type="hidden" name="retpath" value="','">',$output);
- $filename=$addur->saveCaptcha(getTag('<img src="','" class="b-captcha__image">',$output));
- "retpath"=>$retpath,
- "rep"=>$result_key);
- //print_r($post); die();
- $output=$this->get_curl_info('http://yandex.ru/checkcaptcha?key='.$post['key'].'&retpath='.$post['retpath'].'&rep='.$post['rep'].'');
- }
- function get_curl_info($url,$post="")
- {
- $path_up = "../";
- $user_agent="Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36";
- //curl_setopt($ch, CURLOPT_HTTPHEADER, array($referer_new));
- //curl_setopt($ch, CURLOPT_FRESH_CONNECT, FALSE);
- //curl_setopt($ch, CURLOPT_NOBODY,true);
- {
- }
- return $data;
- }
P.S. не судите строго, программирую на php не так давно