Ответов: 6 Просмотров: 2335
|
Всем привет.
Задача состоит в следующем.
Есть ссылки
http://popmyads[dot]com/serve/3848/3[dot][dot][dot]c3BlcGl0by5jb20v
http://clkmon[dot]com/adServe/sa?cid[dot][dot][dot]scarga%20directa
Значит, дело в том, что каждый раз заходя по одной из ссылок происходит цепочка редиректов, но каждый раз по разному, и в конечном итоге заходя с одного и того же айпи, и с одного и того же юзерагента получаем разные урлы.
Пробовал отлавливать заголовки курлом, установил хождение по редиректам, но до конечного редиректа не ходит, потому что иногда редирект есть в локейшене, а иногда в яваскрипе прописал черех хреф.локейшн.
И ещё, я так и не понял как отловить конечные урлы запуская несколько раз в терминале.
Заходя через браузер меня редиректит на разные урлы, а через терминал бросает на один и тот же. Получается что с куками что-то связано.
Кто что скажет по этому поводу, может приходилось сталкиваться с этим??
Вот собственно код CODE ( htmlphp):
скопировать код в буфер обмена
<?php //подключаю файл с юзерагентами, рендомом подставляю каждый раз при заходе include("random-user-agent.php"); curl_setopt($ch, CURLOPT_URL, 'http://clkmon.com/adServe/sa?cid=PORPOP&pid=&q=estrenos%2C%20peliculas%2C%20series%2C%20musica%2C%20software%2C%20ebooks%2C%20descarga%20directa'); curl_setopt($ch, CURLOPT_USERAGENT,random_user_agent()); //curl_setopt($ch, CURLOPT_PROXY, "186.109.91.3:8080"); if(!$page) { } else { echo $page; } ?>
:
Получается что мне как бы должно вываливать всю цепь редиректов, но оно идёт до первого и получается что один заголовок присылает 302, а второй 200, но у него редирект стоит яваскриптом, я пытался отлавливать его через регулярное выражение, хотя, по идее курл должен ходить до конца. И ещё нужно будет через прокси пробовать, но это уже потом. |