PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи

Страниц (1): [1]

> Найдено сообщений: 2
fofan1988 Отправлено: 28 Ноября, 2013 - 09:43:34 • Тема: Не могу спарсить через CURL • Форум: Работа с сетью

Ответов: 0
Просмотров: 1787
Пытаюсь спарсить товар с сайта через CURL. Вот кусок кода CURL:

Цитата:

$curl = curl_init(); //инициализация сеанса
curl_setopt($curl, CURLOPT_URL, 'http://www.сайт.ru/projects.php'); //урл сайта к которому обращаемся

curl_setopt($curl, CURLOPT_COOKIEJAR, $_SERVER['DOCUMENT_ROOT'].'/cook.txt');//сохранить куки в файл
curl_setopt($curl, CURLOPT_COOKIEFILE, $_SERVER['DOCUMENT_ROOT'].'/cook.txt');//считать куки из файла

curl_setopt($curl, CURLOPT_HEADER, 1); //выводим заголовки
curl_setopt($curl, CURLOPT_POST, 1); //передача данных методом POST
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); //теперь curl вернет нам ответ, а не выведет

curl_setopt($curl, CURLOPT_FAILONERROR, 1);

//curl_setopt($curl, CURLOPT_PROXY, "218.246.22.98:3128");


curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0'); //эта строчка как-бы говорит: "я не скрипт, я IE5" Улыбка


curl_setopt ($curl, CURLOPT_REFERER, "http://сайт.ru"); //а вдруг там проверяют наличие рефера
$res = curl_exec($curl);


Запускаю через ajax, ставлю рандомные задержки между запросам (30 - 60 секунд), id товара ставлю тоже рандомное (из определенного диапазона).

Все равно через несколько запросов к сайту - получаю БАН по IP....
fofan1988 Отправлено: 25 Ноября, 2013 - 14:32:05 • Тема: Сайт блокирует парсер • Форум: Работа с сетью

Ответов: 2
Просмотров: 1416
Пытаюсь спарсить с сайта все email-адреса. Парсить пытался без CURLа, просто через file_get_content, использовал ajax, ставил рандомное время таймаута между открытием страниц, в результате - на n-ной странице (10 - 15) получал бан по IP на сутки. Сайт несколько раз лежал от DDOSа. Возможно это как то связано с анти-DDOS системой.

Слышал, что такие вещи лучше делать через CURL, только вот изменит ситуацию его использование - не знаю.

Страниц (1): [1]
Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB