Новичок
Покинул форум
Сообщений всего: 27
Дата рег-ции: Дек. 2015
Помог: 0 раз(а)
|
event
Уже работает!
Сейчас я тебе помогу, мой друг.. дай взглянуть..
вот твое рег. выражение.. рабочее)
PHP:
скопировать код в буфер обмена
$regex = '`<div[\s\w="\'-]+itemprop=["\']articleBody["\']>(.*?)<\/div>[\s\n\r]+<div\s+class=["\']entry-meta content-block-header["\']>`is'
А это нормальная CURL функция для получения контента.. рекомендую использовать именно ее в коде.. чтобы было так..
Это сама функция, что использую в предыдущем коде. Почему? Потому-что... универсальная, получает сжатый контент, эмитирует просмотр страницы через браузер, а не через PHP код, получает подробную информацию о потоке, легка в отладке..
Спойлер (Отобразить)PHP:
скопировать код в буфер обмена
"Mozilla/5.0 (Windows; U; Windows NT 6.0; fr; rv:1.9.1b1) Gecko/20081007 Firefox/3.1b1", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.0", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.19 (KHTML, like Gecko) Chrome/0.4.154.18 Safari/525.19", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13", "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30)", "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.40607)", "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.1; .NET CLR 1.1.4322)", "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.1; .NET CLR 1.0.3705; Media Center PC 3.1; Alexa Toolbar; .NET CLR 1.1.4322; .NET CLR 2.0.50727)", "Mozilla/45.0 (compatible; MSIE 6.0; Windows NT 5.1)", "Mozilla/4.08 (compatible; MSIE 6.0; Windows NT 5.1)", "Mozilla/4.01 (compatible; MSIE 6.0; Windows NT 5.1)", "Mozilla/5.0 (Windows NT 5.1; rv:17.0)", 'Mozilla/5.0 (Windows NT 5.1; rv:30.0) Gecko/20100101 Firefox/30.0' ); function getRandomUserAgent ( ) { global $UA; } function _cURL ($link, $config=array(), $to_string = true, $data = '', $datatipe = 'POST', $login_details = array('username' =>null , 'password' => null)){ 'errno' => null, 'error' => null, 'info' => null, 'content' => null, 'options' => null ); CURLOPT_URL =>$link, CURLOPT_REFERER => 'www.google.com', CURLOPT_AUTOREFERER => true, CURLOPT_HEADER => false, CURLOPT_USERAGENT => getRandomUserAgent(), CURLOPT_ENCODING => '', CURLOPT_TIMEOUT => 200, CURLOPT_CONNECTTIMEOUT => 200, CURLOPT_FOLLOWLOCATION => 1, ); if ($to_string) { $options[CURLOPT_RETURNTRANSFER] = true; } if ($data !='') { if ($datatipe == 'POST') { $options[CURLOPT_POST] = true; $options[CURLOPT_POSTFIELDS] = $data; } } if (count($login_details) && (!empty($login_details['username']) && !empty($login_details['password']))) { $options [CURLOPT_HTTPAUTH] = CURLAUTH_ANY; $options [CURLOPT_USERPWD] = $login_details['username'].':'.$login_details['password']; } // $cURL_return['options'] = $options; return $cURL_return; }
(Отредактировано автором: 13 Января, 2016 - 03:21:16)
|