Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: проблема с парсером страницы
Форумы портала PHP.SU » PHP » PEAR и PECL » проблема с парсером страницы

Страниц (2): [1] 2 »
 

1. PATCH - 03 Января, 2012 - 00:50:06 - перейти к сообщению
PHP:
скопировать код в буфер обмена
  1. <?PHP
  2. $ch = curl_init();
  3. $headers = array
  4. (  
  5.     'User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7',
  6.         'Referer: http://www.php.su/',
  7.     'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*;q=0.8',
  8.     'Accept-Language: ru,en-us;q=0.7,en;q=0.3',
  9.     'Accept-Encoding: deflate',
  10.     'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7'
  11. );
  12. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  13. curl_setopt($ch, CURLOPT_URL, "http://vkontakte.ru/");
  14. curl_exec($ch);
  15. ?>
вот собствено код думаю тут оч просто и понятно) вот тока ответ приходит) (смотрите в прикреплено скриншоте) вопрос с чем это связано?
2. caballero - 03 Января, 2012 - 01:06:25 - перейти к сообщению
связано очевидно с кодировкой
3. PATCH - 03 Января, 2012 - 01:22:57 - перейти к сообщению
за очевидно спасибо) и сам понел)) вот тока не понел почему он так выводит)) если заголовок отправляется 'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7' )
4. PATCH - 04 Января, 2012 - 00:25:31 - перейти к сообщению
UP) пробывал запрашивать страницу через file тоже самое) точнее не тоже самое) html теги отображает а за мест содержимого ???????? - аналогично если не отправлять в курле header
5. Bio man - 04 Января, 2012 - 00:31:58 - перейти к сообщению
у http://vkontakte[dot]ru/ какая кодировка?
(Добавление)
сам посмотрел. windows-1251. перед выводом в браузер передайте заголовок content-type="text/html; charset=windows-1251" и сам скрипт закодируйте в windows-1251
(Добавление)
заголовок браузеру я имел в виду.
6. PATCH - 04 Января, 2012 - 00:45:36 - перейти к сообщению
тоже самое)

PHP:
скопировать код в буфер обмена
  1. header("content-type=text/html; charset=windows-1251");
  2. $ch = curl_init("http://vkontakte.ru/");
  3. $headers = array
  4. (  
  5.     'User-Agent: Mozilla/5.0',
  6.         'Referer: http://www.php.su/',
  7.     'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
  8.     'Accept-Language:ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4',
  9.     'Accept-Encoding: gzip,deflate,sdch',
  10.     'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.3'
  11. );
  12. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  13.  
  14. curl_exec($ch);
в кажду строку хедер по вставлял до вывода страницы)) одно и тоже) через ноте пад изменил кодировку файла на windows 1251)) тоже самое)
7. Bio man - 04 Января, 2012 - 00:52:49 - перейти к сообщению
PHP:
скопировать код в буфер обмена
  1. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  2. header("content-type=text/html; charset=windows-1251");
  3. curl_exec($ch);
ща у себя попробую
8. PATCH - 04 Января, 2012 - 01:17:22 - перейти к сообщению
затестил и с концами)) нашел фишку) страница парсируется норм) вот тока вбраузер передается коряво)) проверил методом сохранения данных в файл)) как исправить если header не помогает?) есть одна идея) но ресусов займет больше) типо
1)парсить
2)сохранить в файл
3)вывести информацию с файла в браузер)
и как кстати с помощью курла сохранить страницу) я планирую авторизоватся с помощью кукисов) сохранить страницу и потом ее вывести) вк - чисто для тестов взял)
9. Bio man - 04 Января, 2012 - 01:23:42 - перейти к сообщению
PHP:
скопировать код в буфер обмена
  1. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  2. curl_setopt($ch, CURLOPT_URL, "http://vkontakte.ru/");
  3. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  4. $output = curl_exec($ch);
  5. echo $output;

может так?
10. PATCH - 04 Января, 2012 - 01:26:01 - перейти к сообщению
неа) коряво выводит)
11. Bio man - 04 Января, 2012 - 01:29:05 - перейти к сообщению
нашел проблему. щас исправлю и отпишу
(Добавление)
PHP:
скопировать код в буфер обмена
  1. $ch = curl_init();
  2. $headers = array
  3. (  
  4.     'User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7',
  5.         'Referer: http://www.php.su/',
  6.     'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*;q=0.8',
  7.     'Accept-Language: ru,en-us;q=0.7,en;q=0.3',
  8.     'Accept-Encoding: identity',
  9.     'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7'
  10. );
  11. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  12. curl_setopt($ch, CURLOPT_URL, "http://vkontakte.ru/");
  13. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  14. header('Content-Type: text/html;charset=windows-1251');
  15. $output = curl_exec($ch);
  16. echo $output;
12. PATCH - 04 Января, 2012 - 01:40:40 - перейти к сообщению
отлично) ток вот нашелся се равно косяк) в Opere норм) а в chroome замест слов тупо ???????????????? - жирные такие вопросы) и кстати в чем был косяк в 'Accept-Encoding: identity' ? + header?
13. Bio man - 04 Января, 2012 - 01:43:04 - перейти к сообщению
PATCH, в основном в Accept-Encoding, header для кодировки. какая кодировка в хроме приходит?
14. PATCH - 04 Января, 2012 - 01:45:52 - перейти к сообщению
PHP:
скопировать код в буфер обмена
  1. (Request-Line):GET /test/test/readsite.php HTTP/1.1
  2. Host:localhost
  3. Connection:keep-alive
  4. User-Agent:Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7
  5. Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
  6. Referer:http://localhost/test/test/
  7. Accept-Encoding:gzip,deflate,sdch
  8. Accept-Language:ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4
  9. Accept-Charset:windows-1251,utf-8;q=0.7,*;q=0.3
15. Bio man - 04 Января, 2012 - 01:51:27 - перейти к сообщению
PATCH, я имел ввиду не заголовки. как в файрфоксе: Вид -> Кодировка
(Добавление)
у меня в хроме норм все приходит, нормальный текст...

 

Powered by ExBB FM 1.0 RC1