Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: проблема с парсером страницы

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (2): [1] 2 »   

> Без описания
PATCH
Отправлено: 03 Января, 2012 - 00:50:06
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




PHP:
скопировать код в буфер обмена
  1. <?PHP
  2. $ch = curl_init();
  3. $headers = array
  4. (  
  5.     'User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7',
  6.         'Referer: http://www.php.su/',
  7.     'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*;q=0.8',
  8.     'Accept-Language: ru,en-us;q=0.7,en;q=0.3',
  9.     'Accept-Encoding: deflate',
  10.     'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7'
  11. );
  12. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  13. curl_setopt($ch, CURLOPT_URL, "http://vkontakte.ru/");
  14. curl_exec($ch);
  15. ?>
вот собствено код думаю тут оч просто и понятно) вот тока ответ приходит) (смотрите в прикреплено скриншоте) вопрос с чем это связано?
Прикреплено изображение (Нажмите для увеличения)
32347.jpg
 
 Top
caballero
Отправлено: 03 Января, 2012 - 01:06:25
Post Id


Активный участник


Покинул форум
Сообщений всего: 5998
Дата рег-ции: Сент. 2011  
Откуда: Харьков


Помог: 126 раз(а)




связано очевидно с кодировкой


-----
Бесплатная система складского учета с открытым кодом https://zippy[dot]com[dot]ua/zstore
 
 Top
PATCH
Отправлено: 03 Января, 2012 - 01:22:57
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




за очевидно спасибо) и сам понел)) вот тока не понел почему он так выводит)) если заголовок отправляется 'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7' )
 
 Top
PATCH
Отправлено: 04 Января, 2012 - 00:25:31
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




UP) пробывал запрашивать страницу через file тоже самое) точнее не тоже самое) html теги отображает а за мест содержимого ???????? - аналогично если не отправлять в курле header

(Отредактировано автором: 04 Января, 2012 - 00:26:26)

 
 Top
Bio man
Отправлено: 04 Января, 2012 - 00:31:58
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




у http://vkontakte[dot]ru/ какая кодировка?
(Добавление)
сам посмотрел. windows-1251. перед выводом в браузер передайте заголовок content-type="text/html; charset=windows-1251" и сам скрипт закодируйте в windows-1251
(Добавление)
заголовок браузеру я имел в виду.
 
 Top
PATCH
Отправлено: 04 Января, 2012 - 00:45:36
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




тоже самое)

PHP:
скопировать код в буфер обмена
  1. header("content-type=text/html; charset=windows-1251");
  2. $ch = curl_init("http://vkontakte.ru/");
  3. $headers = array
  4. (  
  5.     'User-Agent: Mozilla/5.0',
  6.         'Referer: http://www.php.su/',
  7.     'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
  8.     'Accept-Language:ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4',
  9.     'Accept-Encoding: gzip,deflate,sdch',
  10.     'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.3'
  11. );
  12. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  13.  
  14. curl_exec($ch);
в кажду строку хедер по вставлял до вывода страницы)) одно и тоже) через ноте пад изменил кодировку файла на windows 1251)) тоже самое)
 
 Top
Bio man
Отправлено: 04 Января, 2012 - 00:52:49
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




PHP:
скопировать код в буфер обмена
  1. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  2. header("content-type=text/html; charset=windows-1251");
  3. curl_exec($ch);
ща у себя попробую
 
 Top
PATCH
Отправлено: 04 Января, 2012 - 01:17:22
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




затестил и с концами)) нашел фишку) страница парсируется норм) вот тока вбраузер передается коряво)) проверил методом сохранения данных в файл)) как исправить если header не помогает?) есть одна идея) но ресусов займет больше) типо
1)парсить
2)сохранить в файл
3)вывести информацию с файла в браузер)
и как кстати с помощью курла сохранить страницу) я планирую авторизоватся с помощью кукисов) сохранить страницу и потом ее вывести) вк - чисто для тестов взял)

(Отредактировано автором: 04 Января, 2012 - 01:19:48)

 
 Top
Bio man
Отправлено: 04 Января, 2012 - 01:23:42
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




PHP:
скопировать код в буфер обмена
  1. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  2. curl_setopt($ch, CURLOPT_URL, "http://vkontakte.ru/");
  3. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  4. $output = curl_exec($ch);
  5. echo $output;

может так?
 
 Top
PATCH
Отправлено: 04 Января, 2012 - 01:26:01
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




неа) коряво выводит)
 
 Top
Bio man
Отправлено: 04 Января, 2012 - 01:29:05
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




нашел проблему. щас исправлю и отпишу
(Добавление)
PHP:
скопировать код в буфер обмена
  1. $ch = curl_init();
  2. $headers = array
  3. (  
  4.     'User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7',
  5.         'Referer: http://www.php.su/',
  6.     'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*;q=0.8',
  7.     'Accept-Language: ru,en-us;q=0.7,en;q=0.3',
  8.     'Accept-Encoding: identity',
  9.     'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7'
  10. );
  11. curl_setopt($ch, CURLOPT_HTTPHEADER,$headers);
  12. curl_setopt($ch, CURLOPT_URL, "http://vkontakte.ru/");
  13. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  14. header('Content-Type: text/html;charset=windows-1251');
  15. $output = curl_exec($ch);
  16. echo $output;
 
 Top
PATCH
Отправлено: 04 Января, 2012 - 01:40:40
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




отлично) ток вот нашелся се равно косяк) в Opere норм) а в chroome замест слов тупо ???????????????? - жирные такие вопросы) и кстати в чем был косяк в 'Accept-Encoding: identity' ? + header?
 
 Top
Bio man
Отправлено: 04 Января, 2012 - 01:43:04
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




PATCH, в основном в Accept-Encoding, header для кодировки. какая кодировка в хроме приходит?
 
 Top
PATCH
Отправлено: 04 Января, 2012 - 01:45:52
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 924
Дата рег-ции: Апр. 2011  


Помог: 22 раз(а)




PHP:
скопировать код в буфер обмена
  1. (Request-Line):GET /test/test/readsite.php HTTP/1.1
  2. Host:localhost
  3. Connection:keep-alive
  4. User-Agent:Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7
  5. Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
  6. Referer:http://localhost/test/test/
  7. Accept-Encoding:gzip,deflate,sdch
  8. Accept-Language:ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4
  9. Accept-Charset:windows-1251,utf-8;q=0.7,*;q=0.3
 
 Top
Bio man
Отправлено: 04 Января, 2012 - 01:51:27
Post Id


Постоянный участник


Покинул форум
Сообщений всего: 2751
Дата рег-ции: Июль 2010  
Откуда: Даугавпилс, Латвия


Помог: 52 раз(а)




PATCH, я имел ввиду не заголовки. как в файрфоксе: Вид -> Кодировка
(Добавление)
у меня в хроме норм все приходит, нормальный текст...
 
 Top
Страниц (2): [1] 2 »
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« PEAR и PECL »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB