Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: file_get_contents()

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: нужен парсер.
AbrakadabrA
Отправлено: 11 Августа, 2012 - 07:41:22
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Привет всем.
Для оптимизации своего рабочего времени решил написать парсер сайта http://users[dot]v8[dot]1c[dot]ru/
Но дело в том что этот сайт я не могу открыть программно.

file_get_contents('http://users.v8.1c.ru/') выдает ошибку

Warning: file_get_contents(http://users.v8.1c.ru/actual.jsp) [function.file-get-contents]: failed to open stream: Redirection limit reached, aborting in C:\web_development\Apache\htdocs\parser\index.php on line 38

Грешу на то что сайт написан на java (страницы имеют расширение jsp)
Кто нибудь сталкивался ? Помогите...
 
 Top
DelphinPRO
Отправлено: 11 Августа, 2012 - 08:20:51
Post Id



Активный участник


Покинул форум
Сообщений всего: 7187
Дата рег-ции: Февр. 2012  


Помог: 353 раз(а)




язык, на котором написан сайт, абсолютно не причем.

вы сами попробуйте перейти по этой ссылке. Вас редиректит на страницу логина.

Короче вам следйет использовать CURL для получения страниц этого сайта. CURL позволяет сохранять и отдавать куки, из-за отсутствия которых, собственно и происходит редирект.


-----
Чем больше узнаю, тем больше я не знаю.
 
 Top
AbrakadabrA
Отправлено: 11 Августа, 2012 - 16:30:45
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Спасибо за помощь. А как Вы определили что меня редиректит ?
 
 Top
DelphinPRO
Отправлено: 11 Августа, 2012 - 16:47:24
Post Id



Активный участник


Покинул форум
Сообщений всего: 7187
Дата рег-ции: Февр. 2012  


Помог: 353 раз(а)




Элементарно, Ватсон. Улыбка
я просто перешел по ссылке


-----
Чем больше узнаю, тем больше я не знаю.
 
 Top
AbrakadabrA
Отправлено: 11 Августа, 2012 - 16:53:54
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




DelphinPRO пишет:
Элементарно, Ватсон. Улыбка
я просто перешел по ссылке

Ну это понятно, а как определить что редирект то произошел ?
И еще вопросик. Шалит curl.
Fatal error: Call to undefined function curl_init()

В php.ini все раскомментировано, апача перезапущена, а один фиг не пашет.
phpInfo() о curl молчит.
 
 Top
DelphinPRO
Отправлено: 11 Августа, 2012 - 19:09:56
Post Id



Активный участник


Покинул форум
Сообщений всего: 7187
Дата рег-ции: Февр. 2012  


Помог: 353 раз(а)




AbrakadabrA пишет:
В php.ini все раскомментировано, апача перезапущена, а один фиг не пашет.

а DLL-ка нужная (php_curl.dll) лежит в папке с расширениями?
(Добавление)
AbrakadabrA пишет:
Ну это понятно, а как определить что редирект то произошел ?

ну как - наблюдайте за адресной строкой.
я перехожу на http://users[dot]v8[dot]1c[dot]ru/actual[dot]jsp а оказываюсь на http://users[dot]v8[dot]1c[dot]ru/


-----
Чем больше узнаю, тем больше я не знаю.
 
 Top
AbrakadabrA
Отправлено: 12 Августа, 2012 - 10:50:49
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Цитата:

а DLL-ка нужная (php_curl.dll) лежит в папке с расширениями?

Да, все присутствует. Перепробовал все что выдал гугель.
Цитата:
ну как - наблюдайте за адресной строкой.
я перехожу на http://users[dot]v8[dot]1c[dot]ru/actual[dot]jsp а оказываюсь на http://users.v8.1c.ru/

Ой! Прошу прощения, я Вас запутал. Попробуйте без actual.jsp - file_get_contents('http://users.v8.1c.ru'). Все равно выдает Warning.
 
 Top
AbrakadabrA
Отправлено: 13 Августа, 2012 - 08:14:02
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




С cURLом разобрался, все работает, только в результате он выводит такую строчку "The URL has moved here ;" и эта ссылка ведет на тот сайт который мне надо отпарсить...
Сижу за проксей, курлу это указываю. Может в этом проблема ?
 
 Top
AbrakadabrA
Отправлено: 13 Августа, 2012 - 15:22:10
Post Id


Новичок


Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Теперь никак немогу заставить курл ходить по ссылкам.
Получаю главную страницу, ПОСТом авторизуюсь, перенаправляюсь на другую страницу...ее парсю, получаю определенные ссылки...а как теперь по ним пройти и получить хтмл код страницы ?
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« HTTP и PHP »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB