Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011
Помог: 0 раз(а)
Привет всем.
Для оптимизации своего рабочего времени решил написать парсер сайта http://users[dot]v8[dot]1c[dot]ru/
Но дело в том что этот сайт я не могу открыть программно.
Warning: file_get_contents(http://users.v8.1c.ru/actual.jsp) [function.file-get-contents]: failed to open stream: Redirection limit reached, aborting in C:\web_development\Apache\htdocs\parser\index.php on line 38
Грешу на то что сайт написан на java (страницы имеют расширение jsp)
Кто нибудь сталкивался ? Помогите...
DelphinPRO
Отправлено: 11 Августа, 2012 - 08:20:51
Активный участник
Покинул форум
Сообщений всего: 7187
Дата рег-ции: Февр. 2012
Помог: 353 раз(а)
язык, на котором написан сайт, абсолютно не причем.
вы сами попробуйте перейти по этой ссылке. Вас редиректит на страницу логина.
Короче вам следйет использовать CURL для получения страниц этого сайта. CURL позволяет сохранять и отдавать куки, из-за отсутствия которых, собственно и происходит редирект.
----- Чем больше узнаю, тем больше я не знаю.
AbrakadabrA
Отправлено: 11 Августа, 2012 - 16:30:45
Новичок
Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011
Помог: 0 раз(а)
Спасибо за помощь. А как Вы определили что меня редиректит ?
DelphinPRO
Отправлено: 11 Августа, 2012 - 16:47:24
Активный участник
Покинул форум
Сообщений всего: 7187
Дата рег-ции: Февр. 2012
Помог: 353 раз(а)
Элементарно, Ватсон.
я просто перешел по ссылке
----- Чем больше узнаю, тем больше я не знаю.
AbrakadabrA
Отправлено: 11 Августа, 2012 - 16:53:54
Новичок
Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011
Помог: 0 раз(а)
DelphinPRO пишет:
Элементарно, Ватсон.
я просто перешел по ссылке
Ну это понятно, а как определить что редирект то произошел ?
И еще вопросик. Шалит curl.
Fatal error: Call to undefined function curl_init()
В php.ini все раскомментировано, апача перезапущена, а один фиг не пашет.
phpInfo() о curl молчит.
DelphinPRO
Отправлено: 11 Августа, 2012 - 19:09:56
Активный участник
Покинул форум
Сообщений всего: 7187
Дата рег-ции: Февр. 2012
Помог: 353 раз(а)
AbrakadabrA пишет:
В php.ini все раскомментировано, апача перезапущена, а один фиг не пашет.
а DLL-ка нужная (php_curl.dll) лежит в папке с расширениями? (Добавление)
AbrakadabrA пишет:
Ну это понятно, а как определить что редирект то произошел ?
Ой! Прошу прощения, я Вас запутал. Попробуйте без actual.jsp - file_get_contents('http://users.v8.1c.ru'). Все равно выдает Warning.
AbrakadabrA
Отправлено: 13 Августа, 2012 - 08:14:02
Новичок
Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011
Помог: 0 раз(а)
С cURLом разобрался, все работает, только в результате он выводит такую строчку "The URL has moved here ;" и эта ссылка ведет на тот сайт который мне надо отпарсить...
Сижу за проксей, курлу это указываю. Может в этом проблема ?
AbrakadabrA
Отправлено: 13 Августа, 2012 - 15:22:10
Новичок
Покинул форум
Сообщений всего: 10
Дата рег-ции: Май 2011
Помог: 0 раз(а)
Теперь никак немогу заставить курл ходить по ссылкам.
Получаю главную страницу, ПОСТом авторизуюсь, перенаправляюсь на другую страницу...ее парсю, получаю определенные ссылки...а как теперь по ним пройти и получить хтмл код страницы ?
Все гости форума могут просматривать этот раздел. Только зарегистрированные пользователи могут создавать новые темы в этом разделе. Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.