Ребят, привет. У меня такая ситуация, что нужно сделать что-то на подобии парсера\грабера. Да, сразу скажу все такие темы тут епречитала, так что повторятся сильно не буду
Теперь собственно опишу свою проблемочку.
Создала я уже парсер 1-ой из нужных мне страничкек, скрипт заходит на сайт указанный мною, и глупо сохраняет в новом файле весь хтмл код. Далее идёт загрузка этого когда - и вуоля - я вижу копию нужной мне странички. Собственно далее, я пытаюсь "обрезать" лишний для меня код (хтмл код весь сохраняется у меня в текстовом файле) .. Но к сожалению никак не могу с этим справится. Находила много описаний таких операций, но даже глупо скопированные мини скриптики дял этих целей - неработают....
Собственно прочитали вы это, и наверное незаметили вопроса:просьбы. А вот и она. Просьба. Ребят, покажите нубёхе на примере как выделять немного кода из большого объёма ... желательно, что бы код брался из другого файла. . .а там глядиш и сама уже смогу разобратся дальше что да как
И ещё етсь вопрос. Как подключатся к https:// через пхп... собственно невыходит. .к хттп. всё хорошо идёт, а как только хттпс - сразу неработает скрипт. Изпользую цУРЛ.
И ещё, как сделать "автологин" Мне надобудет вытаскивать 1-ну статистику из сайта, что бы естественно к ней получить доступ - надо залогинится. Вот хочу облегчить себе задачу, и всё своё иметь на 1ом сайте, а не бегать по интернету и постоянно вводдя логины пароли следить за всем что меня косается. именно для этих целей и стала пистаь такой вот не сложный скриптик...
ЕЩё раз повторю, что хотелось бы сделать...
1. Узнать о удалении лишнего текста из большого объёма текста, который находится в отдельном текстовом файле.
2. Узнать как подключаться к https://
3. Узнать как сделать "автологин"
Понимающим и желающим помочь - зарание спасибо.
1. киса - 01 Февраля, 2009 - 03:15:49 - перейти к сообщению
2. Roler - 01 Февраля, 2009 - 07:44:53 - перейти к сообщению
Цитата:
1. Узнать о удалении лишнего текста из большого объёма текста, который находится в отдельном текстовом файле.
Preg_replace, а дальше - зависит от содержимого.
3. Ch_chov - 01 Февраля, 2009 - 16:02:16 - перейти к сообщению
Универсальный "автологин" вряд ли сделать получится.
Надо знать тип авторизации на каждом конкретном сайте.
Надо знать тип авторизации на каждом конкретном сайте.
4. киса - 01 Февраля, 2009 - 19:32:31 - перейти к сообщению
Roler - спасибо. Сейчас буду пробывать
Ch_chov - а почему не выйдет ? Если к примеру не универсальный, а на каждый сайт - свой.
Вот впринципе самая большая проблема в этом и заключается...
Нашла сегодня на 1ом форуме вот аткой скрипт.. но он на ХТТП подключается... а мне надо что бы на ХТТПС шло всё...
Ch_chov - а почему не выйдет ? Если к примеру не универсальный, а на каждый сайт - свой.
Вот впринципе самая большая проблема в этом и заключается...
Нашла сегодня на 1ом форуме вот аткой скрипт.. но он на ХТТП подключается... а мне надо что бы на ХТТПС шло всё...
CODE (text):
скопировать код в буфер обмена
скопировать код в буфер обмена
- <?
- //error_reporting(E_ALL);
- //DRDB - parameter for login.
- $tar_url="http://login.myspace.com/index.cfm?fuseaction=login.process";
- $host="login.myspace.com";
- //$q = "email=".urlencode("%%%%%%%")."&password=".urlencode("%%%%%%%%%%");
- $q = "email=%%%%%%%&password=%%%%%%%";
- $query = "POST ".$tar_url." HTTP/1.1\r\n".
- "Host: ".$host."\r\n".
- "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)\r\n".
- "Referer: ".$tar_url."\r\n".
- "Content-Type: application/x-www-form-urlencoded\r\n".
- "Content-Length: ".strlen($q)."\r\n".
- "\r\n".$q;
- ob_start();
- $fp = fsockopen($host, 80);
- if (!$fp){
- echo "Cannot open socket\n";
- exit;
- } else {
- fputs($fp, $query);
- while (!feof($fp)) {
- $respStr .= fgets($fp, 1000);
- }
- fclose($fp);
- $str = explode("Set-Cookie: DERDB=", $respStr);
- //$str = explode("Mytoken=", $respStr);
- $str = explode(";", $str[1]);
- //echo $str[0];
- header("Location: http://home.myspace.com/index.cfm?DERDB=".$str[0]);
- ob_end_flush();
- }
- ?>