PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи

Страниц (1): [1]

> Найдено сообщений: 2
hellp123 Отправлено: 30 Ноября, 2008 - 15:14:18 • Тема: вопрос по регуляркам и парсенгу урлов • Форум: Программирование на PHP

Ответов: 2
Просмотров: 289
собственно что требуется взять из файла углов url.txt
содержащий список урлов ну кпримеру
rusyaz.ru/is/ns/lol.html
www[dot]38th[dot]ru/imho[dot]htm
rutube.ru/tracks/217914.html?v=0c6ccc42458ddd9119b5b2dabd0d315
http://i-vd[dot]org[dot]ru/books/php/files[dot]shtml#f
http://www.php.su/articles/?cat=fs&page=005
http://www[dot]codenet[dot]ru/webmast/php/files.php

нужн брать из файла и парсить по очере
ну вот брать я могу
PHP:
скопировать код в буфер обмена
  1. <?PHP
  2. /*
  3. $fp = file("url.txt");
  4. $b = count($fp);
  5.      $a=0;
  6.      while($a<$b)
  7.      {
  8.  $a=$a+1;
  9. $url=$fp[$a-1];
  10. а вот дальше продолжение не могу
  11.  
  12. }
  13.  
  14. ?>

а дальше переменую ур обработать
и сделать тоа что бы получилось 2 переменые первые $domain была по очереде равна домену урла те
rusyaz.ru
38th.ru
rutube.ru
i-vd.org.ru
php.su
codenet.ru
а вторая перемена $url2 была равна урлу без http:// и www. те
rusyaz.ru/is/ns/lol.html
38th.ru/imho.htm
rutube.ru/tracks/217914.html?v=0c6ccc42458ddd9119b5b2dabd0d315
i-vd.org.ru/books/php/files.shtml#f
php.su/articles/?cat=fs&page=005
codenet.ru/webmast/php/files.php

помогите с этими 2 перемеными а то у меня с регулярками хренова
hellp123 Отправлено: 21 Сентября, 2008 - 09:46:34 • Тема: помагити вы отпарсить выдачу! • Форум: Напишите за меня, пожалуйста

Ответов: 1
Просмотров: 58
есть такая штука
CODE (text):
скопировать код в буфер обмена
  1. /* получаем содержимое нужной нам страницы в переменную $content (обратите внимание, - мы используем для этого функцию file_get_contents. Она может работать с удаленными URL только если в настройках PHP установлена опция allow_url_fopen) */
  2. //$content = file_get_contents("http://news.yandex.ru/");
  3. // Определяем позицию строки, до котой нужно все отрезать (используем функцию strpos()).
  4. //$pos = strpos($content, "популярные новости</h3>");
  5. /*Отрезаем все, что идет до нужной нам позиции (функция substr в данном случае принимает два параметра: строка для обработки и //номер позиции. Функция вернет строку, НАЧИНАЯ с указанной позиции) */
  6. //$content = substr($content, $pos);
  7. // Точно таким же образом находим позицию второй строки
  8. // $pos = strpos($content, "<td class=");
  9. // Отрезаем нужное количество символов от нулевого
  10. // $content = substr($content, 0, $pos);
  11. // выводим полученную строку.

она позваляет в выдаваймом ходе удалить всё до указанной позиции и после...

у меня есть такой код
CODE (text):
скопировать код в буфер обмена
  1. <?php
  2. error_reporting(E_ALL); // врубал дя отладки
  3.  
  4. set_time_limit(0); // чтоб успело дограбить всё
  5.  
  6. ignore_user_abort();
  7.  
  8. $fp2 = fsockopen("revix.ru", 80, $errno, $errstr, 60);
  9. $out2 = "POST http://www.revix.ru/ HTTP/1.0\r\n";    
  10. $out2.= "Cookie: \r\n";
  11. $out2.= "Proxy-Connection: close\r\n\r\n";
  12. fputs($fp2,$out2);
  13.  
  14. fputs($fp2,$out2);
  15. while (!feof($fp2)) {
  16.    $content2= fgets($fp2);
  17.    echo $content2;
  18. }
  19.  
  20. fclose($fp2);
  21.  
  22. ?>

в ответ на выполнения получаем....
Цитата:
HTTP/1.1 411 Length Required
Server: nginx/0.5.35
Date: Sun, 21 Sep 2008 06:29:46 GMT
Content-Type: text/html
Content-Length: 181
Connection: close

<html>
<head><title>411 Length Required</title></head>
<body bgcolor="white">
<center><h1>411 Length Required</h1></center>
<hr><center>nginx/0.5.35</center>
</body>
</html>

как отпарсить выдачу чтобы в ответ на выполнения скрипта вводилось то что находится между тегами <center> и </center>
те на запрос после выполнения скрипта мы видели
Цитата:
<center>nginx/0.5.35</center>

а не весь код паги

Страниц (1): [1]
Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB