Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Граббер сайтов

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Irina88
Отправлено: 18 Декабря, 2021 - 19:54:43
Post Id



Новичок


Покинул форум
Сообщений всего: 61
Дата рег-ции: Март 2018  
Откуда: Kyiv, Ukraine


Помог: 0 раз(а)




Можете пошагово объяснить как парсить сайты?
 
 Top
Vladimir Kheifets
Отправлено: 19 Декабря, 2021 - 12:16:12
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 879
Дата рег-ции: Март 2017  
Откуда: Германия, Бавария


Помог: 37 раз(а)




Irina88 пишет:
Можете пошагово объяснить как парсить сайты?

Добрый день, Ирина!
Если совсем просто, то можно применить PHP class DOMDocument, но для этого нужно знать
как устроена DOM (document object model) и что Вы хотите спарсить
Например, возьмём эту страницу сайта php.su и спарсим все теги <a>
PHP:
скопировать код в буфер обмена
  1. <?
  2. $dom = new DOMDocument();
  3. $dom->loadHTMLFile('http://forum.php.su/topic.php?forum=60&topic=7408&postid=1639850083#1639850083');
  4. $tags = $dom -> getElementsByTagName( 'a' ); //выбираем все теги <a>
  5. foreach ( (object)$tags as $tag ) {
  6.    $link = $tag -> nodeValue;
  7.    $href = $tag -> getAttribute('href');
  8.    echo "link: $link href: $href<br>";
  9. }
  10. /*
  11. link: href:
  12. link:  PHP.SU href: http://php.su/
  13. link: Tweet href: http://twitter.com/share
  14. link: PHP.SU Портал href: http://www.php.su
  15. link:  Главная href: http://forum.php.su
  16. link:  Помощь href: tools.php?action=help
  17. ........................
  18. ........................
  19. link: Поиск в теме href: search.php?action=intopic&forum=60&topic=7408
  20. link: Версия для печати href: printpage.php?forum=60&topic=7408
  21. */
  22. ?>
Удачи!

(Отредактировано автором: 19 Декабря, 2021 - 14:37:42)

 
 Top
Irina88
Отправлено: 19 Декабря, 2021 - 19:30:46
Post Id



Новичок


Покинул форум
Сообщений всего: 61
Дата рег-ции: Март 2018  
Откуда: Kyiv, Ukraine


Помог: 0 раз(а)




Ну, к примеру, видео из https://mm[dot]anwap[dot]tube ...

(Отредактировано автором: 19 Декабря, 2021 - 19:31:37)

 
 Top
Vladimir Kheifets
Отправлено: 19 Декабря, 2021 - 21:26:22
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 879
Дата рег-ции: Март 2017  
Откуда: Германия, Бавария


Помог: 37 раз(а)




Irina88 пишет:
Ну, к примеру, видео из https://mm[dot]anwap[dot]tube ...

"Из кувшина можно вылить только то, что в нем есть."
Вы думаете, что видео записно в html-code caйта и его можно спарзить как тэги?
Посмотрите в браузере код любого сайта и узнаете, что из него можно вытянуть.
Если другие примеры?
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Напишите за меня, пожалуйста »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB