Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Граббер сайтов
Форумы портала PHP.SU » PHP » Напишите за меня, пожалуйста » Граббер сайтов

Страниц (1): [1]
 

1. Irina88 - 18 Декабря, 2021 - 19:54:43 - перейти к сообщению
Можете пошагово объяснить как парсить сайты?
2. Vladimir Kheifets - 19 Декабря, 2021 - 12:16:12 - перейти к сообщению
Irina88 пишет:
Можете пошагово объяснить как парсить сайты?

Добрый день, Ирина!
Если совсем просто, то можно применить PHP class DOMDocument, но для этого нужно знать
как устроена DOM (document object model) и что Вы хотите спарсить
Например, возьмём эту страницу сайта php.su и спарсим все теги <a>
PHP:
скопировать код в буфер обмена
  1. <?
  2. $dom = new DOMDocument();
  3. $dom->loadHTMLFile('http://forum.php.su/topic.php?forum=60&topic=7408&postid=1639850083#1639850083');
  4. $tags = $dom -> getElementsByTagName( 'a' ); //выбираем все теги <a>
  5. foreach ( (object)$tags as $tag ) {
  6.    $link = $tag -> nodeValue;
  7.    $href = $tag -> getAttribute('href');
  8.    echo "link: $link href: $href<br>";
  9. }
  10. /*
  11. link: href:
  12. link:  PHP.SU href: http://php.su/
  13. link: Tweet href: http://twitter.com/share
  14. link: PHP.SU Портал href: http://www.php.su
  15. link:  Главная href: http://forum.php.su
  16. link:  Помощь href: tools.php?action=help
  17. ........................
  18. ........................
  19. link: Поиск в теме href: search.php?action=intopic&forum=60&topic=7408
  20. link: Версия для печати href: printpage.php?forum=60&topic=7408
  21. */
  22. ?>
Удачи!
3. Irina88 - 19 Декабря, 2021 - 19:30:46 - перейти к сообщению
Ну, к примеру, видео из https://mm[dot]anwap[dot]tube ...
4. Vladimir Kheifets - 19 Декабря, 2021 - 21:26:22 - перейти к сообщению
Irina88 пишет:
Ну, к примеру, видео из https://mm[dot]anwap[dot]tube ...

"Из кувшина можно вылить только то, что в нем есть."
Вы думаете, что видео записно в html-code caйта и его можно спарзить как тэги?
Посмотрите в браузере код любого сайта и узнаете, что из него можно вытянуть.
Если другие примеры?

 

Powered by ExBB FM 1.0 RC1