1. Irina88 - 18 Декабря, 2021 - 19:54:43 - перейти к сообщению
Можете пошагово объяснить как парсить сайты?
2. Vladimir Kheifets - 19 Декабря, 2021 - 12:16:12 - перейти к сообщению
Irina88 пишет:
Можете пошагово объяснить как парсить сайты?
Добрый день, Ирина!
Если совсем просто, то можно применить PHP class DOMDocument, но для этого нужно знать
как устроена DOM (document object model) и что Вы хотите спарсить
Например, возьмём эту страницу сайта php.su и спарсим все теги <a>
PHP:
скопировать код в буфер обмена
скопировать код в буфер обмена
- <?
- $dom = new DOMDocument();
- $dom->loadHTMLFile('http://forum.php.su/topic.php?forum=60&topic=7408&postid=1639850083#1639850083');
- $tags = $dom -> getElementsByTagName( 'a' ); //выбираем все теги <a>
- foreach ( (object)$tags as $tag ) {
- $link = $tag -> nodeValue;
- $href = $tag -> getAttribute('href');
- echo "link: $link href: $href<br>";
- }
- /*
- link: href:
- link: PHP.SU href: http://php.su/
- link: Tweet href: http://twitter.com/share
- link: PHP.SU Портал href: http://www.php.su
- link: Главная href: http://forum.php.su
- link: Помощь href: tools.php?action=help
- ........................
- ........................
- link: Поиск в теме href: search.php?action=intopic&forum=60&topic=7408
- link: Версия для печати href: printpage.php?forum=60&topic=7408
- */
- ?>