Есть регулярка для разбора текста:
PHP:
скопировать код в буфер обмена
скопировать код в буфер обмена
- $pattern = '~
- <a[\s]+name="ni(?<news_id>[\d]+)"><h2>(?<news_title>.*)<\/h2><\/a>
- (?:.*)
- <p><small>(?<news_published>[\d\w\s,]+)
- (?:.?)
- \|
- (?:.*)
- <img[\s]+src="(?<news_image>.*)
- "
- (?:.*)
- \/>
- (?<news_content>.*)
- <br[\s]+clear="left"[\s]*\/>
- (?:.*)
- ~isUx'; // result all without pages