Добрый день.
Пишу сейчас скрипт, который парсит страницы блога и вытаскивает из них посты. Блог разбит по страницам, на каждой странице размещено по три поста. Структура страницы приблизительно следующая:
CODE ( html):
скопировать код в буфер обмена
<html> <body> <header>...</header> <h1>Заголовок поста #1</h1> <p>Первый параграф поста</p> <p>Второй параграф поста</p> <h1>Заголовок поста #2</h1> <p>Первый параграф поста</p> <p>Второй параграф поста</p> <h1>Заголовок поста #3</h1> <p>Первый параграф поста</p> <p>Второй параграф поста</p> <footer>...</footer> </body> </html>
Вот такая вот, в общем, плоская структура (я бы, например, посты поместил в <article>...</article> или какой-то другой контейнер).
Моя задача - получить код всех трёх постов с их заголовками, далее при помощи PHP изменить их порядок (на сайте они размещены в обратном порядке, т.е. самый свежий пост расположен вверху, мне же нужно разместить посты в прямом хронологическом порядке, то есть наоборот).
Подскажите, пожалуйста, выражение для PCRE, которое позволит получить код постов вместе с их заголовками.
Заранее спасибо (Отредактировано автором: 23 Июня, 2014 - 20:59:29)
|