Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Регулярное выражение
Форумы портала PHP.SU » » Вопросы новичков » Регулярное выражение

Страниц (1): [1]
 

1. event - 10 Февраля, 2015 - 19:01:21 - перейти к сообщению
Ребят, помогите составить регулярку чтобы парсила текст новости из этой страницы - _http://fulledu.ru/news/vuzi/news/1793_v-dalnevostochnom-universitete-nachali-gotovit-sit.html

Заранее спасибо.

PS: GoDr, на этот раз вроде сайт нормальный =)))
2. GoDr - 10 Февраля, 2015 - 20:07:20 - перейти к сообщению
ты уже с десяток точно подобных вопросов задал. Суть ты прекрасно понял. Осталось включить голову ;)

открой код страницы. Найди где находится нужный тебе контент. Найди метки, которые однозначно смогут идентифицировать начало и конец контента. Ну и вытаскивай. Как? ты знаешь Улыбка

Вот что ты сейчас дал. Начало очень хорошо идентифицируется.
CODE (html):
скопировать код в буфер обмена
  1. <div class="article-item">

или как ты любишь, без картинки. Картинка идёт ниже


Как видно, что там, что там идут class`ы, но не id, а значит 100% гарантии нет. И поэтому лучше использовать два маяка
Цитата:
#<div class="article-item".*?<div class="pict-wrap".*?</div>(.*?)#


Далее конец. На данном сайте он тоже хорошо виден, это начало Яндекс.Директ

по этому имеем регулярку
Цитата:
#<div class="article-item".*?<div class="pict-wrap".*?</div>(.*?)<div class="advert"#

Далее мы не знаем как идут обрывы строк и т.п. и добавим модификатор s и будем рассматривать данные как строку. Так же мы не уверены что теги в одном регистре, а значит добавим модификатор i
Цитата:
#<div class="article-item".*?<div class="pict-wrap".*?</div>(.*?)<div class="advert"#si


Вот в принципе получили регулярку. Не проверял, но по идее должна работать Закатив глазки
3. event - 10 Февраля, 2015 - 21:21:09 - перейти к сообщению
GoDr, незнаю, но с регулярными выражениями уже пробовал раз 5 разобраться, в итоге нифика никогда у меня не выходит.
(Добавление)
GoDr, чего-то не работает регулярка(
4. event - 10 Февраля, 2015 - 23:35:58 - перейти к сообщению
GoDr, а не все работает. Спасибо. Улыбка

 

Powered by ExBB FM 1.0 RC1