Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Регулярное выражение

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
event
Отправлено: 10 Февраля, 2015 - 19:01:21
Post Id


Частый посетитель


Покинул форум
Сообщений всего: 542
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Ребят, помогите составить регулярку чтобы парсила текст новости из этой страницы - _http://fulledu.ru/news/vuzi/news/1793_v-dalnevostochnom-universitete-nachali-gotovit-sit.html

Заранее спасибо.

PS: GoDr, на этот раз вроде сайт нормальный =)))
 
 Top
GoDr
Отправлено: 10 Февраля, 2015 - 20:07:20
Post Id



Посетитель


Покинул форум
Сообщений всего: 446
Дата рег-ции: Янв. 2015  
Откуда: Тамбов


Помог: 17 раз(а)




ты уже с десяток точно подобных вопросов задал. Суть ты прекрасно понял. Осталось включить голову ;)

открой код страницы. Найди где находится нужный тебе контент. Найди метки, которые однозначно смогут идентифицировать начало и конец контента. Ну и вытаскивай. Как? ты знаешь Улыбка

Вот что ты сейчас дал. Начало очень хорошо идентифицируется.
CODE (html):
скопировать код в буфер обмена
  1. <div class="article-item">

или как ты любишь, без картинки. Картинка идёт ниже


Как видно, что там, что там идут class`ы, но не id, а значит 100% гарантии нет. И поэтому лучше использовать два маяка
Цитата:
#<div class="article-item".*?<div class="pict-wrap".*?</div>(.*?)#


Далее конец. На данном сайте он тоже хорошо виден, это начало Яндекс.Директ

по этому имеем регулярку
Цитата:
#<div class="article-item".*?<div class="pict-wrap".*?</div>(.*?)<div class="advert"#

Далее мы не знаем как идут обрывы строк и т.п. и добавим модификатор s и будем рассматривать данные как строку. Так же мы не уверены что теги в одном регистре, а значит добавим модификатор i
Цитата:
#<div class="article-item".*?<div class="pict-wrap".*?</div>(.*?)<div class="advert"#si


Вот в принципе получили регулярку. Не проверял, но по идее должна работать Закатив глазки


-----
Система управления веб-содержимым Lotos CMS
 
 Top
event
Отправлено: 10 Февраля, 2015 - 21:21:09
Post Id


Частый посетитель


Покинул форум
Сообщений всего: 542
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




GoDr, незнаю, но с регулярными выражениями уже пробовал раз 5 разобраться, в итоге нифика никогда у меня не выходит.
(Добавление)
GoDr, чего-то не работает регулярка(
 
 Top
event
Отправлено: 10 Февраля, 2015 - 23:35:58
Post Id


Частый посетитель


Покинул форум
Сообщений всего: 542
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




GoDr, а не все работает. Спасибо. Улыбка
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB