Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Помогите с регуляркой

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
event
Отправлено: 21 Января, 2015 - 17:17:04
Post Id


Частый посетитель


Покинул форум
Сообщений всего: 542
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Привет.
Ребят, помогите составить регулярку чтобы парсила статью с сайта - _http://studopedia.net/1_13473_tema--sredstva-obrabotki-videosignala.html

Пробую как-то так, но не работает...:

PHP:
скопировать код в буфер обмена
  1. $site = file_get_contents("http://studopedia.net/1_13473_tema--sredstva-obrabotki-videosignala.html");
  2.  
  3. preg_match('#</td></tr></table><p>(.+?)<p>#i', $site, $text);
  4.  
  5. var_dump($text);


Заранее спасибо.

(Отредактировано автором: 21 Января, 2015 - 17:20:35)

 
 Top
event
Отправлено: 21 Января, 2015 - 22:55:20
Post Id


Частый посетитель


Покинул форум
Сообщений всего: 542
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




Мучусь уже два часа, никак не получается. Не понял

Что ни у кого нет идей?
 
 Top
GoDr
Отправлено: 22 Января, 2015 - 08:44:10
Post Id



Посетитель


Покинул форум
Сообщений всего: 446
Дата рег-ции: Янв. 2015  
Откуда: Тамбов


Помог: 17 раз(а)




event, ты где такие сайты откапываешь? Радость Вообще-то бред что-то с него сдирать. Может проще найти прогу которая тебе тупо скопирует весь сайт с сервера?

Код html просто ужасен. Встречаются теги которые устарели ещё в HTML4. Плюс ко всему куча рекламы в контенте.... И абсолютно никакой семантики кода, даже нет ни CLASS или ID!!! одним словом коЧмар!

В общем если парсить именно эту страницу (другие не гарантирую, код может быть вообще другим), то что-то такое
PHP:
скопировать код в буфер обмена
  1. // Получаем страницу
  2. $str = file_get_contents("http://studopedia.net/1_13473_tema--sredstva-obrabotki-videosignala.html");
  3.  
  4. // Пытаемся выдернуть основной контент
  5. preg_match("#</noindex>\s+</td></tr></table>(.*?)</center><hr>#si", $str, $tmp);
  6.  
  7. // Удаляем гугловскую рекламу и всякую гадость
  8. $result = preg_replace('#<noindex.*?</noindex>|<script.*?</script>|<ins.*?</ins>|<!--.*?-->#si', '', $tmp[1]);
  9.  
  10. // Выводим результат
  11. echo $result;

(Добавление)
попробовал другие страницы, вроде работают..

(Отредактировано автором: 22 Января, 2015 - 08:45:24)



-----
Система управления веб-содержимым Lotos CMS
 
 Top
event
Отправлено: 22 Января, 2015 - 12:49:20
Post Id


Частый посетитель


Покинул форум
Сообщений всего: 542
Дата рег-ции: Май 2011  


Помог: 0 раз(а)




GoDr, клиент для парсировки подганяет))

Пасиб. Подмигивание
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB