Новичок
Покинул форум
Сообщений всего: 47
Дата рег-ции: Янв. 2008
Помог: 0 раз(а)
|
Пишу парсер одного сайта.
скрипт
PHP:
скопировать код в буфер обмена
$www = file_get_contents('http://www.kolesa.ru/article/2010/03/29/formula-1_vyehali_vse_pod_dozhd'); //скачивание страницы // достаем заголовок $title2 = $title['1']['0']; $title2 = iconv("UTF-8", "windows-1251", "$title2"); // достаем текст и удаляем лишнее $text = strstr($www,'<div class="text" style="float: right;">'); $text = iconv("UTF-8", "windows-1251", "$text[0]"); $text = str_replace ('<div class="text" style="float: right;">', "", $text); $text = str_replace ('<p class="article-images">', "", $text); $text = preg_replace("/(?<=<\/p>)(\s)*(?=<\/p>)/Uism", '', $text); $text = str_replace ('<p>', "<p align = 'justify'>", $text); echo $text;
выводит статью не полностью а урывками (начало и конец), но если закомментировать (//) строки с 17 по 27, то скрипт выводит статью в исходном виде. Далее по одному убираем комментарии с перезагрузкой страницы - текст форматируется как надо. с чем это связано?
|