Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: чтение из фала и file_get_html

PHP.SU

Программирование на PHP, MySQL и другие веб-технологии

PHP.SU Портал

Главная

Помощь

Поиск

Поиск Яндекс Вакансии

Пользователи

Здравствуйте, Гость

( Вход · Регистрация · Правила форума )

Забыли пароль?

чтение из фала и file_get_html

Форумы портала PHP.SU » PHP » Программирование на PHP » Вопросы новичков (Модераторы: OrmaJever, Саныч, Строитель)

Страниц (1): [1]

Без описания

Поиск в теме | Версия для печати

mrstorm	Отправлено: 04 Декабря, 2014 - 12:47:29
Новичок Покинул форум Сообщений всего: 6 Дата рег-ции: Дек. 2014 Помог: 0 раз(а)	Добрый день, уважаемые Гуру программирования на php. Я новичок в этом деле, но стараюсь освоить данный язык программирования. Два дня пытаюсь сделать простенький парсер некоторого контента с некоторого сайта. Суть парсера - есть файл с адресами страниц сайта, в обычном текстовом файле. Каждая страница - с новой строки. Парсер должен взять каждую страницу, найти в html коде страницы тег ( в моем случае это тег H1) и сохранить то что между этим тегом в другой текстовый файл. В настойщий момент написал код такого вида: PHP: скопировать код в буфер обмена <? include 'simple_html_dom.php'; $k[1] = 'http://mail.ru'; $k[2] = 'http://iphones.ru'; $k[3] = 'http://mail.com'; for ($i=1; $i<=3; $i++) { echo $i; echo $k[$i]; echo file_get_html($k[$i])->find('h1',0); } ?> и на выходе я получаю список заголовков (под тегом H1) с каждого сайта. Принцип понятен, теперь пытаюсь чтобы скрипт брал данные из текстового файла, для этого дописываю код чтения данных из файла в массив: PHP: скопировать код в буфер обмена $url = fopen("url.txt", "r"); //открываем файл for ($y=1; $y<=2; $y++) { //запускаем цикл ( далее сделаю через while) $k[$y] = fgets($url); //производим запись в массив $k } fclose($url); //закрываю текстовый файл данный код совершенно спокойно выводит данные, которые записаны в тектовом файле и в последствии считанные в массив $k. Далее - объединяю два кода и получаю : PHP: скопировать код в буфер обмена include 'simple_html_dom.php'; $url = fopen("url.txt", "r"); // for ($y=1; $y<=2; $y++) { $k[$y] = fgets($url); } fclose($url); for ($i=1; $i<=2; $i++) { echo $i; //выводу номер по порядку echo $k[$i]; //вывожу ссылку из текстового файла echo file_get_html($k[$i])->find('h1',0); //вывожу данные тега H1 по ссылке } после этого на выходе я получаю только вывод на экран самой первой строчки из текстового файла. На этом я понимаю, что скрипт дальше не обрабатывает данные. Но если в текстовом файле оставить только одну строчку, то скрипт начинает правильно обрабатывать данные, выводит нужный текст между тегом H1. Понимаю, что скорее всего дело в лишних переносах, т.к. именно после добавление новой строки в текстовый файл появляется ошибка. Буду благодарен за ответ. Заранее прошу прощение за допущенные ошибки в коде.

Panoptik	Отправлено: 04 Декабря, 2014 - 13:00:41
Постоянный участник Покинул форум Сообщений всего: 2493 Дата рег-ции: Нояб. 2011 Откуда: Одесса, Украина Помог: 131 раз(а)	замените вот это PHP: скопировать код в буфер обмена $url = fopen("url.txt", "r"); // for ($y=1; $y<=2; $y++) { $k[$y] = fgets($url); } fclose($url); for ($i=1; $i<=2; $i++) { echo $i; //выводу номер по порядку echo $k[$i]; //вывожу ссылку из текстового файла echo file_get_html($k[$i])->find('h1',0); //вывожу данные тега H1 по ссылке } на єто PHP: скопировать код в буфер обмена $urls = file('url.txt'); foreach($urls as $i => $url) { // пропускаем пустые строки в файле if(!$url) continue; echo $i; //выводу номер по порядку echo $url; //вывожу ссылку из текстового файла echo file_get_html($url)->find('h1',0); //вывожу данные тега H1 по ссылке } так будет короче насколько я вижу, в цикле вы принудительно ограничивали количество итераций до 1 поэтому следующая итерация так и не начиналась почитайте про циклы for, while, foreach можно конечно решить вопрос с помощью for только в условии выхода из цикла нужно указать граничное значение вместо 2 примерно так PHP: скопировать код в буфер обмена $k = array(); while (($buffer = fgets($handle, 4096)) !== false) { // пропускаем пустые строки if(!$buffer) continue; $k[] = $buffer; } fclose($url); // считаем количество элементов в массиве $cnt = count($k); for ($i=1; $i<=$cnt; $i++) { ----- Just do it

mrstorm	Отправлено: 04 Декабря, 2014 - 13:55:21
Новичок Покинул форум Сообщений всего: 6 Дата рег-ции: Дек. 2014 Помог: 0 раз(а)	Изменил код: PHP: скопировать код в буфер обмена include 'simple_html_dom.php'; $urls = file('url.txt'); foreach($urls as $i => $url) { // пропускаем пустые строки в файле if(!$url) continue; echo $i; //выводу номер по порядку echo $url; //вывожу ссылку из текстового файла echo file_get_html($url)->find('h1',0); //вывожу данные тега H1 по ссылке } но все равно результат такой же - если более одной строчки в файле - выводит только ссылку и номер по порядку. А поиск по тегу - не делает. Тут именно проблема в совмещении импорта ссылок из файла и получения нужных данных по этим ссылкам. (Добавление) Вообщем сам нашел решение - нужно было при записи в массив удалить все возможные пробелы и переносы. Скорее всего перенос записывался в массив к значению, и уже открыть сайт скрипту не удавалось. Решил вопрос вот так: PHP: скопировать код в буфер обмена $k[$y] = str_replace("\n", ' ', fgets($url)); //производим запись в массив $k А определить как долго будет идти цикл решил с помощью: PHP: скопировать код в буфер обмена $lineCount = count(file('url.txt')); В итоге код имеет слудующий вид: PHP: скопировать код в буфер обмена include 'simple_html_dom.php'; $url = fopen("url.txt", "r"); //открываем файл $lineCount = count(file('url.txt')); for ($y=1; $y<=$lineCount; $y++) { //запускаем цикл ( далее сделаю через while) $k[$y] = str_replace("\n", ' ', fgets($url)); //производим запись в массив $k } fclose($url); //закрываю текстовый файл for ($i=1; $i<=$lineCount; $i++){ // echo $i; //выводу номер по порядку // echo $k[$i]; //вывожу ссылку из текстового файла echo file_get_html($k[$i])->find('h1',0); //вывожу данные тега H1 по ссылке } это рабочий скрипт, позволяет вывести на экран значение тега H1 с сайта. В дальнейшем хочу чтобы это значение писалось в соседний текстовый файл, может через разделитель. Как доделаю выложу, может кому то понадобиться

Bio man	Отправлено: 04 Декабря, 2014 - 18:42:44
Постоянный участник Покинул форум Сообщений всего: 2751 Дата рег-ции: Июль 2010 Откуда: Даугавпилс, Латвия Помог: 52 раз(а)	По моему лучше заменить это PHP: скопировать код в буфер обмена for ($y=1; $y<=$lineCount; $y++) { //запускаем цикл ( далее сделаю через while) $k[$y] = str_replace("\n", ' ', fgets($url)); //производим запись в массив $k } на это PHP: скопировать код в буфер обмена while ($line = fgets($url)) { $k[$y] = str_replace("\n", ' ', $line); } и это PHP: скопировать код в буфер обмена for ($i=1; $i<=$lineCount; $i++){ // echo $i; //выводу номер по порядку // echo $k[$i]; //вывожу ссылку из текстового файла echo file_get_html($k[$i])->find('h1',0); } на это PHP: скопировать код в буфер обмена foreach ($k as $value){ echo file_get_html($value)->find('h1',0); //вывожу данные тега H1 по ссылке }

Поиск в теме | Версия для печати

Страниц (1): [1]

Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)

« Вопросы новичков »

Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.