Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Парсер для HTML

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Albertino
Отправлено: 16 Декабря, 2010 - 09:52:38
Post Id


Гость


Покинул форум
Сообщений всего: 92
Дата рег-ции: Окт. 2010  


Помог: 0 раз(а)




есть веб архив сделаный в Mac, мне нужно его прочитать из php и вынуть оттуда информацию, например

<input name="firstname" value="Alex">

нужно взять инф-цию fisrstname и Alex, пробывал cделать так
PHP:
скопировать код в буфер обмена
  1.  
  2. $file_arr = glob("*.webarchive");
  3. foreach ($file_arr as $file){
  4. $file_cont = file_get_contents($file);
  5. preg_math('/(<input)(.)*(firstname)(value=")([A_Za-z]+)(".*>)/', $file_cont, $maches );
  6. echo $maches[5];
  7. }
  8.  

но что-то ничего не происходит
может ли быть проблема в разных кодировках. так как веб архив был создан в Mac, а на сервере стоит Windows
 
 Top
Мелкий Супермодератор
Отправлено: 16 Декабря, 2010 - 10:01:38
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




0) phpfaq.ru/debug
1) что за функция preg_math? По параметрам похожа на preg_match
2) не вижу у регулярки модификаторов, все файлы однострочные?

(Отредактировано автором: 16 Декабря, 2010 - 10:02:15)



-----
PostgreSQL DBA
 
 Top
Albertino
Отправлено: 16 Декабря, 2010 - 10:06:12
Post Id


Гость


Покинул форум
Сообщений всего: 92
Дата рег-ции: Окт. 2010  


Помог: 0 раз(а)




Мелкий пишет:
0) phpfaq.ru/debug
1) что за функция preg_math? По параметрам похожа на preg_match
2) не вижу у регулярки модификаторов, все файлы однострочные?

1) да это она и есть, просто описался
2) получаются однострочные я ж использую file_get_contents(), а он читает файл в строку
 
 Top
Мелкий Супермодератор
Отправлено: 16 Декабря, 2010 - 10:14:36
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Albertino пишет:
2) получаются однострочные я ж использую file_get_contents(), а он читает файл в строку

Информация в переменной типа string != однострочный текст.
Или вы думаете, что случайно есть модификатор m (многострочный поиск), хотя preg_match принимает строго string?

А file_get_contents читает бинарно, в строгом соответствии с тем, что есть в файле.

(Отредактировано автором: 16 Декабря, 2010 - 10:15:55)



-----
PostgreSQL DBA
 
 Top
Albertino
Отправлено: 16 Декабря, 2010 - 10:21:15
Post Id


Гость


Покинул форум
Сообщений всего: 92
Дата рег-ции: Окт. 2010  


Помог: 0 раз(а)




А как тогда посоветуете сделать?
 
 Top
Мелкий Супермодератор
Отправлено: 16 Декабря, 2010 - 10:58:03
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Так вроде уже прямым текстом сказал, чего как минимум не хватает - модификатора m.
И то это если отталкиваться от того, что указанная регулярка находит нужный кусок, если ей прямым текстом скормить строку, которую она должна найти. Чего она, кстати, не делает.
CODE (regexp):
скопировать код в буфер обмена
  1. /<input[^>]*firstname[^>]*value="([a-z]+)"[^>]*>/mi


-----
PostgreSQL DBA
 
 Top
Albertino
Отправлено: 16 Декабря, 2010 - 11:32:18
Post Id


Гость


Покинул форум
Сообщений всего: 92
Дата рег-ции: Окт. 2010  


Помог: 0 раз(а)




Спасибо большое за помощь
 
 Top
Albertino
Отправлено: 16 Декабря, 2010 - 14:33:02
Post Id


Гость


Покинул форум
Сообщений всего: 92
Дата рег-ции: Окт. 2010  


Помог: 0 раз(а)




Мелкий а можешь пожалуйсто написать регуляр. выражение для поиска страны из select, а то у меня с ними пока плохо, например
CODE (html):
скопировать код в буфер обмена
  1. <select name="country">
  2. <option value="3" selected="">Russia</option>
  3. <option value="4">Germanu</option>
  4. </select>

нужно взять значение selected, то есть Russia

(Отредактировано автором: 16 Декабря, 2010 - 14:48:09)

 
 Top
Мелкий Супермодератор
Отправлено: 16 Декабря, 2010 - 15:26:38
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




А у меня с регулярками тоже плохо...
Может, так:
CODE (regexp):
скопировать код в буфер обмена
  1. /<select[^>]*name="country">.*<option[^>]*selected[^>]*>([^<]*)/msi


-----
PostgreSQL DBA
 
 Top
Invert
Отправлено: 16 Декабря, 2010 - 16:11:55
Post Id



Частый гость


Покинул форум
Сообщений всего: 223
Дата рег-ции: Нояб. 2010  


Помог: 5 раз(а)




Можно также таким образом:
но по памяти не скажу - не помню.
 
 Top
JustUserR
Отправлено: 16 Декабря, 2010 - 19:57:47
Post Id



Активный участник


Покинул форум
Сообщений всего: 8715
Дата рег-ции: Июнь 2009  


Помог: 17 раз(а)




Albertino В качестве оптимального варианта используемого для предполагаемой вами задачи с осуществлением разбора HTML-документа целесообразно использование библиотеки XML-анализатора - позволяющий обеспечить корректное получения компонентов оригинального файлоа на основе его представления в объектной модели


-----
Сделать можно все что угодно - нужно только старание, терпение и хороший поисковик Улыбка
Безлимитный web-хостинг от 15 рублей за 40 МБ дискового пространства - http://ihost[dot]oks71[dot]ru/
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Программирование на PHP »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB