Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Вопрос по парсингу через preg_match_all
Форумы портала PHP.SU » PHP » Регулярные выражения » Вопрос по парсингу через preg_match_all

Страниц (1): [1]
 

1. Craken - 13 Августа, 2010 - 15:39:20 - перейти к сообщению
Привет всем!
Уж так получилось, что кое-какая информация пишется в файл и причем в одну строку!
Вытащив эту строку, мне нужно получить информацию по рег. выражению!
Вот что имеется:
PHP:
скопировать код в буфер обмена
  1. preg_match_all("/<tr><td>\d*?<\/td><td>.*?<\/td><td>\d*?<\/td><td>.*?<\/td><td>\d*<\/td><td>.*?<\/td><td>\d*<\/td><td>.*?<\/td><td>\d*<\/td><td>.*?<\/td><td>.*?<\/td><td>-----------------<\/td><td>.*?<\/td><\/tr>/im", $text, $match);


На том месте, где много дефисов должна становится фамилия человека! Но тут возникла проблема!
Скрипты которые добавляют записи работают криво, и если там становится 2 фамилии, то они могут стать так: "ИвановСидоров" или "СидоровИванов" или может бить просто одна какая-то!
То есть мне нужно узнать, сколько таких вот совпадений по каждой из фамилий.. Но как я уже упоминал, фамилия может быть не одна (Всего около 20-ти фамилий)!
Пробовал так:
- не работает! Практически все что мне нужно, так указать что перед фамилией или после нее может быть еще одна или может быть пусто!
Всем заранее Спасибо за помощь!
2. Champion - 13 Августа, 2010 - 18:11:39 - перейти к сообщению
На место дефисов такую регистрозависимую регулярку:
>[^а-яА-Я]*((?:[А-Я][а-я]+){2,})[^а-яА-Я]*<

Сматчатся те вещи, в которых более одной фамилии.
3. JustUserR - 13 Августа, 2010 - 21:53:47 - перейти к сообщению
Craken пишет:
Практически все что мне нужно, так указать что перед фамилией или после нее может быть еще одна или может быть пусто
При осущественнии поиска в шаблоне некоторых символьных вхождений которые могут быть предварены некоторым другими значения не входящими в данный шаблон - можно использовать операции операции просмотра вперед или назад которые могут работать как позитивном так и негативном режиме - осуществляя совпадения для некоторого шаблона только в том случае если рядом с ним находится или соответственно не находится указанное вхождение
4. Craken - 14 Августа, 2010 - 08:57:11 - перейти к сообщению
Champion пишет:
На место дефисов такую регистрозависимую регулярку:
>[^а-яА-Я]*((?:[А-Я][а-я]+){2,})[^а-яА-Я]*<

Сматчатся те вещи, в которых более одной фамилии.

Спасибо конечно! Но не совсем то что нужно!
Интересует именно поиск например фамилии "Петров" в:
"<td>СидоровПетров</td>" или "<td>ПетровСидоров</td>" или просто "<td>Петров</td>"
То есть может быть как угодно! И важно что вставляется между ""<td></td>!
Я так понял что вот так не получится "<td>.*?Петров.*?</td>"
5. Champion - 14 Августа, 2010 - 09:19:34 - перейти к сообщению
А, т.е. есть конкретная фамилия и ее надо найти?
<td>.*?Петров.*?</td> не совсем хорошо, лучше тогда <td>[^<]*?Петров[^<]*?</td>/
Тогда получится. Просто .*, которое является последовательностью, любых символов, может разползтись налево и направо от Петрова довольно далеко. А вот так [^<] мы не дадим ей разползтись дальiе, чем в пределах <td>...</td>
6. JustUserR - 15 Августа, 2010 - 01:52:50 - перейти к сообщению
Craken пишет:
Я так понял что вот так не получится "<td>.*?Петров.*?</td>"
Некоторые конструкции используемые при составлении шаблона для регулярного выражения являюся похожими - и с точки зрения конкретного поиска в одной итерации представляют собой одно и то же - и разница в них проявляется относительно механизма сохранения вхождений Например использование операторов просмотра вперед и назад позволяет управлять сохранением работающего с ним текстового шаблона без их собственного сохранения - в то время как обычные запоминающие круглые скобки включат в список вхождений и собственное совпадение

 

Powered by ExBB FM 1.0 RC1