Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Удалить все теги <h[1-6]>, </h[1-6]> после тега </h2>.
Форумы портала PHP.SU » PHP » Регулярные выражения » Удалить все теги <h[1-6]>, </h[1-6]> после тега </h2>.

Страниц (2): [1] 2 »
 

1. AleksRyzhov - 23 Мая, 2010 - 15:54:02 - перейти к сообщению
Приветствую всех! Возникла проблемка, помогите плиз с решением. Суть - нужно удалить все теги <h[1-6]>, </h[1-6]> после тега </h2>(окончание названия статьи). С регулярками не в ладах, пробовал так
PHP:
скопировать код в буфер обмена
  1. $file1 = preg_replace('|</h2>(.*)((<h\d>|</h\d>)*)(.*)|is', '</h2>\$1\$3', $file1);

Спасибо.
2. alexspb - 23 Мая, 2010 - 16:05:02 - перейти к сообщению
надо было экранировать | и ссылка на фрагмент иначе:
<h\d>\|</h\d>

</h2>\\1\\3

Лобовое решение:
1) получаем часть с заголовком2
2) из оставшейся части вырезаем ненужное - удалив начальную часть с заголовком2 (работает и если заголовок2 встречается больше 1 раза)

PHP:
скопировать код в буфер обмена
  1. //1)
  2. echo preg_replace('|</h2>.*$|is', '</h2>', $file1);
  3. //2)
  4. echo preg_replace('|<(h\d)>(.*)</\1>|isU', '', preg_replace('|^.*</h2>|isU', '', $file1));
  5.  

во второй регулярке (.*) "лишнее", но это если захочется сам текст из заголовков сохранять
3. JustUserR - 23 Мая, 2010 - 17:29:00 - перейти к сообщению
AleksRyzhov Можете использовать следующее регулярное выражение preg_replace('/\<h2\>(.*?)\<h([1-6]+)\>(.*?)<\/h\2\>/ig','</h2>\1') - то есть вы находитет окончание тега h2 наиболее близко к нему ищите первый тег <hX> и закрывающий тег </hX> - причем значение X должно быть одним и тем же что показано в обратной ссылке а квантификаторы должны быть нежадными
4. AleksRyzhov - 23 Мая, 2010 - 17:56:31 - перейти к сообщению
Спасибо за помощь, но пока к сожалению, ни 1 вышеприведенный код не работает.

<h1>Категория</h1>
<h2>Заголовок</h2>
Текст в котором попадаются записи в тегах <h1>, <h2>, <h3>.


Задача в тексте после Заголовка удалить все теги <h1>... и закрывающие их.
5. alexspb - 23 Мая, 2010 - 18:47:25 - перейти к сообщению
Цитата:
<h1>Категория<h1>

может просто вы пример взяли некорректный?
у вас нет закрывающих тэгов
код я выложил рабочий - проверил сначала

PHP:
скопировать код в буфер обмена
  1. <?PHP
  2. $s = <<<END
  3. <h1>Категория</h1>
  4. <h2>Заголовок</h2>
  5. Текст в котором попадаются записи в тегах
  6. <h1>hhhhhhhhhhhhhh1</h1>
  7. 11
  8. <h2>hhhhhhhhhhhhhh2</h2>
  9. 22
  10. <h3>hhhhhhhhhhhhhh3</h3>
  11. 333
  12. END;
  13.  
  14. echo preg_replace('|</h2>.*$|is', '</h2>', $s);
  15. echo preg_replace('|<(h\d)>.*</\1>|isU', '', preg_replace('|^.*</h2>|isU', '', $s));
  16. ?>

результат
Цитата:
<h1>Категория</h1>
<h2>Заголовок</h2>
Текст в котором попадаются записи в тегах

11

22

333
6. AleksRyzhov - 23 Мая, 2010 - 18:49:43 - перейти к сообщению
Спасибо поправил. Я опечатался, закрывающие теги есть везде.
7. alexspb - 23 Мая, 2010 - 18:53:54 - перейти к сообщению
JustUserR, у меня пишет на вашу регулярку
Цитата:
<b>Warning</b>: preg_replace(): Unknown modifier 'g' in <b>test_preg.php</b> on line <b>...</b>
8. AleksRyzhov - 23 Мая, 2010 - 18:55:42 - перейти к сообщению
alexspb, там вместо g должно быть s. Та регулярка работает, но она удаляет не все мешающие теги, а только первые после заголовка.
9. Champion - 23 Мая, 2010 - 19:15:26 - перейти к сообщению
Вариант 1 - копнуть в сторону preg_replace_callback - сматчить ей <\h2>.+$ и внутри вызываемой функции заменить все <\/?h\d> на пустоту.

Вариант второй пока я писал, понял, что не сработает. Короче, в голову приходить только один вариант.

А во, пришел в голову третий вариант: preg_replace(/<\/?h\d>/, '', substr(от strips('<\/h2>') до конца)).

Смысл думаю понятен, синтаксис поправишь.
10. alexspb - 23 Мая, 2010 - 19:29:15 - перейти к сообщению
Champion, в вашем варианте тексты заголовков останутся, ТС говорит про тэги, но явно не сказано, нужно ли оставлять то, что в контейнере...
11. AleksRyzhov - 23 Мая, 2010 - 19:33:05 - перейти к сообщению
Верно, текст в тегах нужно бы оставить.
12. alexspb - 23 Мая, 2010 - 19:54:04 - перейти к сообщению
AleksRyzhov пишет:
Верно, текст в тегах нужно бы оставить.

тогда
PHP:
скопировать код в буфер обмена
  1. $s = <<<END
  2. <h1>Категория</h1>
  3. <h2>Заголовок</h2>
  4. Текст в котором попадаются записи в тегах
  5. <h1>hhhhhhhhhhhhhh1</h1>
  6. 11
  7. <h2>hhhhhhhhhhhhhh2</h2>
  8. 22
  9. <h3>hhhhhhhhhhhhhh3</h3>
  10. 333
  11. END;
  12. echo preg_replace('|</h2>.*$|is', '</h2>', $s);
  13. echo preg_replace('|<(h\d)>(.*)</\1>|isU', '\\2', preg_replace('|^.*</h2>|isU', '', $s));
13. AleksRyzhov - 23 Мая, 2010 - 20:18:45 - перейти к сообщению
alexspb, у меня данный код очищает файлы, если preg_replace загнать в переменные, если как у вас записать, только без echo, то ничего не происходит.

Все походу разобрался, спасибо вам огромное.
PHP:
скопировать код в буфер обмена
  1. $file3 = preg_replace('|</h2>.*$|is', '</h2>', $file1);
  2. $file4 = preg_replace('|<(h\d)>(.*)</\1>|isU', '\\2', preg_replace('|^.*</h2>|isU', '', $file1));
  3. $file1 = $file3.$file4;
14. alexspb - 23 Мая, 2010 - 20:25:21 - перейти к сообщению
AleksRyzhov пишет:
если как у вас записать, только без echo, то ничего не происходит

правильно, это я для отладки и быстроты использую, вам достаточно присвоить результат переменной вместо echo:
PHP:
скопировать код в буфер обмена
  1. $result  = preg_replace('|</h2>.*$|is', '</h2>', $s);
  2. $result .= preg_replace('|<(h\d)>(.*)</\1>|isU', '\\2', preg_replace('|^.*</h2>|isU', '', $s));

а потом используете $result как надо

к слову, в загловках могут быть стили, тогда можно поменять
<(h\d)> на <(h\d)[^>]*>
15. AleksRyzhov - 23 Мая, 2010 - 20:27:06 - перейти к сообщению
Последний вариант кода у меня удаляет все из файлов))) Я выше написал код, который сработал норм, сейчас еще раз получше посмотрю.

PHP:
скопировать код в буфер обмена
  1. $file3 = preg_replace('|</h2>.*$|is', '</h2>', $file1);
  2. $file4 = preg_replace('|<(h\d)>(.*)</\1>|isU', '\\2', preg_replace('|^.*</h2>|isU', '', $file1));
  3. $file1 = $file3.$file4;
Вот такой код работает так, как нужно.

 

Powered by ExBB FM 1.0 RC1