Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Повторяющиеся значения для preg_replace. Как удалить?
Форумы портала PHP.SU » » Вопросы новичков » Повторяющиеся значения для preg_replace. Как удалить?

Страниц (1): [1]
 

1. LShark - 09 Декабря, 2012 - 10:37:49 - перейти к сообщению
Извиняюсь, если уже достал, но еще один вопрос.

Есть большой HTML, который создается вордом (увы, это единственный способ объяснить нашим старикам, как добавить файл на сервер).

Я очищаю его от 99% мусора, но остается еще одно:

CODE (html):
скопировать код в буфер обмена
  1. <p>Текст</p><p>Еще текст</p><p>Куча текста</p><p>Еще абзац</p><p>Еще абзац2</p><p>Еще абзац3</p>


В результате после очистки я получаю разреженное отображение текста:
CODE (htmlphp):
скопировать код в буфер обмена
  1. Текст
  2.  
  3. Еще текст
  4.  
  5. Куча текста
  6.  
  7. Еще абзац
  8.  
  9. Еще абзац2
  10.  
  11. Еще абзац3


А надо
CODE (htmlphp):
скопировать код в буфер обмена
  1. Текст
  2. Еще текст
  3. Куча текста
  4. Еще абзац
  5. Еще абзац2
  6. Еще абзац3


Попробовал просто заменить все </p><p> на <br> - почти хорошо получилось, НО!
Время от времени встречается <p align=center> и после такого обрезания на <br> все, что ниже тега center тоже начинает центрироваться.

Попытался так:
заменяю
<p>([^align=]*?)</p><p>
на
<p>\\1<br>

Получаю - часть обрабатывается, как надо, но часть вообще не обрабатывается.
Если такую зачистку провести несколько раз (3-4), то почти все, как надо, но все таки, может есть более простое выражение, чтобы получалось из:


CODE (html):
скопировать код в буфер обмена
  1. <p>Текст</p><p align=center>Еще текст</p><p>Куча текста</p><p>Еще абзац</p><p>Еще абзац2</p><p>Еще абзац3</p>


CODE (html):
скопировать код в буфер обмена
  1. <p>Текст</p><p align=center>Еще текст</p><p>Куча текста<br>Еще абзац<br>Еще абзац2<br>Еще абзац3</p>
2. LIME - 09 Декабря, 2012 - 10:52:05 - перейти к сообщению
striptags()
(Добавление)
nl2br()
3. LShark - 09 Декабря, 2012 - 11:04:11 - перейти к сообщению
Не получится.

Стриптаг отрезает вообще ВСЕ тэги, а это полноценный документ, с боди, стилями и прочим мусором.

Плюс он УЖЕ вытянут в одну строку (т.е. в нем НЕТ переносов строк - nl2br отпадает)

Проблема в ОТОБРАЖЕНИИ текста в браузере.

</p><p> создают между строками отступ, который мне не нужен. Потому мне выгоднее <br>

Но как убрать только те тэги </p>, которые не закрывают абзац с align ?

т.е.
<p>Текст</p><p>Еще текст</p> <<<< тут </p><p> подлежит замене на <br>
<p align=center>Текст</p><p>Еще текст</p> <<<< тут </p><p> НЕ подлежит замене на <br>, так как тогда "Еще текст" тоже отцентруется, а мне это не нужно.

В документе сотни строк, буквально по 3-4 слова в строке, потому и надо их "сжать" по высоте. Ну и к тому же - 200 раз <p></p> - это 200х7=1400 символов, а 200 раз <br> - это лишь 200х4=800 - немного, но выигрыш в размерах все таки есть. А строк иногда бывает по 2-3к.
4. DeepVarvar - 09 Декабря, 2012 - 11:20:37 - перейти к сообщению
5. LIME - 09 Декабря, 2012 - 11:24:23 - перейти к сообщению
#<p\s*.?>(.*?)<\p>#
"$1<br>"
6. DeepVarvar - 09 Декабря, 2012 - 11:38:30 - перейти к сообщению
LIME зачем запоминать лишние помаски?
7. LShark - 09 Декабря, 2012 - 11:42:51 - перейти к сообщению
DeepVarvar пишет:
preg_replace('/<\/p>\s*<p>/', '<br />', $str)


Хм... Этот вариант не производит ни одной замены, почему то.


#<p\s*.?>(.*?)<\p>#
А это как вставить в массив для preg_replace?

Сейчас у меня примерно такое:
PHP:
скопировать код в буфер обмена
  1. $search = array ("'([\r\n])[\s]+'si",
  2.                 "' class=.*?( |>)'si",
  3.                 "'<p>(.*?)</p><p>'si");

на на замену:
$replace = array (" ",
"\\1",
"<p>\\1<br>");

Если вставляю как есть - дает ошибку.
8. LIME - 09 Декабря, 2012 - 11:49:56 - перейти к сообщению
#</p>\s<p\s.*?># если внешний p оставлять
а ты вообще задачу не понял)
9. LShark - 09 Декабря, 2012 - 11:52:50 - перейти к сообщению
LIME пишет:
<p\s*.?>(.*?)<\p>


Вот это, похоже, сработало.

Только в конце не \p , а /p

а делать </p>/s+<p> не стоит, пробелы между тегами я уже урезал заранее.
10. LIME - 09 Декабря, 2012 - 11:54:03 - перейти к сообщению
LShark если регулярки не знаешь может проще http://habrahabr[dot]ru/post/114143/
?
11. LShark - 09 Декабря, 2012 - 12:05:44 - перейти к сообщению
Я, видишь ли, врач Улыбка
И это мое хобби, которое, одновременно, облегчает жизнь мне и куче других людей, которые вообще считают компьютер "Бесовской машиной" и не способны ни на что, кроме натыкивания в Ворде документов.

Потому для меня 99% всяких
$books[$i]['id'] = $element->id;
$books[$i]['image'] = $element->children(0)->src;

Темный лес, опутанный колючей проволокой. В основном для этого юзал страницу про регулярные выражения с главной страницы php.su. Но не всегда ее хватает.

 

Powered by ExBB FM 1.0 RC1