Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Повторяющиеся значения для preg_replace. Как удалить?

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: </p><p> превратить в <br>, если предыдущий абзац без align
LShark
Отправлено: 09 Декабря, 2012 - 10:37:49
Post Id



Частый гость


Покинул форум
Сообщений всего: 240
Дата рег-ции: Нояб. 2012  


Помог: 1 раз(а)




Извиняюсь, если уже достал, но еще один вопрос.

Есть большой HTML, который создается вордом (увы, это единственный способ объяснить нашим старикам, как добавить файл на сервер).

Я очищаю его от 99% мусора, но остается еще одно:

CODE (html):
скопировать код в буфер обмена
  1. <p>Текст</p><p>Еще текст</p><p>Куча текста</p><p>Еще абзац</p><p>Еще абзац2</p><p>Еще абзац3</p>


В результате после очистки я получаю разреженное отображение текста:
CODE (htmlphp):
скопировать код в буфер обмена
  1. Текст
  2.  
  3. Еще текст
  4.  
  5. Куча текста
  6.  
  7. Еще абзац
  8.  
  9. Еще абзац2
  10.  
  11. Еще абзац3


А надо
CODE (htmlphp):
скопировать код в буфер обмена
  1. Текст
  2. Еще текст
  3. Куча текста
  4. Еще абзац
  5. Еще абзац2
  6. Еще абзац3


Попробовал просто заменить все </p><p> на <br> - почти хорошо получилось, НО!
Время от времени встречается <p align=center> и после такого обрезания на <br> все, что ниже тега center тоже начинает центрироваться.

Попытался так:
заменяю
<p>([^align=]*?)</p><p>
на
<p>\\1<br>

Получаю - часть обрабатывается, как надо, но часть вообще не обрабатывается.
Если такую зачистку провести несколько раз (3-4), то почти все, как надо, но все таки, может есть более простое выражение, чтобы получалось из:


CODE (html):
скопировать код в буфер обмена
  1. <p>Текст</p><p align=center>Еще текст</p><p>Куча текста</p><p>Еще абзац</p><p>Еще абзац2</p><p>Еще абзац3</p>


CODE (html):
скопировать код в буфер обмена
  1. <p>Текст</p><p align=center>Еще текст</p><p>Куча текста<br>Еще абзац<br>Еще абзац2<br>Еще абзац3</p>

(Отредактировано автором: 09 Декабря, 2012 - 10:44:39)



-----
Истина прежде всего в том, что...
 
 Top
LIME
Отправлено: 09 Декабря, 2012 - 10:52:05
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




striptags()
(Добавление)
nl2br()
 
 Top
LShark
Отправлено: 09 Декабря, 2012 - 11:04:11
Post Id



Частый гость


Покинул форум
Сообщений всего: 240
Дата рег-ции: Нояб. 2012  


Помог: 1 раз(а)




Не получится.

Стриптаг отрезает вообще ВСЕ тэги, а это полноценный документ, с боди, стилями и прочим мусором.

Плюс он УЖЕ вытянут в одну строку (т.е. в нем НЕТ переносов строк - nl2br отпадает)

Проблема в ОТОБРАЖЕНИИ текста в браузере.

</p><p> создают между строками отступ, который мне не нужен. Потому мне выгоднее <br>

Но как убрать только те тэги </p>, которые не закрывают абзац с align ?

т.е.
<p>Текст</p><p>Еще текст</p> <<<< тут </p><p> подлежит замене на <br>
<p align=center>Текст</p><p>Еще текст</p> <<<< тут </p><p> НЕ подлежит замене на <br>, так как тогда "Еще текст" тоже отцентруется, а мне это не нужно.

В документе сотни строк, буквально по 3-4 слова в строке, потому и надо их "сжать" по высоте. Ну и к тому же - 200 раз <p></p> - это 200х7=1400 символов, а 200 раз <br> - это лишь 200х4=800 - немного, но выигрыш в размерах все таки есть. А строк иногда бывает по 2-3к.

(Отредактировано автором: 09 Декабря, 2012 - 11:08:13)



-----
Истина прежде всего в том, что...
 
 Top
DeepVarvar Супермодератор
Отправлено: 09 Декабря, 2012 - 11:20:37
Post Id



Активный участник


Покинул форум
Сообщений всего: 10377
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




 
 Top
LIME
Отправлено: 09 Декабря, 2012 - 11:24:23
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




#<p\s*.?>(.*?)<\p>#
"$1<br>"
 
 Top
DeepVarvar Супермодератор
Отправлено: 09 Декабря, 2012 - 11:38:30
Post Id



Активный участник


Покинул форум
Сообщений всего: 10377
Дата рег-ции: Дек. 2008  
Откуда: Альфа Центавра


Помог: 353 раз(а)




LIME зачем запоминать лишние помаски?
 
 Top
LShark
Отправлено: 09 Декабря, 2012 - 11:42:51
Post Id



Частый гость


Покинул форум
Сообщений всего: 240
Дата рег-ции: Нояб. 2012  


Помог: 1 раз(а)




DeepVarvar пишет:
preg_replace('/<\/p>\s*<p>/', '<br />', $str)


Хм... Этот вариант не производит ни одной замены, почему то.


#<p\s*.?>(.*?)<\p>#
А это как вставить в массив для preg_replace?

Сейчас у меня примерно такое:
PHP:
скопировать код в буфер обмена
  1. $search = array ("'([\r\n])[\s]+'si",
  2.                 "' class=.*?( |>)'si",
  3.                 "'<p>(.*?)</p><p>'si");

на на замену:
$replace = array (" ",
"\\1",
"<p>\\1<br>");

Если вставляю как есть - дает ошибку.


-----
Истина прежде всего в том, что...
 
 Top
LIME
Отправлено: 09 Декабря, 2012 - 11:49:56
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




#</p>\s<p\s.*?># если внешний p оставлять
а ты вообще задачу не понял)
 
 Top
LShark
Отправлено: 09 Декабря, 2012 - 11:52:50
Post Id



Частый гость


Покинул форум
Сообщений всего: 240
Дата рег-ции: Нояб. 2012  


Помог: 1 раз(а)




LIME пишет:
<p\s*.?>(.*?)<\p>


Вот это, похоже, сработало.

Только в конце не \p , а /p

а делать </p>/s+<p> не стоит, пробелы между тегами я уже урезал заранее.

(Отредактировано автором: 09 Декабря, 2012 - 11:53:55)



-----
Истина прежде всего в том, что...
 
 Top
LIME
Отправлено: 09 Декабря, 2012 - 11:54:03
Post Id


Активный участник


Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010  


Помог: 322 раз(а)




LShark если регулярки не знаешь может проще http://habrahabr[dot]ru/post/114143/
?
 
 Top
LShark
Отправлено: 09 Декабря, 2012 - 12:05:44
Post Id



Частый гость


Покинул форум
Сообщений всего: 240
Дата рег-ции: Нояб. 2012  


Помог: 1 раз(а)




Я, видишь ли, врач Улыбка
И это мое хобби, которое, одновременно, облегчает жизнь мне и куче других людей, которые вообще считают компьютер "Бесовской машиной" и не способны ни на что, кроме натыкивания в Ворде документов.

Потому для меня 99% всяких
$books[$i]['id'] = $element->id;
$books[$i]['image'] = $element->children(0)->src;

Темный лес, опутанный колючей проволокой. В основном для этого юзал страницу про регулярные выражения с главной страницы php.su. Но не всегда ее хватает.


-----
Истина прежде всего в том, что...
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB