Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: preg_match_all + utf8 - позиция в байтах
Форумы портала PHP.SU » » Кодировки и все смежное » preg_match_all + utf8 - позиция в байтах

Страниц (1): [1]
 

1. voodoo_dn - 09 Января, 2014 - 11:56:10 - перейти к сообщению
Добрый день!

Есть задача, выбирать из текста некоторые слова. Далее, я могу их редактировать из БД.
Но суть в том, что, регулярка возвращает мне позицию слова в байтах. Можно конечно работать со словами через str_replace, но я хочу работать через позицию слова и длину слова, чтобы производить замену. Т.к. к примеру слова МАГАЗИН и МАГАЗИНЫ, схожи, кроме последнего символа. И изменив что-то в МАГАЗИН, оно отразится в МАГАЗИНЫ.

Как я могу получить правильную позицию слова? Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного Улыбка

Спасибо за ответы.

p.s. кодировка только utf8, языки разные, маньямский, тайваньский, китайский и т.п.
2. OrmaJever - 09 Января, 2014 - 12:11:18 - перейти к сообщению
voodoo_dn пишет:
регулярка возвращает мне позицию слова

это как? Регулярка возвращает то что попало под её маску.
(Добавление)
voodoo_dn пишет:
Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного

тоесть mb_strpos() сложнее чем mb_strlen() ?
3. voodoo_dn - 09 Января, 2014 - 12:14:24 - перейти к сообщению
Регулярка возвращает то что попало, но позицию слова указывает в байтах.

mb_strpos - не то. а если таких искомых слов несколько? а мне надо исправить 2й из 3х.
Уже всё обдумано сто раз) Надо просто узнать, как сделать так, чтобы регулярка показывала нормальную позицию слова, не в байтах. Если это вообще реально.
4. OrmaJever - 09 Января, 2014 - 12:21:37 - перейти к сообщению
ну тогда подозреваю что вам нужен флаг u (не путать с U)
5. Мелкий - 09 Января, 2014 - 12:37:03 - перейти к сообщению
OrmaJever пишет:
ну тогда подозреваю что вам нужен флаг u

Всё равно будет позиция в байтах. preg_match_all позицию всегда в байтах возвращает.

Оперируйте лучше байтами.
Или сделайте substr от 0 до указанного смещения, потом mb_strlen к полученному - получите смещение в символах.

 

Powered by ExBB FM 1.0 RC1