Добрый день!
Есть задача, выбирать из текста некоторые слова. Далее, я могу их редактировать из БД.
Но суть в том, что, регулярка возвращает мне позицию слова в байтах. Можно конечно работать со словами через str_replace, но я хочу работать через позицию слова и длину слова, чтобы производить замену. Т.к. к примеру слова МАГАЗИН и МАГАЗИНЫ, схожи, кроме последнего символа. И изменив что-то в МАГАЗИН, оно отразится в МАГАЗИНЫ.
Как я могу получить правильную позицию слова? Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного
Спасибо за ответы.
p.s. кодировка только utf8, языки разные, маньямский, тайваньский, китайский и т.п.
1. voodoo_dn - 09 Января, 2014 - 11:56:10 - перейти к сообщению
2. OrmaJever - 09 Января, 2014 - 12:11:18 - перейти к сообщению
voodoo_dn пишет:
регулярка возвращает мне позицию слова
это как? Регулярка возвращает то что попало под её маску.
(Добавление)
voodoo_dn пишет:
Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного
тоесть mb_strpos() сложнее чем mb_strlen() ?
3. voodoo_dn - 09 Января, 2014 - 12:14:24 - перейти к сообщению
Регулярка возвращает то что попало, но позицию слова указывает в байтах.
mb_strpos - не то. а если таких искомых слов несколько? а мне надо исправить 2й из 3х.
Уже всё обдумано сто раз) Надо просто узнать, как сделать так, чтобы регулярка показывала нормальную позицию слова, не в байтах. Если это вообще реально.
mb_strpos - не то. а если таких искомых слов несколько? а мне надо исправить 2й из 3х.
Уже всё обдумано сто раз) Надо просто узнать, как сделать так, чтобы регулярка показывала нормальную позицию слова, не в байтах. Если это вообще реально.
4. OrmaJever - 09 Января, 2014 - 12:21:37 - перейти к сообщению
ну тогда подозреваю что вам нужен флаг u (не путать с U)
5. Мелкий - 09 Января, 2014 - 12:37:03 - перейти к сообщению
OrmaJever пишет:
ну тогда подозреваю что вам нужен флаг u
Всё равно будет позиция в байтах. preg_match_all позицию всегда в байтах возвращает.
Оперируйте лучше байтами.
Или сделайте substr от 0 до указанного смещения, потом mb_strlen к полученному - получите смещение в символах.