Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: preg_match_all + utf8 - позиция в байтах

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
voodoo_dn
Отправлено: 09 Января, 2014 - 11:56:10
Post Id


Новичок


Покинул форум
Сообщений всего: 12
Дата рег-ции: Янв. 2014  


Помог: 0 раз(а)




Добрый день!

Есть задача, выбирать из текста некоторые слова. Далее, я могу их редактировать из БД.
Но суть в том, что, регулярка возвращает мне позицию слова в байтах. Можно конечно работать со словами через str_replace, но я хочу работать через позицию слова и длину слова, чтобы производить замену. Т.к. к примеру слова МАГАЗИН и МАГАЗИНЫ, схожи, кроме последнего символа. И изменив что-то в МАГАЗИН, оно отразится в МАГАЗИНЫ.

Как я могу получить правильную позицию слова? Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного Улыбка

Спасибо за ответы.

p.s. кодировка только utf8, языки разные, маньямский, тайваньский, китайский и т.п.
 
 Top
OrmaJever Модератор
Отправлено: 09 Января, 2014 - 12:11:18
Post Id



Активный участник


Покинул форум
Сообщений всего: 7540
Дата рег-ции: Янв. 2010  
Откуда: Чернигов


Помог: 299 раз(а)




voodoo_dn пишет:
регулярка возвращает мне позицию слова

это как? Регулярка возвращает то что попало под её маску.
(Добавление)
voodoo_dn пишет:
Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного

тоесть mb_strpos() сложнее чем mb_strlen() ?


-----
Если вы хотя бы 3-4 раза не решите всё выкинуть и начать заново - вы явно что-то делаете не так.
 
 Top
voodoo_dn
Отправлено: 09 Января, 2014 - 12:14:24
Post Id


Новичок


Покинул форум
Сообщений всего: 12
Дата рег-ции: Янв. 2014  


Помог: 0 раз(а)




Регулярка возвращает то что попало, но позицию слова указывает в байтах.

mb_strpos - не то. а если таких искомых слов несколько? а мне надо исправить 2й из 3х.
Уже всё обдумано сто раз) Надо просто узнать, как сделать так, чтобы регулярка показывала нормальную позицию слова, не в байтах. Если это вообще реально.
 
 Top
OrmaJever Модератор
Отправлено: 09 Января, 2014 - 12:21:37
Post Id



Активный участник


Покинул форум
Сообщений всего: 7540
Дата рег-ции: Янв. 2010  
Откуда: Чернигов


Помог: 299 раз(а)




ну тогда подозреваю что вам нужен флаг u (не путать с U)


-----
Если вы хотя бы 3-4 раза не решите всё выкинуть и начать заново - вы явно что-то делаете не так.
 
 Top
Мелкий Супермодератор
Отправлено: 09 Января, 2014 - 12:37:03
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




OrmaJever пишет:
ну тогда подозреваю что вам нужен флаг u

Всё равно будет позиция в байтах. preg_match_all позицию всегда в байтах возвращает.

Оперируйте лучше байтами.
Или сделайте substr от 0 до указанного смещения, потом mb_strlen к полученному - получите смещение в символах.


-----
PostgreSQL DBA
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Кодировки и все смежное »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB