PHP.SU

Программирование на PHP, MySQL и другие веб-технологии

PHP.SU Портал

Главная

Помощь

Поиск

Поиск Яндекс Вакансии

Пользователи

Здравствуйте, Гость

( Вход · Регистрация · Правила форума )

Забыли пароль?

preg_match_all + utf8 - позиция в байтах

Форумы портала PHP.SU » PHP » Программирование на PHP » Кодировки и все смежное (Модераторы: OrmaJever, Саныч)

Страниц (1): [1]

Без описания

Поиск в теме | Версия для печати

voodoo_dn	Отправлено: 09 Января, 2014 - 11:56:10
Новичок Покинул форум Сообщений всего: 12 Дата рег-ции: Янв. 2014 Помог: 0 раз(а)	Добрый день! Есть задача, выбирать из текста некоторые слова. Далее, я могу их редактировать из БД. Но суть в том, что, регулярка возвращает мне позицию слова в байтах. Можно конечно работать со словами через str_replace, но я хочу работать через позицию слова и длину слова, чтобы производить замену. Т.к. к примеру слова МАГАЗИН и МАГАЗИНЫ, схожи, кроме последнего символа. И изменив что-то в МАГАЗИН, оно отразится в МАГАЗИНЫ. Как я могу получить правильную позицию слова? Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного Спасибо за ответы. p.s. кодировка только utf8, языки разные, маньямский, тайваньский, китайский и т.п.

OrmaJever	Отправлено: 09 Января, 2014 - 12:11:18
Активный участник Покинул форум Сообщений всего: 7540 Дата рег-ции: Янв. 2010 Откуда: Чернигов Помог: 299 раз(а)	voodoo_dn пишет: регулярка возвращает мне позицию слова это как? Регулярка возвращает то что попало под её маску. (Добавление) voodoo_dn пишет: Интересует только позиция, т.к. определить длину слова через mb_strlen - нет ничего сложного тоесть mb_strpos() сложнее чем mb_strlen() ? ----- Если вы хотя бы 3-4 раза не решите всё выкинуть и начать заново - вы явно что-то делаете не так.

voodoo_dn	Отправлено: 09 Января, 2014 - 12:14:24
Новичок Покинул форум Сообщений всего: 12 Дата рег-ции: Янв. 2014 Помог: 0 раз(а)	Регулярка возвращает то что попало, но позицию слова указывает в байтах. mb_strpos - не то. а если таких искомых слов несколько? а мне надо исправить 2й из 3х. Уже всё обдумано сто раз) Надо просто узнать, как сделать так, чтобы регулярка показывала нормальную позицию слова, не в байтах. Если это вообще реально.

OrmaJever	Отправлено: 09 Января, 2014 - 12:21:37
Активный участник Покинул форум Сообщений всего: 7540 Дата рег-ции: Янв. 2010 Откуда: Чернигов Помог: 299 раз(а)	ну тогда подозреваю что вам нужен флаг u (не путать с U) ----- Если вы хотя бы 3-4 раза не решите всё выкинуть и начать заново - вы явно что-то делаете не так.

Мелкий	Отправлено: 09 Января, 2014 - 12:37:03
Активный участник Покинул форум Сообщений всего: 11926 Дата рег-ции: Июль 2009 Откуда: Россия, Санкт-Петербург Помог: 618 раз(а)	OrmaJever пишет: ну тогда подозреваю что вам нужен флаг u Всё равно будет позиция в байтах. preg_match_all позицию всегда в байтах возвращает. Оперируйте лучше байтами. Или сделайте substr от 0 до указанного смещения, потом mb_strlen к полученному - получите смещение в символах. ----- PostgreSQL DBA

Поиск в теме | Версия для печати

Страниц (1): [1]

Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)

« Кодировки и все смежное »

Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.