Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: preg_replace на некорректные символы UTF-8
Форумы портала PHP.SU » PHP » Регулярные выражения » preg_replace на некорректные символы UTF-8

Страниц (1): [1]
 

1. BlackHacker - 21 Июня, 2014 - 18:28:30 - перейти к сообщению
Здравствуйте. Помогите пожалуйста с регуляркой на замену некорректных символов utf-8. Через api vk получаю сообщения со стены, в utf-8, потом сохраняю в бд, но в сообщениях, где есть смайлы, присутствует код нечитаемого символа, из-за чего не сохраняет в бд. Обычные символы имеют вид

, те, которые стоят на месте смайлов -

Нужно по коду символа убрать все лишние символы, которые находятся за пределами читаемых символов. В гугле наткнулся на тему с такой же проблемой, но там никто не ответил.


Пока воспользовался временным решением через iconv, она удаляет лишние символы.
2. Мелкий - 22 Июня, 2014 - 09:18:22 - перейти к сообщению
iconv//IGNORE, по совместительству, самый производительный способ.
Регулярку я помню, что видел тут: https://bugs.php.net/bug.php?id=48507
3. BlackHacker - 22 Июня, 2014 - 12:13:08 - перейти к сообщению
Мелкий пишет:
iconv//IGNORE, по совместительству, самый производительный способ.
Регулярку я помню, что видел тут: https://bugs.php.net/bug.php?id=48507



Сейчас так и сделал, только приходится сначала из utf-8 перекодировать в другую кодировку, а затем обратно, чтобы убрать лишние символы. Есть ли способ обойтись без этого шага?

PHP:
скопировать код в буфер обмена
  1. $this->data = iconv('windows-1251', 'utf-8//IGNORE', iconv('utf-8', 'windows-1251//IGNORE', $this->data));
4. Мелкий - 22 Июня, 2014 - 13:00:39 - перейти к сообщению
Просто utf8 в utf8 не работает? Я что-то не могу вспомнить, в какой книге читал.
5. BlackHacker - 22 Июня, 2014 - 15:41:10 - перейти к сообщению
Нет, так не работает, уже пробовал. Либо работает, но после выполнения функции все остается как было. Символы убираются, если только перекодировать из одной кодировки в другую. Изначально данные в utf-8, и не получится использовать другую кодировку, насколько я помню, json работает только в этой кодировке.

 

Powered by ExBB FM 1.0 RC1