Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: preg_replace на некорректные символы UTF-8

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
BlackHacker
Отправлено: 21 Июня, 2014 - 18:28:30
Post Id


Новичок


Покинул форум
Сообщений всего: 38
Дата рег-ции: Май 2010  


Помог: 0 раз(а)




Здравствуйте. Помогите пожалуйста с регуляркой на замену некорректных символов utf-8. Через api vk получаю сообщения со стены, в utf-8, потом сохраняю в бд, но в сообщениях, где есть смайлы, присутствует код нечитаемого символа, из-за чего не сохраняет в бд. Обычные символы имеют вид

, те, которые стоят на месте смайлов -

Нужно по коду символа убрать все лишние символы, которые находятся за пределами читаемых символов. В гугле наткнулся на тему с такой же проблемой, но там никто не ответил.


Пока воспользовался временным решением через iconv, она удаляет лишние символы.

(Отредактировано автором: 21 Июня, 2014 - 19:59:47)

 
 Top
Мелкий Супермодератор
Отправлено: 22 Июня, 2014 - 09:18:22
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




iconv//IGNORE, по совместительству, самый производительный способ.
Регулярку я помню, что видел тут: https://bugs.php.net/bug.php?id=48507


-----
PostgreSQL DBA
 
 Top
BlackHacker
Отправлено: 22 Июня, 2014 - 12:13:08
Post Id


Новичок


Покинул форум
Сообщений всего: 38
Дата рег-ции: Май 2010  


Помог: 0 раз(а)




Мелкий пишет:
iconv//IGNORE, по совместительству, самый производительный способ.
Регулярку я помню, что видел тут: https://bugs.php.net/bug.php?id=48507



Сейчас так и сделал, только приходится сначала из utf-8 перекодировать в другую кодировку, а затем обратно, чтобы убрать лишние символы. Есть ли способ обойтись без этого шага?

PHP:
скопировать код в буфер обмена
  1. $this->data = iconv('windows-1251', 'utf-8//IGNORE', iconv('utf-8', 'windows-1251//IGNORE', $this->data));
 
 Top
Мелкий Супермодератор
Отправлено: 22 Июня, 2014 - 13:00:39
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Просто utf8 в utf8 не работает? Я что-то не могу вспомнить, в какой книге читал.


-----
PostgreSQL DBA
 
 Top
BlackHacker
Отправлено: 22 Июня, 2014 - 15:41:10
Post Id


Новичок


Покинул форум
Сообщений всего: 38
Дата рег-ции: Май 2010  


Помог: 0 раз(а)




Нет, так не работает, уже пробовал. Либо работает, но после выполнения функции все остается как было. Символы убираются, если только перекодировать из одной кодировки в другую. Изначально данные в utf-8, и не получится использовать другую кодировку, насколько я помню, json работает только в этой кодировке.
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Регулярные выражения »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB