Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Количество символов в строке юникод

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Описание: Как найти количество символов в строке юникод
MAXUS
Отправлено: 12 Ноября, 2014 - 11:41:51
Post Id


Посетитель


Покинул форум
Сообщений всего: 329
Дата рег-ции: Апр. 2011  


Помог: 7 раз(а)




Была такая тема, но не могу найти.

PHP:
скопировать код в буфер обмена
  1. $expr="10л!==1";
  2.  
  3. echo strlen($expr)."<br />";
  4. echo mb_strlen($expr)."<br />";


В обоих случаях возвращает 8.

PHP:
скопировать код в буфер обмена
  1. $expr="10w!==1";
  2.  
  3. echo strlen($expr)."<br />";
  4. echo mb_strlen($expr)."<br />";


В обоих случаях возвращает 7.

Понятно, что возвращается количество байт. Но не понятно тогда:
1. Чем mb_strlen отличается от strlen?
2. А как правильно найти количество символов в строке юникод?
 
 Top
Panoptik
Отправлено: 12 Ноября, 2014 - 11:49:55
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2493
Дата рег-ции: Нояб. 2011  
Откуда: Одесса, Украина


Помог: 131 раз(а)




мануалы читать умеем?

у mb_strlen есть второй параметр. передайте туда utf-8 и увидите результат
так же можно установить глобально mb_internal_encoding


-----
Just do it
 
 Top
MAXUS
Отправлено: 12 Ноября, 2014 - 12:02:44
Post Id


Посетитель


Покинул форум
Сообщений всего: 329
Дата рег-ции: Апр. 2011  


Помог: 7 раз(а)




Panoptik пишет:
мануалы читать умеем?

у mb_strlen есть второй параметр. передайте туда utf-8 и увидите результат
так же можно установить глобально mb_internal_encoding


Гран мерси, увери вел сенкью! Тыкнул в кармуУлыбка

(Отредактировано автором: 12 Ноября, 2014 - 12:03:09)

 
 Top
esterio
Отправлено: 12 Ноября, 2014 - 13:12:11
Post Id



Активный участник


Покинул форум
Сообщений всего: 5025
Дата рег-ции: Нояб. 2012  
Откуда: Украина, Львов


Помог: 127 раз(а)




MAXUS пишет:
Чем mb_strlen отличается от strlen?

потому как strlen считает количество байт в строке, а mb_strlen учитивает кодировку. cp1251 однобайтовая кодировка (один байт = один символ) strlen показивает верно количество. а вот UTF-8 уже многобайтовая (например кирилица в ней занимает 2 байта). вот получаеться что в UTF-8 количество байт != количество символов
 
 Top
MAXUS
Отправлено: 12 Ноября, 2014 - 15:59:37
Post Id


Посетитель


Покинул форум
Сообщений всего: 329
Дата рег-ции: Апр. 2011  


Помог: 7 раз(а)




esterio пишет:
MAXUS пишет:
Чем mb_strlen отличается от strlen?

потому как strlen считает количество байт в строке, а mb_strlen учитивает кодировку. cp1251 однобайтовая кодировка (один байт = один символ) strlen показивает верно количество. а вот UTF-8 уже многобайтовая (например кирилица в ней занимает 2 байта). вот получаеться что в UTF-8 количество байт != количество символов


Не. Это я понимаю. Я ступил почему mb_strlen выдает тот же результат, что и простая strlen. Как правильно сказали, не заглянул в описание функции, поэтому выполнял ее с кодировкой по умолчанию.
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Кодировки и все смежное »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB