Doox911 пишет:т.е. когда я беру символ и сравниваю именно как символ и знаю что символ в utf-8 php всё равно не понимает его код?
Не понял вопроса.
Doox911 пишет:Он всегда сравнивает по битно?
Побайтово.
zend движок я не знаю, не покажу место в исходнике.
Doox911 пишет:И что значит utf-8, что резиновая?
Да, от 1 до 4 байт на символ. Есть ли следующий байт для этого символа определяется по крайнему биту каждого байта.
По старому стандарту в UTF8 было от 1 до 6 байт, потом отпилили до 4 байт максимум.
Doox911 пишет:utf-16 2 я так понимаю строго 2 байта = 16 бит.
Нет. Бывает 16 или 32 бита на символ.
Постоянную ширину из UTF имеет только UTF32, где символ всегда занимает 4 байта.
Кстати, 4 байт юникода вполне используется в жизни всякими смартфонами под смайлики. От чего интересные грабли собирали пользователи mysql, где utf8 кодировка не может хранить 4 байт, только максимум 3 на символ. Поэтому в mysql появилась utf8mb4, в 5.5 помнится.
|