Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Почему в режиме $strict in_array не верную кодировку?
Форумы портала PHP.SU » » Вопросы новичков » Почему в режиме $strict in_array не верную кодировку?

Страниц (1): [1]
 

1. Doox911 - 17 Июля, 2018 - 08:50:15 - перейти к сообщению
Делаю вот такую проверку:
PHP:
скопировать код в буфер обмена
  1.  
  2.     public static function CheckRussianLanguage ( $string ) {
  3.         $alfavit = array (' ','А','а','Б','б','В','в','Г','г','Д','д','Е','е','Ё',
  4.                          'ё','Ж','ж','З','з','И','и','Й','й','К','к','Л','л','М','м',
  5.                          'Н','н','О','о','П','п','Р','р','С','с','Т','т','У','у','Ф',
  6.                          'ф','Х','х','Ц','ц','Ч','ч','Ш','ш','Щ','щ','Ъ','ъ','Ы','ы',
  7.                          'Ь','ь','Э','э','Ю','ю','Я','я','0','1','2','3','4','5','6','7','8','9');
  8.         $dlinna_str = strlen ( $string );
  9.         $clear_string = '';
  10.         for ( $count = 0; $count<$dlinna_str; $count++ ) {
  11.             var_dump($string[$count]);
  12.            
  13.             $check = in_array ( $string[$count], $alfavit, true );
  14.             if ( $check ) {
  15.                 $clear_string .= $string[$count];
  16.             }
  17.         }
  18.         $clear_string = preg_replace ( "/ {1,}/", " ", $clear_string );
  19.         return $clear_string;
  20.     }
  21.  


При не строгом режиме пропускает всё. В чём может быть причина?
Вывожу var_dump

string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(0) ""
2. Vladimir Kheifets - 17 Июля, 2018 - 12:00:58 - перейти к сообщению
Doox911 пишет:
Делаю вот такую проверку:
PHP:
скопировать код в буфер обмена
  1.  
  2.     public static function CheckRussianLanguage ( $string ) {
  3.         $alfavit = array (' ','А','а','Б','б','В','в','Г','г','Д','д','Е','е','Ё',
  4.                          'ё','Ж','ж','З','з','И','и','Й','й','К','к','Л','л','М','м',
  5.                          'Н','н','О','о','П','п','Р','р','С','с','Т','т','У','у','Ф',
  6.                          'ф','Х','х','Ц','ц','Ч','ч','Ш','ш','Щ','щ','Ъ','ъ','Ы','ы',
  7.                          'Ь','ь','Э','э','Ю','ю','Я','я','0','1','2','3','4','5','6','7','8','9');
  8.         $dlinna_str = strlen ( $string );
  9.         $clear_string = '';
  10.         for ( $count = 0; $count<$dlinna_str; $count++ ) {
  11.             var_dump($string[$count]);
  12.            
  13.             $check = in_array ( $string[$count], $alfavit, true );
  14.             if ( $check ) {
  15.                 $clear_string .= $string[$count];
  16.             }
  17.         }
  18.         $clear_string = preg_replace ( "/ {1,}/", " ", $clear_string );
  19.         return $clear_string;
  20.     }
  21.  


При не строгом режиме пропускает всё. В чём может быть причина?
Вывожу var_dump

string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(0) ""

Добрый день!
Причина в том, Вы выбираете по одному байту, а для каждый символа кириллицы в UTF-8 нужно выбирать по 2 байта и для строки "АаБбВв" strlen выдаёт значение 12, а не 6.
Спойлер (Отобразить)
Удачи!
3. armancho7777777 - 17 Июля, 2018 - 14:58:31 - перейти к сообщению
PHP:
скопировать код в буфер обмена
  1. $word = 'Привет';
  2. $len = mb_strlen($word, 'UTF-8');
  3.  
  4. for($i=0; $i < $len; $i++) {
  5.     echo mb_substr($word, $i, 1, 'UTF-8'), "\n";
  6. }
  7.  

А вообще, Вашу задачу можно решить одной строкой кода:
PHP:
скопировать код в буфер обмена
  1. $clear_string = preg_replace (["/[^а-яё\d ]/ui", "/ +/"], ["", " "], $word);
4. Doox911 - 18 Июля, 2018 - 07:16:39 - перейти к сообщению
Vladimir Kheifets пишет:

Причина в том, Вы выбираете по одному байту, а для каждый символа кириллицы в UTF-8 нужно выбирать по 2 байта и для строки "АаБбВв" strlen выдаёт значение 12, а не 6.
Спойлер (Отобразить)
Удачи!


О_о! Спасибо! Для кирилици получается два байта.
(Добавление)
armancho7777777 пишет:
PHP:
скопировать код в буфер обмена
  1. $word = 'Привет';
  2. $len = mb_strlen($word, 'UTF-8');
  3.  
  4. for($i=0; $i < $len; $i++) {
  5.     echo mb_substr($word, $i, 1, 'UTF-8'), "\n";
  6. }
  7.  

А вообще, Вашу задачу можно решить одной строкой кода:
PHP:
скопировать код в буфер обмена
  1. $clear_string = preg_replace (["/[^а-яё\d ]/ui", "/ +/"], ["", " "], $word);


Я вот покурил мануалы и не совсем понимаю, вы написали регулярку которая делает так:
Оставь мне только русский символ, любого регистра в юникоде. и если найдёшь более одного пробела замени его на один. Но ведь ^ после [ это считается исключающем? Т.е. Не оставь мне русские буквы а наоборот. Почему получается так, что работает по первому сценарию?
5. Строитель - 18 Июля, 2018 - 11:25:47 - перейти к сообщению
Шаблон [^а-яё\d ] можно прочитать так:

Найдено совпадение, если текущий символ НЕ соответствует набору символов, перечисленному в символьном классе [...]

Т.е., поиск успешен, если текущий символ: НЕ кириллическая буква, НЕ цифра, НЕ пробел (хотя пробелы лучше обозначать с помощью символьного класса \s)
6. Doox911 - 18 Июля, 2018 - 11:57:42 - перейти к сообщению
Строитель пишет:
Шаблон [^а-яё\d ] можно прочитать так:

Найдено совпадение, если текущий символ НЕ соответствует набору символов, перечисленному в символьном классе [...]

Т.е., поиск успешен, если текущий символ: НЕ кириллическая буква, НЕ цифра, НЕ пробел (хотя пробелы лучше обозначать с помощью символьного класса \s)


Абсолютно согласен. Но как тогда остаются только кириллические символы?
7. Строитель - 18 Июля, 2018 - 15:24:04 - перейти к сообщению
Doox911 пишет:
Но как тогда остаются только кириллические символы?
Пример последней версии вашего кода, пожалуйста, опубликуйте.
8. armancho7777777 - 18 Июля, 2018 - 16:38:10 - перейти к сообщению
Doox911 пишет:
Но как тогда остаются только кириллические символы?
armancho7777777 пишет:
preg_replace

Удалит всё, что не входит в исключение.
CODE (text):
скопировать код в буфер обмена
  1. "/[^а-яё\d ]/ui" -> ""
9. Doox911 - 20 Июля, 2018 - 06:51:55 - перейти к сообщению
armancho7777777 пишет:
Doox911 пишет:
Но как тогда остаются только кириллические символы?
armancho7777777 пишет:
preg_replace

Удалит всё, что не входит в исключение.
CODE (text):
скопировать код в буфер обмена
  1. "/[^а-яё\d ]/ui" -> ""

Понял. Спасибо!

 

Powered by ExBB FM 1.0 RC1