Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Почему в режиме $strict in_array не верную кодировку?

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Doox911
Отправлено: 17 Июля, 2018 - 08:50:15
Post Id



Частый гость


Покинул форум
Сообщений всего: 166
Дата рег-ции: Сент. 2011  


Помог: 0 раз(а)




Делаю вот такую проверку:
PHP:
скопировать код в буфер обмена
  1.  
  2.     public static function CheckRussianLanguage ( $string ) {
  3.         $alfavit = array (' ','А','а','Б','б','В','в','Г','г','Д','д','Е','е','Ё',
  4.                          'ё','Ж','ж','З','з','И','и','Й','й','К','к','Л','л','М','м',
  5.                          'Н','н','О','о','П','п','Р','р','С','с','Т','т','У','у','Ф',
  6.                          'ф','Х','х','Ц','ц','Ч','ч','Ш','ш','Щ','щ','Ъ','ъ','Ы','ы',
  7.                          'Ь','ь','Э','э','Ю','ю','Я','я','0','1','2','3','4','5','6','7','8','9');
  8.         $dlinna_str = strlen ( $string );
  9.         $clear_string = '';
  10.         for ( $count = 0; $count<$dlinna_str; $count++ ) {
  11.             var_dump($string[$count]);
  12.            
  13.             $check = in_array ( $string[$count], $alfavit, true );
  14.             if ( $check ) {
  15.                 $clear_string .= $string[$count];
  16.             }
  17.         }
  18.         $clear_string = preg_replace ( "/ {1,}/", " ", $clear_string );
  19.         return $clear_string;
  20.     }
  21.  


При не строгом режиме пропускает всё. В чём может быть причина?
Вывожу var_dump

string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(0) ""
 
 Top
Vladimir Kheifets
Отправлено: 17 Июля, 2018 - 12:00:58
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 879
Дата рег-ции: Март 2017  
Откуда: Германия, Бавария


Помог: 37 раз(а)




Doox911 пишет:
Делаю вот такую проверку:
PHP:
скопировать код в буфер обмена
  1.  
  2.     public static function CheckRussianLanguage ( $string ) {
  3.         $alfavit = array (' ','А','а','Б','б','В','в','Г','г','Д','д','Е','е','Ё',
  4.                          'ё','Ж','ж','З','з','И','и','Й','й','К','к','Л','л','М','м',
  5.                          'Н','н','О','о','П','п','Р','р','С','с','Т','т','У','у','Ф',
  6.                          'ф','Х','х','Ц','ц','Ч','ч','Ш','ш','Щ','щ','Ъ','ъ','Ы','ы',
  7.                          'Ь','ь','Э','э','Ю','ю','Я','я','0','1','2','3','4','5','6','7','8','9');
  8.         $dlinna_str = strlen ( $string );
  9.         $clear_string = '';
  10.         for ( $count = 0; $count<$dlinna_str; $count++ ) {
  11.             var_dump($string[$count]);
  12.            
  13.             $check = in_array ( $string[$count], $alfavit, true );
  14.             if ( $check ) {
  15.                 $clear_string .= $string[$count];
  16.             }
  17.         }
  18.         $clear_string = preg_replace ( "/ {1,}/", " ", $clear_string );
  19.         return $clear_string;
  20.     }
  21.  


При не строгом режиме пропускает всё. В чём может быть причина?
Вывожу var_dump

string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(1) "�"
string(0) ""

Добрый день!
Причина в том, Вы выбираете по одному байту, а для каждый символа кириллицы в UTF-8 нужно выбирать по 2 байта и для строки "АаБбВв" strlen выдаёт значение 12, а не 6.
Спойлер (Отобразить)
Удачи!

(Отредактировано автором: 17 Июля, 2018 - 12:01:49)

 
 Top
armancho7777777 Супермодератор
Отправлено: 17 Июля, 2018 - 14:58:31
Post Id



Активный участник


Покинул форум
Сообщений всего: 4526
Дата рег-ции: Февр. 2011  
Откуда: Москва


Помог: 221 раз(а)




PHP:
скопировать код в буфер обмена
  1. $word = 'Привет';
  2. $len = mb_strlen($word, 'UTF-8');
  3.  
  4. for($i=0; $i < $len; $i++) {
  5.     echo mb_substr($word, $i, 1, 'UTF-8'), "\n";
  6. }
  7.  

А вообще, Вашу задачу можно решить одной строкой кода:
PHP:
скопировать код в буфер обмена
  1. $clear_string = preg_replace (["/[^а-яё\d ]/ui", "/ +/"], ["", " "], $word);
 
 Top
Doox911
Отправлено: 18 Июля, 2018 - 07:16:39
Post Id



Частый гость


Покинул форум
Сообщений всего: 166
Дата рег-ции: Сент. 2011  


Помог: 0 раз(а)




Vladimir Kheifets пишет:

Причина в том, Вы выбираете по одному байту, а для каждый символа кириллицы в UTF-8 нужно выбирать по 2 байта и для строки "АаБбВв" strlen выдаёт значение 12, а не 6.
Спойлер (Отобразить)
Удачи!


О_о! Спасибо! Для кирилици получается два байта.
(Добавление)
armancho7777777 пишет:
PHP:
скопировать код в буфер обмена
  1. $word = 'Привет';
  2. $len = mb_strlen($word, 'UTF-8');
  3.  
  4. for($i=0; $i < $len; $i++) {
  5.     echo mb_substr($word, $i, 1, 'UTF-8'), "\n";
  6. }
  7.  

А вообще, Вашу задачу можно решить одной строкой кода:
PHP:
скопировать код в буфер обмена
  1. $clear_string = preg_replace (["/[^а-яё\d ]/ui", "/ +/"], ["", " "], $word);


Я вот покурил мануалы и не совсем понимаю, вы написали регулярку которая делает так:
Оставь мне только русский символ, любого регистра в юникоде. и если найдёшь более одного пробела замени его на один. Но ведь ^ после [ это считается исключающем? Т.е. Не оставь мне русские буквы а наоборот. Почему получается так, что работает по первому сценарию?
 
 Top
Строитель Модератор
Отправлено: 18 Июля, 2018 - 11:25:47
Post Id



Участник


Покинул форум
Сообщений всего: 1580
Дата рег-ции: Февр. 2014  
Откуда: Украина


Помог: 73 раз(а)




Шаблон [^а-яё\d ] можно прочитать так:

Найдено совпадение, если текущий символ НЕ соответствует набору символов, перечисленному в символьном классе [...]

Т.е., поиск успешен, если текущий символ: НЕ кириллическая буква, НЕ цифра, НЕ пробел (хотя пробелы лучше обозначать с помощью символьного класса \s)
 
 Top
Doox911
Отправлено: 18 Июля, 2018 - 11:57:42
Post Id



Частый гость


Покинул форум
Сообщений всего: 166
Дата рег-ции: Сент. 2011  


Помог: 0 раз(а)




Строитель пишет:
Шаблон [^а-яё\d ] можно прочитать так:

Найдено совпадение, если текущий символ НЕ соответствует набору символов, перечисленному в символьном классе [...]

Т.е., поиск успешен, если текущий символ: НЕ кириллическая буква, НЕ цифра, НЕ пробел (хотя пробелы лучше обозначать с помощью символьного класса \s)


Абсолютно согласен. Но как тогда остаются только кириллические символы?
 
 Top
Строитель Модератор
Отправлено: 18 Июля, 2018 - 15:24:04
Post Id



Участник


Покинул форум
Сообщений всего: 1580
Дата рег-ции: Февр. 2014  
Откуда: Украина


Помог: 73 раз(а)




Doox911 пишет:
Но как тогда остаются только кириллические символы?
Пример последней версии вашего кода, пожалуйста, опубликуйте.
 
 Top
armancho7777777 Супермодератор
Отправлено: 18 Июля, 2018 - 16:38:10
Post Id



Активный участник


Покинул форум
Сообщений всего: 4526
Дата рег-ции: Февр. 2011  
Откуда: Москва


Помог: 221 раз(а)




Doox911 пишет:
Но как тогда остаются только кириллические символы?
armancho7777777 пишет:
preg_replace

Удалит всё, что не входит в исключение.
CODE (text):
скопировать код в буфер обмена
  1. "/[^а-яё\d ]/ui" -> ""
 
 Top
Doox911
Отправлено: 20 Июля, 2018 - 06:51:55
Post Id



Частый гость


Покинул форум
Сообщений всего: 166
Дата рег-ции: Сент. 2011  


Помог: 0 раз(а)




armancho7777777 пишет:
Doox911 пишет:
Но как тогда остаются только кириллические символы?
armancho7777777 пишет:
preg_replace

Удалит всё, что не входит в исключение.
CODE (text):
скопировать код в буфер обмена
  1. "/[^а-яё\d ]/ui" -> ""

Понял. Спасибо!
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB