Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757
Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737 Форумы портала PHP.SU :: буква "Ё" и проблемы с ней
Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010
Помог: 53 раз(а)
недавно вылезшая проблема
регулярка "[А-Яа-я]*" не найдет правильно русские слова в который присутствует буква Ё
приходится менять на "[А-Яа-яЁё]*"
ну и вообще есть более разумный вариант чем модифицировать код подобными вставками?
grefon
Отправлено: 17 Декабря, 2010 - 15:39:28
Частый посетитель
Покинул форум
Сообщений всего: 823
Дата рег-ции: Нояб. 2010
Помог: 32 раз(а)
На сколько я помню нет! И кажется это еще касается большой Й, хотя могу ошибаться.
У меня такие заморочки возникали в utf файлах. Может win1251 к этим буквам более лояльно относится.
----- ____________________________________________________________________
Ну как то так, наверное. http://grefon[dot]com
EuGen
Отправлено: 17 Декабря, 2010 - 16:12:41
Профессионал
Покинул форум
Сообщений всего: 9095
Дата рег-ции: Июнь 2007 Откуда: Berlin
Помог: 707 раз(а)
[\xC0-\xFF]*
----- Есть в мире две бесконечные вещи - это Вселенная и человеческая глупость. Но насчет первой .. я не уверен.
DlTA
Отправлено: 17 Декабря, 2010 - 17:24:34
Постоянный участник
Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010
Помог: 53 раз(а)
EuGen пишет:
[\xC0-\xFF]*
это для всех кодировок?
Champion
Отправлено: 17 Декабря, 2010 - 19:00:09
Активный участник
Покинул форум
Сообщений всего: 4350
Дата рег-ции: Авг. 2008 Откуда: Москва
Помог: 57 раз(а)
Нет, не для всех. Буква ё на самом деле не входит в интервал а-я, надо писать [а-яё].
В utf еще хитрее: там большие буквы кириллицы (или маленькие) на 2 отдельных интервала делятся.
JustUserR
Отправлено: 17 Декабря, 2010 - 20:45:30
Активный участник
Покинул форум
Сообщений всего: 8715
Дата рег-ции: Июнь 2009
Помог: 17 раз(а)
EuGen пишет:
[\xC0-\xFF]*
В действительности использование ASCII-представлений сммволов вхождений для огранизации щаблонов регулярных выражений может осуществлять как положительные так и отрицательные эффекты - с одной стороны указаныый способ обесечивает независимостить внутреннего представления ннформационного поля компонента от кодовой таблицы в которой произведено сохранение PHP-приложения - однако с другой стороны такой подход не позвоялет использовать систему автоматической конверсии представления строковых информационных полей в зависимости от выбранных региональных параметров
----- Сделать можно все что угодно - нужно только старание, терпение и хороший поисковик
Безлимитный web-хостинг от 15 рублей за 40 МБ дискового пространства - http://ihost[dot]oks71[dot]ru/
Все гости форума могут просматривать этот раздел. Только зарегистрированные пользователи могут создавать новые темы в этом разделе. Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.