Форумы портала PHP.SU :: Версия для печати :: Регулярки и разные шрифты

1. rafaello9 - 25 Ноября, 2015 - 13:42:01 - перейти к сообщению

Необходимо произвести проверку текста письма на спам слова. Для этого используется:

    foreach ($category as $rule){
    if (preg_match($rule[0], $content)){
    //сделай то-то....
    }
    }

Вот кусок кода, где собраны спам-слова:

PHP:
скопировать код в буфер обмена

    $category = array (
    .....
    array('%\bЗаказ\b%ui','Содержит слово \'Заказ\'','0.9'),
    array('%\bзаколоть\b%ui','Содержит слово \'заколоть\'','1.1'),
    array('%\bзалупа\b%ui','Содержит слово \'залупа\'','0.6'),
    array('%\bзасирать\b%ui','Содержит слово \'засирать\'','0.7'),
    .......);

Получается интересная ситуация. Если я сам лично ввожу со своего компьютера и текст письма и ввожу данные в переменную $category, то все отрабатывает на ура. Но если другой пользователь, используя этот скрипт через интернет, через свой компьютер вводит текст письма, то проверка происходит через раз, какие то слова проверяются, а какие то просто игнорируются....
Получается, что здесь замешан тот факт, что шрифты у разных компьютеров разные, и поэтому во втором случае выходят осечки при проверке.
Как можно избежать этого момента? Неужели дело в шрифтах?
Есть какой то способ при сохранении текста письма приводить его к единому виду?
Спасибо.

При проверке журнала ошибок нашел вот это:

CODE (htmlphp):
скопировать код в буфер обмена

preg_match(): Compilation failed: invalid UTF-8 string at offset 2