Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Проверьте пожалуйста регулярку для URL-ов

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Rinker
Отправлено: 05 Декабря, 2018 - 16:01:43
Post Id


Новичок


Покинул форум
Сообщений всего: 5
Дата рег-ции: Сент. 2018  


Помог: 0 раз(а)




Проверьте пожалуйста регулярку. Будет использоваться для обработки всех URL-ов, по которым обращаются к сайту, чтобы исключить любые SQL инъекции.

Регулярка
$str = preg_replace('/[^a-zа-яA-ZА-ЯёЁ0-9\s"\/?&_=-]/u', '', $str);

Список допустимых символов:
a-zа-яA-ZА-ЯёЁ - все буквы
0-9 - все числа
\s - пробел
" - двойные кавычки
\/ - слэш
? для параметров в адресе
& для параметров в адресе
= для параметров в адресе
_ нижнее подчеркивание
- тире
Все остальные символы исключены.

Правильно ли составлена регулярка?
Тире правильно прописано? (если его поставить не последним, то работает не корректно).
Может что-то изменить/добавить?
Есть альтернативные варианты полного экранирования ссылок на сайте?
Я конечно же проверил, но действительно ли ссылки, имеющие кириллические слова будут корректно обрабатываться данной регуляркой(для этого указан флаг /u)?

Улучшил регулярку:
$str = preg_replace('#[^a-zа-яё0-9\s"\/\?&_=-]#ui', '', $str);

(Отредактировано автором: 05 Декабря, 2018 - 18:01:31)

 
 Top
Строитель Модератор
Отправлено: 05 Декабря, 2018 - 18:35:51
Post Id



Участник


Покинул форум
Сообщений всего: 1580
Дата рег-ции: Февр. 2014  
Откуда: Украина


Помог: 73 раз(а)




Rinker, надо использовать подготовленные запросы, чтобы не было инъекций, а не велосипедить на регулярках.
 
 Top
Rinker
Отправлено: 05 Декабря, 2018 - 18:58:52
Post Id


Новичок


Покинул форум
Сообщений всего: 5
Дата рег-ции: Сент. 2018  


Помог: 0 раз(а)




Строитель пишет:
Rinker, надо использовать подготовленные запросы, чтобы не было инъекций, а не велосипедить на регулярках.

Согласен, но в запросы попадают данные из URL, например сортировка, номер страницы, которые нужно обезопасить, так почему бы не экранировать сразу весь URL, а потом уже разбить на составные части и использовать в запросах...
 
 Top
Строитель Модератор
Отправлено: 05 Декабря, 2018 - 22:00:19
Post Id



Участник


Покинул форум
Сообщений всего: 1580
Дата рег-ции: Февр. 2014  
Откуда: Украина


Помог: 73 раз(а)




Rinker, вы действительно думаете, что в PDO забыли предусмотреть безопасную передачу данных из пост, гет, и т.п. источников? Улыбка Я уверен, что вы просто не внимательно читали мануал.

На счёт регулярных выражений - их тут использовать конечно можно. Только зачем? Ради использования регулярных выражений? )
 
 Top
Мелкий Супермодератор
Отправлено: 06 Декабря, 2018 - 10:31:21
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Rinker пишет:
например сортировка, номер страницы, которые нужно обезопасить

Зачем?

Не шутка. Зачем?
Вы должны корректно использовать значения, а не мифически обезопасить.

Сортировка? Так вы заранее знаете, по чему сортировать можно и в каких направлениях. Вот и проверяйте по белому списку.
Номер страницы? Даже если строить пагинацию отталкиваясь от неверного способа смещения через offset - почему об этом должен беспокоиться роутер? У вас заведомо будет отдельный код, высчитывающий нужные значения окна данных для страницы, где куда уместнее проверка, что номер страницы должен быть числом больше нуля.

https://ru[dot]stackoverflow[dot]com/a/571274/203622
https://ru[dot]stackoverflow[dot]com/q/637185/203622


-----
PostgreSQL DBA
 
 Top
Rinker
Отправлено: 08 Декабря, 2018 - 09:57:07
Post Id


Новичок


Покинул форум
Сообщений всего: 5
Дата рег-ции: Сент. 2018  


Помог: 0 раз(а)




Цитата:
Сортировка? Так вы заранее знаете, по чему сортировать можно и в каких направлениях. Вот и проверяйте по белому списку.

Хорошо, с сортировкой и другими передаваемыми параметрами понятно, перед SQL запросом можно сравнить их с белым списком, спасибо за совет.
А как быть например с поисковым запросом, который также передается в адресе и в нем может быть все что угодно, поэтому и нужно проверить URL или поисковый запрос на наличие плохих символов регуляркой.

Возник немного другой вопрос: регулярка '#[^a-zа-яё0-9\s"\/\?&_=-]#ui' вырезает плохие символы, если они переданы в обычном виде, например "abcd * & = -", но что если символы передадут в виде кодов DEC, OCT, HEX, HTML, например "& # 37 ; & # 39 ; & # 43 ;"(без пробелов), регулярка не вырежет плохие символы?
 
 Top
Мелкий Супермодератор
Отправлено: 08 Декабря, 2018 - 11:45:39
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Rinker пишет:
с поисковым запросом, который также передается в адресе и в нем может быть все что угодно

согласен

Rinker пишет:
поэтому и нужно проверить URL или поисковый запрос на наличие плохих символов регуляркой

Есть у людей интересная особенность: быть уверенными в том что видят причинно-следственную связь там её нет и никогда не было.
Почему вы считаете что эта часть цитаты каким-либо образом связана с предыдущим высказыванием?
И тем паче, при чём тут регулярка?

Не существует мифических плохих символов. Существует безалаберный разработчик, не обеспечивший корректный транспорт или представление полученного значения.
Ещё раз предлагаю прочитать ответы на ruSO, на которые я дал ссылки.


-----
PostgreSQL DBA
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Регулярные выражения »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB