Вопросы валидации и фильтрации стали возникать в другой теме:
http://forum.php.su/topic.php?fo...59003#1374059003
Чтобы не было каши в обсуждении, я и создал эту тему. Интересуют, особенно, эффективные способы фильтрации html при отсутствии bb-кодов разметки текста, когда вместо них применяются аналогичные html-коды форматирования текста в сообщениях пользователя. Целесообразность и способы применения белых и черных списков в целях фильтрации и безопасности.
Интересует применение известных фильтров: HTML Purifier, HTML Tidy, Simple HTML DOM Parser, htmLawed (особенно) и т.д.
В целях данной темы предлагаю под валидацией понимать проверку html-документа или текста в html-разметке на отсутствие ошибок (незакрытые теги, неверный синтаксис атрибутов и т.д.). В частности, применяется валидация текста и данных, вводимых пользователем сайта через форму ввода. А под фильтрацией - защиту от вредоносных кодов, включаемых хакерами в html-коды.
Два основных подхода. Применение bb-кодов разметки текста, вводимого пользователем через форму ввода. Применение html-кодов разметки текста в том же случае.
Применении bb-кодов существенно упрощает дальнейшую фильтрацию, но требует парсинга bb в html. Применение html-кодов разметки текста в том же случае не требует парсинга, но предполагает, как правило, дальнейшую мощную фильтрацию на сервере с применением перечисленных выше мощных фильтров - HTML Purifier, HTML Tidy и т.д. (Отредактировано автором: 17 Июля, 2013 - 16:17:22)
|