Говнокодеры изобрели защиту контента от парсинга - надо просто писать невалидную разметку!
Ладно, по делу - Тут придется валидировать ручками.
Не знаю, но первая мысль - собрать регуляркой в массив все валидные теги, остальные - для начала откинуть сразу.
В последующих версиях парсера, если это критично, пытаться исправить и включать в валидный результат.
|