> как работает хак "красивый контент"?
комплексное преобразование "красивый контент" заключается в последовательном использовании нескольких хаков:
1 - удалить стили и стилевые атрибуты
2 - удалить плавающие фреймы (в контенте обычно никогда не нужны, а вот вреда могут принести, например всем известен троян даунлоадер)
3 - удаление скриптов и событий
4 - хак, который оставляет только разрешённые теги:
'h1', 'h2', 'h3', 'h4', 'h5', 'h6', 'h7', 'b', 'i', 'u', 'strong', 'a', 'strike',
'p', 'table', 'tr', 'td', 'th', 'ul', 'ol', 'li', 'object', 'iframe', 'style', 'script', 'img',
'param', 'hr', 'br', 'nobr', 'multicol', 'noenmed', 'noframes', 'nolayer', 'noscript', 'pre',
'q', 'rt', 'ruby', 's', 'samp', 'small', 'sub', 'sup', 'textarea', 'tt', 'var', 'wbr', 'xmp', 'div'
5 - хак, который исправляет незакрытые теги
6 - хак, который удаляет пустые теги
7 -
типограф (требует PHP5 и выше!)8 - хак, который удаляет лишние переводы строк вначале и в конце контента
9 - хак, который удаляет лишние пробелы