欢迎访问 水平网    今天是:2017年11月22日 注册 | 登录 | 订阅 | 收藏
>> PHP >> 移除Remove Microsoft Word HTML Tag
推荐代码
热点代码

移除Remove Microsoft Word HTML Tag

作者:未知,  来源:网络,  阅读:1348,  发布时间:2014-06-29  【放入收藏夹
当你使用Microsoft Word会创建许多Tag,比如font,span,style,class等。这些标签对于Word本身而言是非常有用的,但是当你从Word粘贴至网页时,你会发现很多无用的Tag。因此,下面的这段代码可帮助你删除所有无用的Word HTML Tag。
代码:PHP复制
function cleanHTML($html) {
    /// <summary>
    /// Removes all FONT and SPAN tags, and all Class and Style attributes.
    /// Designed to get rid of non-standard Microsoft Word HTML tags.
    /// </summary>
    // start by completely removing all unwanted tags
    $html = ereg_replace("<(/)?(font|span|del|ins)[^>]*>", "", $html);

    // then run another pass over the html (twice), removing unwanted attributes
    $html = ereg_replace("<([^>]*)(class|lang|style|size|face)=(" [ ^ "]*" | '[^'] * '|[^>]+)([^>]*)>","<\1>",$html);
$html = ereg_replace("<([^>]*)(class|lang|style|size|face)=("[^"]*"|' [ ^ ']*' | [ ^ >] + )([ ^ >] * ) > "," < \1 > ",$html);

return $html
}
Tags:MicrosoftWord
您可能还有兴趣查阅的内容
  • 没有相关内容
评论【共有0条评论】查看所有评论
昵称:(*)   邮箱:   QQ:   验证码: 看不清楚?点击刷新验证码