|
这篇文章主要介绍了PHP正则删除HTML代码中宽高样式的方法,涉及php针对HTML代码的正则匹配、替换等操作技巧,需要的朋友可以参考下 本文实例讲述了PHP正则删除HTML代码中宽高样式的方法。分享给大家供大家参考,具体如下: 因工作需要,需要采集html,并把html内容保存到数据库中。为了避免影响使用,宽高样式需要删除。例如图片和p中的width, height等。 不过采集到的html中,样式的写法各有不同,例如大小写,中间有空格等。 因此使用php正则编写了下面这个方法,对这些奇葩的样式进行过滤。 代码如下:
<?php
/**
* 清除宽高样式
* @param String $content 内容
* @return String
*/
function clear_wh($content){
$config = array('width', 'height');
foreach($config as $v){
$content = preg_replace('/'.$v.'s*=s*d+s*/i', '', $content);
$content = preg_replace('/'.$v.'s*=s*.+?["']/i', '', $content);
$content = preg_replace('/'.$v.'s*:s*d+s*pxs*;?/i', '', $content);
}
return $content;
}
?>演示:
<?php
$html = <<<HTML
<p style="text-align:center" width="500" height="300">
<p style="Width : 100px ; Height: 100 px;">
<img src="/images/test.jpg" width=400 height = 200>
<p style="float:left; width: 100px; height : 200 px;"></p>
</p>
<p style="width : 100 px ;height: 100px">
<img src="/images/test.jpg" width=400 height = 200>
</p>
</p>
HTML;
echo '<xmp>';
echo '原内容:'.PHP_EOL;
echo $html.PHP_EOL.PHP_EOL;
echo '过滤后内容:'.PHP_EOL;
echo clear_wh($html);
echo '</xmp>';
?>输出:
原内容:
<p style="text-align:center" width="500" height="300">
<p style="Width : 100px ; Height: 100 px;">
<img src="/images/test.jpg" width=400 height = 200>
<p style="float:left; width: 100px; height : 200 px;"></p>
</p>
<p style="width : 100 px ;height: 100px">
<img src="/images/test.jpg" width=400 height = 200>
</p>
</p>
过滤后内容:
<p style="text-align:center" >
<p style=" ">
<img src="/images/test.jpg" >
<p style="float:left; "></p>
</p>
<p style="">
<img src="/images/test.jpg" >
</p>
</p> |