DedeCMS常用的采集过滤规则包括:去除HTML标签、过滤JavaScript代码、删除特殊字符等。
DEDECMS常用的采集过滤规则
在DEDECMS(织梦内容管理系统)中,采集功能是非常强大的工具,但为了确保采集的内容符合网站需求并减少垃圾信息,通常需要使用过滤规则,以下是一些常用的DEDECMS采集过滤规则:
过滤规则代码 | |
span标签 | {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} |
div标签 | {dede:trim}{/dede:trim} {dede:trim} {/dede:trim} |
li标签 | {dede:trim} {/dede:trim} {dede:trim} {/dede:trim} |
ul标签 | {dede:trim}
{/dede:trim} |
font标签 | {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} |
table标签 | {dede:trim} {/dede:trim} |
tbody标签 | {dede:trim}{/dede:trim} {dede:trim} {/dede:trim} |
tr标签 | {dede:trim} |
{/dede:trim}
td标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim}
a标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} iframe标签 {dede:trim}{/dede:trim} style标签 {dede:trim} script标签 {dede:trim}{/dede:trim} option标签 {dede:trim}{/dede:trim} select标签 {dede:trim}{/dede:trim} object标签 {dede:trim}{/dede:trim} embed标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} param标签 {dede:trim}{/dede:trim}相关问答FAQs
Q1: 如何保留链接中的文本部分?
A1: 如果你希望保留链接中的文本部分,可以使用以下正则表达式来匹配和保留:
{dede:trim}([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim}
这种写法会将链接的文本部分提取出来,而去除链接的其他属性。
Q2: 如何过滤掉JavaScript广告调用?
A2: 你可以使用以下过滤规则来去除JavaScript广告调用:
{dede:trim}<script(.*)>(.*)</script>{/dede:trim}
这个规则会匹配并移除所有的<script>
标签及其内容,从而避免广告代码被采集到你的页面中。