一般我们采集规则写好后,比较郁闷的就是内容里的链接了,因为我不想看到内容里有别人网站的链接,当然更不用说广告了。这里需要说明的是,下面的方式只可以替换掉一些规则或者相对规则的链接和广告,只要那些比较变态的网站在内容里加很多随机文字的,那就没办法了。
过滤广告最简单的方式是在“过滤广告正则”的输入框里输入相应的正则,4.7以前的没有带,4.7以后的系统带的有,下面是个比较全些的广告过滤正则:
,,,,
基本上已经够了。
如果过滤内容里的链接呢?这里可以在 过滤选项 的 替换:(针对标题与内容) 里输入正则,多个用逗号分开,但是不要在这里写,,,,这样的正则,因为这样你会采不到页面,呵呵,它把你采集的页面都给过滤了。
DEDE会员注册开启邮箱验证通知正确完整的修改方法
DedeCMS让channelartlist支持currentstyle属性
织梦删除Power by DedeCms版权链接
织梦dedecms自定义表单提交成功提示信息和跳转的修改
DedeCMS文章列表每5隔行加横线的实现方法
dedecms站内搜索和tag标签不支持大写字母的解决办法
DEDE5.7列表页模板中调用TAG标签的方法
在个人模板中的调用会员信息的方法