WIXOO

Digest

kingcms的采集与一般的不太一样,大家习惯就会发现在kc的采集效率更高更强大

作者:中国素材网 发布时间 10/02/20 来源 中国素材网

kingcms的采集与一般的不太一样,大家习惯就会发现在kc的采集效率更高更强大

一.添加项目

1.指定开始URL,一般指定列表页或网站首页都可以
2.自动收集URL,一般都要钩选(你会发现在kc的采集有点像搜索引擎的爬虫,自动把链接收集起来)
3.包含URL,防止收集URL时跑到预定目标以外
4.过滤,有些不需要采的可以在这里设置过滤,一行一个网址

二.采集规则

内容截取部分就不说了,开始标签,结束标签,每个采集程序都要设置的
提示一点,支持正则表达式,理论上没有什么采不了的

主要给大家说说"包含内容"

包含内容是判定是否符合规则的指标也是文章分类的指标

例如:1.我只要采采集http://www.xxx.com/xxx目录下的文章,里面的文章都包含指定标记的才是我需要的,这时候把那个特别的地方写到包含里就可以了

2.我要整站采集,把文章分到不同的栏目里,假设该站文章模板相同(即标题与内容标签不用更改)

这时我们只能靠"包含内容"来判断这个文章属于哪一分类
包含内容一般根据网站的导航就可以设置,因为导航标志了这个文章的归属嘛

首页>>文章>>图片
首页>>文章>>文字

采集的时候只要写两个规则,包含内容分别写成
文章>>图片
文字>>图片

就可以把文章归到两个不同的类目里了(当然不同规则需要指定不同的导入栏目)

其他的不多说了,免得太多人使用祸乱"江湖"就不好了...


如果不明白就算了,自己慢慢想,不再做任何解释,具体操作可以参照kingcms论坛里的录像