落尘 发表于 2007 年 7 月 18 日 11:50:09

你用的什么采集器?

龙韵文化 发表于 2007 年 7 月 18 日 11:52:07

原帖由 落尘 于 2007-7-18 11:50 发表 http://jgwy.net/bbs/images/common/back.gif
你用的什么采集器?
终点文学系统自带的

落尘 发表于 2007 年 7 月 18 日 11:52:23

还有一个不是办法的办法``
把字过滤掉``
言情
书库
文学...
把所有的标签词都设置过滤
他站总不能很多很多标签吧
只是不晓的这样会不会影响到文章

龙韵文化 发表于 2007 年 7 月 18 日 11:57:04

原帖由 落尘 于 2007-7-18 11:52 发表 http://jgwy.net/bbs/images/common/back.gif
还有一个不是办法的办法``
把字过滤掉``
言情
书库
文学...
把所有的标签词都设置过滤
他站总不能很多很多标签吧
只是不晓的这样会不会影响到文章
这个系统自带简单过滤和高级过滤
各可以设置三个,所以过滤字这个最多只能过滤掉3条,而高级过滤是针对源文件内容过滤,可是我设置的规则为:
原文内容开始标记:<div style='display:none'>
原文内容结束标记:</div>
把其中包含的内容替换为空,结果根本过滤不掉

龙韵文化 发表于 2007 年 7 月 18 日 12:02:06

大家帮忙研究一下,小弟真的是没办法了

落尘 发表于 2007 年 7 月 18 日 12:03:20

建议用火车采集试下~!

龙韵文化 发表于 2007 年 7 月 18 日 12:04:47

原帖由 落尘 于 2007-7-18 12:03 发表 http://jgwy.net/bbs/images/common/back.gif
建议用火车采集试下~!
可是火车采回来后不方便发上去呀!而且偶不是固定地方上网,所以用火车很不方便

伤心♂oO○ 发表于 2007 年 7 月 18 日 12:12:56

嘿嘿,这个就没办法啦,终点我用过,我知道的,他不支持正则表达式
而高级过滤也的确过滤不了,建议使用 读吧 3.1 (不推荐用3.3)
用读吧3.1的话,只要 rd8_/<div style='display:none'>.*<\/div>/isU 就可以了
你甚至可以使用 rd8_/<div style='display:none'>.*<\/div>/isU#rd8#<div style='display:none'>衰锅小说收藏网 http://localhost</div>   这样的方式来替换为你自己的AD

monkey5882 发表于 2007 年 7 月 18 日 12:13:43

回复 #18 伤心♂oO○ 的帖子

MM你真行。。。。:kiss: :kiss:

龙韵文化 发表于 2007 年 7 月 20 日 09:54:08

在偶的呼唤下,系统作者已经出补丁包了
页: 1 [2]
查看完整版本: 会采集的进来,懂规则设计的也来