龙韵文化 发表于 2007 年 7 月 18 日 11:39:55

会采集的进来,懂规则设计的也来

http://www.86zw.com/Html/Book/18/5633/588257.shtm
大家看看怎么才能够把里面内容里的<div style='display:none'> </div>
标签内容去处掉?我用终点文学系统高级过滤,结果过滤不掉

落尘 发表于 2007 年 7 月 18 日 11:42:59

<div style='display:none'>*</div>

坏脾气 发表于 2007 年 7 月 18 日 11:43:03

关注此帖~~~~

10y 发表于 2007 年 7 月 18 日 11:43:44

原帖由 落尘 于 2007-7-18 11:42 发表 http://bbs.jgfree.net/images/common/back.gif
*
那直接就没内容了!

10y 发表于 2007 年 7 月 18 日 11:45:31

把这些字符全部分开屏蔽掉!

pengxing 发表于 2007 年 7 月 18 日 11:46:39

<div style='display:none'>.*?</div>试试

落尘 发表于 2007 年 7 月 18 日 11:47:21

貌似都是
<div style='display:none'> 言情 书库 文学 文学 文学</div>

直接过滤这段不就得了``

龙韵文化 发表于 2007 年 7 月 18 日 11:47:37

2楼办法偶已经测试了,一样没用
5楼所说的没法实现,因为里面的宣传字符是随机的

龙韵文化 发表于 2007 年 7 月 18 日 11:48:18

原帖由 落尘 于 2007-7-18 11:47 发表 http://jgwy.net/bbs/images/common/back.gif
貌似都是
言情 书库 文学 文学 文学

直接过滤这段不就得了``
你换一篇文章看看,字符会随文章内容变的

龙韵文化 发表于 2007 年 7 月 18 日 11:48:47

真的很难搞定呀
页: [1] 2
查看完整版本: 会采集的进来,懂规则设计的也来