金光论坛 - JGLT.NET - JGWY.NET - JGWY.COM|国内外VPS资源推介|优质免费资源交流讨论

很明显 发表于 2007 年 11 月 13 日 17:18:28

怎么我采集东西出来这些内容？

HTTP/1.1 200 OK Date: Tue, 13 Nov 2007 09:04:45 GMT Server: Apache Connection: close Transfer-Encoding: chunked Content-Type: text/html; charset=utf-8 25d8

郁闷，单独做个页面进行采集，内容是采集回来了，就是页面头部出现上面这些个内容。
采集其他页面么得问题。
replace也去不掉:(

pengxing 发表于 2007 年 11 月 13 日 17:25:27

Header头而已...取<html></html>里边内容再分析就行了吧..

很明显 发表于 2007 年 11 月 13 日 17:31:46

问题是这个页面直接
以<table border="0" cellspacing="0" width="100%" cellpadding="0">开头(唯一)
以</table>结束
其中包含多个</table>
请问，我该怎么截取整个页面？并且不出现head头信息?

pengxing 发表于 2007 年 11 月 13 日 17:34:43

<table border="0" cellspacing="0" width="100%" cellpadding="0">*</table>不知道能不能得到整页面内容

很明显 发表于 2007 年 11 月 13 日 17:36:56

貌似不能，其中有多个</table>，只截取到第一个就结束了，后面的没有得到

pengxing 发表于 2007 年 11 月 13 日 17:46:56

不会吧 * 应该匹配所有啊..贪婪模式

*?是匹配尽量少非贪婪模式

我试试的说

pengxing 发表于 2007 年 11 月 13 日 18:02:20

chungwoo 发表于 2007 年 11 月 13 日 18:09:14

丰富(人)民的业余生活

很明显 发表于 2007 年 11 月 13 日 18:51:40

又试验成功了，原来是公司的DNS缓存有问题

vbvs 发表于 2007 年 11 月 13 日 22:10:46

原帖由 275382 于 2007-11-13 18:51 发表 http://www.jgwy.net/bbs/images/common/back.gif
又试验成功了，原来是公司的DNS缓存有问题
很明显
你在折腾人:$

页: [1]

金光网's Archiver

怎么我采集东西出来这些内容？