找回密码
 注册
广告投放 虚位以待【阿里云】2核2G云新老同享 99元/年,续费同价做网站就用糖果主机-sugarhosts.comJtti.com-新加坡服务器,美国服务器,香港服务器
查看: 261|回复: 9

怎么我采集东西出来这些内容?

[复制链接]
发表于 2007 年 11 月 13 日 17:18:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
HTTP/1.1 200 OK Date: Tue, 13 Nov 2007 09:04:45 GMT Server: Apache Connection: close Transfer-Encoding: chunked Content-Type: text/html; charset=utf-8 25d8

郁闷,单独做个页面进行采集,内容是采集回来了,就是页面头部出现上面这些个内容。
采集其他页面么得问题。
replace也去不掉
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
发表于 2007 年 11 月 13 日 17:25:27 | 显示全部楼层
【腾讯云】2核2G云服务器新老同享 99元/年,续费同价
Header头而已...取<html></html>里边内容再分析就行了吧..
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

 楼主| 发表于 2007 年 11 月 13 日 17:31:46 | 显示全部楼层
问题是这个页面直接
以<table border="0" cellspacing="0" width="100%" cellpadding="0">开头(唯一)
以</table>结束
其中包含多个</table>
请问,我该怎么截取整个页面?并且不出现head头信息?
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 11 月 13 日 17:34:43 | 显示全部楼层
<table border="0" cellspacing="0" width="100%" cellpadding="0">*</table>不知道能不能得到整页面内容
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

 楼主| 发表于 2007 年 11 月 13 日 17:36:56 | 显示全部楼层
貌似不能,其中有多个</table>,只截取到第一个就结束了,后面的没有得到
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 11 月 13 日 17:46:56 | 显示全部楼层
不会吧 * 应该匹配所有啊..贪婪模式

*?是匹配尽量少 非贪婪模式

我试试的说
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 11 月 13 日 18:02:20 | 显示全部楼层
【腾讯云】2核2G云服务器新老同享 99元/年,续费同价
  1. <script>
  2. function test() {
  3.   var re = new RegExp("<table>.*</table>");
  4.   str = "<table>uiuouo</table><table>werwerewerwr</table>";
  5.   alert(re.exec(str));
  6. }
  7. test();
  8. </script>
复制代码
  1. <script>
  2. function test_email() {
  3.   var re = new RegExp("<table>.*?</table>");
  4.   str = "<table>uiuouo</table><table>werwerewerwr</table>";
  5.   alert(re.exec(str));
  6. }
  7. test_email();
  8. </script>
复制代码
两个对比下..一个贪婪一个非贪婪
我这正常啊

[ 本帖最后由 pengxing 于 2007-11-13 18:03 编辑 ]
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 11 月 13 日 18:09:14 | 显示全部楼层
丰富(人)民的业余生活
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

 楼主| 发表于 2007 年 11 月 13 日 18:51:40 | 显示全部楼层
又试验成功了,原来是公司的DNS缓存有问题
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 11 月 13 日 22:10:46 | 显示全部楼层
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|金光论坛

GMT+8, 2025 年 2 月 4 日 19:03 , Processed in 0.032049 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表