怎么我采集东西出来这些内容?
HTTP/1.1 200 OK Date: Tue, 13 Nov 2007 09:04:45 GMT Server: Apache Connection: close Transfer-Encoding: chunked Content-Type: text/html; charset=utf-8 25d8郁闷,单独做个页面进行采集,内容是采集回来了,就是页面头部出现上面这些个内容。
采集其他页面么得问题。
replace也去不掉:( Header头而已...取<html></html>里边内容再分析就行了吧.. 问题是这个页面直接
以<table border="0" cellspacing="0" width="100%" cellpadding="0">开头(唯一)
以</table>结束
其中包含多个</table>
请问,我该怎么截取整个页面?并且不出现head头信息? <table border="0" cellspacing="0" width="100%" cellpadding="0">*</table>不知道能不能得到整页面内容 貌似不能,其中有多个</table>,只截取到第一个就结束了,后面的没有得到 不会吧 * 应该匹配所有啊..贪婪模式
*?是匹配尽量少 非贪婪模式
我试试的说 <script>
function test() {
var re = new RegExp("<table>.*</table>");
str = "<table>uiuouo</table><table>werwerewerwr</table>";
alert(re.exec(str));
}
test();
</script><script>
function test_email() {
var re = new RegExp("<table>.*?</table>");
str = "<table>uiuouo</table><table>werwerewerwr</table>";
alert(re.exec(str));
}
test_email();
</script>两个对比下..一个贪婪一个非贪婪
我这正常啊
[ 本帖最后由 pengxing 于 2007-11-13 18:03 编辑 ] 丰富(人)民的业余生活 又试验成功了,原来是公司的DNS缓存有问题 原帖由 275382 于 2007-11-13 18:51 发表 http://www.jgwy.net/bbs/images/common/back.gif
又试验成功了,原来是公司的DNS缓存有问题
很明显
你在折腾人:$
页:
[1]