找回密码
 注册
广告投放 虚位以待【阿里云】2核2G云新老同享 99元/年,续费同价做网站就用糖果主机-sugarhosts.comJtti.com-新加坡服务器,美国服务器,香港服务器
查看: 1051|回复: 16

哪位会杰奇写采集规则?

[复制链接]
发表于 2007 年 12 月 17 日 09:28:29 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
有点事请教
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
 楼主| 发表于 2007 年 12 月 17 日 09:29:29 | 显示全部楼层
【腾讯云】2核2G云服务器新老同享 99元/年,续费同价
主要批量采集那

单篇采集到是没问题了
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 12 月 17 日 09:36:51 | 显示全部楼层
路过
帮你顶一下
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 12 月 17 日 09:38:46 | 显示全部楼层
我不会
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 12 月 17 日 10:59:42 | 显示全部楼层
发个规则啊 单本的也可以   我装的什么都采不了
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

 楼主| 发表于 2007 年 12 月 17 日 11:25:05 | 显示全部楼层
得把批量的那个搞定才可以啊
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 12 月 17 日 16:30:45 | 显示全部楼层
【腾讯云】2核2G云服务器新老同享 99元/年,续费同价
给你个参考的,是小说阅读网的
  1. <?php
  2. $jieqiCollect['sitename'] = '小说阅读网';
  3. $jieqiCollect['siteurl'] = 'http://www.readnovel.com';
  4. $jieqiCollect['subarticleid'] = '';
  5. $jieqiCollect['subchapterid'] = '';
  6. $jieqiCollect['proxy_host'] = '';
  7. $jieqiCollect['proxy_port'] = '';
  8. $jieqiCollect['autoclear'] = '0';
  9. $jieqiCollect['defaultfull'] = '0';
  10. $jieqiCollect['referer'] = '0';
  11. $jieqiCollect['pagecharset'] = 'auto';
  12. $jieqiCollect['urlarticle'] = 'http://www.readnovel.com/novel/<{articleid}>.html';
  13. $jieqiCollect['articletitle']['left'] = '<h1><a  href="/novel/$.html">';
  14. $jieqiCollect['articletitle']['right'] = '</a></h1>';
  15. $jieqiCollect['articletitle']['middle'] = '!!!!';
  16. $jieqiCollect['author']['left'] = '<ul><li>作者:<a href="/search.php?*">';
  17. $jieqiCollect['author']['right'] = '</a></li>';
  18. $jieqiCollect['author']['middle'] = '!!!!';
  19. $jieqiCollect['sort']['left'] = '<li>作品类型:';
  20. $jieqiCollect['sort']['right'] = '</li>';
  21. $jieqiCollect['sort']['middle'] = '!!!!';
  22. $jieqiCollect['keyword'] = '';
  23. $jieqiCollect['intro']['left'] = '书籍简介:</strong>';
  24. $jieqiCollect['intro']['right'] = '<div class="mulutu">';
  25. $jieqiCollect['intro']['middle'] = '****';
  26. $jieqiCollect['articleimage']['left'] = '<img src="';
  27. $jieqiCollect['articleimage']['right'] = '" width="85" height="120"/>';
  28. $jieqiCollect['articleimage']['middle'] = '!!!!';
  29. $jieqiCollect['filterimage'] = '';
  30. $jieqiCollect['indexlink'] = '';
  31. $jieqiCollect['fullarticle']['left'] = '<li>';
  32. $jieqiCollect['fullarticle']['right'] = ':已完成</li>';
  33. $jieqiCollect['fullarticle']['middle'] = '!!!!';
  34. $jieqiCollect['sortid']['青春校园'] = '9';
  35. $jieqiCollect['sortid']['玄幻小说'] = '1';
  36. $jieqiCollect['sortid']['现代文学'] = '9';
  37. $jieqiCollect['sortid']['武侠小说'] = '2';
  38. $jieqiCollect['sortid']['纪实文学'] = '11';
  39. $jieqiCollect['sortid']['短篇作品'] = '9';
  40. $jieqiCollect['sortid']['言情小说'] = '3';
  41. $jieqiCollect['sortid']['网游小说'] = '6';
  42. $jieqiCollect['sortid']['网络小说'] = '11';
  43. $jieqiCollect['sortid']['灵异推理'] = '8';
  44. $jieqiCollect['sortid']['外国文学'] = '11';
  45. $jieqiCollect['sortid']['现代诗歌'] = '9';
  46. $jieqiCollect['sortid']['小说连载'] = '11';
  47. $jieqiCollect['urlindex'] = 'http://www.readnovel.com/partlist/<{articleid}>/';
  48. $jieqiCollect['volume'] = '';
  49. $jieqiCollect['chapter']['left'] = '<li><a href="http://www.readnovel.com/novel/~.html">';
  50. $jieqiCollect['chapter']['right'] = '</a></li>';
  51. $jieqiCollect['chapter']['middle'] = '!!!!';
  52. $jieqiCollect['chapterid']['left'] = '<li><a href="http://www.readnovel.com/novel/';
  53. $jieqiCollect['chapterid']['right'] = '.html">~</a></li>';
  54. $jieqiCollect['chapterid']['middle'] = '!!!!';
  55. $jieqiCollect['urlchapter'] = 'http://www.readnovel.com/novel/<{chapterid}>.html';
  56. $jieqiCollect['content']['left'] = '<h1><a title="~">~</a></h1>';
  57. $jieqiCollect['content']['right'] = '<div style="text-indent:1.6pc; margin:10px 0">';
  58. $jieqiCollect['content']['middle'] = '****';
  59. $jieqiCollect['contentfilter'] = '</div>';
  60. $jieqiCollect['collectimage'] = '0';
  61. $jieqiCollect['listcollect'] = '';

  62. ?>
复制代码
批量采集这样写就可以了:
  1. 采集网站:小说阅读网
  2. 采集规则名称:青春校园
  3. 采集页面地址:http://www.readnovel.com/ch/10/<{pageid}>.html
  4. 文章序号采集规则:《<a href="/novel/$$$$.html"
  5. 下一页的页码采集规则:++
  6. 起始页页码:2
  7. 最多采集页数:
复制代码
不过如果你是批量采集出现array问题,那个应该是PHP版本问题
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

发表于 2007 年 12 月 17 日 16:31:31 | 显示全部楼层
网络延迟发重复了
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

 楼主| 发表于 2007 年 12 月 17 日 17:11:40 | 显示全部楼层
确实是  是批量采集出现array问题

  我一直以为我采集规则有问题列
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

 楼主| 发表于 2007 年 12 月 17 日 17:12:25 | 显示全部楼层
我传到空间里头试下看看
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|金光论坛

GMT+8, 2025 年 2 月 4 日 12:48 , Processed in 0.072715 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表