当前位置:首页 > ZBLOG > 正文

zblog对接火车头采集(zblog火车头发布模块)

今天给各位分享zblog对接火车头采集的知识,其中也会对zblog火车头发布模块进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

谁有火车头发布接口zblog1.4php版本

字段说明:(标有*的为必填字段,绿色值为默认值)

*log_CateID:文章的分类ID

*log_Title:文章标题

*log_Content:文章内容

log_Tag:文章标签ID,格式为{标签ID},多个为{1}{2}{3}

log_Status:文章的状态,0为正常发布,1为草稿,2为审核

log_Type:文章的类别,0为文章,1为页面

log_IsTop:文章是否置顶,0是不置顶,1是置顶

log_Intro:文章摘要,默认是50字符

log_PostTime:文章发布时间,为UNIX时间戳,默认当前时间

log_ViewNums:文章浏览数,默认为0次

发表地址后缀:zb_users/plugin/QeeZer_Locoy/LocoyPost.php?locoy_key=火车头自动发布密令

火车头采集器(V8.6为例)设置部分:

主要就是发布地址、post字段设置等,

火车头如何自动采集

说下我做采集的方式哈,我这边主要有两种方式,第一个,常规站点,内容很全,那就先找一个采集源,然后爬取整站数据,注意,这种方式,如果源站小说比较多的话,会非常耗时,按火车头十个进程来计算的话,一个进程可以开十个线程,也就是一个火车头最多可以跑100个线程,平均采集一章大概时间为1秒(加上列表采集所耗时间进行平均),10万本书的站,大概5000万加的章节,数据采集完毕大概需要一周时间,这是在你服务器配置比较好的情况下。然后就是发布,发布不能多线程,那么时间就得翻倍,也就是差不多两个多月时间吧。这也是为什么有人说火车采集小说比较慢的原因了。原始内容采集完了,然后每天就采集更新了,方式如第二点。

那么第二个,就是直接采集每日更新,以前的旧书就不采集了。这样的话,速度会比较快。当时就能用。火车头设置好定时任务,自动触发。

这是火车头采集小说网站的传统方式。

我研究火车头采集一个月,找到一个比较合适的快速采集方式,经多方位,多客户测试,采集10万本书,发布完毕,大概就是两天的时间。

具体时间跟服务器配置有一定的关系,比如,硬盘读写速度快慢、网络带宽(火车头放在服务器上的可以忽略)等,测试2H4G美国服务器,10万本大概两天加几个小时,采集需要花几个小时,发布大概接近两天时间。然后每日定时更新即可。

可百度搜索“九七阅读”查看站点,有书库频道,时间一看就知道了。

新手使用火车头发布接口如何采集文章教程

前沿:

如果你对火车头一点都不知道,你还是去网上自学一点火车头采集的知识,我也不是什么大师,硬着头皮写的,至少能用,在这里我不会教你如何写采集规则,因为写法种类太多,你问我我也不知道,火车头相关文件夹里提供的发布接口内置了马甲发布文章,并且支持远程图片抓取本地化,和发布文章时间设置(10-70分钟随机)。用户只需关注火车头标题和内容即可,参数值标题(title),内容(content)。

第一步:站点设置里设置下火车头免登录发布接口的全局变量值:

第二步:将发布接口上传覆盖程序根目录:

第三步:登录火车头软件后导入发布模块"

下图更多处下拉--选择导入:

导入后:

上图中,数字1处填写你在网站后台设置的全局变量值。

2 处选择 utf-8 编码。

3 处填写你网站域名,不要带 反斜杠'/'.

4处选择不需要登录

5 处点击获取列表--选择你需要入库的分类

6 随便给当前这个发布模块写个名字,后续采集任务模块会用到。

最后点击保存配置按钮。

---------

下面讲解导入采集任务:

新建任务分组后,在该分组下导入任务规则(导入任务至该分组):

选择我们的采集任务规则(.ljobx文件):

下一步:双击规则项

点击第三步:修改发布内容设置

修改下你发布的分类:

最后保存即可:

然后右键开始任务采集:

火车头采集器怎么采集今日头条文章?

第一步采集网址,下载好火车头采集器后打开,新建一个任务,任务名随意。把需要采集的网站文章列表页网址添加到起始网址。从图中看出该列表页有34页,每页有N篇文章。

2

列表页会一级网址,添加多级网址获取,从而获取二级网址(文章页网址)

设置列表分页获取,3个地方分别是:分页源代码前面和后面还有中间位置。这一步用于获取列表页面链接,因为有34个列表页面。设置完保存。

网址获取选项,这一步用于获取列表页上面文章页的链接,根据自己需要设置需要截取的部分和根据网址的结构设置包含与不包含某些字符。为空即没限制,设置完保存。

设置好链接采集规则后,可以测试网址,看测试结果调整规则。看图可以看到采集链接规则从起始链接到全面列表页再到列表页上的文章页链接都已经成功采集。

第二步是采集内容,首先修改标题规则,在页面源代码里面找到标题的代码,把标题前后代码负责过去截取出标题。保存。

修改内容采集规则,跟标题规则差不多,也是源代码里面找到内容的前后代码。这里内容会有一些其他html标签,所以得添加一个html标签排除的规则。

完成后,测试看一下结果,从测试结果来调试规则,直到测试结果是自己想要的内容为止。

第三步是采集导出。前面1、2两步把规则设置好,最后就要把文章导出了。先做一个导出的模版。

然后选择方式二,把每一篇文章都分别记录到一个txt文本,保存位置自己选择,模板选择刚刚做好的导出模版.保存的文件名用文章标题为命名。其他默认,保存。

把采集网址,采集内容,发布3个选项框都勾选,然后开始采集。完成后文本就自动生成在刚刚保存的文件夹里面了。

火车头采集器采集文章教程到此就完成了,由于每个网站都是不一样的,所以这里只能用一个网站演示,只是一个方法思路,自己采集文章还需要灵活变通。

关于zblog对接火车头采集和zblog火车头发布模块的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

取消
扫码支持 支付码