杰奇利用一库多站,解决采集异常

发布时间:2020-01-09 19:18:47

107

有时候经常会出现这种情况,就是制作好一份模板,或者买来一份源码,看起来没什么问题,但是采集的时候却出现各种报错,比如 “关关采集器载入小说信息出错” 等问题,有时候想个几天都搞不定。怎么说呢,其实关关采集器是一个比较矫情的程序,很多地方的问题都会导致采集的异常,有时候时常我都觉得能够正常采集都是一种幸运。但是总之,有一个关键点在于,杰奇的原装程序,采集一般都正常。

先罗列一下我所知道的无法采集的原因:

1. 数据库连接信息填写错误
2. 网站目录设置不正确
3. 杰奇版本设置不正确
4. 文件夹没有读写权限
5. 数据库异常或者没有写入权限
6. 目录页及阅读页模板调用语句不识别
7. 服务器环境缺乏支持组件
8. 杰奇分页标签因为二次修改不被识别
9. 小说模块参数配置文件出现错误
10. 采集规则或者采集源站有问题
11. 人品极差

通过以上问题,可以发现,11 条里面,有 5 条都和程序本身有问题,而且这 5 条还都是最常出现的问题。为什么呢?

原因大概一下几条:

1. 因为程序的复制粘贴,上传之类的,都可能破坏文件夹权限,或者损坏文件。
2. 模板开发为了追求更加美观的效果而写出更加复杂的目录或者阅读调用语句。
3. 为了网站的整体美观性,修改杰奇默认的分页标签对应的代码。
4. 个人性,作死行为

但是一般来说,修这些问题都是异常困难的,但是总不可能因为模板的制作要求,就直接放弃采集。其实有一个很好的解决办法,就是利用杰奇的一库多站,而且这种方法可以为网站的封面图片,或者用户头像,分配单独的域名,并且对于网站的整体程序,基本没有修改。

那么,教程就是这样的

1. 分清楚这样配置的概念,在这个过程,需要一个不可直接访问的站点作为采集,以及用来保存图片和 txt。而其它一个或者多个站点,只负责呈现,调取数据,于是案例的设置如下:

采集:F:websitecj
呈现:F:websitecx

2. 设置域名的绑定,采集站不需要绑定到根目录,而是绑定到 files 文件夹,这样就完全无法访问网站,而呈现就只需要绑定到根目录就好了,毕竟只用于访问:

采集:127.0.0.1 绑定到:F:websitecjfiles
呈现:127.0.0.2 绑定到:F:websitecx

3. 设置呈现站的配置,调用图片和 txt 文件:

设置系统管理 - 参数设置 - 会员头像保存目录:F:websitecjfilessystemavatar
设置系统管理 - 参数设置 - 会员头像访问 URL:http://127.0.0.1/system/avatar

设置小说连载模块 - 参数设置 - 文本保存目录:F:websitecjfilesarticletxt
设置小说连载模块 - 参数设置 - OPF 文件目录:F:websitecjfilesarticletxt
设置小说连载模块 - 参数设置 - 封面图片保存目录:F:websitecjfilesarticleimage
设置小说连载模块 - 参数设置 - 访问封面图片的 URL:http://127.0.0.1/article/image

注意,如果需要启用类似 txt 下载之类的功能,那就也需要对所在目录在后台进行配置

4.【重要】采集和呈现的网站都使用同一个数据库,如果出现权限问题导致呈现站无法读取采集站的 txt 目录,那么可以将采集站,设置为呈现站的子目录里面,作为子网站,这样就可以避免权限问题导致的无法读取。当然也可以解除限制跨站目录读取的设置。

最后,采集器的设置

设置网站目录:F:websitecj // 其实就是采集站的文件目录
设置数据库:两个网站共用的数据库连接
设置杰奇版本:按照当前情况,总之两个网站最好杰奇版本相同,其实就是采集站是杰奇官方的原装程序,而呈现站就是无法用于采集的主要二次开发版本杰奇。对于 2.2 和 2.3 版本,就用 1.8 作为采集站也没问题。

以上就是利用杰奇一库多站配置,解决自己制作或者买来的程序及模板,无法采集的问题。其实很多时候,去修改杰奇默认的目录,阅读,分页文件,是根本不可避免的事情,毕竟现在网站的花样都越来越复杂,简单的模式已经略微满足不了要求了。不过部分采集器版本似乎不会出现这类问题,所以以实际情况为准,而这个教程也可以使采集和呈现的网站完全分开,乃至于丢在完全不同的磁盘(当然这样似乎不安全)

上一篇:百度搜索网页标题规范(这是百度给的建议) 下一篇:杰奇小说CMS生成手机APP应用教程