采集设置

1.小技巧:类名可用“h2:eq(2)”这样的形式。文章页标题、作者、缩略图、完整目录页可采用、“meta[property=og:novel:author]|content”这样的写法。
2.无需设置或无需采集的项请留空或保持默认。预过滤规则中,如果是固定字符串过滤,如“ABC书屋”,可单独一行只写需过滤字符串,无需以正则形式。
3.栏目模式介绍:“多栏目匹配”表示目标网站各栏目及栏目分页分别采集,此时需将url中[cate]与目标站一一对应。“单列表匹配”表示采集目标站混合列表页(如最近更新、排行榜等),该模式需采集文章所属栏目标记,和[cate]一一对应入库。

是否启用
用于展现给用户,如三七中文
突破采集
代理(慎用)
无法采集时启用,代理需在其他设置中填写可用代理
图片本地化
图片属性
用于解决图片防盗链问题
所属栏目
采集内容所属栏目
目标网站域名
网站编码
域名结尾去掉“/”
URL替换规则
用于解决301重定向问题,如“abc.com###abc.net”,一行一条
规则列表页面
[page]表示页码,[cate]表示不同分类
附加列表页面
无法通过规则列表记录的页面,可用[cate]匹配多栏目
[cate]对应情况
源站[cate]
对应栏目
最大页码
仅适用于“多栏目匹配”和“单列表匹配”。
1.多栏目匹配:需结合规则列表中[cate]使用,如栏目无对应[cate],请留空,并填写各栏目最大页数,此时,[规则列表页码]中的最大页不再生效,以此处为准
2.单列表匹配:需在文章页面采集所属栏目标记,与此处填写的[cate]值一一对应后才能导入相应栏目。如栏目识别失败,则导入默认栏目
3.如需删除某行,清空该行cate输入框,保存即可
规则列表页码
“a|b|c”第a页开始,最多到第c页,每次增加b
无缩略图标志
如“nocover”。包含nocover的图片会替换为系统默认封面图

列表页:源码预过滤规则
常规情况下留空。代码处理前先进行替换,一行一条,如“{filter replace='替换后代码'}<div id="ad480">(.*)</div>{/filter}”
列表页:链接CSS选择器
如“#list ul a”
列表页:标题CSS选择器
如“#list ul a h2”
列表页:缩略图CSS选择器
如“#list ul a img|src”,若需在文章页采集缩略图,请留空
列表页:作者CSS选择器
如“#list ul em”,若需在文章页采集作者,请留空

文章页:源码预过滤规则
常规情况下留空。代码处理前先进行替换,一行一条,如“{filter replace='替换后代码'}<div id="ad480">(.*)</div>{/filter}”
文章页:标题CSS选择器
如“h1”、“#content img:eq(0)|title”,可用|分割字段属性
文章页:作者CSS选择器
如“#author”、“meta[property=og:novel:author]|content”
文章页:分类标记CSS选择器
仅“单列表匹配”时需要填写。如“.sort”、“meta[property=og:novel:category]|content”
文章页:内容CSS选择器
如“#article .articlebody”,+分割多段内容,|分割过滤内容
文章页:缩略图CSS选择器
如“#cimg|src”、“meta[property=og:image]|content”,若已在列表页采集,请留空
文章页:完结标志
如“已完结”,“class="fulltxt"”
文章页:完整目录页CSS选择器
如“h2.seemore a”、“meta[property=og:novel:read_url]|content”。如文章页即目录页,请留空

章节目录页:源码预过滤规则
常规情况下留空。代码处理前先进行替换,一行一条,如“{filter replace='替换后代码'}<div id="ad480">(.*)</div>{/filter}”
章节目录页:区域CSS选择器
章节区域ID或类名,如“table#chapterlist”
章节目录页:采集规则
参考参数“[link]、[title]、[string]”,link表示章节链接,title表示章节名,string表示无需采集的任意字符
章节目录页:顺序调整
默认无需改动,如章节顺序反了,请调为倒序
章节目录页:顺序调整间隔
如填写3,表示每3章倒序一次。仅在需要时填写

章节内容页:源码预过滤规则
常规情况下留空。代码处理前先进行替换,一行一条,如“{filter replace='替换后代码'}<div id="ad480">(.*)</div>{/filter}”
章节内容页:内容CSS选择器
如“#bookcontent”
章节内容页:分页标识
如“点击下一页”,留空则不检测分页
章节内容页:分页链接选择器
如“a#pb_next”
章节内容页:段落顺序调整规则(99lib)
如“meta[name=client]|content”
ID 网址 标题 作者 缩略图
{:$k+1} {$vi.url} {$vi['title']} {$vi['author']} {$vi.thumb}
省略……
当前URL
当前采集的列表页url
代码预览
目标文章页
文章网址
文章标题
文章作者
分类标记
文章内容
缩略图
章节页
代码预览
章节列表
章节内容页
章节内容
{$pname}规则导出
规则导入
导入方式
如果导入为现有节点将会更新该节点的规则
采集点名称
唯一标识,只支持字母+数字。留空则使用原采集点名称
所属栏目

节点转移功能介绍:用于批量转换该节点的小说到指定节点。一次转换一本,如果指定节点记录中有该小说对应记录,则转换成功。转换过的小说,现有数据将作废,重新从新节点采集。

是否启用
采集点标识(唯一,字母+数字)
对应栏目
{~$i=0;}
{~$i++;}
新增规则 导入规则

指定ID/指定ID范围采集

目标节点
目标站URL格式
仅支持数字id,subid由系统根据id计算
起始文章ID
ID范围过大,会导致网站卡死。“1-20”表示采集范围,“1,2,8,1015”表示指定采集
指定所属栏目
多栏目节点无法对小说智能分类,需要预先指定,单列表节点会自动分类
批量转换节点 ×
移动<>文档到: