FictionDown 是一款专为网络文学爱好者设计的爬取工具,它能够自动校对、支持多种格式转换,并有效处理章节目录缺失和次序混乱的问题。另外它还内置了基础的广告过滤功能,尽管目前还不够完善,但已经可以过滤掉大部分需要手动删除的广告内容。
软件亮点
以起点中文网为模板,支持多网站线程同步爬取和校对。
支持导出为 txt 格式,以兼容大部分阅读软件。
支持导出为 markdown 格式,可以使用 pandoc 转换为 epub 格式。
保存书籍信息、卷结构、作者信息。
内嵌简易的广告过滤功能(目前尚不完善)。
软件特点
使用 Golang 编写,安装部署便捷,外部依赖仅有 PhantomJS。
支持爬取起点中文网,并携带 Cookie 以爬取已购买章节。
支持刺猬猫(即“欢乐书客”)。
支持直接输出 epub 格式,无需 pandoc 转换。
支持小说站内关键字搜索。
线程同步变换 markdown 格式。
整理 main 库中的面条逻辑。
整理命令行参数设计风格。
在 Windows 下,解决 markdown 转换到 epub 时的路径问题。
健全广告过滤功能。
简化应用流程。
提升日志输出。
书籍介绍支持 HTML 格式,即使用 <p>??</p> 而非 \t 和 \n。
如何使用
输入起点中文网的书籍链接,获取书籍信息并开始爬取各章节内容。
遇到 VIP 章节时,将其放入 Example 中作为校对样例。
手动设置笔趣阁等盗版小说网站的对应连接,再次启动并开始爬取,仅爬取 VIP 部分,并与 Example 进行校对。
手动编写相应的缓存,手动删除广告和一些随意标识符(部分为关键词,可能会造成 pandoc 内存溢出或格式错误)。
使用 -f md 命令生成 markdown 文件。
使用 pandoc 转换 markdown 文件为 epub 格式:pandoc -o xxxx.epub xxxx.md。
版本更新
改动网站搭配结构。
每个输出文件格式稍作整理。
希望这些改进能够使 FictionDown 更加易用和高效,为您的阅读体验提供更多便利。
谷歌卫星地图下载器
神奇音视频自动下载软件
至尊种子搜索神器
学无止下载器
雷神软件管家
机械师软件管家
云吞
Free Download Manager
2K公布免费第三人称英雄射击游戏《Ethos计划》
考试啦,《葫芦娃2》带来原动画细节小考卷(4)
王国两位君主北欧之地隐士有什么用
我的世界种子怎么种植方法
崩坏学园2怎么注销崩坏怎么注销账号
不止《生化危机》外媒精选30款恐怖佳作
王国两位君主北欧之地雷神之锤解锁顺序
梦幻西游梦玲珑穿什么
功夫熊猫阿宝邀你切磋,《蛋仔派对》联动KouKouLove第二弹开启
终结之王SF《街头篮球》提升胜率之失误控制