kindle 追起点文有何好方法?

2017-09-30 15:17:41 +08:00
 yuanfnadi

是否有爬虫可以爬起点、纵横的文章。就是相当于我配好书籍名字和自己账户,就会定时轮训章节的更新。 然后把文字趴下来发到自己 kindle 上。

9496 次点击
所在节点    程序员
23 条回复
greatghoul
2017-09-30 15:24:33 +08:00
这个有意思
lifeintools
2017-09-30 15:28:07 +08:00
可以啊。。技术上可以实现 自己写一个呗
MontagePa
2017-09-30 15:29:07 +08:00
发送文章好说,主要是起点的稿子都是加密的。
yueyueniao89
2017-09-30 16:00:58 +08:00
刷安卓
vankid
2017-09-30 16:20:11 +08:00
自己写,然后解码
jadec0der
2017-09-30 16:21:00 +08:00
多看里有一些网文吧,就是有点贵
izoabr
2017-09-30 16:22:27 +08:00
曾经想过,支持微信订阅号之类的网页文章,转成 PDF,自动发送到 kindle 邮箱。
zjl03505
2017-09-30 16:26:30 +08:00
爬下来后还是需要付费再阅读的
yuanfnadi
2017-09-30 16:31:09 +08:00
@zjl03505 付费没问题,只是想在 kindle 上看罢了。
vainl1
2017-09-30 17:24:59 +08:00
写个脚本定时爬,爬完之后发到 kindle 文档服务邮箱,然后就可以看了。
参见:
Kindle 个人文档服务: https://www.amazon.cn/gp/help/customer/display.html/?nodeId=200767340
使用您的〖发送至 Kindle 〗电子邮箱: https://www.amazon.cn/gp/help/customer/display.html?nodeId=201974220
keenwon
2017-09-30 17:41:49 +08:00
kindle 格式是个麻烦的问题,txt,pdf 支持的都不算好
yuanfnadi
2017-09-30 17:48:21 +08:00
@vainl1 发邮件我也知道。只是想问一下有没有人建好轮子
Trim21
2017-09-30 17:51:06 +08:00
@yuanfnadi 我能想到的最快捷的办法是建一个 KindleEar,然后自己把爬来的文章转成 rss,让 KindleEar 处理转成数据和发送到 kindle 的工作
ifaii
2017-09-30 17:54:49 +08:00
我自己写过一个 抓取过滤发送到 kindle 一气呵成的爬虫,但因为水平不够,起点是 VIP 部分需要登录搞不定,只能爬到免费部分
8811
2017-09-30 18:04:38 +08:00
从数据安全的角度,起点的 vip 内容,肯定很难输出
Abirdcfly
2017-09-30 18:16:31 +08:00
从支持正版的角度,我支持用付费用户爬起点的正版内容自己看。
从技术实现,估计爬盗版小网站或者对应贴吧的连载贴容易点😂
a1044634486
2017-09-30 18:16:42 +08:00
vip 的直接掏钱啊,楼主又没说免费看
yuanfnadi
2017-09-30 18:25:38 +08:00
@8811 可以输出。我刚才试了一下


const getContent = async (pageUrl) => {
console.log("开始爬取起点的网页%s",pageUrl)
const page = await browser.newPage();
await page.goto(pageUrl);
var atricle = await page.evaluate(() => {
var article = document.querySelector("#chapterContent > section")
return article.innerText
});
await page.close()
return atricle
}
module.exports = {getContent};


目前正在写。
Hzzone
2017-09-30 18:33:40 +08:00
https://github.com/Hzzone/kindle-zhuishu
我以前想过写一个类似功能的脚本,调用追求神器 API,然后通过信任邮箱发送到 kindle 上。但是问题是只能说一章一章推,不能像手机一样有目录。
时间比较少,有了思路然后跨了半步,后面就弃了,希望贴主能做一个轮子出来,造福所有喜欢读小说的。
dong3580
2017-09-30 18:50:57 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/394882

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX