昨夜刚撸完一个微信公众号爬虫的网站,欢迎提出意见

2015-01-22 09:20:24 +08:00
 iewgnaw

http://weiread.pw/

每天定时抓取公众号文章,提供订阅阅读,另外还可以生成kindle杂志定时推送。

css和js现学现用的,写的比较渣;欢迎提出使用意见

36908 次点击
所在节点    Python
85 条回复
iewgnaw
2015-01-22 20:17:29 +08:00
@Alecio 这么巧啊。用的kindlegen的,calibre有命令行的方式?
@vivisidea 细究的话肯定有的,但这种网站不会有什么大的影响,应该没人追究吧
@Lucups 应该是那个js有些问题。我再改改看
iewgnaw
2015-01-22 20:19:29 +08:00
@tjxiter 不是免费的,一年也就几十块

@shiny
@hanyun
实现了一个代理池的功能,保证每次请求都是代理池中的ip
ljcarsenal
2015-01-22 21:19:41 +08:00
大家都热衷爬微信的文章,哈哈。。。一个月之前做了个 http://www.fxbiao.net/ ,不过界面不是我写的
fuermosi777
2015-01-23 00:05:12 +08:00
可以看看我做的iOS app 也是用python爬的 不过目前公众号只有120多个 https://itunes.apple.com/us/app/xue-sheng-ri-bao-hui-ju-zui/id954164794?mt=8
flash866
2015-01-23 10:31:24 +08:00
楼主能分享下原理吗?
Juntle
2015-01-23 10:46:56 +08:00
很赞哦!
ATiGr
2015-01-23 10:53:42 +08:00
非常好用!期待信息更加完全!感觉比手机看方便太多啊!
imlewc
2015-01-23 12:00:02 +08:00
imlewc
2015-01-23 12:00:46 +08:00
@shiny 何必那么频繁,定时就够了
imlewc
2015-01-23 12:01:17 +08:00
@dddd 这个还行 量还是有的
imlewc
2015-01-23 12:02:17 +08:00
@vivisidea 在中国是不太用考虑这个问题的
imlewc
2015-01-23 12:03:54 +08:00
@fuermosi777 点个赞
vivisidea
2015-01-23 14:41:50 +08:00
@tjxiter pw域名不免费,但相对比较便宜,namecheap上最近注册了一个 lib64.pw 首年才24块RMB,续费好像是 50RMB/year

估计这类域名对搜索引擎不是很友好,可能内容比较难被收录
tjxiter
2015-01-23 17:16:05 +08:00
@vivisidea 看来一分钱一分货是永恒的真理。

要是搞个个人博客买什么域名比较好呀?
ivlucks
2015-01-23 18:03:08 +08:00
@yanwen 谢谢
vivisidea
2015-01-23 18:21:37 +08:00
@tjxiter 不造啊。。个人博客写着写着就写不下去了,我还有一个 info 域名收录情况貌似还好

去google 的 webmaster tool 提交索引请求
提交 sitemap.xml
优化页面的 title,keywords

这些基本的对搜索引擎友好的事情要做

当然最重要还是文章质量要高
rico93
2015-01-25 15:14:17 +08:00
kindle的订阅发送时怎么实现的
dellch
2015-01-25 17:11:36 +08:00
@fuermosi777 请问是原生应用么?
fuermosi777
2015-01-25 23:00:53 +08:00
@dellch 是的 文章页面用的webview
Crossin
2015-01-29 10:53:45 +08:00
@iewgnaw @wanghanlin 嗯,那么问题来了:他这里是通过什么发现文章更新并抓取的呢?
虽然从实现上来说,有一个地方能给到最新数据已经可以了,但没想通这个问题。官方公开渠道是没找到。
有想到过,通过微信关注一堆公众号,然后想办法模拟这个微信号的登录,拿到收到的公众号文章列表。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/164359

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX