昨夜刚撸完一个微信公众号爬虫的网站,欢迎提出意见

2015-01-22 09:20:24 +08:00
 iewgnaw

http://weiread.pw/

每天定时抓取公众号文章,提供订阅阅读,另外还可以生成kindle杂志定时推送。

css和js现学现用的,写的比较渣;欢迎提出使用意见

36908 次点击
所在节点    Python
85 条回复
tjxiter
2015-01-22 09:23:23 +08:00
做个网站,一个月多少钱啊?
yanwen
2015-01-22 09:23:58 +08:00
不错。。赞一个。。
typcn
2015-01-22 09:25:27 +08:00
Error code: DNS_PROBE_FINISHED_NXDOMAIN
lzxgh621
2015-01-22 09:28:25 +08:00
图片全挂,要不缓存一下,成本太高。。。
crabhit
2015-01-22 09:28:35 +08:00
这数据是怎么爬下来的
iewgnaw
2015-01-22 09:31:17 +08:00
@tjxiter 什么一个月多少钱?
likid
2015-01-22 09:31:57 +08:00
点击订阅没反映。

另,搜索可以用 搜狗的微信搜索。
其实可以不用放自己服务器上,只需要做一个简单的转换,把搜狗搜索的内容扒过来即可。也不需要定时抓取。
iewgnaw
2015-01-22 09:32:03 +08:00
@typcn 可能是pw后缀的域名 有的地方不能解析吧,当时没考虑这个问题
Hiufan
2015-01-22 09:33:35 +08:00
用python写的?
likid
2015-01-22 09:33:57 +08:00
给我接口,帮你鲁一个 iOS 的 App
iewgnaw
2015-01-22 09:40:55 +08:00
@likid 登录之后才能订阅的。点击订阅不是跳转到登录界面?
内容是根据搜狗抓取来的,不爬图片服务器压力也不大的
xmy2232867
2015-01-22 09:41:18 +08:00
搞个这个要用到哪些技术啊?
wuxianglong
2015-01-22 09:42:04 +08:00
请问楼主,数据是怎么抓取的?
iewgnaw
2015-01-22 09:43:25 +08:00
@lzxgh621 你那边看不到图片?部分放qiniu上的,其他都是外链微信的
iewgnaw
2015-01-22 09:44:27 +08:00
@Hiufan 是的,django框架
dddd
2015-01-22 09:45:02 +08:00
以前看到过一个传送门……
http://chuansong.me/

…………
likid
2015-01-22 09:45:55 +08:00
@iewgnaw 没有跳到登录界面。
likid
2015-01-22 09:46:41 +08:00
@iewgnaw 刚才试了一下,又可以了
iewgnaw
2015-01-22 09:46:51 +08:00
@dddd 是的,开始我也是用传送门的;我一开始的目的是为了抓取推送到kindle的,后来还是顺带用django写了阅读功能
jaytags
2015-01-22 09:48:56 +08:00
@iewgnaw
lz速度还不错哦。 主机哪里买的呢?
qiniu 的存储怎么变成这样的clouddn.com域名呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/164359

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX