小弟开源了一个 Python 爬虫+App 的应用,欢迎围观一波。

2016-07-26 10:50:07 +08:00
 allencode

One

项目地址

Crawler

爬虫代码你可以在这里看到:

Sample

戳这里体验一下

Contribution

由于自己暑期实习不是 Android 开发这块。所以并不能把大量时间花在这上面。项目虽然主体架构以及主要功能完成,但是可以扩展的地方蛮多的:

Open source library

ScreenShot

10934 次点击
所在节点    Python
38 条回复
allencode
2016-07-26 15:25:00 +08:00
@xiaosheng 你好 我用云真机测试了 mi4 确实是解析包问题。我试了小米其他的机子,却没有问题。请保持关注。我会上传到酷安应用市场试试看。
allencode
2016-07-26 15:29:53 +08:00
@xiaosheng 你的系统版本是 4. 几几的吗?我又测试了 6.0.1 的小米四 发现时可以正常的。
xiaosheng
2016-07-26 15:37:07 +08:00
@allencode miui6...安卓 4.4.4
allencode
2016-07-26 15:40:46 +08:00
@xiaosheng 额 好吧,那是因为开发的时候版本就比较高,为了一些效果。后续我会想想能不能优化改进哈。
nightspirit
2016-07-26 15:57:43 +08:00
我想问的是豆瓣为啥用 mongo 存储
allencode
2016-07-26 16:32:03 +08:00
@xiaosheng 现在可以试一下了。我这边是没问题的。至少在安装上不会出现解析包问题了。
allencode
2016-07-26 16:32:22 +08:00
@nightspirit 那个是我收集的爬虫博客链接。
songz
2016-07-27 00:10:57 +08:00
本人小白,看到爬虫就滚进来了,如果我想统计某个网页上的某个数据,楼主可以提点一下吗
allencode
2016-07-27 09:01:29 +08:00
@songz 好 可以交流 应该能找到我的联系方式吧
holajamc
2016-07-27 11:31:36 +08:00
手里有一个落网的爬虫~不知道楼主需要不需要加进来~
allencode
2016-07-27 12:15:12 +08:00
@holajamc 哈哈,我写过落网的爬虫,目录里面也有,如果你觉得思路不一样,你可以提 pr
holajamc
2016-07-27 12:27:38 +08:00
@allencode 看了一下~思路不同我是直接遍历把歌曲 url 存入数据库,顺手写抓了期刊的内容~
allencode
2016-07-27 12:31:12 +08:00
@holajamc 可以可以,你直接提 pr ,等我回到电脑前 merge 一下,注意相关格式哈,一起完善😄
holajamc
2016-07-27 12:35:49 +08:00
@allencode 稍晚时候提给你~
lengjingxu
2016-07-28 08:54:00 +08:00
大端文字的字间距,端间距什么的调整一下阅读效果会好些
allencode
2016-07-28 09:30:23 +08:00
@lengjingxu 嗯嗯,这些数据都是爬回来的,暂时还没想到怎么去改动这些。后续想想是否可以在爬的过程中存储时候改动一下。
iam36
2016-08-02 13:54:56 +08:00
楼主能开源你的 APP 吗?
allencode
2016-08-02 17:11:18 +08:00
@iam36 已经开源了。目前正在优化和改进。请持续关注。 https://github.com/wuchangfeng/One

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/294962

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX