爬虫代码你可以在这里看到:
由于自己暑期实习不是 Android 开发这块。所以并不能把大量时间花在这上面。项目虽然主体架构以及主要功能完成,但是可以扩展的地方蛮多的:
1
seewhy 2016-07-26 10:52:31 +08:00
学习一下
|
2
ExploreWay 2016-07-26 10:55:02 +08:00
好厉害的
|
3
allencode OP 喜欢的话,还请各位帮忙 star 一波
|
5
zcwlwen 2016-07-26 11:24:02 +08:00
可以的,厉害。
|
6
wujunze 2016-07-26 11:24:29 +08:00
很有想法 并且 DO it 赞一个
|
7
echopan 2016-07-26 11:36:00 +08:00
已经拿走研究
|
8
coolloves 2016-07-26 13:14:02 +08:00
mark!!!!!
|
9
jugelizi 2016-07-26 13:53:51 +08:00
我当初看 一个 也是 没有电子版
自己爬下来处理下放电子书里看了 ID 自增的 ORZ |
10
wannianma 2016-07-26 13:58:04 +08:00
爬虫完全用正则匹配太累了,可以用一些第三库来简化,比如 BeautifulSoup 或者 xpath
|
11
allencode OP @wannianma 嗯 为了练手的。另外一个就是用 bs4 的。有的需要提取的内容比较简单,就直接用正则了。
谢谢你看了代码。 |
12
allencode OP @jugelizi 哈哈,是吗,可以想办法推送到 kindle 上。我也是为了练手 Android 才想起来这么做的。
|
13
allencode OP 有什么问题,可以 qq 跟我交流。互相学习
|
14
koloz 2016-07-26 14:05:55 +08:00
|
15
GreatMartial 2016-07-26 14:12:12 +08:00 via Android
关注一波
|
16
xiaosheng 2016-07-26 14:57:37 +08:00
python 几呢
|
17
xiaosheng 2016-07-26 15:03:10 +08:00
解析包时出现错误...
|
21
allencode OP @xiaosheng 你好 我用云真机测试了 mi4 确实是解析包问题。我试了小米其他的机子,却没有问题。请保持关注。我会上传到酷安应用市场试试看。
|
25
nightspirit 2016-07-26 15:57:43 +08:00
我想问的是豆瓣为啥用 mongo 存储
|
27
allencode OP @nightspirit 那个是我收集的爬虫博客链接。
|
28
songz 2016-07-27 00:10:57 +08:00
本人小白,看到爬虫就滚进来了,如果我想统计某个网页上的某个数据,楼主可以提点一下吗
|
30
holajamc 2016-07-27 11:31:36 +08:00
手里有一个落网的爬虫~不知道楼主需要不需要加进来~
|
31
allencode OP @holajamc 哈哈,我写过落网的爬虫,目录里面也有,如果你觉得思路不一样,你可以提 pr
|
33
allencode OP @holajamc 可以可以,你直接提 pr ,等我回到电脑前 merge 一下,注意相关格式哈,一起完善😄
|
35
lengjingxu 2016-07-28 08:54:00 +08:00 via Android
大端文字的字间距,端间距什么的调整一下阅读效果会好些
|
36
allencode OP @lengjingxu 嗯嗯,这些数据都是爬回来的,暂时还没想到怎么去改动这些。后续想想是否可以在爬的过程中存储时候改动一下。
|
37
iam36 2016-08-02 13:54:56 +08:00
楼主能开源你的 APP 吗?
|
38
allencode OP @iam36 已经开源了。目前正在优化和改进。请持续关注。 https://github.com/wuchangfeng/One
|