你写爬虫的目的是什么?

2014-03-25 20:55:01 +08:00
 kehr
相信许多人都写过自己的网络爬虫。说说促使你写爬虫的目的是什么?用到了那些技术和工具?留下地址大家围观一下 ~\(^o^)/~
11404 次点击
所在节点    程序员
59 条回复
janxin
2014-03-25 21:16:37 +08:00
写了这么久没写过爬虫…我不是合格程序员…
wvidc
2014-03-25 21:21:06 +08:00
你猜猜
~\(^o^)/~
john990
2014-03-25 21:34:04 +08:00
为自己的网站弄点数据
paicha
2014-03-25 21:37:22 +08:00
微信公众号,教务系统成绩查询
caiych
2014-03-25 23:01:51 +08:00
……看漫画……网站不给打包下载……
以及抓一些数据测试算法……
binux
2014-03-25 23:06:40 +08:00
这是我的工作。。
xuxu
2014-03-25 23:09:20 +08:00
蛋疼的时候玩
vitoziv
2014-03-25 23:32:59 +08:00
毕业设计的时候,为了做一个移动版教务系统,爬了学校的教务系统数据..
jsonline
2014-03-25 23:47:29 +08:00
每个月都能看见有人发布一个新的爬虫……
reverland
2014-03-25 23:58:33 +08:00
显然是为了搜集信息
csx163
2014-03-26 00:22:05 +08:00
抓H种子
抓H图

果然H是第一生产力啊
WildCat
2014-03-26 09:02:48 +08:00
@paicha 这…怎么查?没API诶
WildCat
2014-03-26 09:04:38 +08:00
@paicha
@vitoziv

求如何爬正方教务系统
http://123.232.100.110:86

@csx163
你不怕查水表?
Amoscoder
2014-03-26 11:27:56 +08:00
工具用的Mechanize。。

@WildCat
你爬正方的教务系统难点在哪儿?很容易啊。
vilic
2014-03-26 12:04:44 +08:00
主要是提高生产力吧, Marketing Research 之类的. 还有就是之前做的外包, 是 SEO 工具, 统计数据用的.
另外现在自己的背单词应用也是爬的词库. 感觉经常会用到.
@WildCat 哈哈, 说道这个还真的爬过教务处网站抓课表, 虽然那个项目后来没继续搞了. https://github.com/vilic/ClassScheduleProxy
xavierskip
2014-03-26 12:51:24 +08:00
美女图!妹子图!无聊图!
kehr
2014-03-26 12:55:56 +08:00
@Amoscoder
@vilic

你们的教务系统外网能够访问么?比如查成绩,查课表之类的?我们这里只能通过内网进行。

如果外网无法访问,那么爬虫还能爬到数据么?
bbiao
2014-03-26 13:20:42 +08:00
要是能匿名回答就好了。
kehr
2014-03-26 13:36:30 +08:00
@bbiao 查水表的没有那么快~
vilic
2014-03-26 13:37:59 +08:00
@kehr 多数教务网貌似外网还是能访问的诶。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/105871

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX