有人用 Java 写爬虫吗?

2019-06-11 16:54:03 +08:00
 wz497345846
3673 次点击
所在节点    程序员
11 条回复
calming
2019-06-11 17:02:08 +08:00
httpclient+jsoup 呗
leon0903
2019-06-11 17:14:23 +08:00
我记得好像有好几个 java 爬虫框架
shionri
2019-06-11 17:17:42 +08:00
用过 selenium java,写爬虫的话有点大材小用的感觉?
fenrao
2019-06-11 17:30:29 +08:00
webmagic
jiom
2019-06-11 17:40:43 +08:00
一楼的方案是最常用的了
tikazyq
2019-06-11 18:29:18 +08:00
可以尝试一下爬虫管理平台 Crawlab,支持任何语言、任何框架,可以用 Crawlab 集成你的 Java 爬虫

https://github.com/tikazyq/crawlab
c4f36e5766583218
2019-06-11 19:28:29 +08:00
retrofit 接 api 爬。
sean250031
2019-06-11 19:59:04 +08:00
bigbigeggs
2019-06-11 20:08:16 +08:00
写过好多。跟 python 没什么区别。就是拿到数据,然后清洗数据。
python:request + (bs4,re 等)
java: httpclent + (jsoup,re 等)
brucefu
2019-06-11 21:37:44 +08:00
去哪儿爬信息百分之 95 的 java
luozic
2019-06-11 21:39:39 +08:00
apache 组织有开源的爬虫和抽取数据框架,java 语言的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/572864

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX