求助,爬虫问题

209 天前
 juoyi

求助:兄弟们,小弟遇到个问题
1 、爬取全国的国企名单(省、市级)
2 、爬取全国的公立医院名单(省、市级)
省级国企名单要到各省国资委网站查找,市级国企名单要到各市国资委网站查找
至于公立医院也是分别要到省卫健委和各市卫健委网站查找
问题是全国这么多省市,这个用爬虫咋做?不知道描述清楚没有,路过的兄弟有啥想法吗

ps
国企网站倒是找了这么个网站,但是好像不是很权威
http://www.guozi.org/certification/directory_index.php

丁香园医院汇好像又只能看到 10 页...
https://y.dxy.cn/hospital/?page=1&trade=1

788 次点击
所在节点    问与答
3 条回复
crab
209 天前
https://y.dxy.cn/hospital/id 递增( 1~12812 )
juoyi
208 天前
@crab 感谢回复,这样确实可以看到更多数据,但是我后面发现丁香园的数据和卫健委官网上的有些出入,39 健康网上的数据更全一点,但是爬全国数据还是太多了,一个省可能就好几千家医院了,其实卫健委官网上并没有这么多
wuxin987
208 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1033436

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX