从高德采集最新的省市区三级坐标和行政区域边界 csv 格式

2019-04-16 08:36:27 +08:00
 xiangyuecn

当然还是用 js 在浏览器中运行采集的啦,包含采集源码,可自行采集,采集请求数据部分仅需 2 分钟。

相关介绍: https://www.cnblogs.com/xiangyuecn/p/10714707.html

数据下载: https://github.com/xiangyuecn/AreaCity-JsSpider-StatsGov/releases

数据预览:


另 20 天前发了一个帖子 /t/548567 对应的省市区镇数据采集。

另 117 天前发了一个帖子 /t/512328 咨询过城市变更我们数据库里面的老数据应对方案,虽然没什么好的结论,但还是可以参考参考。


为啥不用百度地图,其实最开始用的百度的,采集完才发现百度地图的数据有严重问题,然后才选择的高德。

嘲讽一下百度地图:

大量的这种垃圾数据,这么一看 高德简直完美无比。

10665 次点击
所在节点    程序员
67 条回复
xiangyuecn
2019-04-16 15:37:13 +08:00
@vibin 中山、东莞、儋州 没有区这一级,看地图上 这几个地区面积明显和同类小很多。

原始数据这样:广东-中山-?-沙溪
看面积应该是:广东-?-中山-沙溪

实际使用:广东-中山-中山-沙溪,能保证整个数据上下层级的结构一致性
sighforever
2019-04-16 16:34:16 +08:00
厉害厉害,先下载为敬
DannyVim
2019-04-16 16:53:59 +08:00
不过对于学术研究而言,大家作图时利用更多的还是 shp。望洋。
xiangyuecn
2019-04-16 16:59:24 +08:00
@oldbird #38 嗯,高德的数据是火星坐标系
xiangyuecn
2019-04-16 16:59:56 +08:00
@sighforever #42 哈,感谢支持
xiangyuecn
2019-04-16 17:03:39 +08:00
@DannyVim #43 原来如此,看到了 webmap.cn 里下载的数据里面有 shp 后缀文件
SN7
2019-04-16 17:11:37 +08:00
如果能采集商家手机号就更更好了。
ml1344677
2019-04-16 17:36:33 +08:00
上一份工作把高德地图数据扒了一大半,包括所有 building 的 polygon 底面和高度,全国所有 poi 的数据(通过企业级接口请求 ID 然后爬虫获得 POI 的 polygon )。有需要但要求不那么高的 v2,推荐你们一个开源数据源,openstreetmap 根据文档可以直接解析出来,包括道路什么矢量数据(高德这块道路水系应该是渲染在底图的,不好获得)。
icylogic
2019-04-16 19:03:46 +08:00
我记得 openstreetmap 有中国行政区划的数据包的,好处在于 API 和对应的开源工具非常多……
vanis
2019-04-16 19:14:48 +08:00
@ml1344677 方便交流下么?对你的工作有需求。
aleung
2019-04-16 19:55:50 +08:00
@ml1344677 OpenStreetMap 的行政区划数据准确性没有保障,我有时爬山看到个界碑,也会上去更新一下。
Twislight
2019-04-16 20:06:42 +08:00
收藏一下
ml1344677
2019-04-16 20:11:41 +08:00
@aleung 对的,osm 主要是做一个低精度要求需求的数据补充,因为他本身从可获得性上来说比较方便。
ml1344677
2019-04-16 20:13:35 +08:00
@vanis v: cTM5ODU1NjA1Mw==
xiangyuecn
2019-04-16 20:38:39 +08:00
@ml1344677 @icylogic @aleung 学习了,我研究一下 OpenStreetMap
xiangyuecn
2019-04-16 20:40:44 +08:00
@SN7 #47 这个嘛。。。😅 说不定#48 已经爬好了😄
limingjie138
2019-04-16 21:19:53 +08:00
点个❤️ 插个眼
dyb
2019-04-16 23:20:12 +08:00
不错,mark 一下
lby876176278
2019-04-16 23:41:42 +08:00
刚刚在 Gayhub 上看到有这个开源的项目就按照惯例收藏了一波,想不到作者也在 v 站~ 支持一波
w797200
2019-04-17 00:26:28 +08:00
mark 一下 回来研究

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/555554

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX