根据地址识别出国家,大家有好的建议吗

2020-09-26 11:49:29 +08:00
 wdg8106

比如:"首尔市江南区永东大路亚洲会议塔" 目前想到的是 先分词,然后再找一份世界主要城市国家映射表进行匹配 用 jieba 分词,得到的结果是首尔 /市 /江南 /区 /永 /东大路 /亚洲 /会议 /塔 接下来依次用这些词在映射表中匹配,第一个匹配到就返回

但是目前还没找到靠谱的国家城市映射表,大家有做过的,诚心求教~~

5105 次点击
所在节点    Python
31 条回复
wdg8106
2020-09-26 21:23:32 +08:00
@helloworld000 多谢,我在网上下了个城市国家信息表,还是想先从这方面入手,如果精确度不够再考虑谷歌 api
wdg8106
2020-09-26 21:24:15 +08:00
@bellchu 哦哦 长见识了 ....
bellchu
2020-09-26 21:29:01 +08:00
你可以优先 extract 字段中的邮编,可以相对准确的判断国家。
uuiitwp
2020-09-26 23:51:53 +08:00
典型的地理编码 /逆地理编码问题
Pythondr
2020-09-27 00:11:03 +08:00
一般的地图服务都有地址标准化的 API,可以看下高德开放平台
cheng6563
2020-09-27 01:24:57 +08:00
google 地图的 api,免费额度不够可以多开几个账号均衡负载
winterbells
2020-09-27 08:16:40 +08:00
我们之前用的是谷歌地图搜索

搜索完了它会自动将坐标放进 URL,取出来就是,也没什么免费额度之说。
fhsan
2020-09-27 08:19:12 +08:00
建议 google 地图 api,分词十分不靠谱
lichdkimba
2020-09-27 11:26:22 +08:00
地球上至少 80%的人不会打中文地址吧。。。。。
loliordie
2020-09-27 16:30:39 +08:00
这个题, 使用传统方法解决最大的问题其实来源于数据质量.
teddy2725
2020-09-27 17:26:34 +08:00
搞点高质量数据用 fasttext 训练一个文本分类模型来做

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/710633

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX