首字母排序,多音字如何处理呢

2018-06-12 13:36:05 +08:00
 ghostgril

在做一个地址按照首字母排序的页面,但是发现类似重庆这样的就会被分配到 Z 组里面去

有什么解决方案吗

2835 次点击
所在节点    前端开发
9 条回复
wxsm
2018-06-12 16:45:32 +08:00
用拼音排序,不要用汉字。
qiayue
2018-06-12 16:47:28 +08:00
我觉得可以出现两次,C 和 Z 各出现一次
ghostgril
2018-06-12 16:47:52 +08:00
@wxsm 我的意思是: 数据是汉字的,我现在通过汉字解析出拼音来排序。但是现在解析会出问题,就是多音字没办法分辨出来
ghostgril
2018-06-12 16:48:33 +08:00
@qiayue 页面里出现两次重庆不好吧,而且其他地名也有多音字的区别
iridescent0rsy
2018-06-12 16:58:21 +08:00
如果只是地名的话,多音字的全部枚举出来,特殊处理?我这个方法好笨的😂
lmqdlr
2018-06-12 16:59:04 +08:00
QQ 里面的 行(hang)政部了解一下
qiayue
2018-06-12 17:05:00 +08:00
出现重复有时候反而是个 feature,照顾读错的人
就像搜狗输入法,你打错的拼音,也能够找到正确的字
不过地名数据量不大,你人工把多音字纠正下就行
yalanaika
2018-06-12 17:06:46 +08:00
github 上转拼音 识别多音字的项目还是蛮多的 例如 https://github.com/letiantian/ChineseTone
bmxbmx3
2021-03-07 15:24:14 +08:00
pypi 有个 cn_sort 库应该能帮到你

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/462441

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX