请问如何判断一个字符串是否多拼,如果是多拼如何判断由几个拼音组成呢?

2014-03-20 17:09:10 +08:00
 lusin
4355 次点击
所在节点    PHP
7 条回复
Fedor
2014-03-20 17:15:33 +08:00
你自己怎么判断的? 把自己的判断思维转换成程序语言。
jsonline
2014-03-20 17:48:23 +08:00
什么叫多拼? 什么样的字符串?
lusin
2014-03-20 18:28:55 +08:00
@jsonline 就是一个字符串可以拆成单字拼音 比如 dapaiyundongxie 能拆成 da pai yun dong xie这样
@Fedor 自己想不到好办法,双拼的话就把单字拼音拼成双拼存起来,判断的时候去比较,但多拼就想不到好办法了,超过四五拼了感觉数据有点大,单字拼音差不多400个左右,按我说的拼起来的话五拼就有点吓人了
qiayue
2014-03-20 19:11:09 +08:00
其实跟中文分词是一个思路,你可以去研究一下分词算法
xianshi 西安市/县市
lerry
2014-03-21 09:52:17 +08:00
我觉得应该从拼音的结构入手,一般的词是声母加韵母,有的词只有韵母
iEverX
2014-03-21 22:24:53 +08:00
拼音,声母,b p m f d t n l 等,韵母 a o e i u v ai ei ui等,还有类似于 xuan这种,可以学一下双拼的方法,声部就是声母了,韵部包括韵母和韵母组合 uan,ian这种。然后用这三种串区匹配一个输入的字符串,知道完成或者不能匹配为止
只有 声部 + 韵部,或者韵母(不包括uan这种)才是拼音
dong3580
2014-03-22 10:14:18 +08:00
C#里面有个拼音转成汉字汉字转拼音,识别率还是很高的,可以尝试调用,试试。至于其他语言,我想应该也有类似的吧,尝试用学习的方法,将用户输入频率高的加入字典,这样可以间接给出用户拼写建议。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/105149

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX