@jsonline 就是一个字符串可以拆成单字拼音 比如 dapaiyundongxie 能拆成 da pai yun dong xie这样 @Fedor 自己想不到好办法,双拼的话就把单字拼音拼成双拼存起来,判断的时候去比较,但多拼就想不到好办法了,超过四五拼了感觉数据有点大,单字拼音差不多400个左右,按我说的拼起来的话五拼就有点吓人了
qiayue
2014-03-20 19:11:09 +08:00
其实跟中文分词是一个思路,你可以去研究一下分词算法 xianshi 西安市/县市
lerry
2014-03-21 09:52:17 +08:00
我觉得应该从拼音的结构入手,一般的词是声母加韵母,有的词只有韵母
iEverX
2014-03-21 22:24:53 +08:00
拼音,声母,b p m f d t n l 等,韵母 a o e i u v ai ei ui等,还有类似于 xuan这种,可以学一下双拼的方法,声部就是声母了,韵部包括韵母和韵母组合 uan,ian这种。然后用这三种串区匹配一个输入的字符串,知道完成或者不能匹配为止 只有 声部 + 韵部,或者韵母(不包括uan这种)才是拼音