网站一般怎么做简体/繁体切换呢?内容怎么保存?搜索怎么处理?

2015-02-12 15:51:18 +08:00
 roricon

我简单的想法是,统一保存简体内容,使用繁简切换的JS库。
搜索时候转换成简体,返回结果再用JS处理一遍。

我觉得肯定有更好的解决方式,希望大家能给点想法。

4760 次点击
所在节点    编程
10 条回复
Agromania
2015-02-12 15:56:03 +08:00
如果内容不多,对准确要求高,建议维护简繁两个版本的内容,程序转换是不靠谱的。

比如简体“后”,解释是古代君主或帝王的妻子的时候,繁体是“后”,解释是空间或时间上与“前”相对的时候,繁体是“後”

这种情况非常之多。维护一个大词典,做分词和猜测意思,能够从某种程度上解决这个问题,但是古文中很多单字为句的,要联系上下文还要具备专业知识才能判断,不是程序能搞定的。
roricon
2015-02-12 15:59:45 +08:00
@Agromania
看来我想的还是简单了。
lichao
2015-02-12 16:03:09 +08:00
举个简单的例子

我们说 软件,他们说 軟體(软体)
我们说 缓存,他们说 快取

除非你的转换程序足够智能,否则还是维护两套内容吧
Agromania
2015-02-12 16:15:50 +08:00
如果内容是你自己维护的,又要追求准确,最好是简体繁体分别维护。

字典转换的库很不准确,转换出来的繁体在真正使用繁体的人眼里可能是笑话百出的
词典准确性要好的多,比如楼上说的,你对简体内容做分词,根据词典做单元匹配,把“软件”转换成“軟體”。这个词典会非常大,我记得看过一个,词数是千万条的量级。应该要放在后端处理,JS搞不定。但是还是会遇到一些无法分词匹配不上的情况,

比如“过年了,我家门上贴了一个 ‘发’ 字”
这里应该转成發,如果转成髪就要闹笑话了。

这个诗词网 http://sou-yun.com
有一个简繁转换的功能http://sou-yun.com/STConvert.aspx
也许不适用你的场景但是希望能对你有所启发,他们在转换的时候碰到1对多的情况 会分别告诉用户什么意思,让用户自己选择。
seki
2015-02-12 16:18:52 +08:00
opencc
wikipedia 也维护有一个较大的简繁转换库

这些也都不重,但是要 js 完成的话总得把一个数据库传输到用户浏览器里,我国的窄带网玩不动啊
Kilerd
2015-02-12 17:40:15 +08:00
直接做好i18n就好啦,
shiny
2015-02-12 17:41:49 +08:00
简体转繁体会有比较多的错误,繁体转简体问题会少很多。
tmqhliu
2015-02-12 17:49:07 +08:00
曾经用过繁体中文版的 Windows XP,用了一周时间,觉得界面有点乱,然后就果段重装……
abelyao
2015-02-12 19:12:05 +08:00
曾见过一个简繁切换做得非常好的网站,它是这样的:
cn.domain.com 为简体中文页面,面向大陆用户;
hk.domain.com 为香港繁体页面,面向香港用户;
tw.domain.com 为台湾繁体页面,面向台湾用户;

如果当前你在访问 cn.domain.com/abc/xyz.html 页面,然后点击切换到香港繁体,会直接进入 hk.domain.com/abc/xyz.html 去,页面的外观样式完全一样,但是接下来你就是在 hk 这个子域继续浏览了,体验很赞。

另外如果访问 domain.com 或者 www 的话,会根据 IP 地址所在地区自动跳入 cn / hk / tw。
blacktulip
2015-02-12 19:32:06 +08:00
楼主应该分开维护,非要维护一个的话,维护繁体比较靠谱

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/170488

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX