有没有办法判断一个字符串里面是否有乱码?

2015-10-20 14:56:34 +08:00
 RangerWolf
举个例子:
MyEPSON Connect⼀꺾䌄腤蠀 Adobe AIR


上面明显知道是两个 app 的名字之间出现了乱码, 但是我不知道有什么办法能检测到名字之中有乱码,如果能定位到乱码在的位置就更好了。。。

注意: app 的名字可能确实有中日韩文出现~ 甚至可能出现阿拉伯文。。。
3185 次点击
所在节点    问与答
4 条回复
yeyeye
2015-10-20 22:47:07 +08:00
乱码本身就不是“乱码”。乱码是编码错误导致从字库表里出来的字是错误的,但是那些字又不是“错字”,虽然编码错了,但是依然成功的获取到了文字,它就是正确的!

也就是说,你写信的时候写错了地址,邮递员是不可能知道的。只有当他发现到了那个地方,却找不到相对精确的人或位置时才知道错了。明白了?除非你限定范围,限定字符编码的范围(每个字符都是一个数字,定义在这种编码表里的第几个字)

否则电脑是不知道你是打错了字,还是说这是一个新的网络词语。
RangerWolf
2015-10-21 07:39:52 +08:00
@yeyeye 看来还得准备一个乱码字符表?
yeyeye
2015-10-21 08:47:31 +08:00
@RangerWolf 从你的主题来看,其中只存在一个乱码,所以只要你把乱码的范围记录下来,做检测就行了,中间有 4 个中文字已经显示出来的,是不能作为乱码范围的,因为那是正常的文字啊
RangerWolf
2015-10-21 09:26:55 +08:00
@yeyeye 乱码还有其他的样子的~ 比如: Microsoft Visual C++ 2013 Redistributable (x86) - 12.0.30501㵊恽ᬰ耀 c:\Program Files\Common Files\Micros Microsoft Corporation

乱码以及后面的内容都是无效的~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/229539

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX