有一些奇奇怪怪的字符,显示就是白框 比如字符串(注意 a 、b 、c 后面都跟了一个东西,v 站可能显示不出来):a b c 在 sublime 里面显示 a<0x01>b<0x01>c<0x02> hex 显示 6101 6201 6302 拷贝到 idea 字符串就是 String s = "a\u0001b\u0001c\u0002"
去询问了用户,用户也只是在 word 上或者网页上拷贝一段文字,不是恶意行为。 想要去掉这些奇奇怪怪的东西...
@CEBBCAT 连接是 How To Remove a Character from a String in Java ,不是 how to remove non-utf8 character from a string in java 替换这些编码找不到的字符...我只是举个列子 0x01 与 0x02 。还有很多这种乱七八糟的东西...