如何读取 Unicode 的文本?

2015-03-24 01:40:31 +08:00
 soratadori

用Windows的记事本创建一个编码为unicode的文本,但怎么也读不出来。如果保存成ANSI和UTF-8的话都可以读的出来。

虽然用想办法用一些其他的办法读出来了,但还是不太懂原理,为什么普通的办法读不出来?

错误代码:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence

python的代码:
file = open('unicode.txt','r+')
file = file.read() #这里试过decode/encode成utf-8 gbk 都不行

print(file)

1999 次点击
所在节点    问与答
1 条回复
yfdyh000
2015-03-24 01:49:17 +08:00
试了一下,那个选项保存的是UTF-16LE BOM。
http://stackoverflow.com/questions/22459020/python-decode-utf-16-file-with-bom

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/178923

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX