情形 1 : LC_ALL="en_US.UTF-8"
>>>i=u'呵呵'
>>>i
u'\u5475\u5475'
>>>i.encode('utf-8')
'\xe5\x91\xb5\xe5\x91\xb5'
>>>type(i)
<type 'unicode'>
情形 2 : LC_ALL=C
>>> i=u'呵呵'
>>> i
u'\xe5\x91\xb5\xe5\x91\xb5' #这是什么鬼??
>>> type(i)
<type 'unicode'>
>>> i.encode('utf-8')
'\xc3\xa5\xc2\x91\xc2\xb5\xc3\xa5\xc2\x91\xc2\xb5'
唯一的区别就是 LC_ALL 了,所以谁能详细解释下这个编码与 LC_ALL 的关系呢。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.