Linux shell下如何转换编码?

2013-05-19 10:52:50 +08:00
 andybest
一个600M文本文件,是gbk编码的,转为utf-8编码使用什么命令?
3120 次点击
所在节点    问与答
10 条回复
alexrezit
2013-05-19 10:56:44 +08:00
我只会一种方法: 用 vim 打开, 然后 :set fenc=utf8 然后保存, 不知道 vim 的处理方式会不会卡.
andybest
2013-05-19 10:58:11 +08:00
@alexrezit 谢谢,问题就在这里,我的vps小鸡只有128m内存,600M文件vim一开这肯定经受不住。
alexrezit
2013-05-19 11:00:47 +08:00
@andybest
vim 不是一次全加载的...
switch
2013-05-19 11:02:07 +08:00
iconv -f gbk -t utf-8 -o <output> <input>
andybest
2013-05-19 11:04:24 +08:00
@switch 谢谢!!!

顺便问下怎么检测文件编码? 我想在转换之前确定一下该文件是否为GBK.
balancezou
2013-05-19 11:05:38 +08:00
iconv
switch
2013-05-19 11:08:25 +08:00
@andybest file <filename>
andybest
2013-05-19 11:14:08 +08:00
@switch 谢谢!好用,但没法检测html文件,例如:

# file index.html
index.html.1: HTML document text

我尝试把index.html改名为c.log也不行:

# file c.log
c.log: HTML document text

怎么检测html文件编码? 再次感谢!
switch
2013-05-19 11:17:55 +08:00
用 enca <filename> 试试。
可能需要安装 enca,如果没有。
andybest
2013-05-19 11:21:18 +08:00
@switch 好用!万分感谢!解决了我的大问题了! :)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/69365

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX