shift_jis 如何完美转换成 utf8?

2015-02-18 16:03:49 +08:00
 a2z
用了codec.encode和codec.decode


title='無料出会いサイト調査ファイル[地域別・セックス・逆援助・SMなどの攻略情報]'
title=codecs.decode(title,charset,'replace')
title=codecs.encode(title,"utf8","replace")

無料出会いサイト調査ファイル[地域別・セックス・逆援助・SMなどの攻略情報]

至少终端里看起来片假名全变成方块……
8294 次点击
所在节点    Python
16 条回复
ehs2013
2015-02-18 16:07:28 +08:00
终端的字体很有可能不带半角片假名字体。
建议输出到文本进入专业文本编辑器中查看。
rikeinei
2015-02-18 16:07:50 +08:00
if getEncoding(resultSF) == "shift-jis":
resultSF = resultSF.decode('shift-jis').encode('utf-8')
if getEncoding(resultSF) == "euc-jp":
resultSF = resultSF.decode('euc-jp').encode('utf-8')
loading
2015-02-18 16:09:32 +08:00
@ehs2013 指了一条明路,楼主,冲吧。
rikeinei
2015-02-18 16:11:04 +08:00
@a2z 楼主做啥工作的? 这个title的内容有点......
a2z
2015-02-18 16:16:25 +08:00
@rikeinei
爬虫相关……这个title是碰巧……
rikeinei
2015-02-18 16:18:07 +08:00
@a2z 楼主,快说,报警了!风俗相关产业的从业人员?还是???
a2z
2015-02-18 16:19:52 +08:00
@rikeinei
搜索引擎相关,有些日语的title显示出来编码不对……我随便挑了一个看着眼熟的(逃
rikeinei
2015-02-18 16:20:05 +08:00
@a2z 嘿嘿,想像一下啊,边看某网站,边写代码,结果随手拷贝一段文字用来做测试,恰好是。。。
哈哈哈
a2z
2015-02-18 16:21:41 +08:00
@rikeinei
人坚不拆……
la0wei
2015-02-18 16:26:11 +08:00
@rikeinei 我觉着楼主是做国外H站的,我记得有个站可以根据番号看封面......暴露了
jamesxu
2015-02-18 16:29:55 +08:00
大年三十的还在折腾
imn1
2015-02-18 16:30:00 +08:00
终端只是字体问题,你终端使用的字体不支持半角片假字符
rikeinei
2015-02-18 16:31:13 +08:00
@la0wei 看标题应该不是你说的那个网站,你要想看,sod,dmm随便看了
orancho
2015-02-18 20:26:53 +08:00
楼主爬的是什么网站, sm圆月抛都出来了
wdlth
2015-02-19 00:12:33 +08:00
逆援助……这不是找牛郎么……
xiaotaoqi
2016-06-22 20:02:16 +08:00
数据处理,加我 QQ574632347 ,一起交流一下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/171668

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX