Python 求助

2020-11-05 21:59:19 +08:00
 leeguo

事情原本比较简单, 我想把 json 存入数据库, 结果我用 python json.dumps()把数据转为 json, 自动转成了 unicode 字符串, 我也没在意, 不过存入了数据库, unicode 的反斜杠不见了,取出来也没有, 被 mysql 的 json 坑惨了, 只有一个 uxxxx, 而不是\uxxxx , 里边夹杂了没有转成 unicode 字符串的 比如英文数字之类的, 我该怎么正常为中文呢, 之前替换, 老式出现错误. 现在字符串全是这种. 大佬们, 我该怎么办呢. eg: u9ad8u9e97u5c4bu4e09u4ee3u8972u540d u516bu4ee3u76ee u5e02u5dddu67d3u4e94u90ce u5bc6u77403650u65e5 u8bf7u4ee5u4f60u7684u540du5b57u547cu5524u6211

2344 次点击
所在节点    Python
19 条回复
ipwx
2020-11-05 22:01:23 +08:00
我猜你存进数据库的时候,既没有用 ORM 也没有用 prepared statement 。。。
l4ever
2020-11-05 22:03:15 +08:00
pymysql.escape_string()
leeguo
2020-11-05 22:03:15 +08:00
@ipwx 没有, 图简单, 当时一时直接用的 pymysql...
GodFastion
2020-11-05 22:03:33 +08:00
for 遍历一下,每个 u 前面加个斜杠🤓
leeguo
2020-11-05 22:13:17 +08:00
@GodFastion 不行额, 之前我是替换的, 总会出一些错... 我都疯了....
ferock
2020-11-05 22:23:45 +08:00
不要转 unicode 不就行了
leeguo
2020-11-05 22:25:33 +08:00
@ferock 问题是我, 已经弄了几十万的数据了, 现在已经晚了. 只有想办法把反斜杠加上去....
leeguo
2020-11-05 22:28:58 +08:00
我能转成功一部分, 但是一起转成汉字重会出错一些....
ungrown
2020-11-05 22:47:04 +08:00
@leeguo #8
出错的例子给一下
包括数据库里带 u 的字符串、预期的原字符串、报错
imn1
2020-11-05 22:57:14 +08:00
还不如再转一次,update
想清转 json 楚留不留汉字,或者入库用什么 sql 语句
lxilu
2020-11-05 23:23:13 +08:00
u[a-f0-9]{4}不行?
leeguo
2020-11-06 00:49:38 +08:00
谢谢各位了, 我找到问题所在了, 弄好了 unicode, 在转回去, 可能不是我转 json 的问题, 而是转了 json, 然后再次存储过程中, 有几条数据 json 数据, 无法存储, 具体问题不知道, 但错误率可能在 1/1000 一下, 但数据比较多, 所以弄了很多次以喜爱在就错误了, 谢谢各位了, 这么晚了, 先休息吧, 我明 er 看看为什么那几条 json 存不进去....
HuberyPang
2020-11-06 09:27:15 +08:00
这个我遇到过,就是转义的问题。数据存入 MySQL 时,\会被转义为空。json.dumps(, ensure_ascii=False)就行了
leeguo
2020-11-06 10:14:43 +08:00
@HuberyPang 是的,我之前没注意, 存了几十万数据之后才发现.....
ungrown
2020-11-06 10:18:59 +08:00
@leeguo #14 MySQL 我不熟,如果不支持 Unicode 字符串的话,可以考虑 base64
ipwx
2020-11-06 10:59:07 +08:00
@ungrown 用 prepared statement + 参数绑定,手拼字符串会出问题很正常。如果一定要手拼,2L 已经给出答案了,escape_string() ...

楼主你对二楼的正确答案都无视了好不好。。。
ipwx
2020-11-06 11:00:03 +08:00
@ungrown 这根本不是 MySQL 是不是支持 unicode 字符串,感觉是楼主可能不懂 escape 是咋回事。。还有就是 unicode & utf-8 这两者楼主也需要了解一下,mysql 默认以 utf-8 存储字符串。
leeguo
2020-11-06 11:43:02 +08:00
@ipwx @-@... 我看了一下, 没看动,就找其他方法了, 谢谢了, 我在看看...
no1xsyzy
2020-11-06 11:44:40 +08:00
想象它是一个 LL(4) 的编程语言写个解释器吧,然后全部重新 update 过一遍

方便还是 ORM 方便,主要是,有对数据库的防御性编程思想在的话,手写 SQL 总是思前想后,对比起来 ORM 是真的方便

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/722180

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX