分享一个今天踩得 MySQL 编码坑

2020-04-13 21:11:41 +08:00
 whoami9894

有这样三张表,三张表主键都是 stu_num:

起因是发现返回 apply 记录的 JSON 接口有一个用户字段重复了,该接口查询是:

SELECT ... FROM apply a LEFT JOIN info i ON a.stu_num=i.stu_num

排查后发现 apply 中多了一个全角stu_num的记录,1111,unicode \uFF11。但插入 apply 表的stu_num是从 session 中取的,session 是在登录时设置的,登录验证逻辑:

uname, pwd = request.post_form.get();
if (hash(pwd) == sql_exec('SELECT pwd FROM auth WHERE uname=?', uname))
    session.set('uname', uname);

最后结合 log 发现是用户登录时提交了全角的数字 id,而由于auth表的字符集,uname='1111'时将uname='1111'的记录 SELECT 出来了,然后将全角字符设置进了 session 里,在 apply 时被插入了 apply 中

其实挺好奇用户用的什么浏览器 or 输入法会输入全角的数字


插曲

debug 过程中发现了一些以前没有注意到的,关于 MySQL COLLATE

排查时执行SELECT count(*) FROM apply WHERE stu_num='1111';只返回了一条记录

而 bug 成因是SELECT pwd FROM auth WHERE uname='1111'返回了stu_num=1111的记录。测试后是因为字符集 COLLATE 导致的,utf8mb4 存在将全角转换为半角的性质,而 utf8 的utf8_general_ci却没有这种性质

且查询 apply 的接口之所以 SELECT 出了两条记录,是因为 JOIN 操作 ON 判断的两张表中有一张表的字符集有转换全角的性质,修改 info 表字符集为 utf8 后再 join apply 表则只能 SELECT 出1111一条记录了

958 次点击
所在节点    分享发现
3 条回复
Vegetable
2020-04-13 21:14:46 +08:00
什么输入法都有可能
不小心按到快捷键太正常了12345
Vegetable
2020-04-13 21:15:05 +08:00
微软shift+space
whoami9894
2020-04-13 21:18:02 +08:00
@Vegetable
确实。我原来一直以为输入法只有特殊字符会输入全角

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/662096

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX