iOS 下,如何解析接口传回的 emoji 表情??

2017-09-22 09:23:41 +08:00
 q409195961

问题是这样的,在请求中发送 emoji 表情到接口,无论是直接发还是转码成 Unicode 再发,接口返回的就变成"������",导致解析不了

网络请求返回的 NSData,转 NSDict 报错“ Code=3840 Unable to convert data to string around character 481.”,转 NSString(UTF8)返回也 nil。

然后让后端把 MySQL 的编码 utf8mb4,还是不行

关键是安卓能显示,iOS 显示不了,直接走网络错误,然后后端就不配合了,让我们自己想办法解决

3908 次点击
所在节点    iOS
17 条回复
laoyur
2017-09-22 09:38:21 +08:00
接口返回就已经是\ufffd 了,那果断服务端的锅啊,你返回一个「 replacement character 」(就是上面的�),居然还指望客户端能显示出 emoji 来?
q409195961
2017-09-22 09:43:49 +08:00
@laoyur 但安卓特么就显示出来了,感觉好奇怪
laoyur
2017-09-22 10:16:29 +08:00
光看你这个截图,貌似返回的 json 里面,混杂了 utf32 和 utf8 两种编码?
抓包把返回的数据扔上来才能下定论,包括 content-type 啥的所有 headers
b821025551b
2017-09-22 10:24:36 +08:00
半年前踩过这个坑,接口不能转义 unicode 字符,iOS 那边不干。
但是你这个接口的截图,是\ufffd 啊,本身就是无效 emoji,怎么显示?
还是抓包看看 android 和你的接口原始数据有什么不同吧。
q409195961
2017-09-22 10:32:54 +08:00
@laoyur
这个 Charles 抓的报文,Postman 发的请求
https://i.loli.net/2017/09/22/59c476297f15e.png
laoyur
2017-09-22 10:38:13 +08:00
切换到 Hex 显示,发截图来看看,怀疑 commentContext 传的字符串并不是有效的 utf8 编码
q409195961
2017-09-22 10:41:01 +08:00
laoyur
2017-09-22 10:41:38 +08:00
看上面截图,�一共显示了 6 个,然后看此帖,\ufffd 一共 18 个,那不就是把「\ufffd\ufffd\ufffd 」当做一个 utf8 字符了嘛
传过来的数据错了,并不是 utf8 编码,服务端的锅
vmebeh
2017-09-22 10:53:03 +08:00
试了一下 hex,是“😒😒😒”

\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92
laoyur
2017-09-22 11:04:26 +08:00
Hex 看上去是有效的 utf8 码流
@vmebeh \xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92 这段当做 utf8 来解析的话,对应上面 三个 emoji 字符?不对吧,怎么解的呢
laoyur
2017-09-22 11:12:06 +08:00
>>> a = b'\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92'
>>> print a.decode('utf-8')
😒😒😒

的确是这三个笑脸,不过我还是没懂怎么会解析成这么三个字符,求高人指点
vmebeh
2017-09-22 11:15:24 +08:00
@laoyur

#coding: utf-8

from Tkinter import Tk
r = Tk()
r.withdraw()
r.clipboard_clear()
r.clipboard_append('\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92\xed\xa0\xbd\xed\xb8\x92'.decode('utf-8'))
r.update()
r.destroy()

python2,搜的复制代码……
q409195961
2017-09-22 11:25:16 +08:00
@laoyur
>>> a = b'\xf0\x9f\x98\x92\xf0\x9f\x98\x92\xf0\x9f\x98\x92'
>>> print a.decode('utf-8')
😒😒😒


\xf0\x9f\x98\x92\xf0\x9f\x98\x92\xf0\x9f\x98\x92
才能解析出来吧
laoyur
2017-09-22 11:47:44 +08:00
laoyur
2017-09-22 14:01:04 +08:00
minbaby
2017-09-23 22:46:30 +08:00
```
<?php

$a = ['key' => '😄 👹'];

$b = json_encode($a);

$c = json_decode('{"key":"\ud83d\ude04 \ud83d\udc79"}');

var_dump($a, $b, $c);
```



```
[Running] php "/tmp/a.php"
array(1) {
["key"]=>
string(18) "😄 👹"
}
string(44) "{"key":"\ud83d\ude04 \ud83d\udc79"}"
object(stdClass)#1 (1) {
["key"]=>
string(18) "😄 👹"
}
```

这种问题之前数据库编码没整对会有问题,编码问题好了就没问题了。看返回的确是有问题,正常的应该是一个 emoji 对应两个 \u 也就是 utf8
minbaby
2017-09-23 22:48:31 +08:00
@minbaby @q409195961 只需要用正确的 json 用 oc 解析一下就好了,看看是 oc 解析问题还是返回数据问题。这是需要先确认的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/392721

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX