macOS 的搜狗输入法到底安不安全?至少从《隐私政策》来看,要比 Windows 的搜狗「克制」一些

2022-08-10 20:51:17 +08:00
 Roykira

每过一段时间就会有「月经贴」会询问 macOS 系统下什么输入法最好用,一些人或许还带着 Windows 系统的记忆老觉得搜狗全是广告,但用过搜狗的人也知道,macOS 端的搜狗确实没有广告。因为此前有朋友跟我纠结了很久要不要在 macOS 上使用搜狗输入法,其实这个东西就是个习惯问题,但既然他问到了隐私政策的问题,那我就从法律文书的角度来分析一下搜狗输入法到底收集了用户的什么隐私。

分析 Windows (以下称为 W 版)与 macOS (以下称为 M 版)系统下搜狗输入法的隐私政策。

一些前提条件

W 版与 M 版搜狗输入法在《隐私政策》上的不同

  1. W 版搜狗输入法到底会收集哪些「敏感信息」?
    1. 从 W 版的《隐私政策》来看,搜狗输入确实会收集特别多的内容,但是他并没有明确说明这些敏感信息是如何收集、计算而来的。
    2. W 版中,将个人信息及个人敏感信息定义为:个人信息包括 1 )姓名、出生日期、住址、电话、电子邮件等个人基本资料; 2 )身份证、护照、驾驶证、工作证、社保证、居住证等个人身份信息; 3 )基因、指纹、声纹、掌纹、面部识别特征等个人生物识别信息; 4 )个人信息账号、IP 地址、个人数字证书等网络身份标识信息; 4 )个人健康生理信息; 5 )职业、职位、工作单位、学历、工作经历、成绩单等个人教育工作信息; 6 )银行账号、口令、存款信息、房产信息、信贷信息、征信信息、交易和消费记录、流水记录、虚拟财产等个人财产信息; 7 )通信记录和内容、短信、彩信、电子邮件等个人通信信息; 8 )通讯录、好友列表、群列表、电子邮件地址列表等联系人信息; 9 )网络浏览记录、软件使用记录、点击记录、收藏列表等个人上网操作记录信息; 10 )硬件序列号、软件列表、设备 MAC 地址、唯一设备识别码等设备信息; 11 )定位信息、行踪轨迹、住宿信息、经纬度等个人位置信息; 12 )婚史、宗教信仰、性取向、未公开的违法犯罪记录等其他信息。
    3. 上述敏感信息是如何提供并上传的?
      1. 「用户主动提供」,在《隐私政策》中主要把它「归功」与用户使用不限于 QQ 、微信、邮箱、手机号注册等,注册并登录搜狗输入法,也就是说,基本上与实名制挂钩的信息都是在这个环节被搜狗通过「同意打钩否则就不能用软件」的方式获取到的。
      2. 「您在使用我们的产品和服务时上传的信息」,这一条就比较有趣,因为在第一章第二款的 1.2 这个部分,里面有一句并没有加粗的话,看上去很简单,但是包含了巨大的信息量:您在使用语音转写、翻译功能时选择在云端存储的待转写、待翻译及转写、翻译后的文本;其他您在使用我们产品和服务时上传的信息,以具体产品或服务的隐私政策为准。前述信息收集的目的是为对应的具体功能的实现,如您不提供相关信息的,对应功能可能无法实现。
      3. 也就是说,大家最关心的「使用输入法时键入内容被记录并上传」的隐私问题,从通篇的《隐私政策》里,我只能从这句比较模糊的不起眼的条款中看出。
  2. M 版搜狗输入法到底会收集哪些「敏感信息」?
    1. 「 M 版明确划分了可能被上传服务器的内容」:从 M 版的《隐私政策》来看,搜狗并未像 W 版的《隐私政策》对敏感信息做出了大段定义,而是拟出了一个明确的用户信息收集的清单。
    2. 基本的邮箱、电话等这些信息不用多说,如果要使用词库同步的功能,就必须要登录账号。所以我在一开始做了那个「实验」,即使用一个未与自己任何个人信息挂钩的 Gmail 注册账号并登录的方法是可行的。所以目前来讲,M 版的搜狗也能收集到的是一个 Gmail 邮箱。
    3. 根据 M 版《隐私政策》的 1.1.1 款所示:当您通过搜狗通行证登录搜狗输入法 Mac 版账号,您需要向我们提供您的用户名、邮箱或手机号以完成注册及登录。您也可以选择使用第三方账号登录,经过您的授权同意,第三方账号平台可能会向我们提供您的账户昵称、头像、OpenID 。以及如您不登录搜狗输入法 Mac 版账号,我们不会收集您的上述个人信息,但与登录相关的功能将无法使用。可以看出,M 版的用户信息收集相对要「克制」一点。
    4. 「哪些内容会被上传?」值得欣慰的是,M 版的搜狗在《清单》中明确表示:文本信息、剪切板内容、图像信息、通讯录中的姓名、手机号是不上传服务器的。
    5. 同时在《隐私政策》的 1.1.2 至 1.1.4 对上述不上传服务器的内容有具体解释:
      1. 当您使用语音输入功能时,您需要向我们提供您的语音信息,以实现语音转写的输入功能。语音输入完成后我们不会存储您的语音信息。
      2. 在您使用打字功能、剪切板功能、截图功能时,我们会在本地读取您键入、复制剪切的字符或截取的图像信息,以便完成文字和截图输入上屏的基本服务功能,请您知悉,前述您输入的内容不会上传到云端。
      3. 为了及时解决您的意见反馈、投诉或咨询本产品的相关问题,您需要向我们提供真实的联系方式,以及问题相关的证明材料(包括图片、视频或文本信息)。此外,请您知悉,系统可能会记录您与客服之间的沟通记录、处理方案及结果。如您不提供上述信息,我们可能无法核验身份、定位问题并向您及时反馈。
      4. 为了提高您输入日常联系人信息的便捷性以及输入内容的准确性,经您同意打开通讯录权限后,我们会在本地读取您的通讯录信息中的姓名、手机号,并形成本地词库,但我们不会收集和上传您的通讯录内容。
    6. 或许仍有搜狗拥有最终解释权的灰色地带。在《隐私政策》 1.2.3 款中,当您使用搜狗输入法 Mac 版产品和服务时,为了通过分析统计数据以提高产品和服务质量,推出对用户有帮助的创新功能和服务,我们可能会收集并记录您对搜狗输入法 Mac 版各项功能的使用情况,以便我们在分析数据后,提升产品和服务的使用体验。这里指的「各项功能」并没有明确写明是否是云词库、本地词库同步等功能。但按照文书内部逻辑,1.1.3 款中明确提到了不会对「键入」进行上传,1.2.3 中的功能应当不包含软件在键入时触发的云输入、联想、调频功能。
  3. 「征得同意的例外」,这是《隐私政策》中必须要出现的一部分,也拥有最高抗辩权。关于这个格式条款的讨论,我在自己的博客有写到过。这里就不再赘述。

结论

  1. 「 W 版搜狗输入法比 M 版搜狗输入法收集的用户信息可能更多」
    • 这个结论显而易见,我相信这也是很多人选择使用苹果生态其中一个原因,W 版把用户隐私的定义写得如此详细,大概也是用了一个「最大值」来涵盖自己目前和将来可能会的收集范围。
    • M 版的搜狗输入法的《搜狗输入法 Mac 个人信息收集清单》所示,M 版在用户信息的收集方面确实要克制很多,并且明确表明他们对用户键入时的相关信息并未进行上传服务器的行为。
  2. 可能你会说:「《隐私政策》不过是单方面的说法,现实是不是这样执行的不太好说」
    • 当然,包括我在内,我对国产软件的「隐私保护」并没有太多信心,我以前也在互联网公司呆过,负责过审《隐私政策》时,当然知道这些《隐私政策》其实都是一个版本的格式条款。但既然 M 版的《隐私政策》不同于 W 版,那本身也可以说明搜狗输入法在这两个操作系统的产品,确实是采用不同的隐私政策标准。
    • 既然是契约,那就拥有法律效力。如果 M 版的输入法,确实对用户键入内容时的云输入、联想、调频进行了上传行为,那《隐私政策》和《清单》本身作为的契约文书,是可以作为搜狗违约的证据。
  3. 是否推荐搜狗输入法?仍然不太推荐
    • 说实话,我仍然不推荐,就算我平时会在特定场景(比如写博客)切换到搜狗输入法进行使用,但平时大部分时间我仍然使用 macOS 自带的输入法——因为自带输入法的词库简直太拉胯了,而且 macOS 和 iOS 端的词库是不同步的!对于文字工作者,词库和词频确实是提高效率最为关键的因素之一。
      • 我的解决方案:安装搜狗输入法,但通过 Input Source Pro 设置它仅在我的博客地址下,或 notion 应用程序内使用搜狗输入法,其他地方仍继续自动切换回系统自带输入法使用。
    • 搜狗输入法至今仍未解决一个历史问题:即大量读写硬盘。轻则 100mb ,动则 50GB 以上,具体的原因由于我并不是技术出身,没办法越俎代庖进行专业分析。今天仅能从「法律」的角度来解读一下《隐私政策》本身。
    • 我也推荐 Rime ,对于爱搞机的朋友,这款输入法确实能做被调教得非常棒。但由于我作为文字工作者,需要大量的输入和词频的智能化调整,所以我确实调教不来 Rime 。虽然没用,但是还是推荐大家。
  4. 其他需要注意之点。
    • M 版的词库(包含快捷短语)、输入统计等,并无法同步至 W 版的搜狗输入法,或许能够证明键入内容部分与 W 版是不相通的。
    • 个人词库仍然可以同步并上传云端的,因为可以和 iOS 端进行同步使用。如果登录账号无法追踪到手机号,那这些词库本身是无法对应到具体身份信息的。在《隐私协议》 1.2.1 款中提到:我们不会将该等信息与您的个人身份信息进行匹配,除本政策另有明确约定外,我们也不会将您的设备信息提供给任何第三方。但「另有明确约定」其实就是「征得同意的例外」这一条最高尊则。所以词库本身,并不能说是 100%安全的。大家也知道,词库的内容本身也可以推算出一个人的性别、性向、婚史、宗教信仰等等。
      • 解决方案:不登录使用确实是一个好方法,但换电脑之后词库无法同步,跟 macOS 自带输入法是一样的「酸爽配方」。
    • 本内容仅对搜狗输入法的《隐私政策》通过法律视角进行分析,过程中并无「拉踩」「反对」「对立」等挑拨行为,也再次明确声明我不对搜狗输入法作出推荐。
5261 次点击
所在节点    macOS
29 条回复
Twnysta
2022-08-10 21:00:26 +08:00
文本信息不传,那信息的 hash 会不会传呢?
neochen13
2022-08-10 21:18:54 +08:00
MacOS 没有一个很好的输入法,痛苦
janus77
2022-08-10 21:44:19 +08:00
无所谓,windows 我用破解版
至于云词库的上传情况,这块控制不了,爱咋咋地吧
Lindp
2022-08-10 22:16:57 +08:00
Mac 的确是没有一个能打遍天下的输入法,现在也只能是原生输入法用着了,好在用的时候足够长原生输入法也可以适应习惯。
B3UzMhCd3dDvVVLa
2022-08-10 22:28:51 +08:00
我就是不登录用着搜狗的,偶尔会导出词库,换机的话再导进来
nonone
2022-08-10 22:39:07 +08:00
算了 还是自带的吧
dcsuibian
2022-08-10 22:40:42 +08:00
不登录用搜狗+1 ,搜狗有明文传输隐私数据的前科
但其它的输入法真的没有他好用
estk
2022-08-10 23:15:40 +08:00
谷歌安卓输入法也不好用
bs10081
2022-08-11 06:46:05 +08:00
結論,我用自己的 Rime 配置( 打字不會閃,詞庫養好以後,非常的順手。

https://github.com/bs10081/Rime-Cx330
dreamramon
2022-08-11 08:02:27 +08:00
搜狗会上传的,不用洗了,还是老老实实用原生的吧。。。
Leonard
2022-08-11 09:11:19 +08:00
之前公司发的 Mac 上有搜狗输入法,用了几天老提示我什么斗图功能,我又不斗图,烦死,卸载
xingyuc
2022-08-11 09:51:19 +08:00
他说不上传就不上传?火绒还经常扒他们源码……
Roykira
2022-08-11 09:59:18 +08:00
@Twnysta 这个就不是太清楚了,因为我仅仅是从《隐私政策》的条款来分析的,如果它里面没有提别提到这个概念,那说明这个本身也是他们不打算明确写入《隐私政策》的。
astkaasa
2022-08-11 10:00:38 +08:00
@bs10081 我也抄了你的配置, 不错
Roykira
2022-08-11 10:00:57 +08:00
@xingyuc 如果真的是这样,那这个明确证据可以直接拿出来认定搜狗违约了,是他们在《隐私政策》里面写明了「文本信息、剪切板内容、图像信息、通讯录中的姓名、手机号是不上传服务器的。」 Windows 版本的搜狗都没敢写这句话。
Roykira
2022-08-11 10:02:02 +08:00
@dreamramon 所以您是从那一句话看出我在洗搜狗的,还是说只要我没有明确说明「搜狗是垃圾」我就是在替它洗地?
neochen13
2022-08-11 10:51:25 +08:00
@bs10081 谢谢大佬,打字不会闪,试一下看看
warron
2022-08-11 10:51:40 +08:00
用原生了。适应了几天感觉很好
leeum
2022-08-11 11:25:29 +08:00
原生输入法最大的问题就是卡顿,不知道 12.5 会有改善么,我 12.4 有些时候依然是卡顿(原生拼音)
lB2cGz9OQ1agw7XK
2022-08-11 15:30:19 +08:00
最近从 rime 转到 QIM 了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/872014

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX