V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
janus77
V2EX  ›  信息安全

语音助手这个东西真的会监听谈话并且上传,从而泄漏隐私吗?

  •  1
     
  •   janus77 · 2024-04-27 18:52:57 +08:00 · 5203 次点击
    这是一个创建于 386 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如题,此处所说的语音助手指的是天猫精灵、siri 以及国产智能手机的类 siri 的功能和程序,此外新能源车上也出现了这些程序和产品。
    众所周知他们是靠关键字唤醒的,原理我不太清楚,但是应该是会有一个服务在后台一直监听人的说话并匹配命中关键字吧,那么如果是始终在监听的话,那么捕捉下的音频内容会不会被识别并上传呢?上传以后会不会并用来做别的用途呢?注意这是两个问题,我知道有端智能这种东西,但我不是相关从业者所以无法确定,而且各家的做法可能也不尽相同。
    49 条回复    2024-05-01 17:29:36 +08:00
    wangkun025
        1
    wangkun025  
       2024-04-27 19:02:29 +08:00
    如果你是程序员,如果上传这些数据能卖钱,你会怎么做
    estk
        2
    estk  
       2024-04-27 19:06:23 +08:00 via iPhone
    我床头放天猫精灵,睡前手机外放听王爱国油管,几年了貌似还好
    estk
        3
    estk  
       2024-04-27 19:07:21 +08:00 via iPhone
    如果有证据表明天猫精灵会转换所有语音成文本上报,我就把它扔了
    Eatandsleep
        4
    Eatandsleep  
       2024-04-27 19:21:19 +08:00
    大厂应该不至于,主要是可能会被黑,现在很多智能硬件的安全性都不大高。。。
    renmu
        5
    renmu  
       2024-04-27 19:25:33 +08:00 via Android
    不会一直监听并处理,应该是命中关键词之后再对后续进行处理,抓包可以查吧
    gaobh
        6
    gaobh  
       2024-04-27 19:26:35 +08:00 via iPhone
    看注册时候的隐私政策就行了,大部分都会上传分析
    bytesfold
        7
    bytesfold  
       2024-04-27 19:36:30 +08:00 via iPhone
    会的,还会被上传标注
    shyangs
        8
    shyangs  
       2024-04-27 20:04:57 +08:00
    如果上傳這些資料能賣錢,資本家會這樣設計.

    設計喚醒音關鍵字「想買」,用一個服務在後台一直監聽人的說話並匹配命中關鍵字.

    (「天貓精靈」「小愛同學」 距離春節還有多久) -> (老婆我和你說,我「想買」小米 SU7)

    喚醒音「想買」,喚醒手機,記錄「想買」之後的數個音,上傳這幾個音的流量不到幾 KB ,例如「小米 SU7 」,然後就推送小米 SU7 廣告給你. 賣一台米 SU7 要 20 萬人民幣呢.
    frankilla
        9
    frankilla  
       2024-04-27 20:10:29 +08:00
    你说它 100%有或者没有我觉得都不可能,多少应该都有。个人想法。
    bojue
        10
    bojue  
       2024-04-27 20:12:18 +08:00
    15 年人工智能正火热的时候,听说一小时语音包 4000 块
    andrew2558
        11
    andrew2558  
       2024-04-27 20:15:22 +08:00
    骑那种山地自行车,就抱怨了几句这个坐垫太小,屁股疼,晚上打开 jd ,首页有推荐加宽坐垫的广告,没有在手机任何地方有输入过相关内容。
    NoOneNoBody
        12
    NoOneNoBody  
       2024-04-27 20:20:27 +08:00
    上传和泄漏是两个步骤,可以看作是两件事,也可以看作是一件事的前因后果
    上传是几乎肯定的,就算不用做分析,也会用于适应你的语气和说话的情感
    泄漏,就看是主观故意还是无心之失了,不过无论哪种,前者都是不会承认的
    wxf666
        13
    wxf666  
       2024-04-27 20:33:36 +08:00
    把设备晾在那一天,看看语音助手耗多少电、用多少流量,不就心中有数了嘛。。
    snw
        14
    snw  
       2024-04-27 20:33:47 +08:00 via Android
    从合规的角度说,上传数据的要求远比下载数据严格。所以如果是我的话,我会设计成:
    从服务器预先下载全部热门产品分类的广告资源(少量图片和大量链接),并设置相应分类的唤醒词,一旦命中这些唤醒词就从预下载的本地资源中显示相应的广告;如果用户往下翻动,那么按链接列表继续从服务器加载图片等资源;如果用户点进去看,那么从服务器更新该类别更多相关推荐。
    WDFWL
        15
    WDFWL  
       2024-04-27 20:47:13 +08:00 via Android
    之前看有的输入法都会把你所有输入的东西上传,不知道有没有人抓包验证一下语音助手
    way2create
        16
    way2create  
       2024-04-27 22:58:24 +08:00
    我床头放了小爱 我是懒得关了 做坏事的时候都开着
    littlecreek
        17
    littlecreek  
       2024-04-28 01:26:24 +08:00
    应该没有小厂在做这个? 不要买小厂的.

    大厂的东西, 应该不至于官方开后门监听你, 成本+风险-->收益 划不来. 不过会不会中间被里应外合串通倒卖, 只有天知道, 只能说可能性较小

    但是有一个可能, 就是你被有关部门盯上, 然后他们想监听你, 这种肯定是能的, 而且大厂会毫不犹豫的配合
    catamaran
        18
    catamaran  
       2024-04-28 01:46:05 +08:00
    应该不会,这个如果有的话,弄个代理,分析一下很容易被发现。
    ZOUHUGO
        19
    ZOUHUGO  
       2024-04-28 02:21:20 +08:00 via Android
    @renmu 个人认为这个是目前最合理的猜测。包括手机监听对话精准推送谈论内容相关广告
    shijingshijing
        20
    shijingshijing  
       2024-04-28 02:49:20 +08:00   ❤️ 2
    高通手机芯片的关键词唤醒从 Snapdragon 835 开始就提供硬件级的支持,后面越来越强大:

    https://www.qualcomm.com/products/features/voice-assist

    835 的语音唤醒功能待机状态功耗极低:Low power voice activation: 0.65 mA

    到了 855 ,除了支持简单地唤醒,Hexagon 引擎还有更厉害的功能:
    Hexagon Voice Assistant accelerator supports two wake words simultaneously (Google Assistant, Amazon Alexa, Baidu, Cortana)

    Aqstic offers a hardware-based voice assistant accelerator for always-on echo cancellation and noise suppression, plus up to 4 mic far-field mic support for better voice recognition in tough conditions

    此外配合 Secure Processing Unit 还能实现 Biometric Authentication (Voice),用于声音解锁,声纹识别甚至可以用于支付
    shijingshijing
        21
    shijingshijing  
       2024-04-28 02:53:26 +08:00
    @shijingshijing 上面的 feature 全部是在手机本地硬件实现的,不需要软件和网络的参与,如果配合操作系统和应用程序,实现更复杂的功能轻而易举,所以你说监听可不可能,我觉得不是可不可能的问题,是泄漏信息多和少的问题,泄漏给了多少个相关方的问题。

    建议联系下面这篇文章来看:
    https://www.secrss.com/articles/54476
    dawn009
        22
    dawn009  
       2024-04-28 07:02:39 +08:00
    只要技术上可行,就当它会。
    ttyhtg
        23
    ttyhtg  
       2024-04-28 08:54:48 +08:00 via Android
    识别是肯定的,上传的话也是有可能的
    dfkjgklfdjg
        24
    dfkjgklfdjg  
       2024-04-28 09:07:46 +08:00
    昨天参加活动和别人坐着闲聊,友 B 问友 C 来上海有没有去迪士尼玩,C 说没有来及的,马上就得坐飞机回北京。
    友 B 顺着话茬就说他一直想去环球影城但是没有机会。友 C 就说他就住在环球影城附近,Balabalabala…

    晚上我回浙江的时候微信就给我推送环球影城的广告了🙄🙄🙄反正是蛮“凑巧”的。
    layman3612
        25
    layman3612  
       2024-04-28 09:10:06 +08:00
    语音都是小事, 输入法收集的更多, 微信聊完 京东酒推荐
    ljn95869
        26
    ljn95869  
       2024-04-28 09:12:14 +08:00 via Android
    想想你说句小爱同学,马上就有回应,我在,这就是关键词监听,你说个其它的词比如吹风机,马上把这词加入你手机广告 id 的画像词,下次有相关广告商投广告,自动识别投送
    gerefoxing
        27
    gerefoxing  
       2024-04-28 09:16:58 +08:00
    输入法更可怕,收集的更多
    GotKiCry
        28
    GotKiCry  
       2024-04-28 09:24:19 +08:00
    目前还没有实锤,也没有一个精准的实验,大家都是靠猜测脑补
    kneo
        29
    kneo  
       2024-04-28 09:30:47 +08:00
    @wangkun025 “如果你是程序员,如果上传这些数据能卖钱,你会怎么做”——给这灵魂拷问啥呢,你想说如果你是程序员你就会把用户卖了?我没误解你吧?
    gpt5
        30
    gpt5  
       2024-04-28 09:34:43 +08:00
    那得看是哪家的语音助手了,
    siri 肯定绝对一定不会,
    国产那可就不好说了。
    oathamster
        31
    oathamster  
       2024-04-28 09:38:04 +08:00
    有利润,就百分百会
    0576coder
        32
    0576coder  
       2024-04-28 10:12:26 +08:00
    我感觉 siri 应该不会,但是其实很多时候你语音讲过的东西,很可能文字也输入过给别人

    在昨天刚跟朋友说过在职研究生这个事,B 站就有类似的推荐,然后我仔细翻了下,原来我在微信聊天里也输入过此内容,真的很恶心现在。

    各大软件都像个监控软件了
    ScepterZ
        33
    ScepterZ  
       2024-04-28 10:19:02 +08:00
    唤醒是本地的,唤醒之后的内容才会上传
    GBdG6clg2Jy17ua5
        34
    GBdG6clg2Jy17ua5  
       2024-04-28 10:24:37 +08:00
    为啥有人会觉得 siri 不会的呢?凌镜门事件忘了吗?
    默认情况可能不会,但是专门部门想监听你,你看苹果帮不帮忙
    mscsky
        35
    mscsky  
       2024-04-28 10:24:48 +08:00
    本地分析,做成表后上传,又不是直接上传原始音频文件
    JIAOSHOUV578
        36
    JIAOSHOUV578  
       2024-04-28 10:27:25 +08:00
    这就和,杀毒软件不敢在游戏时弹窗,高德地图不接入超速系统一样,谁还敢用啊
    v8p
        37
    v8p  
       2024-04-28 10:34:10 +08:00
    抛开隐私问题,智能音箱是真的挺方便的。那么问题来了,有没有什么开源的解决方案?
    evan9527
        38
    evan9527  
       2024-04-28 10:38:02 +08:00
    会收集,会上传,但是又怎么样呢??
    coffeesun
        39
    coffeesun  
       2024-04-28 10:43:32 +08:00 via Android   ❤️ 1
    @estk 你是真大胆,我手机用 lineageos ,车里听 youtube 时都把手机的麦克风直接关闭的,所有应用包括电话都不能用,来电话时会提醒开启麦克风
    xiaoguai945yeah
        40
    xiaoguai945yeah  
       2024-04-28 13:37:00 +08:00
    @coffeesun 兄弟你这也太谨慎了……这么说吧,做同样动作的人多了去了,自己在家里听完全没触犯任何法律法规。语音助手要是这么干,早就被会抓包的兄弟们发现了。之前那个 tv 版 app 偷用户上传带宽的事情就是这样被发现的。
    SmithJohn
        41
    SmithJohn  
       2024-04-28 14:04:20 +08:00
    @xiaoguai945yeah 在卡巴斯基爆出 PDD 后门之前,你所说的会抓包的兄弟没有给出任何有建设性的意见供网友参考.
    Jame00001
        42
    Jame00001  
       2024-04-28 14:10:01 +08:00
    什么阿猫阿狗做个网站都强制手机号登录,个人信息可值钱了。不然东南亚那几个集团军是怎么养活的。
    Jame00001
        43
    Jame00001  
       2024-04-28 14:12:20 +08:00
    @WDFWL 语音助手是手机开发厂商内置的,他完全可以先加密存在本地伺机混淆在其他请求中发出去。这也不难做到。
    Jame00001
        44
    Jame00001  
       2024-04-28 14:18:51 +08:00
    @littlecreek 它不需要全存到服务器,只需要获取他想要的部分上传。退一步讲,语音助手将其转为文字再上传,几乎是不费成本的,然后通过你的唯一身份不停的塑造你的“个人画像”。这个词你应该听过吧。
    gdfsjunjun
        45
    gdfsjunjun  
       2024-04-28 17:19:11 +08:00
    你直接看流量不就好了,如果持续监听,那上行应该是一直占用,而且流量也很大。
    wangkun025
        46
    wangkun025  
       2024-04-28 18:50:59 +08:00
    @kneo 是的。你没误解我。不然为什么语音服务要免费提供呢。
    xiaoguai945yeah
        47
    xiaoguai945yeah  
       2024-04-29 21:10:10 +08:00
    @SmithJohn 两回事。而且「此前谷歌将其从其安卓应用商店中下架」( https://www.v2ex.com/t/927716 )。另外,听 YouTube 的音频数据也一点不值钱吧,商业公司拿到也没有任何动力去传递:既不能商业变现,又不能交给政府(除非你真的在听分裂国家的、恐怖组织的具体计划这些)……如果开采石油的成本超过了石油能提供的能量,就会停止开采。类似地,从翻墙的网友里抓恐怖组织、分裂分子这个做法,投入的成本(包括存储、带宽、算力、甚至警力等)远超抓到恐怖组织分裂分子的收益(抓到一个坏分子的几率*他能造成的损失),所以根本不会这么做。
    SmithJohn
        48
    SmithJohn  
       2024-04-29 22:06:44 +08:00
    @xiaoguai945yeah 我只是在说你所说的会抓包的兄弟不会提醒你这一点.
    你在说什么?

    还有,你为什么会认为他们在乎成本和收益?
    xiaoguai945yeah
        49
    xiaoguai945yeah  
       2024-05-01 17:29:36 +08:00 via Android
    @SmithJohn 噢噢,原来你说的点我没 get ,现在我明白了。

    之前我在说的是 pdd 后门提权,和偷听数据上传是两回事,会抓包的兄弟和能查出后门的商业公司是两拨人。我相信只要有公司做坏事,就会有好人站出来提醒,或者更扩大的表述,我相信做了事情必会留下痕迹(洛卡德交换原则)

    我认为不管是谁都会在乎成本和收益,非要问为什么,我只能回答因为我相信理性广泛存在于智慧生物,相信自然选择会淘汰掉不理性的、不在乎成本收益、坚持做不可持续的事情的生物。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2597 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 11:38 · PVG 19:38 · LAX 04:38 · JFK 07:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.