[日经] 那些所谓的 AI 音箱真的不偷听吗?

2020-12-13 14:13:14 +08:00
 zsyld

我整了个华为的,

买时就只是想着当做简单的蓝牙音箱用,

那个所谓的“AI”就是智障一样的语音识别,

而且让我不爽的是刚买回来设置 wifi 时必须用它那个 app,app 必须登录绑定手机号。

今天上午我跟老婆说了下等会去理发,

几分钟后就收到某点评的送了个理发优惠券的短信

瞬间感觉好恶心

理发这事情没在任何 app 上说过,就是起床后梳头临时起意的

我直接路由器里禁止它联网了,

想问下这个能抓包吗?想知道它发送了啥东西,路由器统计的数据包,这智障玩意每天几 M 的流量

8274 次点击
所在节点    硬件
83 条回复
yuuko
2020-12-14 10:14:19 +08:00
@FlyingShark 看了连接,和我说的没关系吧?而且我自己手机的相机都没打开过,用的是老太太的手机拍摄
Nuttertoo1s
2020-12-14 10:15:49 +08:00
说句不好听的,你有什么价值让别人付出高昂的成本监听你,就为了送你几张优惠券,还是说为了给你发几条推送?
ylsc633
2020-12-14 10:16:49 +08:00
1. 智能音箱肯定会有收集, 不然怎么识别到 关键词的. 肯定先听,再解析, 发现是关键词, 触发对话
2. 收集后 会不会上传,是实时上传还是到一定规律后上传 那就不一定了... 这个得看厂家的想法和做法了
huayumo
2020-12-14 10:32:53 +08:00
肯定会收集,这些语音数据可以拿来训练模型,至于干其他的事情,那就不知道算法跟不跟得上
mosfet
2020-12-14 10:40:54 +08:00
之前不是有新闻,siri 未经用户同意上传录音信息
我是不敢相信国内厂家的节操的
像米家官方网关长期缺货,可能是为了推小爱同学(带网关功能)。干脆买了绿米兼容的
RoyceLee
2020-12-14 10:48:17 +08:00
这个就太武断了,手机好像可能性更大哟。
lumotian
2020-12-14 11:03:51 +08:00
哈哈 有时候起心动念也能猜到呢。 心念一起 震动十方 这可能叫吸引力法则
sgissb1
2020-12-14 11:08:58 +08:00
偷不偷听不知道,但如果不实时或接近实时开着麦的话,怎么知道你在唤醒它
stfu
2020-12-14 11:22:19 +08:00
@sgissb1 启动就接收音频,但不上传保存,直到获取到唤醒热词才启动联网,否则家家户户都实时接收上传的话,这成本太大了吧,小小平民不值得。
leafre
2020-12-14 11:24:35 +08:00
必须偷听,只是不能说出来
x86
2020-12-14 11:25:56 +08:00
@Removable #57
之前园区停了辆奔驰 S63,我和同事聊到改装车巴博斯,隔天淘宝就有几个巴博萨改装的商品信息,问题是那天没带手机,我也不开奔驰
konchu
2020-12-14 11:27:16 +08:00
也許你會反問:難道 Dropbox 就不監控你的隱私了嗎?

我當然知道 Dropbox 也在盯著我的數據,換言之,當我選擇把數據上傳某個服務器時就已經宣佈放棄自己對於這些數據的隱私權了。討論「把文件存放在百度雲還是放在 Dropbox 更可靠」,看上去就像是在討論「脫光了衣服之後應該給國人看還是洋人看,才能讓被看到的私密部分少一點」。但兩者的不同之處在於,同樣都是赤身露體,Dropbox 至少能做到只用眼睛看而不上手摸,而百度雲卻有權力因為我身體上的某個器官長得「不符合國家有關規定」就把我大卸八塊。相較之下,我更願意選擇前者。

www.nicktalk.com/talk/zeriersi
marcong95
2020-12-14 11:36:40 +08:00
@katana97 #47 这是凌晨 1 点钟上传了 500+M 的数据?这就有点意思了,要是能知道内容就好了
dnL
2020-12-14 12:00:30 +08:00
我在路由器后台发现小米的空调伴侣每天上午都在访问百度的一款理财产品的接口,我直接把它扔了,再也不用小米的物联网产品了
namelosw
2020-12-14 12:12:23 +08:00
反正 Alexa 会听,之前人们以为只会有程序听,后来爆出来其实是有真人听的…

别的厂商听不听我不知道,但是站在别的厂商的角度来讲,不听怎么优化+竞争?

类似的产品我一概不用.
matrix67
2020-12-14 12:28:24 +08:00
路由器上肯定是可以抓包的。

这个问题可以简化为,唤醒词是本地的解析的还是云端解析的,如果是本机的话就没道理一直穿数据到云端。

可以做一个实验,等人都出去了,就开一个音箱放在客厅里面抓包,作为基准,再来一次开着广播作为对比。
raptor
2020-12-14 13:09:04 +08:00
@luckyrayyy 这就是著名的孕妇效应:没怀孕的时候没注意身边的孕妇,一怀孕发现身边好多孕妇。
phpcxy
2020-12-14 13:18:36 +08:00
等等,大数据真的这么厉害吗?
VZXXBACQ
2020-12-14 13:52:59 +08:00
做语音的说一下吧,肯定是在监听的,但是关键词检测是本地做还是云端做我就不知道了,我没买过,可以查查自己的路由器看看是不是有一直有上传,但是我估计不是,这样占的上传太大,关键词大概率在本地做。

后面的语音识别和自然语言处理部分,有更大概率是上云端的,因为计算资源消耗更大。

你的语音数据,不管哪个公司,无论是苹果也好小米也好,是一定,一定会保存的,这些数据的价值太大了。
amwyyyy
2020-12-15 09:44:55 +08:00
我不信它能听懂我的家乡话

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/734962

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX