抖音推荐的都是未曾看过的视频,是服务器会维护一个我已经看过的记录吗?

9 天前
 pdog18

像抖音这种,推荐的都是我未看过的视频,通常的做法是服务器会维护一个我已经看过的记录吗? 如果我看过 1 万个视频,那不是一个账号要关联 10000 个记录。还是其实有更简单的做法呢?

4106 次点击
所在节点    问与答
30 条回复
klo424
9 天前
历史记录是肯定存在的,抖音推荐算法我就不懂了。
cherbium
9 天前
啊、抖音一直都保留你的查看记录啊
kenneth104
9 天前
现在有向量数据库,用这个应该可以达到类似效果
feikaras
9 天前
你猜抖音有多少条视频,就算不维护你也刷不到一样的。维护甚至可以走客户端本地。
mumbler
9 天前
抖音给每个人维护了一个超过 3000 个参数的模型,根据记录不断训练这个模型,记录列表是模型的一部分
falcon05
9 天前
这不是理所当然的吗
coefuqin
9 天前
在你本地客户端走 KNN ,记录也在你本地,以现在手机的算力,类似余 sqlite 的轻量关系型数据库,随便存。
CKR
9 天前
有小概率刷到重复的视频,(也可能是之前缓存的视频)你用多个设备的时候就会发现有时候会给你推送重复的视频。
例如一个视频你在手机上刷过了,过几个小时换 ipad 打开抖音有可能会再次刷到这个视频。
Foxkeh
9 天前
B 站经常刷到看过的[手动笑哭]
summerwar
9 天前
本地存下你的观看记录,你开始看一个视频时,后台加载下一个,与记录比对,看过了秒切第三个,你根本感觉不到
june4
9 天前
在知乎推荐页面会刷到以前看过的,甚至评论过的条目,可能知乎列表有个上限
loli
9 天前
youtube 推荐看过的比没看过的还多.无语了
go522000
9 天前
可以用你手机本地资源去计算。
远程在你刷视频的时候,会提前加载后面 5 个视频列表过来,当推荐过来的列表中有 1 个或 2 个与你本地最近 1000 条比较后相同,就直接跳过,不影响,这样远程服务器需要计算你的爱好就可以,不需要去计算你的浏览记录。
tetora
9 天前
还是不够人性化,经常给我推看过的(换两个人再演一遍同样的剧情)
Dk2014
9 天前
@Foxkeh 批里批里是真的菜,电脑看过手机还推
同一类视频点过一次就疯狂推,点不喜欢还在推
现在很多标题党封面党骗你点击,想看点标题封面和内容有关联的视频都不好找
NoOneNoBody
9 天前
抖音怎么做不知道,但我做的话 ——
最简单的话就存存 10000 个整数 id 就够了,并不是什么难事
实际上存的要更详细,不仅存你看了什么(what),还会存时间(when),设备和 ip(where),通过什么方式到达该视频,观看时长、是否评论、点赞……(how),who 就是帐号,why 就是推荐算法的缓存
复杂度 how 权重最大,how 细分项目越多,画像越容易推算

不然老是听说上亿数据量怎么来的?
Kakarrot
9 天前
我更想让抖音不要推送"已浏览过内容相似 80%+"的视频...

如果能不推送"AI 自动配音/生成"的最好了
lixiaobai913
9 天前
苹果和安卓双持就知道了,同一个账号不同的时间会刷到同一个视频
loveumozart
9 天前
你得找 data 部门的 gofeed 算法工程师给你讲解,我猜这不是服务器工程师该解决的问题
Yuan2One
9 天前
bitmap 布隆过滤器,面试老问,就是不知道是不是真的这么算的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1099234

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX