这样解决 Hash 冲突可好?

2018-04-25 15:14:28 +08:00
 SummerWQM

当前需要做推荐系统 其中需要收集用户画像 未登录用户准备通过打标签的方式来标记

实现方式是向用户浏览器存储 hash 值 为了防止 hash 冲突 这边准备用后台单进程程序 预先生成 hash 值

来分发 而不是实时产生 来避免高并发 或者 恶意攻击带来的 hash 冲突问题 不知道有经验的伙伴儿 一般怎么做?

1581 次点击
所在节点    问与答
4 条回复
dullwit
2018-04-25 15:25:43 +08:00
虽然不知道你在说什么,但是可以参考 HashMap 与 ConcurrentHashMap。简单看了一下,采用的方式为 CHM 或者 CAS
ipwx
2018-04-25 15:29:26 +08:00
hash 里面加时间戳、数据中心(机器) ID、随机数,以及同一个时间 slot 的自增序号。

可以参考 Twitter Snowflake 当年的思路(项目已被移除,不过分析文章应该找得到)。
SummerWQM
2018-04-25 15:38:21 +08:00
@ipwx 细想了下 实现方式不变 算法里边加盐值 遇到相同的就 递归重试 我想单程序跑 冲突的可能应该很小了
feverzsj
2018-04-25 15:52:58 +08:00
cryptographically secure (pseudo) random number generator -> cryptographic hash

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/449754

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX