Theine - 新一代高性能&高命中率泛型内存缓存

先上链接和 benchmarks:

cpu: Intel(R) Core(TM) i7-9750H CPU @ 2.60GHz

BenchmarkGetTheineParallel-12           32432190                36.39 ns/op            0 B/op          0 allocs/op
BenchmarkGetRistrettoParallel-12        63978058                18.86 ns/op           17 B/op          1 allocs/op
BenchmarkSetTheineParallel-12           20791834                84.49 ns/op            0 B/op          0 allocs/op
BenchmarkSetRistrettoParallel-12        23354626                65.53 ns/op          116 B/op          3 allocs/op
BenchmarkZipfTheineParallel-12          14771362                74.72 ns/op            1 B/op          0 allocs/op
BenchmarkZipfRistrettoParallel-12       21031435                61.82 ns/op          100 B/op          3 allocs/op

由于充分利用 sync pool 以及 atomic ，Theine 的 GC 压力很低，同时有着和 Ristretto 同一数量级的性能。

相比于 Ristretto ，Theine 最大的特点其实是极高的缓存命中率，benchmark 结果都是图片,可以直接去 README 看: hit-ratios。简单来说 Ristretto 是通过丢弃请求来达到高性能，代价就是高写入下大量 Set 请求丢弃导致缓存命中率大幅下降。而 Theine 则通过合理的架构避免了这个问题。

同时 Theine 也有 Python 版本: https://github.com/Yiling-J/theine. 所以你也许会觉得看到这个名字眼熟。Theine-Go 的 TinyLFU 部分其实是直接从 Python 版本转过来的，但在提高性能方面 Python 和 Go 版本的 Theine 都根据对应的语言特性做了优化

matrix1010

2023-04-14 12:10:46 +08:00

@victorc 很多 web 框架都支持内存缓存以及多级缓存，毫无疑问内存缓存的性能远高于分布式缓存。另一方面对于数据库或者持久化 KV ，一般也都有内存缓存层来提高性能，比如 pebble 就是用的 clock pro 。当然市场 /浪潮什么的作为 cto 可能比较关心，但我作为普通开发人员还是致力于写出高性能并且有点意思的东西

matrix1010

2023-04-14 16:52:42 +08:00

@qile1 你说的是 Python 版本吧。由于不确定你的架构，比如几台服务器，一致性需求等我没法直接回答你。简单来说你就可以把 Theine 当作一个字典，只是这个字典能设定最多存储多少内容和内容的过期时间。超过最大 size 这个字典会根据一定的规则自动删除数据。如果这样能满足你的需求你可以试一试

matrix1010

2023-04-14 17:00:57 +08:00

@jorneyr 比如你的微服务 A 需要从微服务 B 获取用户信息。获取时先检查本地缓存，如果本地缓存有就用，没有就从微服务 B 获取然后存入本地缓存。这里有 2 个问题，1 是一致性，如果你可以接受短期不一致设个几十秒的 ttl 自动过期就行，或者你可以通过 mq 之类的同步，但总会有一定的不一致。第 2 是并发问题，比如微服务 B 有 10 个 pods ，那这 10 个 pods 都没有缓存的话会同时发请求，如果你的单个微服务有几千个 pods 而且全部同时 miss 可能会瞬间有很大压力

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/932421