微信如果保存全部聊天记录,一年的聊天记录成本大致在多少?

2023-06-30 11:03:31 +08:00
 chenjia404

假设微信有 14 亿日活,一年一个人需要 10mb 存储空间,那么一年需要 1.3 万 t 存储,如果算 1t ssb 存储 1000 人民币,那就一年需要 1300 万人民币。实际很多数一年聊天记录到 1mb 都难,再使用一些压缩技术,存储成本更低了。

聊天记录基本上不需要全文索引这些,只要按用户进行索引和存储就行了,用一些 nosql 就行了,而且可以用 hdd ,甚至使用归档存储,那么感觉一年几十万人民币就能搞定存储。如果要加上实时的按用户查询,那就用 hdd ,分用户进行存储,使用类似 ssdb 这样的 nosql ,也很快。

我看到一些计算方法说要几十亿、几百亿的存储成本,这个计算完全不合理,每个人的聊天记录,大部分都是群聊的图片、视频。

3806 次点击
所在节点    问与答
33 条回复
hello00001
2023-06-30 15:23:29 +08:00
微信保存全部聊天记录的成本取决于多个因素,包括用户数量、消息数量、存储需求和数据管理策略等。

首先,我们需要考虑用户数量。根据微信官方数据,在 2021 年,微信的月活跃用户数超过了 12 亿。如果我们假设这个数字保持不变,那么一年的用户数量可能接近或超过 14 亿。

其次,我们需要考虑消息数量。根据微信的使用情况和研究数据,用户之间的消息交流非常频繁。然而,具体的消息数量因用户行为而异。为了简化计算,我们可以假设每个用户每天平均发送和接收 10 条消息。这样,一年的消息数量可能达到大约 5110 亿条( 14 亿用户 × 365 天 × 10 条消息)。

关于存储需求,每条微信消息通常包含文本、图片、视频和其他附件等不同类型的数据。为了简化计算,我们可以假设平均每条消息的数据大小为 1MB 。这样,一年的存储需求可能达到大约 5110TB ( 5110 亿条消息 × 1MB )。

然而,微信可能会采用各种数据管理策略来减少存储成本,例如数据压缩、归档、存储分级等。因此,实际的成本可能会有所不同。

总的来说,保存全部一年的微信聊天记录的大致成本可能是相当高的,需要考虑到存储设备、数据中心和数据管理等多个方面的费用。具体的成本估算需要考虑更多细节和实际情况,因此以上只是一个粗略的估计。
burymme11
2023-06-30 15:23:40 +08:00
如果把图,语音都转了文字再存储归档呢?
lincanbin
2023-06-30 16:04:19 +08:00
你对数据的估算非常离谱。
leonhao
2023-06-30 16:09:46 +08:00
能有多大,telegram 有腾讯有钱?
chengxy
2023-06-30 17:00:06 +08:00
@leonhao #24 腾讯有钱,微信没钱
4D1ULExi1z1Boii9
2023-06-30 17:02:00 +08:00
@Seanfuck 几十个 g 中基本都是文件,文件七天过期,过期就删了不存了呀
murmur
2023-06-30 17:05:06 +08:00
@Seanfuck 附件没几个月就全给我删干净了,无法访问但是还占我手机空间
tu9oh0st
2023-06-30 17:17:27 +08:00
电脑备份吧,然后手机中的一定要备份,电脑备份不确定能否是跟手机一样的,我换了几次手机都是用手机备份的
laommmm
2023-06-30 17:30:36 +08:00
手机上聊天记录,一年至少几 G 。。。。。。。。。
snw
2023-06-30 17:47:29 +08:00
@aptupdate
telegram 超过一定人数的群,聊天数据是共用的,所以就算文件发到 20 万人的大群,服务器上也只会存一份。表情贴纸也都是共用的,相同的 gif 也会共用。

只有微信这种智障,一份文件转发 50 次就重复存 50 份,直接把存储塞爆。
hongfs
2023-06-30 17:59:27 +08:00
@snw 这只是对用户而言去保存几十份,那从后端角度也大概率会有业务去进行去重的。
wxf666
2023-07-01 19:18:48 +08:00
@OutOfMemoryError #11 应该有不少是索引吧
LRf5sETzOgzGvk6u
2023-07-02 10:51:26 +08:00
都理解的不对,微信可以说就是吧每个用户设备当服务器端了,比如换设备等情况,是不是需要旧设备扫码或者好友发信息给你?你就可以把这个行为理解成一个命令,微信在本地一直拉屎也和这个有关系,一个视频发群里,群里 32 个人,那么就等于存了 32x32 份视频。。有的时候登陆明明找了时间条件符合的人帮忙验证,可是就不成功,根本原因就是从这个人的本地数据里找不到和你微信有关的,每个人都是微信的服务器☺️

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/952944

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX