询问一个 Mysql 数据库一对多关系的存储方式问题

2019-05-03 03:28:37 +08:00
 zhengjian

最近在做毕设,遇到一个数据库存储的问题,不知该如何选择,请各位指点一二。

(楼主是一个前端,后端和数据库很多地方不太懂,如果有的地方说的不对,还请大家批评)

需求描述

与发微博这个操作类似,我就以发微博来说。

一条微博包括内容多张图片

数据库里,内容 就是一个字段,而微博-图片是一个一对多的关系。

在发微博上传图片的时候,我实现的流程是:

  1. 用户选择图片,点击上传
  2. 后端接收上传的图片,生成文件名后上传到云存储服务商,服务商返回处理后的信息
  3. 服务商返回的图片信息有:图片的宽高、大小等基本信息,和多个不同版本(原图,缩略图)的图片信息( Url 等)
  4. 后端将这张图片的信息存储在图片信息表里,返回前端图片的信息(包括图片 id )
  5. 前端显示上传完成,显示预览图。
  6. 用户点击发微博的时候,传给后端的数据内容中图片以 id 表示

一个例子:

POST  /user/xxxx/status

data: 

{
    "content" : "微博内容",
    "pics" : [
        "picId-1",
        "picId-2",
        "picId-3"
    ],
}

而且,图片还是有顺序的。

到正题了,后端该如何存储这条微博。

方案分析

下面是我想到的几种方案

图片信息表结构:

1.新建一张微博-图片表

微博表:

微博-图片表:

优点:

  1. 结构清晰,遵循范式
  2. 可以直接使用 SQL 查询

缺点:

  1. 这种方案在查询的时候需要联合三张表来查
  2. 如果保证顺序的话,需要按照插入的时间戳排序或者增加一个字段,比如 order

2.在微博表中新增一个字段存储图片信息

微博表

2.1 pics 字段使用字符串,以分隔符隔开

比如:

pics = "picId1,picId2,picId3"
优点:
  1. 不用新建表
  2. 保证了顺序问题
缺点:
  1. 违反范式
  2. 需要先解析字符串,再查询

2.2 pics 字段使用 json 格式

比如:

pics = [picId1,picId2,picId3]
优点:
  1. 不用新建表
  2. 保证了顺序问题
  3. 相比 2.1 字符串,更优雅直观
缺点:
  1. 违反范式
  2. 需要先解析字符串,再查询
  3. json 类型依赖特定数据库版本

请教

暂时就想到这几种方案。

请问各位这几种方案孰优孰劣,选择哪种更好一点?

还有没有更好的方案选择呢?

3623 次点击
所在节点    数据库
22 条回复
zhengjian
2019-05-03 03:47:56 +08:00
对不起,图裂了,请看这张图

https://s2.ax1x.com/2019/05/03/ENDKz9.png
zhengjian
2019-05-03 04:43:39 +08:00
睡觉前又想到一个方案。

图片表增加一个 status_id 字段,上传图片的时候为 null,当发布微博的时候再将微博 id 插入进去。

顺序问题还要想想。
2kCS5c0b0ITXE5k2
2019-05-03 05:15:18 +08:00
@zhengjian 顺序问题可以加一个字段 按照上传顺序 比如你上传第一张 Post 的时候加一个标识为第几张
2kCS5c0b0ITXE5k2
2019-05-03 05:19:05 +08:00
@zhengjian 实现起来当然 2.2 更好。但是后续升级维护还是第一种更好
zhengjian
2019-05-03 05:29:01 +08:00
@emeab 嗯嗯,我觉得如果按照 1 的话顺序应该加个字段。

其实还有编辑功能,编辑的时候有可能会修改顺序,或者增删图片。选方案 1 的话工作量还挺大的。
GoLand
2019-05-03 06:07:08 +08:00
用 2.2。图片 ident 塞到信息序列化成字符串,可以前面加个 key。比如 { “ pics ”:[xx, xx]}。之后加其他额外信息往这个 map 里加就行了。好扩展。对于你的第一种方案,画蛇添足,因为图片一般没有查询场景吧?
kevinlm
2019-05-03 06:30:00 +08:00
图片地址存成一个字段,完事,地址本来就是唯一的。
richard1122
2019-05-03 09:59:11 +08:00
图片应该很大概率是不需要单独查找的吧,用 方案 2。
richard1122
2019-05-03 10:00:19 +08:00
另外应该用 json 方式,以后万一有特别的需求 mysql 还可以用 json 操作函数计算
DavidNineRoc
2019-05-03 10:09:26 +08:00
说说方案吧:
json 存储: (图片表)
优势显然可见, 简单. 还有你的问题不会存在, 解析字符串再查询? 有想会查询图片呢? 解析的话, 这个无所谓, 像 redis 缓存一样是把整个数据缓存成字符串.

一对多: (微博表, 图片表)
你的更多可能是一对多, 步骤应该是这样. 前端选择图片,上传之后, 切记不要插入数据库. 因为如果你现在插入, 如果我刷新, 或者不发表文章了, 你的数据库记录是删除掉?反而麻烦了自己.
正确做法: 前端选择图片 -> 云存储(本地存储)保存返回 url 数组 -> 前端直接根据 url 预览 -> 写微博点击发表 -> 先创建微博 -> 拿微博 id 新建图片表

多对多: (微博表, 图片表, 关联表)
这种表结构一定要确定好你的应用场景, 建议和一对多区分开. 这种做法常见的可以参考 wordpress, 一般有一个媒体库. 发微博之前一般先去媒体库上传图片, 等你去微博的时候, 可以选择之前上传过的所有图片(当然你也可以在新建微博的时候上传图片, 同理这些图片在以后也可以继续使用)
kangzai50136
2019-05-03 13:21:24 +08:00
我最近也在做差不多的功能,我是用微博表,微博详情表和图片表。虽然表多,但结构清晰。
xuanbg
2019-05-03 13:55:39 +08:00
图片又不搜索,当然存成 json 最简单。MySQL5.6 就有 json 的支持了,哪怕更早版本,直接当做字符串存储也没问题,反正你并不需要在 sql 语句中解析。
zhengjian
2019-05-03 15:21:29 +08:00
@kangzai50136 #11 请问您的需求中需要保存顺序吗,是怎么解决顺序问题的呢?


@DavidNineRoc #10 感谢您的耐心解答,对于你第二点中的解释,“前端选择图片 -> 云存储(本地存储)保存返回 url 数组”,在返回 url 数组的时候,因为图片会有其他信息和多个 url,这时后端是不是要设置一个过期时间缓存一下,当微博发送的时候再插入数据库,如果用户不发表了,这些图也就过期了。
kangzai50136
2019-05-03 18:57:41 +08:00
@zhengjian 我是增加一个排序字段,排序由前端决定,接口接收参数时检验一下排序字段有没有重复,有则返回错误。{“ content ”:“我是一条新微博”,pics[{filename:xx,sort:1},{filename:yyy,sort:2}]},有兴趣可以加我企鹅大家讨论一下。
zhengwhizz
2019-05-03 21:07:48 +08:00
图片直接前端预览 /压缩( pica),发微博时才上传,避免用户取消发布、删除 /修改图片再请求接口(或者无用图片的存储,毕设可以忽略,产品的话这种操作不在少数, 云存储带宽和容量这些都是成本),至于多表或者 json 没太大区别,个人觉得 json 更方便,至于排序,加个修改时间戳,前端排一下即可。
zhengjian
2019-05-03 22:40:56 +08:00
@kangzai50136 #14 那您修改图片顺序的时候,操作量不会很大。


@zhengwhizz #15 嗯嗯,一起上传的话,如果九张图,考虑到速度问题,还是选择了先上传图片。因为实际需求比微博的表单字段要多很多。
kangzai50136
2019-05-03 23:18:38 +08:00
@zhengjian 为什么修改图片顺序操作量会很大呢
zhengjian
2019-05-04 00:12:56 +08:00
@kangzai50136 #17 抱歉,我以为你是存储的 微博-图片表。

如果表结构为
- weibo_id
- pic_id
- order

更改顺序或增删图片,就要操作多条记录
autogen
2019-05-04 00:34:15 +08:00
一般都是这样设计的:


微博表:
- weibo_id *
- content

图片表:
- pic_id
- width
- height
- thumb
- origin
- weibo_id *



而且图片服务器会返回一个图片 ID,根据这个 ID 来拼链接就行
比如:图片 ID=aaaabbbbccccdddd,
url 你自己拼就行: http://cdn1.cdn.com/aaaabbbbccccdddd_100x100.jpg



-
autogen
2019-05-04 00:41:52 +08:00
代码:
def getWeiboInfo(id):
....getBaseInfo(id)
....getImgInfo(id)
....return combine(base, imgs);

-
def getBaseInfo(id):
....if id in cache:
........return cache.get(id)
....return weibo.query(id)



-

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/560631

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX