Dynamodb 应该怎么复杂查询呢?

2021-04-04 22:55:46 +08:00
 john990

假如现在有一张歌曲表

id title artist duration cover
hash1 青花瓷 周杰伦,林俊杰 320000 http://a.bbb.com/a.jpg
hash2 青花瓷 周杰伦 310000 http://a.bbb.com/b.jpg

因为一首歌可能有多个版本,多个歌手演唱。

那么这个表应该怎么设计才能最快捷的根据 歌手+歌名 查询到对应的数据呢?

Dynamodb 的 getItem 和 query 必须要确定分区主键才能查询,可是我要查询后才能知道主键啊,直接懵了。

客户端初次搞后端很多要学习啊。

2986 次点击
所在节点    Amazon Web Services
12 条回复
RangerWolf
2021-04-04 23:57:06 +08:00
DynamoDB 很便宜,速度也很快,建议以歌名为主键写进去,根据不同的需求去不同的表查询

话说,为什么用这个?直接 MySQL 、PSQL 扛不住么?
john990
2021-04-05 00:00:04 +08:00
@RangerWolf lambda 只支持 dynamodb🙃
john990
2021-04-05 00:01:10 +08:00
@RangerWolf 歌曲同名的很多啊,重复的不能做主键吧
binux
2021-04-05 00:38:53 +08:00
composite primary key
Rocketer
2021-04-05 01:48:34 +08:00
DynamoDB 是靠 GSI 实现复杂查询的。

比如你的需求,可以建一个 Partition Key 为歌手,Sort Key 为歌名的 GSI (其实反过来也行,具体看你还有没有别的需求可以利用这个 GSI ),然后 query 这个 GSI 就行了。

GSI 用起来跟表一模一样,只是表里的键是唯一的,而 GSI 允许重复。你用”歌手=xxx AND 歌名=xxx“为条件可能搜到多个 item,所以你只能 query 而不能 getItem,然后再根据搜到多少条来决定下一步怎么处理。

另外,歌手如果是个检索条件,那就不应该放到同一个 item 里,而是为每个歌手创建一个 item 。这样你就可以通过 GSI 搜索”歌手=xxx”来得到该歌手所有的歌曲。
john990
2021-04-05 07:04:53 +08:00
@Rocketer 谢谢!我去找下相关资料
不过还有个问题,歌曲表的主键随机生成吗,因为歌手和歌名没有唯一确定值的字段
Rocketer
2021-04-05 08:33:05 +08:00
@john990 本来都写了 500 字了,又删了,因为不知道还要写多少。你这是个多对多的关系,是最复杂的场景,我怕是很难用几句话给你讲清楚。

你还是读一下官方的最佳实践吧,根据官方推荐的做法,你应该把所有数据都放在一张表里,所以不会有歌手表这种东西。

另外,用 DynamoDB 不能一点一点的挤牙膏,你得先把所有读取的场景都列出来再设计表,否则后期很难修改。所以最好以微服务的思想去设计你的系统,每个服务各自用一个表,以降低耦合,在充分利用 DynamoDB 优势的同时为后期扩展保留灵活性。
buddie
2021-04-05 08:49:36 +08:00
@Rocketer 说得太好了!
phy25
2021-04-05 09:34:17 +08:00
cassyfar
2021-04-05 09:58:53 +08:00
@phy25 能 nosql 还是 nosql
john990
2021-04-05 10:56:36 +08:00
@Rocketer 非常谢谢你的回复,我懂我该做什么了
john990
2021-04-05 10:58:13 +08:00
@phy25 果然,是我没看到,谢谢提醒

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/768024

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX