Dynamodb 应该怎么复杂查询呢？

假如现在有一张歌曲表

id	title	artist	duration	cover
hash1	青花瓷	周杰伦,林俊杰	320000	http://a.bbb.com/a.jpg
hash2	青花瓷	周杰伦	310000	http://a.bbb.com/b.jpg

因为一首歌可能有多个版本，多个歌手演唱。

那么这个表应该怎么设计才能最快捷的根据歌手+歌名查询到对应的数据呢？

Dynamodb 的 getItem 和 query 必须要确定分区主键才能查询，可是我要查询后才能知道主键啊，直接懵了。

客户端初次搞后端很多要学习啊。

RangerWolf

2021-04-04 23:57:06 +08:00

DynamoDB 很便宜，速度也很快，建议以歌名为主键写进去，根据不同的需求去不同的表查询

话说，为什么用这个？直接 MySQL 、PSQL 扛不住么？

john990

2021-04-05 00:00:04 +08:00

@RangerWolf lambda 只支持 dynamodb🙃

john990

2021-04-05 00:01:10 +08:00

@RangerWolf 歌曲同名的很多啊，重复的不能做主键吧

binux

2021-04-05 00:38:53 +08:00

composite primary key

Rocketer

2021-04-05 01:48:34 +08:00

DynamoDB 是靠 GSI 实现复杂查询的。

比如你的需求，可以建一个 Partition Key 为歌手，Sort Key 为歌名的 GSI （其实反过来也行，具体看你还有没有别的需求可以利用这个 GSI ），然后 query 这个 GSI 就行了。

GSI 用起来跟表一模一样，只是表里的键是唯一的，而 GSI 允许重复。你用”歌手=xxx AND 歌名=xxx“为条件可能搜到多个 item，所以你只能 query 而不能 getItem，然后再根据搜到多少条来决定下一步怎么处理。

另外，歌手如果是个检索条件，那就不应该放到同一个 item 里，而是为每个歌手创建一个 item 。这样你就可以通过 GSI 搜索”歌手=xxx”来得到该歌手所有的歌曲。

john990

2021-04-05 07:04:53 +08:00

@Rocketer 谢谢！我去找下相关资料
不过还有个问题，歌曲表的主键随机生成吗，因为歌手和歌名没有唯一确定值的字段

Rocketer

2021-04-05 08:33:05 +08:00

@john990 本来都写了 500 字了，又删了，因为不知道还要写多少。你这是个多对多的关系，是最复杂的场景，我怕是很难用几句话给你讲清楚。

你还是读一下官方的最佳实践吧，根据官方推荐的做法，你应该把所有数据都放在一张表里，所以不会有歌手表这种东西。

另外，用 DynamoDB 不能一点一点的挤牙膏，你得先把所有读取的场景都列出来再设计表，否则后期很难修改。所以最好以微服务的思想去设计你的系统，每个服务各自用一个表，以降低耦合，在充分利用 DynamoDB 优势的同时为后期扩展保留灵活性。