SQL 表多查询如何有效避免"重复"数据?

2018-07-18 21:50:08 +08:00
 mmdsun

left join 多表查询,这两张表的关系存在一对多的关系,就会出现重复情况。例如一个产品,有多个图片,在关联查询产品的时候会出现重复产品。 这种情况下,需要用子查询,根据规则去重复之后,再次关联,去重数据。 比如: select * from tableA a join (select distinct A,B,C tableB) b on a.A=b.A

还有一种方法是分成多次单表查询代替连表。或者在设计阶段增加冗余字段。

感觉这样效率都很低,而有的时候违背数据库设计原装。

那么数据表多避免出现重复数据最有效的方法是什么?数据库设计阶段应该如何避免呢?谢谢。

2381 次点击
所在节点    问与答
6 条回复
yangqi
2018-07-18 21:55:34 +08:00
方法很多,可以直接 select distinct, 或者用 group by, 或者 select from B right join A. 具体要根据实际情况来定
yidinghe
2018-07-18 21:58:32 +08:00
1、把持好查询时的关联条件,比如表 A 和 B 之间用什么条件关联,不管查询多复杂,这个条件都不要改。

2、用拼凑的方式建立复杂查询,而不是先写一个大杂烩什么都查然后再想办法拆分过滤。
mmdsun
2018-07-18 22:03:12 +08:00
@yangqi 请问 distinct 有没有办法过滤某几个列重复。比如查出来的数据是 a,b,c 列。业务上 a,b 两列重复视为重复。distinct a,b,c 就没办法过滤了。
yangqi
2018-07-18 22:09:53 +08:00
@mmdsun 这种不行,只能用 group by, 不过注意 group by 里面非重复的列是随机选择的。
BaiMax
2018-07-18 22:52:43 +08:00
@mmdsun select distinct concat (a,b) 把这两列拼接一下
mmdsun
2018-07-19 07:41:08 +08:00
@BaiMax select a,b,c 三个列。过滤重复条件是 a,b。你这样就变成 select a,b 了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/472154

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX