搜索
写经验 领红包
 > 电器

如何查找出重复的数据(查找重复项的两种常用方法)

导语:图解面试题:如何查找重复数据?

如何查找出重复的数据(查找重复项的两种常用方法)

【题目】

编写一个SQL查询,查找学生表中所有重复的学生名。

【解题思路】

1.看到“找重复”的关键字眼,首先要用分组函数(group by),再用聚合函数中的计数函数count()给姓名列计数。

2. 分组汇总后,生成了一个如下的表。从这个表里选出计数大于1的姓名,就是重复的姓名。

【解题步骤】

方法一

1)创建一个辅助表,将姓名列进行行分组汇总

1 select 姓名, count(姓名) as 计数2 from 学生表3 group by 姓名;

2)选出辅助表中计数大于1的姓名

1 select 姓名 from 辅助表2 where 计数 > 1;

3)结合前两步,将“创建辅助表”的步骤放入子查询

1 select 姓名 from2 (3  select 姓名, count(姓名) as 计数4  from 学生表5  group by 姓名6 ) as 辅助表7 where 计数 > 1;

结果:

方法二

这时候有的同学可能会想,为什么要这么麻烦创建一个子查询,不能用这个语句(将count放到where字句中)直接得出答案吗?

1 select 姓名2 from 学生表3 group by 姓名4 where count(姓名) > 1;

如果我们运行下这个sql语句,会报下面的错误,问题出在哪里呢?

前面提到聚合函数(count),where字句无法与聚合函数一起使用。因为where子句的运行顺序排在第二,运行到where时,表还没有被分组。(如果不清楚,可以系统看下我之前的课程《从零学会SQL:汇总分析》)

如果要对分组查询的结果进行筛选,可以使用having子句。所以,这道题的最优方法如下:

1 select 姓名f2 rom 学生表3 group by 姓名4 having count(姓名) > 1;

【本题考点】

1)考察思路,有两种解题方法,但是使用having语句的方法更高效。

2)考察对having语句的掌握,很多人会把聚合函数写到where子句中。

3)熟记SQL子句的书写顺序和运行顺序。

【举一反三】

本题也可以拓展为:找出重复出现n次的数据。只需要改变having语句中的条件即可:

1 select 列名2 from 表名3 group by 列名4 having count(列名) > n;

推荐:如何提升你的分析技能,实现升职加薪?

免责声明:本站部份内容由优秀作者和原创用户编辑投稿,本站仅提供存储服务,不拥有所有权,不承担法律责任。若涉嫌侵权/违法的,请反馈,一经查实立刻删除内容。本文内容由快快网络小冰创作整理编辑!