# 滴滴 2020 年面试题：如何找出最小的 N 个数?

![](/files/-MUsVZ2JdDqLa5p1gTkG)

**【题目】**

“学生表” 里记录了学生的学号、入学时间等信息。“成绩表” 里是学生选课成绩的信息。两个表中的学号一一对应。（滴滴 2020 年面试题）

![](/files/-MUsVgxIbAMLkkJMrKgC)

![](/files/-MUsVrRwZ_5gJgCF59ps)

现在需要：

1. 筛选出 2017 年入学的 “计算机” 专业年龄最小的 3 位同学名单（姓名、年龄）
2. 统计每个班同学各科成绩平均分大于 80 分的人数和人数占比

**【解题思路】**

**问题 1：筛选出 2017 年入学的 “计算机” 专业年龄最小的 3 位同学名单（姓名、年龄）**

一看是不是有点懵？

别着急，我们用[逻辑树分析方法](http://mp.weixin.qq.com/s?__biz=MzAxMTMwNTMxMQ==\&mid=2649246563\&idx=2\&sn=3ffe509999d144d23dec5acc101fc2ef\&chksm=835fc353b4284a45ce01391453fe2fec1b225bbd6bbdb67dd7f304aacdd4f21f60d0b27ba309\&scene=21#wechat_redirect)，把这个复杂问题拆解为一个一个可以解决的简单问题：

1）筛选条件：入学时间是 2017，专业是计算机

2）最小的 3 位同学名单（姓名、年龄）

**1. 先找出符合要求的同学**

筛选条件：入学时间是 2017，专业是计算机。year(日期)函数用来获取日期的年份

```sql
select 姓名,年龄
from 学生表
where 专业='计算机' and year(入学时间)=2017;
```

![](/files/-MUsaCD1io2MnmURKmEc)

**2. 最小的 3 位同学名单（姓名、年龄）**

先使用 order by 对年龄排序（从小到大，也就是升序 asc），然后使用 limit 输出前 3 行数据，就是年龄最小的 3 位。

```sql
select 姓名,年龄
from 学生表
where 专业='计算机' and year(入学时间)=2017
order by 年龄 asc
limit 3;
```

![](/files/-MUsaHolRHITihm9-Y0o)

**问题 2：统计每个班同学各科成绩平均分大于 80 分的人数和人数占比**

一看是不是有点懵？

别着急，我们用[逻辑树分析方法](http://mp.weixin.qq.com/s?__biz=MzAxMTMwNTMxMQ==\&mid=2649246563\&idx=2\&sn=3ffe509999d144d23dec5acc101fc2ef\&chksm=835fc353b4284a45ce01391453fe2fec1b225bbd6bbdb67dd7f304aacdd4f21f60d0b27ba309\&scene=21#wechat_redirect)，把这个复杂问题拆解为一个一个可以解决的简单问题：

（1）每位同学的平均成绩

（2）平均分大于 80 分的人数

（3）平均分大于 80 分的人数占比

（4）输出结果是班级，平均分大于 80 分的人数，平均分大于 80 分的人数占比

**1. 每位同学的平均成绩**

涉及到 “每个” 的时候，就要想到[《猴子 从零学会 sql》](http://mp.weixin.qq.com/s?__biz=MzU5NTc1ODI5Mw==\&mid=2247484035\&idx=1\&sn=f6cc38ffb91396061ab7f101257262db\&chksm=fe6c5f39c91bd62f88162ea5ef75a9b757139cad11f02ca6f3de2db931cc89e621921da0dc2d\&scene=21#wechat_redirect)里的分组汇总了。按学号分组（group by），然后求平均成绩（avg 函数），把所得结果看做临时表。

```sql
select 学号,avg(分数) as 平均成绩
from 成绩表
group by 学号;
```

![](/files/-MUsaQWSGCGvi2MRiCLw)

**2. 平均成绩 > 80 的人数**

![](/files/-MUsaWYv6D39PX7sfl6q)

可以使用使用 sum 函数和 case 表达式来统计平均成绩大于 80 的人数

```sql
select sum(
case when 平均成绩>80 then 1 
                     else 0 
end) as 人数
from 临时表；
```

下图是 case 和 sum 结合起来统计人数的 sql 过程：

![](/files/-MUsakZ1w9vfUF9c4MYi)

![](/files/-MUsautUsdVPcNO_XqpZ)

![](/files/-MUsazdfNX8I2sEw0cep)

![](/files/-MUsb2yz2VAiWz8JHuPe)

![](/files/-MUsbZfhUbZa6_cBSG1g)

**3. 平均成绩大于 80 分的人数占比**

平均成绩 > 80 的人数占比 =（平均成绩 > 80 的人数）/ 总人数

总人数是表行数：count(学号)。所以平均成绩 > 80 的人数占比就是：

```sql
select sum(
case when 平均成绩>80 then 1
                     else 0 
end)/count(学号) as 人数占比
from 临时表；
```

**4. 输出结果是班级、人数、人数占比**

班级在 “学生表” 中，这涉及到需要将 “学生表” 和“临时表”2 张表，需要用到多表联结。联结两表的是“学号”，如下：

![](/files/-MUsbiOzkGOliALwW1-Q)

因为要保留 “学生表” 班级的全部数据，所以使用左联结。

```sql
select a.班级
from 学生表 as a 
left join 临时表 as b
on a.学号=b.学号
group by 班级;
```

题目要求是输出班级、人数、人数占比，所以在上面 sql 中加入输出的列名：

```sql
select a.班级,人数,人数占比
from 学生表 as a 
left join 临时表 as b
on a.学号=b.学号
group by 班级;
```

select 子句中的人数、人数占比在前面第 1 步、第 2 步中已经得到，套入这个 sql 语句中就是：

![](/files/-MUsc-emQY1pOzlgNyoI)

最终 sql 如下：

```sql
select a.班级,
sum(
case when b.平均成绩>80 then 1
else 0 end) as 人数,
sum(
case when b.平均成绩>80 then 1
else 0 end)/count(a.学号) as 人数占比
from 学生表 as a left join(
select 学号,avg(分数) as 平均成绩
from 成绩表
group by 学号
) as b
on a.学号=b.学号
group by 班级
```

![](/files/-MUscdsy2QsUadzcArRZ)

**【本题考点】**

1. 使用[逻辑树分析方法](http://mp.weixin.qq.com/s?__biz=MzAxMTMwNTMxMQ==\&mid=2649246563\&idx=2\&sn=3ffe509999d144d23dec5acc101fc2ef\&chksm=835fc353b4284a45ce01391453fe2fec1b225bbd6bbdb67dd7f304aacdd4f21f60d0b27ba309\&scene=21#wechat_redirect)将复杂问题变成简单问题的能力
2. 当遇到 “每个” 问题的时候，要想到用分组汇总
3. 查询最小 n 个数据的问题：先排序（order by），然后使用 limit 取出前 n 行数据
4. 遇到有筛选条件的统计数量问题时，使用 case 表达式筛选出符合条件的行为 1，否则为 0。然后用汇总函数（sum）对 case 表达式输出列求和。

![](/files/-MUscu5Cxj-9iWOVOKAe)

![](/files/-MUsdMIndFQ0Ey4Lr0_x)

有筛选条件的统计数量问题的万能模板

```sql
select sum(
case when <判断表达式> then 1
       else 0
end
) as 数量
from 信息表；
```

**【举一反三】**

**1. 查询最小 / 最大的 N 个数据的问题**

某网站有购买记录表，找出消费最大的 2 名顾客，输出顾客 ID 和消费金额

![](/files/-MUsdTpiMlZ1KHOvlaxh)

```sql
select 顾客ID,消费金额
from 购买记录表
order by 消费金额 desc
limit 2;
```

![](/files/-MUsdYVVbYEgeahxLphX)

**2. 分组汇总问题**

某网站有顾客表和消费表，请统计每个城市的顾客平均消费在 1000 元以上的人数，输出城市，人数

![](/files/-MUsdbpxBbrXEc5H8hr0)

```sql
select a.城市,
sum(
case when b.平均消费>1000 then 1
else 0 end) as 人数
from 顾客表 as a left join(
select ID,avg(消费金额) as 平均消费
from 消费表
group by ID
) as b
on a.ID=b.ID
group by 城市;
```

![](/files/-MUsdg-f0eDlmo3Lv_uQ)

推荐：[如何从零学会 sql？](http://mp.weixin.qq.com/s?__biz=MzAxMTMwNTMxMQ==\&mid=2649247566\&idx=2\&sn=5af748b677eb72028764dde0577675fb\&chksm=835fc77eb4284e68e8cfe3f08c5a671b9e080b2651f20b40b1c793ffda4042ae43ad8f35a755\&scene=21#wechat_redirect)

![](/files/-MUsdotDv0ZyOkqq9DIB)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://houzidata.gitbook.io/sql/di-3-zhang-duo-biao-cha-xun/di-di-2020-nian-mian-shi-ti-ru-he-zhao-chu-zui-xiao-denge-shu.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.