图解面试题:如何分析中位数?
Last updated
Last updated
学校每次考试完,都会有一个成绩表。例如,表中第 1 行表示编号为 1 的用户选择了 C++ 岗位,该科目考了 11001 分。
问题:写一个 sql 语句查询每个岗位的中位数位置的范围,并且按岗位升序排序,结果如下:
解释:
第 1 行表示 C++ 岗位的中位数位置范围为 [2,2],也就是 2。因为 C++ 岗位总共 3 个人,是奇数,所以中位数位置为 2。
第 2 行表示 Java 岗位的中位数位置范围为 [1,2]。因为 Java 岗位总共 2 个人,是偶数,所以要知道中位数,需要知道 2 个位置的数字,而因为只有 2 个人,所以中位数位置为 [1,2]。
第 3 行表示前端岗位的中位数位置范围为 [2,2],也就是 2。因为前端岗位总共 3 个人,是奇数,所以中位数位置为 2。
【解题步骤】
1.要求每个岗位的中位数位置的范围,需要知道每个岗位的总数
那么,如何求每个岗位的总数呢?
看到 “每个”,要想到《猴子 从零学会 SQL》里讲过的,用分组汇总解决这类型问题。按岗位分组(group by),使用汇总函数 count() 得到岗位总数。
2.岗位总数又分为奇数和偶数两种情况。
岗位数有奇数也有偶数,需要分情况进行计算,可以使用 case 表达式
如何判断奇偶呢?我们可以使用 % 或 mod 函数。
奇数,就是除以 2 的余数为 1,可以用下面两种方法表示
(1) 总数 % 2 = 1
(2) mod(总数, 2) = 1
偶数,就是除以 2 的余数为 0,可以用下面两种方法表示
(1) 总数 % 2 = 0
(2) mod(总数, 2) = 0
再结合求中位数起始位置的关系,使用 case 表达式:
而 case 表达式中的总数是由前面使用第 1 步 count() 函数计算出来的,所以第 1 步要先于 case 语句运行,因为要把第 1 步的 sql 作为子查询。
最后按岗位升序排序,用排序子句(order by)
【本题考点】
1.考察如何将复杂问题拆解为简单问题,可以使用多维度拆解分析方法,例如本案例中问题拆解问 3 步:
1)将中位数位置用公式表示出来
2)计算出每个岗位的总数
3)分情况统计总数的奇数、偶数
2.如何用 % 或 mod 函数判断奇偶
3.每个问题,要想到分组汇总来解决
4.多条件判断问题,要想到用 case 表达式
5.考查 sql 的运行顺序和子查询
【举一反三】
以下是某班同学的科目成绩表,查询每门科目的中位数位置的范围,并且按科目升序排序。
第 1 行表示数学科目的中位数位置范围为 [2,2],也就是 2。因为数学科目总共 3 个人,是奇数,所以中位数位置为 2。
第 2 行表示语文科目的中位数位置范围为 [2,3]。因为 Java 岗位总共 4 个人,是偶数,所以要知道中位数,需要知道 2 个位置的数字,而因为只有 4 个人,所以中位数位置为 [2,3]。