sql 中 dense_rank over partition by 用法_sql 中 dense_rank 分区密集排名技巧

在 sql 中,dense_rank() over (partition by ...) 是一种用于分组密集排名的窗口函数。1. 它为相同值分配相同排名且后续排名不跳号;2. 结合 partition by 可按指定字段分组并在组内独立计算排名;3. 使用时必须包含 order by,注意字段类型、null 处理及性能问题;4. 常见错误包括遗漏 order by、分区字段错误、误用 rank() 或处理 null 不当,建议通过验证数据和对比测试来排查问题。

在 SQL 中,DENSE_RANK() OVER (PARTITION BY ...) 是一种非常实用的窗口函数,尤其在需要对数据进行分组排名时特别常见。它的核心作用是:在每个分组内,为行分配一个连续且不跳号的排名。相比 RANK(),它不会因为并列名次而跳号;相比 ROW_NUMBER(),它允许并列。

下面从几个实际使用场景出发,讲讲怎么用好这个函数。


1. 理解 DENSE_RANK 的基本逻辑

DENSE_RANK() 的特点是“密集排名”,也就是说:

  • 相同值的记录会获得相同的排名;
  • 下一名紧跟着上一排名,不会跳号。

举个例子:

姓名 成绩
张三 90
李四 90
王五 85
赵六 80

使用 DENSE_RANK() 排名后:

姓名 成绩 排名
张三 90 1
李四 90 1
王五 85 2
赵六 80 3

如果是 RANK(),王五的排名就是 3,而不是 2。


2. 结合 PARTITION BY 进行分组排名

PARTITION BY 的作用是将数据按某个字段分组,然后在每组内部单独计算排名。

比如我们要对不同班级的学生分别进行成绩排名:

SELECT
  class_id,
  student_name,
  score,
  DENSE_RANK() OVER (PARTITION BY class_id ORDER BY score DESC) AS rank_in_class
FROM
  student_scores;

这样,每个班的成绩都会被独立排名,互不影响。

常见用途包括:

  • 按部门给员工薪资排名;
  • 按月份统计销售员业绩排名;
  • 按用户分组后对其行为时间排序等。

3. 实际应用中的注意事项

虽然语法简单,但实际使用中容易忽略以下几点:

  • ORDER BY 是必须的:没有排序就没有排名依据,这一步不能省。
  • PARTITION BY 可选:如果你不需要分组,可以只写 OVER (ORDER BY col)
  • 字段类型影响排序结果:例如字符串排序、NULL 值处理要提前了解数据库的行为(如 MySQL 和 Oracle 处理方式可能不同)。
  • 性能问题:如果分区字段基数大(比如按用户ID分区),大数据量下可能会慢,适当加索引或限制范围更高效。

4. 常见错误和解决思路

有时候写出来的排名不符合预期,可能是以下几个原因:

  • ❌ 忘记 ORDER BY,导致排名混乱;
  • ❌ 分区字段写错,把不该分的分了;
  • ❌ 使用了 RANK() 却期望不跳号;
  • ❌ 对 NULL 值处理不当,影响排序顺序。

建议的做法:

  • 写完语句先查几条数据验证排名是否符合预期;
  • DENSE_RANK() 改成 RANK()ROW_NUMBER() 测试对比;
  • 如果涉及多字段排序,记得括号内的 ORDER BY 可以写多个字段。

基本上就这些内容了。
掌握好 DENSE_RANK() OVER (PARTITION BY ...),你就有了一个非常强大的工具来处理各类分组排名任务。不复杂,但细节很容易忽略。