CTE vs 子查询 vs 临时表在性能与可读性上的权衡_技术教程

PostgreSQL 12+ 默认不物化 CTE，仅作语法糖，可能内联、重排或多次执行；需强制物化时用 MATERIALIZED 关键字。

CTE 在 PostgreSQL 里到底会不
会物化？

PostgreSQL 12+ 默认不物化 CTE，它只是语法糖，优化器可能内联展开、重排甚至多次执行——这点和 SQL Server 或 Oracle 完全不同。所以 WITH cte AS (SELECT * FROM huge_table WHERE ...) 被引用两次，很可能触发两次全表扫描。

实操建议：

用 EXPLAIN (ANALYZE, BUFFERS) 看执行计划，确认是否真的复用了中间结果
需要强制物化（比如避免重复计算或控制执行顺序），加 MATERIALIZED 关键字：WITH cte AS MATERIALIZED (SELECT ...)
如果 CTE 只被引用一次，且逻辑简单，基本等价于子查询；但可读性更好，命名清晰

子查询嵌套深了为什么执行变慢？

MySQL 5.7 和早期 PostgreSQL 版本对多层嵌套子查询优化乏力，尤其 WHERE x IN (SELECT ...) 或 SELECT * FROM t1 WHERE EXISTS (SELECT ...) 容易触发“相关子查询”逐行求值，性能断崖式下跌。

常见错误现象：

EXPLAIN 显示 DEPENDENT SUBQUERY 或 SubPlan 且 rows 值很大
外层返回 10 行，子查询却被执行了 10 次，每次扫描上万行

优化方向：

能改写成 JOIN 的尽量改写，尤其是 IN/EXISTS 场景
MySQL 8.0+ 支持 LATERAL，可让子查询“感知”外层变量，避免全量重复计算
PostgreSQL 中，NOT IN (NULL) 会意外返回空结果，比子查询逻辑 bug 更隐蔽

临时表什么时候真能提升性能？

临时表（CREATE TEMP TABLE）在需要多次读取、中间结果大、或涉及排序/聚合后再过滤时，往往比 CTE 或子查询更稳——因为数据真实落盘（或内存），统计信息可用，索引可建。

但代价明确：

显式创建 + 手动清理（DROP TEMP TABLE），出错容易残留
事务内自动清理，跨会话不可见，不适合长流程调度
PG 中临时表默认无统计信息，首次查询可能选错执行计划，需手动 ANALYZE

适用场景举例：

ETL 中先 INSERT INTO temp_x SELECT ... FROM big_log WHERE dt = '2025-01-01'，再对 temp_x 做多轮聚合与关联
复杂报表中，中间结果 > 10 万行且被引用 ≥ 3 次
需要在中间结果上建索引加速后续 JOIN 或 WHERE