从千毫秒到亚毫秒：连接条件下推如何让复杂 SQL 飞起来

Ne0inhk

23 Mar 2026 — 9 min read

文章目录

前言
一、问题背景
- 1.1 客户场景中的典型痛点
- 1.2 业界普遍面临的两大难点
  - 1.2.1 语义安全性（Equivalence）
  - 1.2.2 代价评估（Cost）
二、传统方案的局限
三、金仓数据库基于代价的连接条件下推设计
- 3.1 能不能推：等价性判定（Equivalence）
- 3.2 值不值推：代价模型（Cost）
四、效果验证
- 4.1 最小化用例
- 4.2 复杂场景验证
五、总结

前言

在真实的业务系统中，SQL 往往远比教科书示例复杂。随着业务逻辑的不断演进，CTE、多层子查询、窗口函数、聚集计算被广泛用于组织查询逻辑，极大地提升了 SQL 的可读性与表达能力。然而，这类复杂 SQL 也给查询优化器带来了严峻挑战——尤其是在 JOIN 条件无法有效提前过滤数据 的场景下，性能问题往往成为系统瓶颈。

本文聚焦于一个在真实客户场景中高频出现的问题：复杂查询中 JOIN 条件下推失败所导致的性能瓶颈，并系统介绍一种基于代价模型的连接条件下推（Cost-based Join Predicate Pushdown）的设计思路与实现方案。

一、问题背景

1.1 客户场景中的典型痛点

在许多客户的业务系统中，SQL 通常遵循如下模式来组织查询逻辑：

在子查询或 CTE 中完成大量预处理计算（去重、聚集、窗口函数等）
在外层再与其他表进行 JOIN，并施加高选择性的过滤条件

以如下查询为例：

SELECT*FROM(SELECTDISTINCT*FROM s1 ) s JOIN s2 ON s.a = s2.a WHERE s2.b =3;

从业务语义上看，这条 SQL 完全正确；但从执行角度审视，却隐藏着严重的性能隐患：

子查询 s 需要对 s1 进行全量扫描并去重，产生庞大的中间结果集
外层 s2.b = 3 的高选择性过滤条件，无法反向约束子查询的扫描范围
后续的 JOIN、聚集等操作全部建立在"大数据量"之上，性能急剧下降

根本问题不在 JOIN 本身，而在于过滤发生得太晚。

1.2 业界普遍面临的两大难点

将 JOIN 条件下推到子查询内部，看似是一个直观有效的优化方向，但在数据库内核层面，这一问题远比想象中复杂，主要体现在以下两个维度：

1.2.1 语义安全性（Equivalence）

JOIN 条件下推的本质，是改变谓词生效的位置。若处理不当，极易破坏 SQL 的原有语义，尤其在以下场景中风险较高：

聚集操作（GROUP BY）
窗口函数（Window Function）
DISTINCT / UNION
含有副作用或非确定性函数的表达式

因此，并非所有 JOIN 条件都可以安全下推，必须建立严格的等价性判定机制。

1.2.2 代价评估（Cost）

即便语义上等价，下推也未必"划算"：

下推后可能触发参数化执行路径
当外层基数较大时，子查询可能被重复执行 N 次
极端情况下，性能反而出现灾难性下降

这意味着：JOIN 条件下推不仅要"能推"，还要"值得推"。

二、传统方案的局限

面对上述场景，传统优化器通常采用如下执行策略：

完整执行子查询：扫描基表，执行 DISTINCT / UNION / 窗口函数等复杂操作
生成大规模中间结果集
再与外层表进行 JOIN，最后施加过滤条件

这一策略的致命缺陷在于：外层的高选择性 JOIN / WHERE 条件，无法反向约束子查询的扫描范围。当子查询计算复杂、数据量庞大时，这条执行路径几乎必然成为性能瓶颈。

三、金仓数据库基于代价的连接条件下推设计

在金仓数据库 V009R002C014 版本中，我们针对上述问题引入了一套 “等价性 + 代价模型” 双重约束 的连接条件下推机制。整体设计思路可概括为两个核心步骤：

3.1 能不能推：等价性判定（Equivalence）

在这一阶段，优化器的目标并非"尽可能多地下推"，而是只识别绝对安全的下推机会：

分析子查询结构，判断是否满足语义等价条件
对包含聚集、窗口函数、UNION 等复杂结构的子查询进行约束性判定
将 JOIN 条件拆分为：可参数化部分（依赖外层列）与子查询内部列

通过等价性校验的 JOIN 谓词，将被改写为参数化过滤条件，注入到子查询的扫描或过滤阶段。

这一步回答的是：“推下去之后，结果会不会变？”

3.2 值不值推：代价模型（Cost）

通过等价性校验后，优化器并不会立即选择下推，而是进入代价评估阶段：

评估下推前后的完整执行路径
对比子查询扫描行数与中间结果规模的变化
量化参数化执行带来的重复计算成本
选择整体代价最低的执行计划

若代价模型判断下推收益不足，甚至可能引发性能回退，优化器将自动放弃下推，转而选择其他执行路径。

这一步回答的是：“推下去之后，真的会更快吗？”

详细工作流程如下图所示：

四、效果验证

4.1 最小化用例

SELECT*FROM(SELECTDISTINCT*FROM s3) s3, s1 WHERE s1.s1a = s3.s3a;

测试结果对比：

场景	执行策略	执行时间
未下推	子查询全表扫描 + 去重，再与 s1 JOIN	~84ms
下推后	子查询扫描阶段即被 JOIN 条件裁剪	~0.14ms

中间结果规模显著收缩，性能提升幅度达数量级。

作为对比，我们同样测试了 D 厂商（不支持下推）在相同场景下的表现：

EXPLAINSELECT/*+use_nl(s3 s1)*/*FROM(SELECTDISTINCT*FROM s3) s3, s1 WHERE s1.s1a = s3.s3a;

执行时间约 1.62ms，与金仓下推后的 0.14ms 相比，差距明显。

4.2 复杂场景验证

EXPLAINANALYZESELECT*FROM(SELECT*FROM(SELECTDISTINCT*FROM s3 UNIONSELECTDISTINCT*FROM s3 a ) s3, s1 WHERE s1.s1d = s3.s3a ) s JOIN(SELECT*FROM(SELECT s3a,SUM(s3b)OVER(PARTITIONBY s3a) s3d FROM s3 ) s3, s1 WHERE s1.s1a = s3.s3a ) j ON s.s3d = j.s3a;

该 SQL 涵盖 UNION、DISTINCT、窗口函数、多层子查询等复杂结构，是典型的高难度优化场景。

未下推时的执行路径：

处理内层 UNION 查询，左右两侧分别对基表 s3 进行去重全扫描，生成大规模结果集 A
结果集 A 与基表 s1 进行 JOIN，生成中间结果集 B
执行右侧子查询，对 s3 进行分组并计算窗口函数，生成大规模结果集 C
结果集 C 与基表 s1 进行 JOIN，生成中间结果集 D
最终对两个大规模中间结果集 B 与 D 执行 JOIN

整个过程中，子查询几乎全程依赖全表扫描，I/O 与计算开销极高，执行时间约 1081ms。

下推后的执行路径：

JOIN 条件提前注入子查询扫描阶段，数据在读取时即被裁剪
多个子查询由"全量扫描"转为"选择性扫描"，中间结果集规模大幅缩减
后续 JOIN 操作建立在小数据集之上，执行效率显著提升

执行时间从 1081ms 降至 0.23ms，性能提升超过 4000 倍。

五、总结

在复杂查询优化领域，连接条件下推并非一个简单的规则改写问题，而是一个典型的成本驱动型优化问题：

只做规则改写、不考虑代价，可能引发灾难性的性能回退
只关注代价、不保证语义等价，则会直接破坏 SQL 的正确性

通过 “等价性保障 + 基于代价的决策” 的组合设计，金仓数据库实现了：

在语义安全的前提下，最大化 JOIN 条件的提前过滤能力
显著压缩子查询阶段的数据扫描量与中间结果规模
在复杂 SQL 场景中获得数量级乃至万倍级的性能提升

这类优化对于 OLAP、混合负载以及复杂报表型查询场景尤为关键，也将是未来查询优化器持续演进的重要方向之一。

WebPShop插件完整指南：让Photoshop完美支持WebP图像格式

WebPShop插件完整指南：让Photoshop完美支持WebP图像格式【免费下载链接】WebPShopPhotoshop plug-in for opening and saving WebP images 项目地址: https://gitcode.com/gh_mirrors/we/WebPShop 作为现代图像格式的领军者，WebP以其卓越的压缩效率和动画支持能力，正在逐步改变数字图像的处理方式。然而，专业设计师在使用Photoshop时常常面临一个尴尬的现实：原生不支持WebP格式。WebPShop插件应运而生，为Photoshop用户提供了完整的WebP格式解决方案。 🤔 为什么需要WebPShop插件？痛点问题分析 * Photoshop原生无法打开.webp文件，导致工作流程中断 * 无法直接保存为WebP格式，必须依赖第三方转换工具 * 缺乏专业的压缩参数控制，无法优化图像质量与文件大小 * 动态WebP动画处理能力缺失，影响创意表达解决方案概述 WebPShop插件通过开源方式，为Photoshop添加了完整的WebP格式支持。无论是

AI Skills：前端新的效率神器！

近来，AI 领域有个火爆的话题：Skills。 Github 上被疯狂 star 的仓库，很多都是和 skills 有关的。有的仓库仅仅上线三个月就获得了快 50K 的 star，Skills 的火热可见一斑。不管是大模型，还是 Cursor、Codex、Claude、Trae、Copilot 等编程 IDE 都在争先支持 Skills。围绕 Skills，它们在做的就是为了完成一件事情：技能是通过学习和反复练习获得的，而 Skills 是把经验和最佳实践沉淀为 AI 能力，将“知道”转化为“做到”的本领。详解什么是 Skills 要说清楚什么是 Skills，先来了解一下关于 AI 的 2

MES生产制造执行系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

摘要随着工业4.0和智能制造的快速发展，制造企业对生产过程的精细化管理需求日益增长。传统生产管理模式依赖人工记录和纸质单据，存在数据滞后、信息孤岛和效率低下等问题，难以满足现代制造业对实时性、透明化和数字化的要求。MES（制造执行系统）作为连接企业计划层与控制层的关键桥梁，能够实现生产过程的实时监控、资源优化和数据分析，提升生产效率和产品质量。本系统通过信息化手段解决生产过程中的数据采集、任务调度和质量追溯等核心问题，助力企业实现数字化转型。关键词：MES系统、智能制造、数字化转型、生产管理、工业4.0。本系统采用前后端分离架构，后端基于SpringBoot框架实现RESTful API，提供高性能的数据处理和业务逻辑服务；前端使用Vue.js框架构建动态交互界面，提升用户体验；数据库采用MySQL存储生产数据，确保数据的一致性和可靠性。系统功能涵盖生产计划管理、设备监控、质量追溯、物料管理和报表分析等模块，支持多角色权限控制和移动端适配。通过实时数据采集与分析，系统能够优化生产排程、减少停机时间并提高资源利用率，为企业决策提供数据支持。关键词：SpringBoot、Vue.j

1Panel+Ollama+WebUI：打造本地AI模型的完整指南（附Gemini插件教程）

1Panel、Ollama与Open WebUI：构建你的私有化AI模型应用平台实战在AI技术日益普及的今天，许多开发者和技术爱好者不再满足于仅仅调用云端API。他们渴望在本地环境中部署、管理和实验自己的AI模型，无论是出于数据隐私的考量、网络环境的限制，还是纯粹对技术探索的热爱。构建一个稳定、易用且可扩展的本地AI平台，成为了一个极具吸引力的目标。本文将为你呈现一套完整的解决方案，它并非简单的工具堆砌，而是一个经过精心设计的、以1Panel为控制中枢，Ollama为模型引擎，Open WebUI为交互前端的集成化平台。我们将深入探讨如何将它们无缝衔接，并重点解锁通过插件系统集成如Gemini等第三方模型的高级玩法，让你在本地也能拥有媲美云端服务的AI应用体验。 1. 平台基石：1Panel与OpenResty的部署与配置构建任何复杂应用，一个稳定且管理便捷的基础环境是首要前提。1Panel作为一个现代化的Linux服务器运维管理面板，以其直观的Web界面和容器化应用管理能力，极大地简化了服务器运维工作。而OpenResty，作为Nginx的增强版本，集成了LuaJIT，为