Submodular function次模函数概念——AI学习

优质文章学习记录

09 Apr 2026 — 7 min read

论文名称：Submodularity In Machine Learning and Artificial Intelligence

一、综述论文

这篇文章是一篇 综述论文（survey）。

核心目标是：

介绍 Submodular functions（次模函数） 以及它们在 机器学习与人工智能中的应用。

作者想说明一个非常重要的观点：

很多机器学习问题其实是“离散优化问题”。

例如：

Feature Selection：属于数据预处理问题，旨在从原始特征中筛选出最相关、最有信息量的子集，以降低维度、提升模型性能与可解释性。
Dataset Subset Selection：属于数据采样或核心集选择问题，旨在从大规模数据中选取一个具有代表性的子集，以降低计算和存储成本，同时保持模型性能。
Active Learning：属于机器学习训练策略问题，通过让模型主动选择最有价值的数据进行标注，以最少的标注成本最大化模型性能。
Clustering：属于无监督学习问题，旨在根据数据的内在相似性，将未标记的数据自动分组为不同的类别或簇。
Data summarization：属于信息压缩与呈现问题，旨在通过生成简洁的摘要（如关键点、代表性样本或可视化）来捕捉大型数据集或复杂数据的核心信息。

这些问题的共同特点：决策变量是 集合 (set) 不是连续变量。

例如：从1000个数据里选100个，从100个特征里选20个，组合数量是指数级的。

因此：

需要一种结构，使得 指数空间的问题仍然能高效优化。

这就是 Submodular Function 的意义。

作者提出一个很重要的类比：

连续优化	离散优化
convex function	submodular function

可以简单理解为：Submodular ≈ 离散版本的 convex/concave 结构 但其实更复杂。

二、什么是 Submodular Function（核心）

论文给出的正式定义是：

对于集合函数：

即：

输入：集合的子集

输出：一个数值

满足：

对所有集合 A,B。

这叫：

Submodular inequality

更直觉的理解

论文强调：

Submodularity = Diminishing Returns

即：

边际收益递减

数学表达：

f(A \cup \{e\}) - f(A) \ge f(B \cup \{e\}) - f(B)

当：

意思是：

同一个元素 e 加入 小集合 的价值 ≥ 加入 大集合 的价值

这就是 submodular 的核心思想。

可视化解释

这张图表示：

f(S) = 集合 S 的“价值” |S| = 集合大小（选了多少个元素）

曲线特点：一开始增长很快，后面越来越平

集合大小	f(S)	增长
0 → 1	0 → 1	+1
1 → 2	1 → 1.41	+0.41
2 → 3	1.41 → 1.73	+0.32
...	...	越来越小

这正是：边际收益递减（Diminishing Returns）

这张图更关键，它直接画的是：每增加一个元素，带来的“新增价值”

也就是：

f(S ∪ {x}) − f(S)

可以看到：

第一个元素 → 增益最大（≈1）
后面越来越小（0.4 → 0.3 → 0.2 → ...）

这张图就是 Submodular 的本质图像

三、论文给出的例子

“朋友的价值”

设：f(S) = 朋友集合 S 的价值

如果你已经有很多朋友：再增加一个朋友的价值会==》变小。如果你朋友很少那么==》新朋友价值更大。

例如：

第 1个朋友：价值 10

第10个朋友：价值 1

所以：

f({}) → f({A}) 增量很大

f({A,B,C,D}) → f({A,B,C,D,E}) 增量较小

这就是传说中的：边际收益递减

四、论文里的复杂例子（咖啡、牛奶、茶）

论文用一个比较复杂的例子说明：

物品之间可能存在三种关系：

1 Submodular（替代关系）

例如： coffee + tea 两者功能类似。

所以：

f(coffee, tea) < f(coffee) + f(tea)

因为它们是 substitutes替代品

2 Supermodular（互补关系）

例如：coffee + milk 组合更好。

所以：

f(coffee, milk) > f(coffee) + f(milk)

叫：complementarity互补者

3 Modular（独立）

例如：lemon + milk 互不影响

f(A,B) = f(A) + f(B)

所以：

类型	数学
Submodular	diminishing returns
Supermodular	increasing returns
Modular	linear

五、信息论里的经典例子：Entropy

论文给了一个非常重要的结论：

Entropy 是 submodular 函数

设：f(S) = H(X_S)

即：某个变量集合的 entropy。

满足：

原因：互信息非负。

这在信息论里叫：Shannon inequality香农不等式。

六、常见 Submodular Function 类型

论文列了一些机器学习里常见的：

1 concave over cardinality

例如：

因为：

是 concave。

所以：边际增长递减。

2 Feature-based function

形式：

其中：

是 concave

常见于：

NLP

document summarization

3 Facility Location（重要）

定义：

f(S)=\sum_{i\in V}\max_{j\in S} sim(i,j)

含义：每个点 i，找 S 中最像的点

用于：

data summarization
clustering
representative subset

4 Set Cover

含义：S 覆盖的元素数量。

常见：

document summarization

sensor placement

七、Submodular 为什么重要

因为它有 优化保证。

对于：

Submodular Maximization子模最大化

例如：

max f(S)

s.t. |S| ≤ k

使用：

Greedy algorithm贪心

可以保证：

$$(1 - 1/e) \approx 0.63$$

近似最优。

这是一个 非常强的理论保证。

八、机器学习中的应用

论文后半部分主要讲应用：

1 文本摘要

从 100 句新闻选 5 句。目标是覆盖尽量多信息，避免重复

这种目标函数很适合：submodular

2 数据集压缩

例如：100万训练样本，选1万代表样本

目标：覆盖整个数据分布

3 特征选择

例如：1000 个特征，选50 个

目标：信息最多，冗余最少

4 Active Learning

有 100 万未标注数据。

选择：最有信息的 1000 个去标注

九、总结

Submodular function 的本质：

一种具有“边际收益递减”性质的集合函数，使得许多指数级的离散优化问题可以高效近似求解。

它在机器学习中的作用类似于：convex function 在连续优化中的作用

拙见：

很多 AI 问题都是“从一堆东西里选一个子集”

例如：选数据、选句子、选特征、选代表点

如果目标函数是submodular、那么用 greedy 算法就能得到接近最优的解

所以：submodular = 让组合优化变得可解

（WenJGo^_^全文完）

5分钟部署GLM-4.6V-Flash-WEB，视觉大模型网页推理一键启动

5分钟部署GLM-4.6V-Flash-WEB，视觉大模型网页推理一键启动你有没有过这样的经历：刚在技术群里看到一个惊艳的多模态模型，兴冲冲打开终端准备试一试，结果卡在git clone三小时不动、pip install报错十次、CUDA版本对不上、模型权重下载到99%断连……最后关掉终端，默默点开短视频。这次不一样。 GLM-4.6V-Flash-WEB 不是又一个“理论上很厉害但跑不起来”的开源项目。它是一套真正为“今天就要用”而设计的视觉大模型推理方案——单卡可跑、网页直连、API即调、5分钟从零到可用。不需要懂ViT结构，不用配环境变量，不查PyTorch兼容表。你只需要一台带NVIDIA显卡的机器（RTX 3090起步，3060也能凑合），执行三步操作，就能在浏览器里上传图片、输入问题、实时获得图文理解结果。这不是演示，是开箱即用的生产力工具。 1. 为什么说“5分钟部署”不是夸张？ 1.1 它真的不依赖GitHub网络传统方式部署多模态模型，本质是在和网络基建搏斗：

WEB小游戏开发之扫雷游戏项目说明

扫雷游戏项目说明 * 📖 引言 * 🎮 游戏介绍 * 📏 游戏规则 * 基本规则 * 游戏流程 * ✨ 功能特点 * 🚀 安装与运行 * 在线体验 * 本地运行 * 🎯 操作说明 * 桌面设备操作 * 移动设备操作 * 键盘操作 * 🧠 游戏技巧 * 基础技巧 * 高级策略 * 💻 技术实现 * 前端技术 * 核心算法 * 性能优化 * 📁 项目结构 * 🌐 浏览器兼容性 * 📱 移动设备支持 * 🛠 开发说明 * ❓ 常见问题 * 如何提高我的扫雷技巧？ * 为什么第一次点击总是安全的？ * 如何在移动设备上标记地雷？ * 双击功能有什么用？ * 游戏是否有时间限制？ * 👥 贡献指南 * 📄 许可证 📖 引言本篇是一款经典的单人逻辑推理（扫雷）游戏项目说明。 🎮 游戏介绍扫雷是一款经典的单人逻辑推理游戏，最早出现在1960年代的大型机系统上，后来在1990年代随着Windows操作系统的普及而广

满分高危来袭！CVE-2026-21962击穿Oracle WebLogic代理插件，无认证远程控服全解析

2026年1月20日，Oracle发布2026年度首个关键补丁更新（CPU Jan 2026），一次性修复了全产品线158个CVE漏洞、发布337个安全补丁，其中27个关键级漏洞占比8%，涉及13个核心CVE编号。而Oracle WebLogic Server代理插件中曝出的CVE-2026-21962漏洞，凭借CVSS 3.1满分10.0的评级、无认证远程利用、低攻击复杂度的特性，成为本次更新中最具威胁的漏洞，也让全球大量部署WebLogic中间件的企业陷入安全危机。该漏洞并非简单的权限绕过，而是可直接实现远程命令执行（RCE），攻击者仅需构造恶意HTTP请求，即可绕过所有安全校验直接控制目标服务器，窃取、篡改核心业务数据，甚至实现内网横向移动，其危害覆盖金融、政务、能源、电商等所有使用WebLogic代理插件的关键行业。本文将从漏洞背景、技术原理、利用现状、防护方案及行业安全启示等维度，进行专业、全面的深度解读，并结合WebLogic历史漏洞规律给出前瞻性防护建议，为企业筑牢安全防线。一、漏洞核心背景：Oracle 2026首波更新，WebLogic成高危重灾区 Oracl

3步快速上手CloudBeaver：轻松搭建Web数据库管理平台

3步快速上手CloudBeaver：轻松搭建Web数据库管理平台【免费下载链接】cloudbeaverCloud Database Manager 项目地址: https://gitcode.com/gh_mirrors/cl/cloudbeaver CloudBeaver是一款强大的开源云数据库管理工具，让你通过浏览器就能统一管理多种数据库。无论你是开发人员还是数据库管理员，都能快速搭建属于自己的数据库管理平台。本指南将带你从零开始，3步完成CloudBeaver的部署和使用。 🎯 为什么选择CloudBeaver？你是否遇到过这些问题？ * 需要在不同数据库之间频繁切换，操作繁琐 * 团队成员使用不同的数据库客户端，难以统一管理 * 想要通过Web界面远程管理数据库，但找不到合适的工具 CloudBeaver正是为解决这些问题而生： * 统一管理：支持MySQL、PostgreSQL、Oracle等主流数据库 * Web界面：无需安装客户端，浏览器即可访问 * 开源免费：完全开源，无需支付任何费用 📋 环境准备检查在开始安装前，请确保你的