AI大模型学习之基础数学：正态分布-AI大模型中的概率统计基石

Ne0inhk

16 Mar 2026 — 3 min read

🧑 博主简介：ZEEKLOG博客专家、ZEEKLOG平台优质创作者，高级开发工程师，数学专业，10年以上C/C++, C#, Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,qt,python等，具备多种混合语言开发能力。撰写博客分享知识，致力于帮助编程爱好者共同进步。欢迎关注、交流及合作，提供技术支持与解决方案。\n技术合作请加本人wx（注明来自ZEEKLOG）：xt20160813

正态分布：AI大模型中的概率统计基石

人工智能（AI）大模型的理论基础离不开线性代数、概率统计和微积分，其中概率统计为数据建模、不确定性分析和模型优化提供了核心工具。在概率统计中，正态分布（Normal Distribution）因其广泛的存在性和数学性质，成为最重要的分布之一。本文将深入讲解正态分布的概念、原理、关键性质及其在AI大模型中的应用,适合希望掌握模型数学基础的开发者参考。

一、正态分布简介

正态分布，也称为高斯分布（Gaussian Distribution），是一种连续概率分布，其概率密度函数呈现钟形曲线，广泛出现在自然现象和数据分析中。在AI领域，正态分布是许多统计方法和机器学习模型的基础，例如假设检验、参数估计和生成模型。

正态分布的核心特点是对称性和集中趋势，大部分数据点围绕均值分布，两侧逐渐衰减。这种特性使其成为建模随机变量的理想工具，尤其在处理高维数据和模型噪声时。

二、正态分布的核心概念与原理

以下详细讲解正态分布的定义、概率密度函数、性质及相关知识点。

1. 定义与概率密度函数

概念：

正态分布描述连续随机变量XXX的概率分布，由两个参数决定：
- 均值（μ\muμ）：分布的中心，反映数据的平均水平。
- 标准差（σ\sigmaσ）：分布的分散程度，(\sigma)越大，曲线越平坦。
若随机变量XXX服从正态分布，记为X∼N(μ,σ2)X \sim N(\mu, \sigma^2)X∼N(μ,σ2)，其中σ2\sigma^2σ2是方差。

概率密度函数（PDF）：
正态分布的概率密度函数为：
f(x)=12πσ2e−(x−μ)22σ2 f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2πσ21e−2σ2(x−μ)2

其中：
- 2πσ2\sqrt{2\pi\sigma^2}2πσ2是归一化常数，确保概率密度积分等于1。
- e−(x−μ)22σ2e^{-\frac{(x-\mu)^2}{2\sigma^2}}e−2σ2

Flutter for OpenHarmony：swagger_dart_code_generator 接口代码自动化生成的救星（OpenAPI/Swagger）深度解析与鸿蒙适配指南

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net 前言后端工程师扔给你一个 Swagger (OpenAPI) 文档地址，你会怎么做？ 1. 对着文档，手写 Dart Model 类（容易写错字段类型）。 2. 手写 Retrofit/Dio 的 API 接口定义（容易拼错 URL）。 3. 当后端修改了字段名，你对着报错修半天。这是重复劳动的地狱。 swagger_dart_code_generator 可以将 Swagger (JSON/YAML) 文件直接转换为高质量的 Dart 代码，包括： * Model 类：支持 json_serializable，带 fromJson/

Flutter 三方库 junitreport_maintained 的鸿蒙化适配指南 - 实现标准 JUnit XML 测试报告的端侧生成、支持自动化测试结果汇总与 Jenkins/CI 集成实战

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 junitreport_maintained 的鸿蒙化适配指南 - 实现标准 JUnit XML 测试报告的端侧生成、支持自动化测试结果汇总与 Jenkins/CI 集成实战前言在进行 Flutter for OpenHarmony 的大规模工程化开发时，测试驱动开发（TDD）是保障应用质量的关键。但 Flutter 默认的测试输出主要是控制台文本，难以直接接入专业的持续集成（CI）可视化控制台。junitreport_maintained 是一个能将 Dart 测试结果转化为标准的 JUnit XML 格式的工具。本文将介绍如何在鸿蒙端构建极致的自动化测试反馈链路。一、原直观解析 / 概念介绍 1.1 基础原理该工具通过管道符（

【Linux】进程调度算法、进程切换、环境变量

前言这篇文章聚焦 Linux 的进程调度算法、进程切换与环境变量：拆解调度规则如何分配 CPU 资源，解析进程切换的底层步骤，梳理环境变量对程序运行的影响，帮你理清这些机制在系统中的核心作用。 ⚙️ Linux 进程篇【冯诺依曼体系 + 操作系统】【进程概念 + PID + fork函数】【进程状态】【进程优先级】目录 ------------进程调度------------ 1、进程调度概念 2、位图（bitmap）中位的定位与状态判断 3、进程调度流程 ------------进程切换------------ 1、进程切换概念 2、进程上下文是什么？ 3、cpu中的寄存器是什么？【问题】：为什么函数返回值会被外部拿到？【问题】：系统如何知道进程当前执行到哪行代码？ 4、如何进行进程切换？【小故事】：学生当兵【进程切换核心步骤】 ------------环境变量------------ 1、环境变量概念 2、

Linux红帽：RHCSA认证知识讲解（十二）调试 SELinux，如何管理 SELinux 的运行模式、安全策略、端口和上下文策略

Linux红帽：RHCSA认证知识讲解（十二）调试 SELinux，如何管理 SELinux 的运行模式、安全策略、端口和上下文策略 * 前言 * 一、SELinux 简介 * 二、SELinux 的运行模式 * 2.1 查看和切换 SELinux 模式 * 三、SELinux 预设安全策略的开关控制 * 四、管理 SELinux 安全端口开放策略 * 五、管理 SELinux 安全上下文策略 * 六、修改 firewalld 防火墙策略 * 七、真题带练 * 答案 * 逐行讲解前言 * 在红帽 Linux 系统的管理工作中，SELinux 的调试和管理是系统管理员经常会遇到的重要任务。 * 这些任务对于保障系统的安全性和稳定性起着关键作用。 * 本文将深入且详细地讲解如何调试