初识Langchain之AI语言大模型

优质文章学习记录

06 Apr 2026 — 5 min read

1. 什么叫模型

今天我们来聊一聊什么叫做模型。

模型是⼀个从数据中学习规律的“数学函数”或“程序”。旨在处理和⽣成信息的算法，通常模仿⼈类的认知功能。通过从⼤型数据集中学习模式和洞察，这些模型可以进⾏预测、⽣成⽂本、图像或其他输出，从⽽增强各个⾏业的各种应⽤。

简单来说就是一个模型只会处理一件事，我们也可以把它理解为单个工作流，然后多个模型组合在一起就是语言大模型了。

它和工作流的区别在我看来就是它这个处理是需要提前训练。我们看下面这个图片，我们就像这样把下面这些狗狗的图片全部都喂给模型，并且我们需要给每一张图片都标注好这个是狗，这样再经过很多张这样图片让AI看，然后AI就学会分辨什么是狗了。

但是这个模型的话就只可以分辨什么是狗，如果我们问这个模型什么是猫的话，那么这个模式是无法做出回答的。

2. 什么是大语言模型

2.1 神经网络

神经网络我们可以理解为很多个无数个组合在一起的工作流，每一块工作流只处理一小部分的问题，通过各自之间的配合，从而达成有效处理用户信息的能力。

2.2 自监督学习

自监督学习是一种无监督学习的进阶范式，核心是让模型自己从原始数据中构造监督信号（标签），无需人工标注数据，就能完成特征学习和模型训练。

这个的话我的理解就相当于是自学，同时自己给自己修正方向。

2.3 半监督学习

半监督就是“少量指导+⼤量自学”的结合模式。

通过给部分的照片备注，接着再放一些不相关的照片来给模型进行识别，这种学习过程叫做半监督学习。

2.4 语言模型

语⾔模型的核⼼任务就是预测下⼀个词。⼀个强⼤的语⾔模型，能够根据⼀段话，预测出最合理、最通顺的下⼀个词是什么，这样⼀个个词接下去，就能⽣成⼀整段话、⼀篇⽂章。

比如我们平常打字时的自动补全，那就是一种语言模型。

3. 大语言模型的能力

大语言模型和语言模型并不完全是一种东西。简单来说，所有大语言模型都是语言模型，但并非所有语言模型都是大语言模型。

核心定义与关键特征

核心定位：以 “预测下一个词” 为基础任务，通过海量数据学习语言规律、知识与逻辑，涌现对话、推理、创作等通用能力，而非仅针对单一任务。
三大关键特征
- 架构：统一采用 Transformer（多为纯 Decoder），自注意力机制高效捕捉长距离语义依赖，并行计算能力远超 RNN/LSTM。
- 规模：参数量达数十亿至万亿级（如 GPT-3 1750 亿、GPT-4 万亿级），训练数据为 TB 级通用文本（书籍、网页、代码等）。
- 能力：支持零样本 / 少样本学习，可跨任务泛化，具备上下文理解、复杂推理与多模态（文本 + 图像 / 音频）处理能力。

主要挑战与局限

幻觉：生成看似合理但不符合事实的内容，需外部知识库或检索增强（RAG）修正。
算力与成本：训练与推理依赖大规模 GPU 集群，成本高、能耗大。
安全与伦理：存在偏见、隐私泄露、内容滥用风险，需强化对齐与合规管控。
上下文窗口限制：虽持续扩大（如 GPT-4 128k、Gemini 1.5 Pro 10M），但超长文本处理仍有瓶颈。

Windows 11：如何轻松安装或卸载 Copilot 应用（多种方法）

起初，Copilot 是一个与 Windows 11 和 Windows 10 系统紧密结合的内置 AI 助手，能够通过回答问题、调整系统设置等功能来提高你的工作效率。但从 Windows 11 24H2 开始，Copilot 功能已经从系统中剥离出来，成了一个基于 Microsoft Edge 的独立 Copilot 应用。这意味着，你可以像传统桌面应用那样，轻松移动窗口位置、调整窗口大小，并将它固定到任务栏。由于变成了独立应用，所以你也可以在早期 Windows 11 甚至 Windows 10 上安装和卸载它。以下步骤同样适用于 Windows 10，但操作步骤可能会略有不同。在 Windows 11 上安装 Copilot 应用方法

医疗AI场景下算法编程的深度解析（2026新生培训讲稿）（八）

第15章模型融合与集成策略在机器学习竞赛和实际应用中，模型融合（Model Ensemble）是提升预测性能的利器。通过组合多个不同的基模型，集成策略能够综合各个模型的优势，抵消单个模型的偏差和方差，从而获得比任何单一模型更稳定、更准确的预测结果。在医疗AI领域，模型融合同样具有重要价值——面对复杂多模态的医疗数据，单一模型往往难以全面捕捉所有信息，而融合多个异质模型可以提升诊断的鲁棒性和准确性。本章将从集成学习的基本思想出发，系统介绍常见的模型融合方法，包括投票法、平均法、Stacking、Blending等，并通过实战案例展示如何构建融合模型来提升疾病预测性能。 15.1 集成学习的基本思想集成学习（Ensemble Learning）的核心思想是“三个臭皮匠，顶个诸葛亮”——通过结合多个学习器来完成学习任务，通常可以获得比单一学习器更优越的泛化性能。根据个体学习器的生成方式，集成学习主要分为两大类： * Bagging：并行训练多个独立的基学习器，然后通过平均或投票进行结合。典型代表是随机森林。Bagging主要降低方差。 * Boosting：串行训练基学习

Flutter 组件 deepseek 的适配鸿蒙Harmony 实战 - 驾驭国产最强大模型 API、实现鸿蒙端 AI 原生对话与流式渲染的高效集成方案

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 deepseek 的适配鸿蒙Harmony 实战 - 驾驭国产最强大模型 API、实现鸿蒙端 AI 原生对话与流式渲染的高效集成方案前言在 AI 浪潮席卷全球的今天，大模型（LLM）已成为移动应用创新的核心引擎。而在众多的国产模型中，DeepSeek 凭借其卓越的算法效率和极致的性价比，正成为开发者们的“真香”选择。将 DeepSeek 这种顶尖的认知能力，植入到全面拥抱智能化、万物互联的鸿蒙（OpenHarmony）系统中，将碰撞出怎样的火花？ deepseek 库为 Flutter 提供了极简的 API 封装，它完美支持了 SSE（流式事件流）响应，能让你的鸿蒙 App

会议记录自动化实战：用Whisper镜像快速生成多语言转录

会议记录自动化实战：用Whisper镜像快速生成多语言转录引言：会议记录的效率革命在跨部门协作、跨国会议和远程办公日益频繁的今天，手动整理会议纪要已成为一项耗时且低效的任务。传统方式不仅容易遗漏关键信息，还难以应对多语言混合发言、背景噪声干扰等现实挑战。基于 OpenAI Whisper Large v3 构建的「Whisper语音识别-多语言-large-v3语音识别模型」镜像，为这一痛点提供了高效解决方案。该镜像集成了1.5B参数规模的超大规模语音识别模型，支持99种语言自动检测与转录，并通过Gradio构建了直观易用的Web界面，真正实现了“上传即转录”的无缝体验。本文将带您深入掌握： * 如何快速部署并运行该语音识别服务 * 多语言会议录音的自动化处理流程 * 实际使用中的性能优化技巧 * 常见问题排查与稳定性保障策略 1. 镜像核心能力解析 1.1 模型架构与技术优势 Whisper-large-v3采用Transformer编码器-解码器结构，具备以下核心技术特征：特性参数值说明模型参数量1.5B（15亿）超大规模提升语义理解能力

1. 什么叫模型

2. 什么是大语言模型

2.1 神经网络

2.2 自监督学习

2.3 半监督学习

2.4 语言模型

3. 大语言模型的能力

Read more

Windows 11：如何轻松安装或卸载 Copilot 应用（多种方法）

医疗AI场景下算法编程的深度解析（2026新生培训讲稿）（八）

Flutter 组件 deepseek 的适配 鸿蒙Harmony 实战 - 驾驭国产最强大模型 API、实现鸿蒙端 AI 原生对话与流式渲染的高效集成方案

会议记录自动化实战：用Whisper镜像快速生成多语言转录

Flutter 组件 deepseek 的适配鸿蒙Harmony 实战 - 驾驭国产最强大模型 API、实现鸿蒙端 AI 原生对话与流式渲染的高效集成方案