如何使用Dify搭建合同审查平台-法律文书机器人Agent？

优质文章学习记录

10 Apr 2026 — 5 min read

在 Windows 系统中，基于 Dify 这个低代码 LLM 应用开发平台，从零搭建一个能解析合同、识别法律风险、给出修改建议的智能 Agent，全程覆盖环境部署、知识库构建、Agent 配置、功能测试的全流程。

第一阶段：Windows 环境准备（基础依赖安装）

步骤 1：安装 Python（Dify 运行基础）

下载 Python：访问Python 官网，下载Python 3.10+ 版本（推荐 3.10.11，兼容性最好）。
安装注意：
- 勾选「Add Python 3.10 to PATH」（关键，避免手动配置环境变量）。
- 选择「Customize installation」，确保「pip」组件被勾选。
验证安装：打开管理员模式的 CMD，执行：
- python --version # 输出Python 3.10.x即成功
- pip --version # 输出pip版本即成功

步骤 2：安装 Docker（Dify 容器化部署）

Dify 推荐用 Docker 部署（Windows 下最稳定），需安装 Docker Desktop：

下载 Docker Desktop：访问Docker 官网，下载 Windows 版本。
安装要求：
- Windows 10/11 专业版 / 企业版需开启 Hyper-V（控制面板→程序→启用或关闭 Windows 功能→勾选 Hyper-V 和容器）。
- 家庭版需安装 WSL2：执行wsl --install（CMD 管理员模式），重启电脑后自动安装 Ubuntu。
启动 Docker：安装完成后启动 Docker Desktop，等待右下角图标变为「Running」（首次启动可能需要几分钟）。
验证 Docker：CMD 执行：
- docker --version # 输出Docker版本
- docker-compose --version # 输出compose版本

步骤 3：克隆并启动 Dify

安装 Git（可选，也可手动下载）：winget install Git.Git # Windows 10/11自带winget，无则手动下载Git
克隆 Dify 仓库：# 新建文件夹（如D:\dify），进入该文件夹后执行
1. git clone https://github.com/langgenius/dify.git
2. cd dify
启动 Dify 容器：# 启动所有服务（首次启动会下载镜像，约5-10分钟）
1. docker-compose up -d
验证 Dify 启动：
1. 打开浏览器，访问http://localhost:8000，出现 Dify 登录界面即成功。
2. 默认初始账号：[email protected]，密码：password123（首次登录需修改密码）。

正常启动的输出示例（无报错）：

[+] Running 10/10 ✔ Network dify_network Created ✔ Container dify-weaviate Started ✔ Container dify-redis Started ✔ Container dify-db Started ✔ Container dify-worker Started ✔ Container dify-api Started ✔ Container dify-web Started ✔ Container dify-nginx Started

第二阶段：Dify 基础配置（连接大模型）

步骤 1：登录 Dify 并配置大模型

合同审查需要高精度大模型，推荐配置OpenAI GPT-4o（或国内模型如通义千问、文心一言），以下以 OpenAI 为例：

登录 Dify 后，点击左侧「设置」→「模型提供商」。
选择「OpenAI」，填写配置：
- API Key：你的 OpenAI API Key（需自行申请）。
- 模型名称：选择「gpt-4o」（核心）、「gpt-4o-mini」（辅助）。

其他默认，点击「保存」。

若使用国内模型（如通义千问）：选择对应提供商，填写 API Key 和接入地址，步骤类似。

步骤 2：配置文件解析插件（处理合同 PDF/Word）

合同多为 PDF/Word 格式，需启用 Dify 的文件解析功能：

点击左侧「设置」→「功能配置」→「文件解析」。
开启「允许上传文件」，勾选支持的格式：PDF、DOCX、TXT。
解析引擎选择「内置解析器」（无需额外配置，满足基础需求），点击「保存」。

第三阶段：构建法律知识库（RAG 核心）

合同审查 Agent 需要基于法律条文 / 审查规则检索，需先构建知识库：

步骤 1：准备知识库文件

提前准备以下文件（示例）：

        《民法典 - 合同编.pdf》（核心法律条文）。
        《企业合同审查指引.docx》（内部审查规则）。
        《常见合同风险清单.txt》（自定义风险点）。

步骤 2：创建知识库

点击左侧「知识库」→「新建知识库」，填写：
- 名称：「合同审查法律知识库」。
- 描述：「包含民法典、合同审查规则、风险清单的法律知识库」。
- 存储方式：默认「向量库」，点击「创建」。

步骤 3：上传知识库文件并处理

进入新建的知识库，点击「添加文档」→「上传文件」，选择准备好的 PDF/Word/TXT 文件。
文档处理配置：
1. 分块策略：「按段落分块」，分块大小：500 字符，重叠长度：50 字符（法律文本适配）。
2. 嵌入模型：选择「text-embedding-3-small」（OpenAI）或国内模型如「通义千问 - embedding」。
3. 点击「确认」，等待文档解析和向量入库（约 1-2 分钟，视文件大小而定）。

第四阶段：搭建合同审查 Agent（核心步骤）

步骤 1：创建 Agent 应用

点击左侧「应用」→「新建应用」→选择「智能体（Agent）」→「创建」。
基础配置：
- 应用名称：「合同审查智能 Agent」。
- 描述：「自动审查合同法律风险，给出修改建议」。

步骤 2：配置 Agent 核心能力

子步骤 1：设置 Agent 角色与提示词（Prompt）

1. 进入 Agent 编辑页面，点击「提示词」→「系统提示词」，粘贴以下核心提示词（可直接复制）：

你是一名拥有10年商事法律经验的资深法务专家，专注于合同审查领域，严格遵守中国现行法律法规（如《民法典》）。 你的核心任务是： 1. 解析用户上传的合同文件，提取核心条款（主体、标的、金额、付款方式、违约责任、保密条款、争议解决等）。 2. 基于知识库中的法律条文和审查规则，识别合同中的法律风险点。 3. 对每个风险点给出明确的风险等级（高/中/低）、风险描述、法律依据、修改建议。 4. 最终输出结构化的审查报告，语言简洁、专业，符合企业法务审查规范。 约束条件： - 仅基于知识库中的内容回答，不确定的内容标注「

Android端Whisper中文语音识别实战：从模型部署到性能优化

快速体验在开始今天关于 Android端Whisper中文语音识别实战：从模型部署到性能优化的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验在Android设备上实现高效的语音识别一直是个挑战，尤其是处理中文这种复杂的语言。最近我尝试将OpenAI的Whisper模型集成到Android应用中，过程中遇到了不少坑，也总结了一些优化经验，分享给大家。移动端语音识别的特殊挑战 1. 算力限制：相比服务器，手机CPU和GPU性能有限，特别是低端设备。

告别复杂操作：灵感画廊极简AI绘画体验

告别复杂操作：灵感画廊极简AI绘画体验 "见微知著，凝光成影。将梦境的碎片，凝结为永恒的视觉诗篇。" 你是否曾经被复杂的AI绘画工具劝退？参数太多、界面太乱、学习成本太高...现在，这一切都将成为过去。灵感画廊（Atelier of Light and Shadow）基于Stable Diffusion XL 1.0打造，却彻底摒弃了工业化的复杂界面，为你提供一个如艺术沙龙般恬静的创作空间。 1. 为什么选择灵感画廊？传统的AI绘画工具往往让人望而生畏。密密麻麻的参数滑块、晦涩难懂的技术术语、需要反复调试的复杂设置...这些都不是创作者想要的。灵感画廊完全不同。它相信：真正的创作应该专注于灵感本身，而不是技术细节。这里没有"提示词"，只有"梦境描述"；没有"反向词"

ClawdBot效果展示：语音消息→Whisper转写→英译日→Telegram推送全链路

ClawdBot效果展示：语音消息→Whisper转写→英译日→Telegram推送全链路你有没有试过在 Telegram 群里听一段英语语音，想立刻知道它在说什么，又不想手动点开翻译软件、复制粘贴、再切回群聊？或者收到朋友发来的日语语音，却只能干瞪眼？ ClawdBot 不是概念演示，也不是半成品 Demo。它是一套真正跑在你本地设备上的「端到端多模态翻译流水线」——从 Telegram 收到一条语音，到你在手机上看到准确的日语文字回复，全程无需上传云端、不依赖境外服务、不经过第三方服务器，耗时不到 3 秒。这不是科幻设定，而是今天就能搭起来的真实体验。 1. 全链路效果实测：一条语音，三秒落地我们不做抽象描述，直接看真实操作流。以下所有步骤均在一台普通笔记本（i5-1135G7 + 16GB 内存 + RTX3050）上完成，模型全部本地运行，无网络请求穿透防火墙。 1.1 场景还原：群聊中的一条英语语音

Matlab报错找不到编译器？5分钟搞定MinGW-w64 C/C++环境配置（附环境变量设置）

Matlab报错找不到编译器？5分钟搞定MinGW-w64 C/C++环境配置（附环境变量设置）最近在尝试用Matlab调用一些C/C++写的算法库，或者想编译一个别人分享的.mex文件时，是不是经常在命令行里敲下 mex -setup 后，迎面而来的就是一个冰冷的报错窗口？"未找到支持的编译器或 SDK"——这句话对很多刚接触Matlab混合编程的朋友来说，简直像一盆冷水。别担心，这几乎是每个Matlab用户进阶路上的必经之坎。问题的核心，往往不在于Matlab本身，而在于你的电脑缺少一个它认可的“翻译官”：C/C++编译器。对于Windows用户，官方推荐且免费的解决方案就是MinGW-w64。这篇文章，就是为你准备的从报错到成功配置的完整路线图。我们不只告诉你步骤，更会解释每一步背后的逻辑，并附上那些容易踩坑的细节和验证方法，目标是让你一次配置，终身受益。 1. 理解问题根源：为什么Matlab需要单独的编译器？在深入操作之前，花几分钟搞清楚“为什么”，能帮你避免未来很多“是什么”的困惑。Matlab本身是一个强大的解释型语言环境，