Claude 安装实操教程与 AI Agent 基础概念

优质文章学习记录

12 Apr 2026 — 20 min read

注意：安装及使用 Claude 时需要保证网络通畅，否则会出现安装失败、无法登录等问题。

本文档基于 Win11 系统实操经验整理，内容来自个人安装使用经历及学习B站相关教程时的笔记，感谢各位视频创作者的分享。

Claude 完整使用教程

一、下载与安装

1.1 官方下载渠道

官方桌面端下载页：Claude Code by Anthropic | AI Coding Agent, Terminal, IDE

1.2 安装步骤

启动 PowerShell：按下 Win 键搜索 PowerShell，右键选择「以管理员身份运行」（避免权限不足导致安装失败）
安装成功验证：当终端输出 Installation completed successfully! 时，即代表安装完成
启动 Claude：在 PowerShell 中输入 claude 命令，即可启动程序

执行安装命令：在终端中粘贴以下命令，按下回车执行powershell

irm https://claude.ai/install.ps1 | iex

1.3 常见安装失败解决

若提示「脚本执行被禁止」：先执行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser，选择「Y」确认后，再重新执行安装命令
若提示「无法连接到远程服务器」：检查网络环境。

二、账号登录

启动 Claude 后，会自动唤起官方账号登录界面，可直接使用 Claude 免费 / Pro/Max 订阅账号登录
若未弹出登录窗口，在终端输入 /login 命令，手动唤起登录界面
免费替代方案：若不想使用官方账号，可使用第三方接口，参考接口文档完成配置后，可跳过官方账号登录直接使用，这里不过多赘述。

三、核心模式与高频操作

3.1 三种核心工作模式

使用 Shift+Tab 快捷键可循环切换模式，切换后终端会显示对应模式状态：

默认模式（无特殊标注）：安全稳妥模式，每次创建、修改文件都会先询问用户确认，界面显示「? for shortcuts」
自动模式（accept edits on）：高效模式，自动修改文件无需逐次询问用户，适合批量处理、快速开发
规划模式（plan mode on）：构思模式，仅讨论方案、不修改本地文件，适合项目前期梳理、需求拆解

3.2 高频快捷键与基础命令

表格

操作 / 命令	功能说明
`Shift+回车`	终端内换行，避免直接回车发送指令
`Ctrl+G`	打开图形化标签页，替代纯命令行操作
`! + 终端命令`	直接执行 bash/cmd 命令，例：`!start index.html` 快速打开文件
`/login`	唤起账号登录界面
`/resume` 或 `claude -c`	重启后恢复上一次的会话页面
`/restart --resume`	重启 Claude 并恢复会话，无需手动关闭重开

3.3 规划模式与权限管理

规划模式使用：用规划模式写完项目计划后，Claude 会给出 3 个执行选项：
1. YES，进入自动模式（写入文件无需确认，执行 mkdir 等终端命令仍需用户同意）
2. YES，使用默认模式
3. 继续修改计划
任务与进程管理：
- 输入 /tasks 查看当前正在运行的任务列表
- 若执行 npm run dev 等命令阻塞终端，按 Ctrl+B 可将进程放入后台运行
- 在任务列表中按 k 可关闭选中的服务 / 进程

权限放行命令：powershell

claude --dangerously-skip-permissions

执行后 Claude 可自动执行任何终端命令，进入 bypass permissions on 模式，适合信任度高的项目场景

四、进阶功能使用

4.1 回滚操作

Claude 每次接收用户指令都会自动创建回滚点，支持撤销操作，避免误改文件：

触发回滚：输入 /rewind 命令，或连续按 2 次 ESC 键，进入回滚页面
回滚选项：进入后可选择 4 种回滚方式：
1. 回滚代码和会话
2. 仅回滚会话
3. 仅回滚代码
4. 不回滚
补充说明：
- 按 Ctrl+O 可快速查看当前目录所有文件列表
- Claude 仅能回滚自身写入修改的文件，终端命令（如 mkdir、git 命令）生成 / 修改的内容无法回滚

4.2 上下文管理

上下文直接影响 Claude 的响应速度和理解准确性，相关操作如下：

/compact：压缩当前会话上下文，减少 Token 占用，提升响应速度（压缩结果可控性较弱）
/clear：清空当前会话所有上下文，开启全新对话
/init：在当前目录生成 claude.md 项目配置文件，可在文件内追加自定义指令、项目规则
/memory：打开 claude.md 配置文件，分为两种生效范围：
1. 项目级别：放在当前项目目录内，仅对当前项目生效
2. 用户级别：放在系统用户目录内，对当前用户所有会话生效

4.3 MCP 与 Figma 联动

MCP（模型上下文协议）是大模型对接外部工具的统一标准，可通过 Figma 官方 MCP 服务实现设计稿还原：

查看已安装 MCP 工具：输入 /mcp 命令
配置与使用：
- 安装全程需要保证网络正常
- 注册并登录 Figma 账号，在 MCP 配置中完成 authenticate 授权
- 授权完成后，复制 Figma 设计稿链接，即可让 Claude 自动根据设计稿修改代码、还原页面

安装 Figma MCP 服务：执行以下命令powershell

claude mcp add --transport http --scope user figma https://mcp.figma.com/mcp

4.4 Hook 自动化配置

Hook 功能允许用户在工具执行的指定时机，自动运行自定义脚本，比如代码自动格式化：

进入 Hook 配置页面：输入 /hooks 命令
Hook 触发时机：支持以下 4 种核心时机，可按需选择：
1. 使用工具前
2. 使用工具后
3. 使用工具失败时
4. 发送通知时
配置示例（自动格式化代码）：
- 选择「add new matcher」，选择目标工具（例：Write 写入文件工具）
- 填写执行脚本：jq -r '.tool_input.file_path' | xargs prettier --write
- 功能说明：通过 jq 提取 Claude 编辑的文件路径，自动调用 prettier 格式化代码
Hook 生效范围：配置完成后，可选择保存到 3 个级别：
1. 本地项目级别：仅在本机当前项目生效，保存在 settings.local.json，会自动加入 .gitignore
2. 项目级别：所有使用该项目的用户都会生效，保存在 settings.json，会随 Git 同步
3. 用户级别：对当前用户所有项目生效，配置保存在系统用户目录，不与项目绑定

4.5 Agent Skill

Agent Skill 本质是给 Claude Agent 看的说明文档，是可动态加载的自定义 Prompt：

创建步骤：
1. 执行命令创建技能文件夹：mkdir -p ~/.claude/skills/[技能名称]，例：mkdir -p ~/.claude/skills/daily-report
2. 用 VS Code 打开文件夹：code ~/.claude/skills/daily-report
3. 在文件夹内新建 SKILL.md 文件，编写技能规则
SKILL.md 编写规范：
- 顶部元数据：必须包含 name（技能名称，需和文件夹名一致）、description（技能触发场景、功能描述）
- 下方内容：详细编写技能的执行规则、输出格式、判断标准等指令

4.6 SubAgent

SubAgent 是独立的 Agent 实例，拥有独立的上下文、技能集，不污染主会话：

创建 SubAgent：输入 /agents 命令，选择「create new agent」
配置项：
- 生效范围：选择项目级别 / 用户级别
- 创建方式：Claude 自动初始化 / 完全手动创建
- 功能描述：填写该 SubAgent 负责的具体任务
- 可用工具：勾选该 SubAgent 可调用的工具权限
- 标识颜色：选择 SubAgent 的专属颜色，方便区分
与 Agent Skill 的核心区别：
- Agent Skill：继承共享主对话的全部上下文，适合处理和主会话关联度高、对上下文影响小的任务
- SubAgent：开辟全新独立会话，生成的分析过程不会传入主对话，仅回传最终结果，适合处理独立、复杂的专项任务

4.7 Plugin 插件管理

Plugin 可将 Skill、SubAgent、Hook 等配置打包整合，实现一键安装复用：

进入插件管理器：输入 /plugin 命令
插件页分类：
- Discover：可发现、安装官方 / 社区插件
- Installed：已安装的插件列表
- Marketplaces：插件市场
安装示例：在 Discover 页找到 frontend-design 插件，按下回车即可安装
生效范围：安装时可选择「当前项目生效」「当前用户生效」「当前用户的当前项目生效」
补充说明：安装插件的本质，是安装插件内打包的 Agent Skill、SubAgent、Hook 等配置

AI Agent 相关术语解析

一、大模型基础术语

LLM

Large Language Model，大语言模型。目前主流大模型均基于 Transformer 架构训练，该架构最早由 Google 提出，由 OpenAI 推动技术普及。

大模型本质就像一个文字接龙游戏，比如向大模型发送：今天天气怎么样。它会预测下一个概率最高的词。

模型接收到这句话之后经过内部运算预测下一个概率最高的词。比如“特别”，模型吐出来这个词之后，会抓回来追加到刚才的输入后面，然后它会拿着这个新的输入再去预测下一个词，比如“得”，“棒”。整个回答到这里就算结束了。此时Answer为“特别得棒”。

Token

Token就是大模型处理文本的最基本单位。大模型本质是数学函数，仅能识别数字，因此需要 Tokenizer 分词器做「翻译」：

编码：将用户输入的文本拆分为最小片段（Token），再将每个 Token 映射为唯一对应的数字 Token ID，传入大模型
解码：大模型输出 Token ID，Tokenizer 将其还原为对应的 Token（文本），循环生成完整回答

补充说明：Token 和字词没有固定的一一对应关系，是模型自主学习的文本切分规则；平均 1 个 Token ≈ 0.75 个英文单词 ≈ 1.5~2 个汉字。

详细点说：

大模型本质上是一个庞大的数学函数，接收的是数字，输出的也是数字。所以在用户和大模型之间需要中间人来做翻译，这个中间人就叫做Tokenizer。

它负责编码和解码。编码将文字转换为数字，解码将数字还原成文字。比如刚才的“今天天气怎么样”这个问题会先交给Tokenizer处理，将文字转为数字。

这个过程分为两步。第一步切分，把用户问题接过来并拆成一个一个最小的片段，这些片段就是Token。第二步映射，因为大模型只认数字，Tokenizer会把每一个Token对应到一个数字上去，这个数字叫做Token ID，Token ID 和 Token一一绑定，Token是文字，Token ID 是数字。

这时，原来的一句话变成了一串Token ID组成的列表，这串列表会被Tokenizer送入大模型，大模型运算后最终吐出一个Token ID，Tokenizer再次登场，将Token ID 翻译回Token.

解码只有一步，那就是映射，把数字转为文字。解码是不需要切分的，因为模型一次只能给出一个Token。解码完成后，就拿到了大模型输出的第一个Token“特别”，如果模型话还没说完，就继续吐出其他Token。

Context

上下文，指大模型每次处理任务时，接收到的全部信息总和。包括用户的历史对话、当前提问、大模型的历史输出、工具列表、System Prompt 等内容，可理解为大模型的临时记忆体。

Context Window

上下文窗口，指 Context 能容纳的最大 Token 数量，决定了大模型单次能处理的文本长度上限。例如Claude Opus 4.6 的 Context Window 可达 100 万 Token。

Prompt

Prompt中文为提示词，指用户或系统给大模型下达的具体指令、问题，Prompt 的写法直接决定大模型的输出质量，相关研究领域称为 Prompt Engineering（提示词工程）。

一个好的Prompt应该是具体的，清晰的，明确的。

因为有时候不仅要提问题，还要告诉大模型你是谁，按照什么规则做事，所以引出了两种不同的Prompt。

分为两类：

User Prompt：用户输入的具体任务、问题，用户可见可修改
System Prompt：开发者 / 用户在后台设置的大模型人设、做事规则、输出规范，会持续影响大模型的行为，用户默认不可见

比如设计一个辅导机器人，用户在输入问题时不要直接告诉答案，要一步一步引导学生思考。

使用Sytem Prompt设置“你是一位耐心的老师，当用户提问问题时，不要给出答案，要引导用户思考”。用户看不到，但它会一直影响大模型的行为。用户问问题是User Prompt，当大模型看到这两个Prompt之后，不会直接给出答案，而是引导用户思考。如果没有System Prompt，可能大模型会直接给出答案。

RAG

检索增强生成（Retrieval-Augmented Generation），是降低大模型 Token 成本、解决知识过时问题的核心技术。当用户需要大模型基于超长文档（如项目手册、企业知识库）回答问题时，先通过检索算法抽取和用户问题匹配度最高的内容片段，仅将该片段传入大模型，让大模型基于精准片段生成回答，无需传入全量文档。

二、Agent 核心组件术语

Tool

工具，本质是一个可被大模型调用的函数，给入指定参数即可返回对应结果，是大模型感知、影响外部环境的核心能力。完整调用流程：

用户发送问题，平台将问题 + 可用工具列表传给大模型
大模型分析问题，判断需要调用的工具，生成包含工具名称、参数的调用指令
平台接收指令，执行工具调用，获取结果
平台将工具结果返回给大模型，大模型整理后生成最终回答，返回给用户例：天气查询工具、计算器工具、文件读写工具等。

因为用户，大模型，天气查询工具，没法直接对话，需要平台来做传递信息的工作。

例如：

用户将"今天天气怎么样"发送给平台，平台会把用户的问题转发给大模型，不过发给大模型的并不只有用户问题还有目前可用的工具列表，比如天气查询工具，计算器工具等。大模型收到问题之后会自己分析：用户想要实时天气，但自己没有，就去调用天气查询工具。但大模型没法自己调用工具，它唯一的能力就是输出文本，此时大模型会生成调用天气查询工具的指令。

工具名称和对应的参数

{ "tool":"天气查询", "参数":{ "城市":"北京", "日期":"今天" } }

这个会发到平台那边去，平台接收到指令之后就会真正地调用这个工具。平台拿到调用结果之后就会返回给大模型，大模型收到整理后输出给平台，平台会转发给用户。用户就可以看到最后的结果。

MCP

平台要把工具列表传给模型，还要能调用工具。

所以，我们首先就得把工具接入到平台里面，这样平台才知道可用工具列表以及每个工具的用途，参数，调用方法等。

模型上下文协议（Model Context Protocol），是一套统一的工具接入标准。解决的核心痛点：不同大模型平台的工具接入规范不同，同一工具需要为不同平台重复开发适配代码；基于 MCP 规范开发一次工具，即可被所有支持 MCP 的平台（Claude、ChatGPT 等）直接使用。

Agent

智能体，指能够自主规划任务、自主调用工具、循环执行直至完成用户目标的系统。核心能力：自主规划、工具调用、反思迭代。

例：用户指令「查今天北京天气，如果下雨，帮我找附近 5 家卖伞的店铺」，Agent 会自主规划步骤，依次调用定位工具、天气工具、地图工具，最终完成任务。

具体为：大模型接收到指令会先去调用定位工具，获取定位工具结果；根据当前定位调用天气工具，获取天气工具结果；根据天气结果调用店铺工具，获取卖雨伞的店的结果，最后汇总给出答案。

目前主流 Agent 产品：Claude Code、Gemini CLI、Codex 等，主流构建模式包括 ReAct、Plan And Execute 等。

Agent Skill

本质是给 Agent 看的说明文档，是可动态加载的自定义 Prompt 规则。标准格式为 Markdown 文档，分为两部分：

元数据层：顶部的 name（技能名称）、description（技能功能、触发场景）
指令层：详细的执行规则、输出格式、判断标准等内容使用方式：将编写好的 SKILL.md 放入 Agent 指定的技能目录，Agent 即可自动识别、加载并使用该技能。

详细点说：定义好之后需要存到硬盘指定位置里，比如claude需要放到 /.claude/skills文件夹下，首先需要在这个目录下新建一个文件夹，文件夹名字必须和agent skill的名字相同，进入到新建文件夹后创建SKILL.md，名称必须是这个，内容就填写我们所需要的Agent skill。

--- name: daily-report-cpp description: 生成C++后端开发专属每日进度日报。自动基于项目上下文，总结当日开发、优化、排错等工作，适配实习/项目汇报场景。 --- # daily-report-cpp ## 格式要求 请严格按照以下 Markdown 格式输出，内容必须基于当前项目上下文（如Oat++后端、Epoll服务器、MySQL数据库等），突出技术细节与产出： ```markdown # 📅 开发日报（YYYY-MM-DD） ## 💡 今日摘要 （用1-2句话总结今日核心产出，突出技术亮点与项目推进成果） ## 📝 详细变更 ### ✨ 新增功能 - [模块名] 详细描述功能实现、技术方案、代码改动（如：Oat++ Controller层 新增学员信息查询接口，完成DTO/Service/DAO全链路开发） - [模块名] ... ### 🐛 问题修复 - [模块名] 详细描述问题根因、修复方案、优化效果（如：Epoll服务器 修复高并发下的线程安全问题，优化后QPS提升30%） - [模块名] ... ### ⚡ 性能优化 - [模块名] 详细描述优化点、技术手段、性能提升数据（如：MySQL DAO层 优化SQL查询语句，新增索引，查询耗时降低40%） - [模块名] ... ## 🎯 明日计划 - 列出明日核心开发任务，按优先级排序 ## 📌 遇到的问题&解决方案 - 记录当日遇到的技术难点、排查过程、最终解决方案（可选，用于汇报复盘）

基础概念总结

术语	核心定义
LLM	大语言模型
Token	大模型处理数据的最基本单元
Context	大模型每次处理任务时接收到的信息总和
Context Window	大模型上下文可容纳的最大 Token 量
Prompt	给大模型下达的具体指令 / 问题
Tool	大模型感知、影响外部环境的可调用函数
MCP	大模型工具接入的统一标准协议
Agent	可自主规划、调用工具完成任务的智能系统
Agent Skill	给 Agent 用的自定义规则说明文档