Claude 安装实操教程与 AI Agent 基础概念
注意:安装及使用 Claude 时需要保证网络通畅,否则会出现安装失败、无法登录等问题。
本文档基于 Win11 系统实操经验整理,内容来自个人安装使用经历及学习B站相关教程时的笔记,感谢各位视频创作者的分享。
Claude 完整使用教程
一、下载与安装
1.1 官方下载渠道

1.2 安装步骤
- 启动 PowerShell:按下 Win 键搜索 PowerShell,右键选择「以管理员身份运行」(避免权限不足导致安装失败)
- 安装成功验证:当终端输出
Installation completed successfully!时,即代表安装完成 - 启动 Claude:在 PowerShell 中输入
claude命令,即可启动程序
执行安装命令:在终端中粘贴以下命令,按下回车执行powershell
irm https://claude.ai/install.ps1 | iex 
1.3 常见安装失败解决
- 若提示「脚本执行被禁止」:先执行
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser,选择「Y」确认后,再重新执行安装命令 - 若提示「无法连接到远程服务器」:检查网络环境。
二、账号登录
- 启动 Claude 后,会自动唤起官方账号登录界面,可直接使用 Claude 免费 / Pro/Max 订阅账号登录
- 若未弹出登录窗口,在终端输入
/login命令,手动唤起登录界面 - 免费替代方案:若不想使用官方账号,可使用第三方接口,参考接口文档完成配置后,可跳过官方账号登录直接使用,这里不过多赘述。
三、核心模式与高频操作
3.1 三种核心工作模式
使用 Shift+Tab 快捷键可循环切换模式,切换后终端会显示对应模式状态:
- 默认模式(无特殊标注):安全稳妥模式,每次创建、修改文件都会先询问用户确认,界面显示「? for shortcuts」
- 自动模式(accept edits on):高效模式,自动修改文件无需逐次询问用户,适合批量处理、快速开发
- 规划模式(plan mode on):构思模式,仅讨论方案、不修改本地文件,适合项目前期梳理、需求拆解

3.2 高频快捷键与基础命令
表格
| 操作 / 命令 | 功能说明 |
|---|---|
Shift+回车 | 终端内换行,避免直接回车发送指令 |
Ctrl+G | 打开图形化标签页,替代纯命令行操作 |
! + 终端命令 | 直接执行 bash/cmd 命令,例:!start index.html 快速打开文件 |
/login | 唤起账号登录界面 |
/resume 或 claude -c | 重启后恢复上一次的会话页面 |
/restart --resume | 重启 Claude 并恢复会话,无需手动关闭重开 |
3.3 规划模式与权限管理
- 规划模式使用:用规划模式写完项目计划后,Claude 会给出 3 个执行选项:
- YES,进入自动模式(写入文件无需确认,执行 mkdir 等终端命令仍需用户同意)
- YES,使用默认模式
- 继续修改计划
- 任务与进程管理:
- 输入
/tasks查看当前正在运行的任务列表 - 若执行
npm run dev等命令阻塞终端,按Ctrl+B可将进程放入后台运行 - 在任务列表中按
k可关闭选中的服务 / 进程
- 输入
权限放行命令:powershell
claude --dangerously-skip-permissions 执行后 Claude 可自动执行任何终端命令,进入 bypass permissions on 模式,适合信任度高的项目场景

四、进阶功能使用
4.1 回滚操作
Claude 每次接收用户指令都会自动创建回滚点,支持撤销操作,避免误改文件:
- 触发回滚:输入
/rewind命令,或连续按 2 次ESC键,进入回滚页面 - 回滚选项:进入后可选择 4 种回滚方式:
- 回滚代码和会话
- 仅回滚会话
- 仅回滚代码
- 不回滚
- 补充说明:
- 按
Ctrl+O可快速查看当前目录所有文件列表 - Claude 仅能回滚自身写入修改的文件,终端命令(如 mkdir、git 命令)生成 / 修改的内容无法回滚
- 按


4.2 上下文管理
上下文直接影响 Claude 的响应速度和理解准确性,相关操作如下:
/compact:压缩当前会话上下文,减少 Token 占用,提升响应速度(压缩结果可控性较弱)/clear:清空当前会话所有上下文,开启全新对话/init:在当前目录生成claude.md项目配置文件,可在文件内追加自定义指令、项目规则/memory:打开claude.md配置文件,分为两种生效范围:- 项目级别:放在当前项目目录内,仅对当前项目生效
- 用户级别:放在系统用户目录内,对当前用户所有会话生效

4.3 MCP 与 Figma 联动
MCP(模型上下文协议)是大模型对接外部工具的统一标准,可通过 Figma 官方 MCP 服务实现设计稿还原:
- 查看已安装 MCP 工具:输入
/mcp命令 - 配置与使用:
- 安装全程需要保证网络正常
- 注册并登录 Figma 账号,在 MCP 配置中完成 authenticate 授权
- 授权完成后,复制 Figma 设计稿链接,即可让 Claude 自动根据设计稿修改代码、还原页面
安装 Figma MCP 服务:执行以下命令powershell
claude mcp add --transport http --scope user figma https://mcp.figma.com/mcp 
4.4 Hook 自动化配置
Hook 功能允许用户在工具执行的指定时机,自动运行自定义脚本,比如代码自动格式化:
- 进入 Hook 配置页面:输入
/hooks命令 - Hook 触发时机:支持以下 4 种核心时机,可按需选择:
- 使用工具前
- 使用工具后
- 使用工具失败时
- 发送通知时
- 配置示例(自动格式化代码):
- 选择「add new matcher」,选择目标工具(例:Write 写入文件工具)
- 填写执行脚本:
jq -r '.tool_input.file_path' | xargs prettier --write - 功能说明:通过 jq 提取 Claude 编辑的文件路径,自动调用 prettier 格式化代码
- Hook 生效范围:配置完成后,可选择保存到 3 个级别:
- 本地项目级别:仅在本机当前项目生效,保存在
settings.local.json,会自动加入.gitignore - 项目级别:所有使用该项目的用户都会生效,保存在
settings.json,会随 Git 同步 - 用户级别:对当前用户所有项目生效,配置保存在系统用户目录,不与项目绑定
- 本地项目级别:仅在本机当前项目生效,保存在

4.5 Agent Skill
Agent Skill 本质是给 Claude Agent 看的说明文档,是可动态加载的自定义 Prompt:
- 创建步骤:
- 执行命令创建技能文件夹:
mkdir -p ~/.claude/skills/[技能名称],例:mkdir -p ~/.claude/skills/daily-report - 用 VS Code 打开文件夹:
code ~/.claude/skills/daily-report - 在文件夹内新建
SKILL.md文件,编写技能规则
- 执行命令创建技能文件夹:
- SKILL.md 编写规范:
- 顶部元数据:必须包含
name(技能名称,需和文件夹名一致)、description(技能触发场景、功能描述) - 下方内容:详细编写技能的执行规则、输出格式、判断标准等指令
- 顶部元数据:必须包含


4.6 SubAgent
SubAgent 是独立的 Agent 实例,拥有独立的上下文、技能集,不污染主会话:
- 创建 SubAgent:输入
/agents命令,选择「create new agent」 - 配置项:
- 生效范围:选择项目级别 / 用户级别
- 创建方式:Claude 自动初始化 / 完全手动创建
- 功能描述:填写该 SubAgent 负责的具体任务
- 可用工具:勾选该 SubAgent 可调用的工具权限
- 标识颜色:选择 SubAgent 的专属颜色,方便区分
- 与 Agent Skill 的核心区别:
- Agent Skill:继承共享主对话的全部上下文,适合处理和主会话关联度高、对上下文影响小的任务
- SubAgent:开辟全新独立会话,生成的分析过程不会传入主对话,仅回传最终结果,适合处理独立、复杂的专项任务

4.7 Plugin 插件管理
Plugin 可将 Skill、SubAgent、Hook 等配置打包整合,实现一键安装复用:
- 进入插件管理器:输入
/plugin命令 - 插件页分类:
- Discover:可发现、安装官方 / 社区插件
- Installed:已安装的插件列表
- Marketplaces:插件市场
- 安装示例:在 Discover 页找到
frontend-design插件,按下回车即可安装 - 生效范围:安装时可选择「当前项目生效」「当前用户生效」「当前用户的当前项目生效」
- 补充说明:安装插件的本质,是安装插件内打包的 Agent Skill、SubAgent、Hook 等配置

AI Agent 相关术语解析
一、大模型基础术语
LLM
Large Language Model,大语言模型。目前主流大模型均基于 Transformer 架构训练,该架构最早由 Google 提出,由 OpenAI 推动技术普及。
大模型本质就像一个文字接龙游戏,比如向大模型发送:今天天气怎么样。它会预测下一个概率最高的词。
模型接收到这句话之后经过内部运算预测下一个概率最高的词。比如“特别”,模型吐出来这个词之后,会抓回来追加到刚才的输入后面,然后它会拿着这个新的输入再去预测下一个词,比如“得”,“棒”。整个回答到这里就算结束了。此时Answer为“特别得棒”。
Token
Token就是大模型处理文本的最基本单位。大模型本质是数学函数,仅能识别数字,因此需要 Tokenizer 分词器做「翻译」:
- 编码:将用户输入的文本拆分为最小片段(Token),再将每个 Token 映射为唯一对应的数字 Token ID,传入大模型
- 解码:大模型输出 Token ID,Tokenizer 将其还原为对应的 Token(文本),循环生成完整回答
- 补充说明:Token 和字词没有固定的一一对应关系,是模型自主学习的文本切分规则;平均 1 个 Token ≈ 0.75 个英文单词 ≈ 1.5~2 个汉字。
详细点说:
大模型本质上是一个庞大的数学函数,接收的是数字,输出的也是数字。所以在用户和大模型之间需要中间人来做翻译,这个中间人就叫做Tokenizer。
它负责编码和解码。 编码将文字转换为数字,解码将数字还原成文字。比如刚才的“今天天气怎么样”这个问题会先交给Tokenizer处理,将文字转为数字。
这个过程分为两步。第一步切分,把用户问题接过来并拆成一个一个最小的片段,这些片段就是Token。第二步映射,因为大模型只认数字,Tokenizer会把每一个Token对应到一个数字上去,这个数字叫做Token ID,Token ID 和 Token一一绑定,Token是文字,Token ID 是数字。
这时,原来的一句话变成了一串Token ID组成的列表,这串列表会被Tokenizer送入大模型,大模型运算后最终吐出一个Token ID,Tokenizer再次登场,将Token ID 翻译回Token.
解码只有一步,那就是映射,把数字转为文字。解码是不需要切分的,因为模型一次只能给出一个Token。解码完成后, 就拿到了大模型输出的第一个Token“特别”,如果模型话还没说完,就继续吐出其他Token。
Context
上下文,指大模型每次处理任务时,接收到的全部信息总和。包括用户的历史对话、当前提问、大模型的历史输出、工具列表、System Prompt 等内容,可理解为大模型的临时记忆体。
Context Window
上下文窗口,指 Context 能容纳的最大 Token 数量,决定了大模型单次能处理的文本长度上限。例如Claude Opus 4.6 的 Context Window 可达 100 万 Token。
Prompt
Prompt中文为提示词 ,指用户或系统给大模型下达的具体指令、问题,Prompt 的写法直接决定大模型的输出质量,相关研究领域称为 Prompt Engineering(提示词工程)。
一个好的Prompt应该是具体的,清晰的,明确的。
因为有时候不仅要提问题,还要告诉大模型你是谁,按照什么规则做事,所以引出了两种不同的Prompt。
分为两类:
- User Prompt:用户输入的具体任务、问题,用户可见可修改
- System Prompt:开发者 / 用户在后台设置的大模型人设、做事规则、输出规范,会持续影响大模型的行为,用户默认不可见
比如设计一个辅导机器人,用户在输入问题时不要直接告诉答案,要一步一步引导学生思考。
使用Sytem Prompt设置“你是一位耐心的老师,当用户提问问题时,不要给出答案,要引导用户思考”。用户看不到,但它会一直影响大模型的行为。用户问问题是User Prompt,当大模型看到这两个Prompt之后,不会直接给出答案,而是引导用户思考。如果没有System Prompt,可能大模型会直接给出答案。
RAG
检索增强生成(Retrieval-Augmented Generation),是降低大模型 Token 成本、解决知识过时问题的核心技术。当用户需要大模型基于超长文档(如项目手册、企业知识库)回答问题时,先通过检索算法抽取和用户问题匹配度最高的内容片段,仅将该片段传入大模型,让大模型基于精准片段生成回答,无需传入全量文档。
二、Agent 核心组件术语
Tool
工具,本质是一个可被大模型调用的函数,给入指定参数即可返回对应结果,是大模型感知、影响外部环境的核心能力。完整调用流程:
- 用户发送问题,平台将问题 + 可用工具列表传给大模型
- 大模型分析问题,判断需要调用的工具,生成包含工具名称、参数的调用指令
- 平台接收指令,执行工具调用,获取结果
- 平台将工具结果返回给大模型,大模型整理后生成最终回答,返回给用户例:天气查询工具、计算器工具、文件读写工具等。
因为用户,大模型,天气查询工具,没法直接对话,需要平台来做传递信息的工作。
例如:
用户将"今天天气怎么样"发送给平台,平台会把用户的问题转发给大模型,不过发给大模型的并不只有用户问题还有目前可用的工具列表,比如天气查询工具,计算器工具等。大模型收到问题之后会自己分析:用户想要实时天气,但自己没有,就去调用天气查询工具。但大模型没法自己调用工具,它唯一的能力就是输出文本,此时大模型会生成调用天气查询工具的指令。
工具名称和对应的参数
{ "tool":"天气查询", "参数":{ "城市":"北京", "日期":"今天" } }这个会发到平台那边去,平台接收到指令之后就会真正地调用这个工具。平台拿到调用结果之后就会返回给大模型,大模型收到整理后输出给平台,平台会转发给用户。用户就可以看到最后的结果。
MCP
平台要把工具列表传给模型,还要能调用工具。
所以,我们首先就得把工具接入到平台里面,这样平台才知道可用工具列表以及每个工具的用途,参数,调用方法等。
模型上下文协议(Model Context Protocol),是一套统一的工具接入标准。解决的核心痛点:不同大模型平台的工具接入规范不同,同一工具需要为不同平台重复开发适配代码;基于 MCP 规范开发一次工具,即可被所有支持 MCP 的平台(Claude、ChatGPT 等)直接使用。
Agent
智能体,指能够自主规划任务、自主调用工具、循环执行直至完成用户目标的系统。核心能力:自主规划、工具调用、反思迭代。
例:用户指令「查今天北京天气,如果下雨,帮我找附近 5 家卖伞的店铺」,Agent 会自主规划步骤,依次调用定位工具、天气工具、地图工具,最终完成任务。
具体为:大模型接收到指令会先去调用定位工具,获取定位工具结果;根据当前定位调用天气工具,获取天气工具结果;根据天气结果调用店铺工具,获取卖雨伞的店的结果,最后汇总给出答案。
目前主流 Agent 产品:Claude Code、Gemini CLI、Codex 等,主流构建模式包括 ReAct、Plan And Execute 等。
Agent Skill
本质是给 Agent 看的说明文档,是可动态加载的自定义 Prompt 规则。标准格式为 Markdown 文档,分为两部分:
- 元数据层:顶部的
name(技能名称)、description(技能功能、触发场景) - 指令层:详细的执行规则、输出格式、判断标准等内容使用方式:将编写好的
SKILL.md放入 Agent 指定的技能目录,Agent 即可自动识别、加载并使用该技能。
详细点说:定义好之后需要存到硬盘指定位置里,比如claude需要放到 /.claude/skills文件夹下,首先需要在这个目录下新建一个文件夹,文件夹名字必须和agent skill的名字相同,进入到新建文件夹后创建SKILL.md,名称必须是这个,内容就填写我们所需要的Agent skill。
--- name: daily-report-cpp description: 生成C++后端开发专属每日进度日报。自动基于项目上下文,总结当日开发、优化、排错等工作,适配实习/项目汇报场景。 --- # daily-report-cpp ## 格式要求 请严格按照以下 Markdown 格式输出,内容必须基于当前项目上下文(如Oat++后端、Epoll服务器、MySQL数据库等),突出技术细节与产出: ```markdown # 📅 开发日报(YYYY-MM-DD) ## 💡 今日摘要 (用1-2句话总结今日核心产出,突出技术亮点与项目推进成果) ## 📝 详细变更 ### ✨ 新增功能 - [模块名] 详细描述功能实现、技术方案、代码改动(如:Oat++ Controller层 新增学员信息查询接口,完成DTO/Service/DAO全链路开发) - [模块名] ... ### 🐛 问题修复 - [模块名] 详细描述问题根因、修复方案、优化效果(如:Epoll服务器 修复高并发下的线程安全问题,优化后QPS提升30%) - [模块名] ... ### ⚡ 性能优化 - [模块名] 详细描述优化点、技术手段、性能提升数据(如:MySQL DAO层 优化SQL查询语句,新增索引,查询耗时降低40%) - [模块名] ... ## 🎯 明日计划 - 列出明日核心开发任务,按优先级排序 ## 📌 遇到的问题&解决方案 - 记录当日遇到的技术难点、排查过程、最终解决方案(可选,用于汇报复盘)基础概念总结
| 术语 | 核心定义 |
|---|---|
| LLM | 大语言模型 |
| Token | 大模型处理数据的最基本单元 |
| Context | 大模型每次处理任务时接收到的信息总和 |
| Context Window | 大模型上下文可容纳的最大 Token 量 |
| Prompt | 给大模型下达的具体指令 / 问题 |
| Tool | 大模型感知、影响外部环境的可调用函数 |
| MCP | 大模型工具接入的统一标准协议 |
| Agent | 可自主规划、调用工具完成任务的智能系统 |
| Agent Skill | 给 Agent 用的自定义规则说明文档 |