Claude 安装实操教程与 AI Agent 基础概念

Claude 安装实操教程与 AI Agent 基础概念
注意:安装及使用 Claude 时需要保证网络通畅,否则会出现安装失败、无法登录等问题。

本文档基于 Win11 系统实操经验整理,内容来自个人安装使用经历及学习B站相关教程时的笔记,感谢各位视频创作者的分享。

Claude 完整使用教程

一、下载与安装

1.1 官方下载渠道

1.2 安装步骤

  1. 启动 PowerShell:按下 Win 键搜索 PowerShell,右键选择「以管理员身份运行」(避免权限不足导致安装失败)
  2. 安装成功验证:当终端输出 Installation completed successfully! 时,即代表安装完成
  3. 启动 Claude:在 PowerShell 中输入 claude 命令,即可启动程序

执行安装命令:在终端中粘贴以下命令,按下回车执行powershell

irm https://claude.ai/install.ps1 | iex 

1.3 常见安装失败解决

  • 若提示「脚本执行被禁止」:先执行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser,选择「Y」确认后,再重新执行安装命令
  • 若提示「无法连接到远程服务器」:检查网络环境。

二、账号登录

  1. 启动 Claude 后,会自动唤起官方账号登录界面,可直接使用 Claude 免费 / Pro/Max 订阅账号登录
  2. 若未弹出登录窗口,在终端输入 /login 命令,手动唤起登录界面
  3. 免费替代方案:若不想使用官方账号,可使用第三方接口,参考接口文档完成配置后,可跳过官方账号登录直接使用,这里不过多赘述。

三、核心模式与高频操作

3.1 三种核心工作模式

使用 Shift+Tab 快捷键可循环切换模式,切换后终端会显示对应模式状态:

  • 默认模式(无特殊标注):安全稳妥模式,每次创建、修改文件都会先询问用户确认,界面显示「? for shortcuts」
  • 自动模式(accept edits on):高效模式,自动修改文件无需逐次询问用户,适合批量处理、快速开发
  • 规划模式(plan mode on):构思模式,仅讨论方案、不修改本地文件,适合项目前期梳理、需求拆解

3.2 高频快捷键与基础命令

表格

操作 / 命令功能说明
Shift+回车终端内换行,避免直接回车发送指令
Ctrl+G打开图形化标签页,替代纯命令行操作
! + 终端命令直接执行 bash/cmd 命令,例:!start index.html 快速打开文件
/login唤起账号登录界面
/resumeclaude -c重启后恢复上一次的会话页面
/restart --resume重启 Claude 并恢复会话,无需手动关闭重开

3.3 规划模式与权限管理

  1. 规划模式使用:用规划模式写完项目计划后,Claude 会给出 3 个执行选项:
    1. YES,进入自动模式(写入文件无需确认,执行 mkdir 等终端命令仍需用户同意)
    2. YES,使用默认模式
    3. 继续修改计划
  2. 任务与进程管理
    • 输入 /tasks 查看当前正在运行的任务列表
    • 若执行 npm run dev 等命令阻塞终端,按 Ctrl+B 可将进程放入后台运行
    • 在任务列表中按 k 可关闭选中的服务 / 进程

权限放行命令:powershell

claude --dangerously-skip-permissions 

执行后 Claude 可自动执行任何终端命令,进入 bypass permissions on 模式,适合信任度高的项目场景

四、进阶功能使用

4.1 回滚操作

Claude 每次接收用户指令都会自动创建回滚点,支持撤销操作,避免误改文件:

  1. 触发回滚:输入 /rewind 命令,或连续按 2 次 ESC 键,进入回滚页面
  2. 回滚选项:进入后可选择 4 种回滚方式:
    1. 回滚代码和会话
    2. 仅回滚会话
    3. 仅回滚代码
    4. 不回滚
  3. 补充说明
    • Ctrl+O 可快速查看当前目录所有文件列表
    • Claude 仅能回滚自身写入修改的文件,终端命令(如 mkdir、git 命令)生成 / 修改的内容无法回滚

4.2 上下文管理

上下文直接影响 Claude 的响应速度和理解准确性,相关操作如下:

  • /compact:压缩当前会话上下文,减少 Token 占用,提升响应速度(压缩结果可控性较弱)
  • /clear:清空当前会话所有上下文,开启全新对话
  • /init:在当前目录生成 claude.md 项目配置文件,可在文件内追加自定义指令、项目规则
  • /memory:打开 claude.md 配置文件,分为两种生效范围:
    1. 项目级别:放在当前项目目录内,仅对当前项目生效
    2. 用户级别:放在系统用户目录内,对当前用户所有会话生效

4.3 MCP 与 Figma 联动

MCP(模型上下文协议)是大模型对接外部工具的统一标准,可通过 Figma 官方 MCP 服务实现设计稿还原:

  1. 查看已安装 MCP 工具:输入 /mcp 命令
  2. 配置与使用
    • 安装全程需要保证网络正常
    • 注册并登录 Figma 账号,在 MCP 配置中完成 authenticate 授权
    • 授权完成后,复制 Figma 设计稿链接,即可让 Claude 自动根据设计稿修改代码、还原页面

安装 Figma MCP 服务:执行以下命令powershell

claude mcp add --transport http --scope user figma https://mcp.figma.com/mcp 

4.4 Hook 自动化配置

Hook 功能允许用户在工具执行的指定时机,自动运行自定义脚本,比如代码自动格式化:

  1. 进入 Hook 配置页面:输入 /hooks 命令
  2. Hook 触发时机:支持以下 4 种核心时机,可按需选择:
    1. 使用工具前
    2. 使用工具后
    3. 使用工具失败时
    4. 发送通知时
  3. 配置示例(自动格式化代码)
    • 选择「add new matcher」,选择目标工具(例:Write 写入文件工具)
    • 填写执行脚本:jq -r '.tool_input.file_path' | xargs prettier --write
    • 功能说明:通过 jq 提取 Claude 编辑的文件路径,自动调用 prettier 格式化代码
  4. Hook 生效范围:配置完成后,可选择保存到 3 个级别:
    1. 本地项目级别:仅在本机当前项目生效,保存在 settings.local.json,会自动加入 .gitignore
    2. 项目级别:所有使用该项目的用户都会生效,保存在 settings.json,会随 Git 同步
    3. 用户级别:对当前用户所有项目生效,配置保存在系统用户目录,不与项目绑定

4.5 Agent Skill

Agent Skill 本质是给 Claude Agent 看的说明文档,是可动态加载的自定义 Prompt:

  1. 创建步骤
    1. 执行命令创建技能文件夹:mkdir -p ~/.claude/skills/[技能名称],例:mkdir -p ~/.claude/skills/daily-report
    2. 用 VS Code 打开文件夹:code ~/.claude/skills/daily-report
    3. 在文件夹内新建 SKILL.md 文件,编写技能规则
  2. SKILL.md 编写规范
    • 顶部元数据:必须包含 name(技能名称,需和文件夹名一致)、description(技能触发场景、功能描述)
    • 下方内容:详细编写技能的执行规则、输出格式、判断标准等指令

4.6 SubAgent

SubAgent 是独立的 Agent 实例,拥有独立的上下文、技能集,不污染主会话:

  1. 创建 SubAgent:输入 /agents 命令,选择「create new agent」
  2. 配置项
    • 生效范围:选择项目级别 / 用户级别
    • 创建方式:Claude 自动初始化 / 完全手动创建
    • 功能描述:填写该 SubAgent 负责的具体任务
    • 可用工具:勾选该 SubAgent 可调用的工具权限
    • 标识颜色:选择 SubAgent 的专属颜色,方便区分
  3. 与 Agent Skill 的核心区别
    • Agent Skill:继承共享主对话的全部上下文,适合处理和主会话关联度高、对上下文影响小的任务
    • SubAgent:开辟全新独立会话,生成的分析过程不会传入主对话,仅回传最终结果,适合处理独立、复杂的专项任务

4.7 Plugin 插件管理

Plugin 可将 Skill、SubAgent、Hook 等配置打包整合,实现一键安装复用:

  1. 进入插件管理器:输入 /plugin 命令
  2. 插件页分类
    • Discover:可发现、安装官方 / 社区插件
    • Installed:已安装的插件列表
    • Marketplaces:插件市场
  3. 安装示例:在 Discover 页找到 frontend-design 插件,按下回车即可安装
  4. 生效范围:安装时可选择「当前项目生效」「当前用户生效」「当前用户的当前项目生效」
  5. 补充说明:安装插件的本质,是安装插件内打包的 Agent Skill、SubAgent、Hook 等配置

AI Agent 相关术语解析

一、大模型基础术语

LLM

Large Language Model,大语言模型。目前主流大模型均基于 Transformer 架构训练,该架构最早由 Google 提出,由 OpenAI 推动技术普及。

大模型本质就像一个文字接龙游戏,比如向大模型发送:今天天气怎么样。它会预测下一个概率最高的词。

模型接收到这句话之后经过内部运算预测下一个概率最高的词。比如“特别”,模型吐出来这个词之后,会抓回来追加到刚才的输入后面,然后它会拿着这个新的输入再去预测下一个词,比如“得”,“棒”。整个回答到这里就算结束了。此时Answer为“特别得棒”。

Token

Token就是大模型处理文本的最基本单位。大模型本质是数学函数,仅能识别数字,因此需要 Tokenizer 分词器做「翻译」:

  1. 编码:将用户输入的文本拆分为最小片段(Token),再将每个 Token 映射为唯一对应的数字 Token ID,传入大模型
  2. 解码:大模型输出 Token ID,Tokenizer 将其还原为对应的 Token(文本),循环生成完整回答
  • 补充说明:Token 和字词没有固定的一一对应关系,是模型自主学习的文本切分规则;平均 1 个 Token ≈ 0.75 个英文单词 ≈ 1.5~2 个汉字。

详细点说:

大模型本质上是一个庞大的数学函数,接收的是数字,输出的也是数字。所以在用户和大模型之间需要中间人来做翻译,这个中间人就叫做Tokenizer。

它负责编码和解码。 编码将文字转换为数字,解码将数字还原成文字。比如刚才的“今天天气怎么样”这个问题会先交给Tokenizer处理,将文字转为数字。

这个过程分为两步。第一步切分,把用户问题接过来并拆成一个一个最小的片段,这些片段就是Token。第二步映射,因为大模型只认数字,Tokenizer会把每一个Token对应到一个数字上去,这个数字叫做Token ID,Token ID 和 Token一一绑定,Token是文字,Token ID 是数字。

这时,原来的一句话变成了一串Token ID组成的列表,这串列表会被Tokenizer送入大模型,大模型运算后最终吐出一个Token ID,Tokenizer再次登场,将Token ID 翻译回Token.

解码只有一步,那就是映射,把数字转为文字。解码是不需要切分的,因为模型一次只能给出一个Token。解码完成后, 就拿到了大模型输出的第一个Token“特别”,如果模型话还没说完,就继续吐出其他Token。

Context

上下文,指大模型每次处理任务时,接收到的全部信息总和。包括用户的历史对话、当前提问、大模型的历史输出、工具列表、System Prompt 等内容,可理解为大模型的临时记忆体。

Context Window

上下文窗口,指 Context 能容纳的最大 Token 数量,决定了大模型单次能处理的文本长度上限。例如Claude Opus 4.6 的 Context Window 可达 100 万 Token。

Prompt

Prompt中文为提示词 ,指用户或系统给大模型下达的具体指令、问题,Prompt 的写法直接决定大模型的输出质量,相关研究领域称为 Prompt Engineering(提示词工程)。

一个好的Prompt应该是具体的,清晰的,明确的。

因为有时候不仅要提问题,还要告诉大模型你是谁,按照什么规则做事,所以引出了两种不同的Prompt。

分为两类:

  • User Prompt:用户输入的具体任务、问题,用户可见可修改
  • System Prompt:开发者 / 用户在后台设置的大模型人设、做事规则、输出规范,会持续影响大模型的行为,用户默认不可见

比如设计一个辅导机器人,用户在输入问题时不要直接告诉答案,要一步一步引导学生思考。

使用Sytem Prompt设置“你是一位耐心的老师,当用户提问问题时,不要给出答案,要引导用户思考”。用户看不到,但它会一直影响大模型的行为。用户问问题是User Prompt,当大模型看到这两个Prompt之后,不会直接给出答案,而是引导用户思考。如果没有System Prompt,可能大模型会直接给出答案。

RAG

检索增强生成(Retrieval-Augmented Generation),是降低大模型 Token 成本、解决知识过时问题的核心技术。当用户需要大模型基于超长文档(如项目手册、企业知识库)回答问题时,先通过检索算法抽取和用户问题匹配度最高的内容片段,仅将该片段传入大模型,让大模型基于精准片段生成回答,无需传入全量文档。

二、Agent 核心组件术语

Tool

工具,本质是一个可被大模型调用的函数,给入指定参数即可返回对应结果,是大模型感知、影响外部环境的核心能力。完整调用流程:

  1. 用户发送问题,平台将问题 + 可用工具列表传给大模型
  2. 大模型分析问题,判断需要调用的工具,生成包含工具名称、参数的调用指令
  3. 平台接收指令,执行工具调用,获取结果
  4. 平台将工具结果返回给大模型,大模型整理后生成最终回答,返回给用户例:天气查询工具、计算器工具、文件读写工具等。

因为用户,大模型,天气查询工具,没法直接对话,需要平台来做传递信息的工作。

例如:

用户将"今天天气怎么样"发送给平台,平台会把用户的问题转发给大模型,不过发给大模型的并不只有用户问题还有目前可用的工具列表,比如天气查询工具,计算器工具等。大模型收到问题之后会自己分析:用户想要实时天气,但自己没有,就去调用天气查询工具。但大模型没法自己调用工具,它唯一的能力就是输出文本,此时大模型会生成调用天气查询工具的指令。

工具名称和对应的参数

{ "tool":"天气查询", "参数":{ "城市":"北京", "日期":"今天" } }

这个会发到平台那边去,平台接收到指令之后就会真正地调用这个工具。平台拿到调用结果之后就会返回给大模型,大模型收到整理后输出给平台,平台会转发给用户。用户就可以看到最后的结果。

MCP

平台要把工具列表传给模型,还要能调用工具。

所以,我们首先就得把工具接入到平台里面,这样平台才知道可用工具列表以及每个工具的用途,参数,调用方法等。

模型上下文协议(Model Context Protocol),是一套统一的工具接入标准。解决的核心痛点:不同大模型平台的工具接入规范不同,同一工具需要为不同平台重复开发适配代码;基于 MCP 规范开发一次工具,即可被所有支持 MCP 的平台(Claude、ChatGPT 等)直接使用。

Agent

智能体,指能够自主规划任务、自主调用工具、循环执行直至完成用户目标的系统。核心能力:自主规划、工具调用、反思迭代。

例:用户指令「查今天北京天气,如果下雨,帮我找附近 5 家卖伞的店铺」,Agent 会自主规划步骤,依次调用定位工具、天气工具、地图工具,最终完成任务。

具体为:大模型接收到指令会先去调用定位工具,获取定位工具结果;根据当前定位调用天气工具,获取天气工具结果;根据天气结果调用店铺工具,获取卖雨伞的店的结果,最后汇总给出答案。

目前主流 Agent 产品:Claude Code、Gemini CLI、Codex 等,主流构建模式包括 ReAct、Plan And Execute 等。

Agent Skill

本质是给 Agent 看的说明文档,是可动态加载的自定义 Prompt 规则。标准格式为 Markdown 文档,分为两部分:

  1. 元数据层:顶部的 name(技能名称)、description(技能功能、触发场景)
  2. 指令层:详细的执行规则、输出格式、判断标准等内容使用方式:将编写好的 SKILL.md 放入 Agent 指定的技能目录,Agent 即可自动识别、加载并使用该技能。

详细点说:定义好之后需要存到硬盘指定位置里,比如claude需要放到 /.claude/skills文件夹下,首先需要在这个目录下新建一个文件夹,文件夹名字必须和agent skill的名字相同,进入到新建文件夹后创建SKILL.md,名称必须是这个,内容就填写我们所需要的Agent skill。

--- name: daily-report-cpp description: 生成C++后端开发专属每日进度日报。自动基于项目上下文,总结当日开发、优化、排错等工作,适配实习/项目汇报场景。 --- # daily-report-cpp ## 格式要求 请严格按照以下 Markdown 格式输出,内容必须基于当前项目上下文(如Oat++后端、Epoll服务器、MySQL数据库等),突出技术细节与产出: ```markdown # 📅 开发日报(YYYY-MM-DD) ## 💡 今日摘要 (用1-2句话总结今日核心产出,突出技术亮点与项目推进成果) ## 📝 详细变更 ### ✨ 新增功能 - [模块名] 详细描述功能实现、技术方案、代码改动(如:Oat++ Controller层 新增学员信息查询接口,完成DTO/Service/DAO全链路开发) - [模块名] ... ### 🐛 问题修复 - [模块名] 详细描述问题根因、修复方案、优化效果(如:Epoll服务器 修复高并发下的线程安全问题,优化后QPS提升30%) - [模块名] ... ### ⚡ 性能优化 - [模块名] 详细描述优化点、技术手段、性能提升数据(如:MySQL DAO层 优化SQL查询语句,新增索引,查询耗时降低40%) - [模块名] ... ## 🎯 明日计划 - 列出明日核心开发任务,按优先级排序 ## 📌 遇到的问题&解决方案 - 记录当日遇到的技术难点、排查过程、最终解决方案(可选,用于汇报复盘)

基础概念总结

术语核心定义
LLM大语言模型
Token大模型处理数据的最基本单元
Context大模型每次处理任务时接收到的信息总和
Context Window大模型上下文可容纳的最大 Token 量
Prompt给大模型下达的具体指令 / 问题
Tool大模型感知、影响外部环境的可调用函数
MCP大模型工具接入的统一标准协议
Agent可自主规划、调用工具完成任务的智能系统
Agent Skill给 Agent 用的自定义规则说明文档

Read more

前端防范 XSS(跨站脚本攻击)

目录 一、防范措施 1.layui util  核心转义的特殊字符 示例 2.js-xss.js库 安装 1. Node.js 环境(npm/yarn) 2. 浏览器环境 核心 API 基础使用 1. 基础过滤(默认规则) 2. 自定义过滤规则 (1)允许特定标签 (2)允许特定属性 (3)自定义标签处理 (4)自定义属性处理 (5)转义特定字符 常见场景示例 1. 过滤用户输入的评论内容 2. 允许特定富文本标签(如富文本编辑器内容) 注意事项 更多配置 XSS(跨站脚本攻击)是一种常见的网络攻击手段,它允许攻击者将恶意脚本注入到其他用户的浏览器中。

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

目录 1. 打开浏览器开发者工具 2. 使用 Network 面板 3. 查看具体的API请求 a. Headers b. Payload c. Response d. Preview e. Timing 4. 实际操作步骤 5. 常见问题及解决方法 a. 无法看到API请求 b. 请求失败 c. 跨域问题(CORS) 作为一名后端工程师,理解前端如何调用接口、传递参数以及接收返回值是非常重要的。下面将详细介绍如何通过浏览器开发者工具(F12)查看和分析这些信息,并附带图片案例帮助你更好地理解。 1. 打开浏览器开发者工具 按下 F12 或右键点击页面选择“检查”可以打开浏览器的开发者工具。常用的浏览器如Chrome、Firefox等都内置了开发者工具。下面是我选择我的一篇文章,打开开发者工具进行演示。 2. 使用

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例)

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例) 前端开发中最令人头疼的莫过于那些难以定位的UI问题——元素错位、样式冲突、响应式失效...传统调试方式往往需要反复修改代码、刷新页面、检查元素。现在,通过Cursor编辑器集成的Codex功能,你可以直接用截图交互快速定位和修复这些问题。本文将带你从零开始,掌握这套革命性的调试工作流。 1. 环境准备与基础配置 在开始之前,确保你已经具备以下环境: * Cursor编辑器最新版(v2.5+) * Node.js 18.x及以上版本 * React 18项目(本文以Chakra UI 2.x为例) 首先在Cursor中安装Codex插件: 1. 点击左侧扩展图标 2. 搜索"Codex"并安装 3. 登录你的OpenAI账户(需要ChatGPT Plus订阅) 关键配置项: // 在项目根目录创建.