【AIGC】Claude Code的三大模式

优质文章学习记录

08 Apr 2026 — 2 min read

Claude Code 主要有三大核心权限/执行模式（默认、自动编辑、计划），以及思考强度模式、危险模式等辅助模式。

一、三大核心执行模式（权限控制）

这是最常用的三种模式，控制 Claude 对文件与命令的自动化程度，可通过 Shift+Tab 循环切换。

1. 默认模式（Normal / Manual Approval）

状态栏：? for shortcuts
行为：每次文件编辑、命令执行前都需要你手动批准（Y/N/跳过）
适用：学习阶段、不熟悉的项目、重要/敏感修改、需要精细控制
特点：最安全、掌控感最强，但效率较低

2. 自动编辑模式（Auto-Accept / Accept Edits）

状态栏：accept edits on
行为：自动接受所有文件读写修改，但 Shell 命令仍需手动批准
适用：信任 AI 的日常开发、批量生成/修改代码、写测试、生成样板代码
特点：效率高，适合重复性、低风险任务

3. 计划模式（Plan Mode）

状态栏：plan mode on
行为：只读、不执行任何修改；先分析需求 → 生成详细执行计划（含步骤、文件、命令）→ 生成 plan.md → 你审核/修改后再执行
适用：复杂功能开发、架构设计、数据库迁移、生产关键文件修改、需求梳理
特点：安全可控、先规划后执行、减少返工、避免误操作

二、其他辅助模式

1. 思考强度模式（Thinking Modes）

控制推理深度，可在 VS Code 插件中切换：

Think：基础思考
Think Hard：深度推理
Think Harder：更深度分析
Ultrathink：极致深度（适合架构/复杂算法）

2. 危险模式（Dangerously Skip Permissions / YOLO Mode）

命令：claude --dangerously-skip-permissions
行为：完全跳过所有权限检查，自动执行所有文件修改与命令
适用：仅用于完全信任的低风险任务（如修复 lint、生成 boilerplate）
⚠️ 风险：极高，可能意外破坏代码，谨慎使用

3. Fast Mode

作用：调整 API 配置，加快响应速度（非换模型）
适用：交互式快速迭代、实时调试、快速实验
注意：中途开启会按 Fast Mode 费率重新计费上下文

三、模式切换方式

快捷键：Shift+Tab 循环切换（默认 → 自动编辑 → 计划 → 默认）
命令：/plan 直接进入计划模式
VS Code：在插件设置中修改 Initial Permission Mode

Read more

保姆级教程：用llama.cpp加载Qwen2.5-VL多模态模型（附常见错误解决）

保姆级教程：用llama.cpp加载Qwen2.5-VL多模态模型（附常见错误解决）最近在本地跑多模态模型的需求越来越多了，尤其是像Qwen2.5-VL这种既能看懂图又能聊天的模型，对于想自己捣鼓点智能应用的朋友来说，吸引力不小。但说实话，从下载模型到真正跑起来，中间的路可不好走，尤其是用llama.cpp这个工具，版本兼容、环境配置、代码调用，每一步都可能遇到意想不到的坑。我自己在折腾Qwen2.5-VL-3B-Instruct的时候，就花了不少时间解决各种报错。这篇文章，我就把自己踩过的坑和总结出来的完整流程，掰开揉碎了讲给你听。无论你是刚接触本地大模型的初学者，还是想给项目集成多模态能力的中级开发者，跟着这篇教程走，应该能帮你省下不少搜索和调试的时间。我们的目标很简单：让你在自己的电脑上，顺利地用llama.cpp加载Qwen2.5-VL，并让它准确地“看懂”你给的图片。 1. 环境准备与模型获取在动手写代码之前，有两件事必须搞定：一个是准备好能跑起来的llama.cpp环境，另一个是拿到正确且相互匹配的模型文件。很多人第一步就栽了跟头，要么环境装不上，要么模型文件不

AIGC时代大模型幻觉问题深度治理：技术体系、工程实践与未来演进

AIGC时代大模型幻觉问题深度治理：技术体系、工程实践与未来演进

文章目录 * 一、幻觉问题的多维度透视与产业冲击 * 1.1 幻觉现象的本质特征与量化评估 * 1.2 产业级影响案例分析 * 二、幻觉问题的根源性技术解剖 * 2.1 数据污染的复合效应 * 2.1.1 噪声数据类型学分析 * 2.1.2 数据清洗技术实现 * 2.2 模型架构的先天缺陷 * 2.2.1 注意力机制的局限性 * 2.2.2 解码策略的博弈分析 * 2.3 上下文处理的边界效应 * 三、多层次解决方案体系构建 * 3.1 数据治理体系升级 * 3.1.1 动态数据质量监控 * 3.1.2 领域知识图谱构建 * 3.

Trae、Cursor、Copilot、Windsurf对比

我最开始用Copilot（主要是结合IDE开发时进行代码补全，生成单元测试用例），但是后面又接触了Cursor，发现Cursor比Copilot更加实用，Cursor生成的单元测试用例更加全面。多以网上查了查资料，这里记录分享一下。这篇文章资料来自于网络，是对部分知识整理，这里只是记录一下，仅供参考前言随着AI技术的爆发式发展，AI编程工具正在重塑软件开发流程。GitHub Copilot作为先驱者长期占据市场主导地位，但新一代工具如Cursor、Windsurf和Trae正以颠覆性创新发起挑战。本文基于多维度实测数据，深度解析三款工具的核心竞争力，揭示AI编程工具的格局演变趋势。工具定位与核心技术 1. Cursor：智能化的全能助手基于VS Code生态深度改造，Cursor融合GPT-4和Claude 3.5模型，支持自然语言转代码生成、跨文件智能补全和自动文档生成。其核心优势在于： * 上下文感知能力：可同时分析10+个关联文件的语义逻辑 * Agent模

Llama-3.2-3B步骤详解：Ollama部署后启用GPU加速（CUDA/cuDNN）全流程

Llama-3.2-3B步骤详解：Ollama部署后启用GPU加速（CUDA/cuDNN）全流程 1. 为什么需要GPU加速？——从“能跑”到“跑得快”的关键跃迁你可能已经用Ollama成功拉起了Llama-3.2-3B，输入几句话就能看到回复，一切看似顺利。但当你连续提问、生成稍长文本，或者尝试多轮对话时，会明显感觉到响应变慢——几秒甚至十几秒的等待，让原本流畅的交互体验打了折扣。这不是模型能力的问题，而是默认情况下Ollama在CPU上运行。Llama-3.2-3B虽是3B参数量的轻量级模型，但其Transformer结构天然适合并行计算。一块中端消费级显卡（比如RTX 3060或更高），在GPU模式下推理速度可比CPU快3～5倍，显存占用更合理，还能释放出CPU资源去做其他事。更重要的是，Ollama官方明确支持CUDA加速，且无需手动编译模型或修改源码。整个过程不涉及复杂配置文件编辑，也不要求你成为CUDA专家——只要你的机器有NVIDIA显卡、驱动正常、CUDA环境基础就绪，就能完成切换。本文将带你从零开始，一步步验证环境、启用加速、实测对比，并解决你最可能卡