【AIGC】Claude Code的三大模式

Claude Code 主要有三大核心权限/执行模式(默认、自动编辑、计划),以及思考强度模式危险模式等辅助模式。

一、三大核心执行模式(权限控制)

这是最常用的三种模式,控制 Claude 对文件与命令的自动化程度,可通过 Shift+Tab 循环切换。

1. 默认模式(Normal / Manual Approval)
  • 状态栏? for shortcuts
  • 行为每次文件编辑、命令执行前都需要你手动批准(Y/N/跳过)
  • 适用:学习阶段、不熟悉的项目、重要/敏感修改、需要精细控制
  • 特点:最安全、掌控感最强,但效率较低
2. 自动编辑模式(Auto-Accept / Accept Edits)
  • 状态栏accept edits on
  • 行为自动接受所有文件读写修改,但 Shell 命令仍需手动批准
  • 适用:信任 AI 的日常开发、批量生成/修改代码、写测试、生成样板代码
  • 特点:效率高,适合重复性、低风险任务
3. 计划模式(Plan Mode)
  • 状态栏plan mode on
  • 行为只读、不执行任何修改;先分析需求 → 生成详细执行计划(含步骤、文件、命令)→ 生成 plan.md → 你审核/修改后再执行
  • 适用:复杂功能开发、架构设计、数据库迁移、生产关键文件修改、需求梳理
  • 特点:安全可控、先规划后执行、减少返工、避免误操作

二、其他辅助模式

1. 思考强度模式(Thinking Modes)

控制推理深度,可在 VS Code 插件中切换:

  • Think:基础思考
  • Think Hard:深度推理
  • Think Harder:更深度分析
  • Ultrathink:极致深度(适合架构/复杂算法)
2. 危险模式(Dangerously Skip Permissions / YOLO Mode)
  • 命令claude --dangerously-skip-permissions
  • 行为完全跳过所有权限检查,自动执行所有文件修改与命令
  • 适用:仅用于完全信任的低风险任务(如修复 lint、生成 boilerplate)
  • ⚠️ 风险:极高,可能意外破坏代码,谨慎使用
3. Fast Mode
  • 作用:调整 API 配置,加快响应速度(非换模型)
  • 适用:交互式快速迭代、实时调试、快速实验
  • 注意:中途开启会按 Fast Mode 费率重新计费上下文

三、模式切换方式

  • 快捷键Shift+Tab 循环切换(默认 → 自动编辑 → 计划 → 默认)
  • 命令/plan 直接进入计划模式
  • VS Code:在插件设置中修改 Initial Permission Mode

Read more

保姆级教程:用llama.cpp加载Qwen2.5-VL多模态模型(附常见错误解决)

保姆级教程:用llama.cpp加载Qwen2.5-VL多模态模型(附常见错误解决) 最近在本地跑多模态模型的需求越来越多了,尤其是像Qwen2.5-VL这种既能看懂图又能聊天的模型,对于想自己捣鼓点智能应用的朋友来说,吸引力不小。但说实话,从下载模型到真正跑起来,中间的路可不好走,尤其是用llama.cpp这个工具,版本兼容、环境配置、代码调用,每一步都可能遇到意想不到的坑。我自己在折腾Qwen2.5-VL-3B-Instruct的时候,就花了不少时间解决各种报错。这篇文章,我就把自己踩过的坑和总结出来的完整流程,掰开揉碎了讲给你听。无论你是刚接触本地大模型的初学者,还是想给项目集成多模态能力的中级开发者,跟着这篇教程走,应该能帮你省下不少搜索和调试的时间。我们的目标很简单:让你在自己的电脑上,顺利地用llama.cpp加载Qwen2.5-VL,并让它准确地“看懂”你给的图片。 1. 环境准备与模型获取 在动手写代码之前,有两件事必须搞定:一个是准备好能跑起来的llama.cpp环境,另一个是拿到正确且相互匹配的模型文件。很多人第一步就栽了跟头,要么环境装不上,要么模型文件不

AIGC时代大模型幻觉问题深度治理:技术体系、工程实践与未来演进

AIGC时代大模型幻觉问题深度治理:技术体系、工程实践与未来演进

文章目录 * 一、幻觉问题的多维度透视与产业冲击 * 1.1 幻觉现象的本质特征与量化评估 * 1.2 产业级影响案例分析 * 二、幻觉问题的根源性技术解剖 * 2.1 数据污染的复合效应 * 2.1.1 噪声数据类型学分析 * 2.1.2 数据清洗技术实现 * 2.2 模型架构的先天缺陷 * 2.2.1 注意力机制的局限性 * 2.2.2 解码策略的博弈分析 * 2.3 上下文处理的边界效应 * 三、多层次解决方案体系构建 * 3.1 数据治理体系升级 * 3.1.1 动态数据质量监控 * 3.1.2 领域知识图谱构建 * 3.

Trae、Cursor、Copilot、Windsurf对比

我最开始用Copilot(主要是结合IDE开发时进行代码补全,生成单元测试用例),但是后面又接触了Cursor,发现Cursor比Copilot更加实用,Cursor生成的单元测试用例更加全面。         多以网上查了查资料,这里记录分享一下。         这篇文章资料来自于网络,是对部分知识整理,这里只是记录一下,仅供参考 前言         随着AI技术的爆发式发展,AI编程工具正在重塑软件开发流程。GitHub Copilot作为先驱者长期占据市场主导地位,但新一代工具如Cursor、Windsurf和Trae正以颠覆性创新发起挑战。本文基于多维度实测数据,深度解析三款工具的核心竞争力,揭示AI编程工具的格局演变趋势。 工具定位与核心技术 1. Cursor:智能化的全能助手         基于VS Code生态深度改造,Cursor融合GPT-4和Claude 3.5模型,支持自然语言转代码生成、跨文件智能补全和自动文档生成。其核心优势在于: * 上下文感知能力:可同时分析10+个关联文件的语义逻辑 * Agent模

Llama-3.2-3B步骤详解:Ollama部署后启用GPU加速(CUDA/cuDNN)全流程

Llama-3.2-3B步骤详解:Ollama部署后启用GPU加速(CUDA/cuDNN)全流程 1. 为什么需要GPU加速?——从“能跑”到“跑得快”的关键跃迁 你可能已经用Ollama成功拉起了Llama-3.2-3B,输入几句话就能看到回复,一切看似顺利。但当你连续提问、生成稍长文本,或者尝试多轮对话时,会明显感觉到响应变慢——几秒甚至十几秒的等待,让原本流畅的交互体验打了折扣。 这不是模型能力的问题,而是默认情况下Ollama在CPU上运行。Llama-3.2-3B虽是3B参数量的轻量级模型,但其Transformer结构天然适合并行计算。一块中端消费级显卡(比如RTX 3060或更高),在GPU模式下推理速度可比CPU快3~5倍,显存占用更合理,还能释放出CPU资源去做其他事。 更重要的是,Ollama官方明确支持CUDA加速,且无需手动编译模型或修改源码。整个过程不涉及复杂配置文件编辑,也不要求你成为CUDA专家——只要你的机器有NVIDIA显卡、驱动正常、CUDA环境基础就绪,就能完成切换。本文将带你从零开始,一步步验证环境、启用加速、实测对比,并解决你最可能卡