openclaw使用本地llama.cpp

优质文章学习记录

08 Apr 2026 — 1 min read

llama.cpp兼容openapi接口，自然可以作为openclaw的后端。
添加自定义provider同前：为openclaw增加自定义provider
反复修改，总是不能得到正确的model状态。

{"meta":{"lastTouchedVersion":"2026.2.3-1", "lastTouchedAt":"2026-02-05T12:16:30.399Z"}, "wizard":{"lastRunAt":"2026-01-30T12:20:58.674Z", "lastRunVersion":"2026.1.29", "lastRunCommand":"onboard", "lastRunMode":"local"}, "models":{"mode":"merge", "providers":{"llamacpp":{"baseUrl":"http://192.168.1.182:8087/v1", "apiKey":"no need key", "api":"openai-completions", "models":[{"id":"Qwen3-8B-Q6_K", "name":"Qwen3", "api":"openai-completions", "reasoning": true, "input":["text"], "cost":{"input":0, "output":0, "cacheRead":0, "cacheWrite":0}, "contextWindow":262144, "maxTokens":32000}]}}}, "agents":{"defaults":{"model":{"primary":"llamacpp/Qwen3-8B-Q6_K"}, "models":{"llamacpp/Qwen3-8B-Q6_K":{"alias":"Qwen3"}}, "maxConcurrent":4, "subagents":{"maxConcurrent":8}}}, "messages":{"ackReactionScope":"group-mentions"}, "commands":{"native":"auto", "nativeSkills":"auto"}, "gateway":{"port":18789, "mode":"local", "bind":"loopback", "auth":{"mode":"token", "token":"a08c51975f90e3afa566f4af1de977a70b6e9630909cc8c0", "password":"a08c51975f90e3afa566f4af1de977a70b6e9630909cc8c0"}, "tailscale":{"mode":"off", "resetOnExit":false}}, "skills":{"install":{"nodeManager":"npm"}}}

注意C:\Users\yusp7.openclaw\agents\main\agent\models.json，要与config\models\provider里一致，内容不能有重复provider名的：

{"providers":{"llamacpp":{"baseUrl":"http://192.168.1.182:8087/v1", "apiKey":"no need key", "api":"openai-completions", "models":[{"id":"Qwen3-8B-Q6_K", "name":"Qwen3", "api":"openai-completions", "reasoning": true, "input":["text"], "cost":{"input":0, "output":0, "cacheRead":0, "cacheWrite":0}, "contextWindow":262144, "maxTokens":32000}]}}}

在这里插入图片描述

但是，为什么返回的对话不对？

在这里插入图片描述

Read more

如何借助AI完成测试用例的生成？实测高效落地指南

作为一名测试从业者，想必你也有过这样的困扰：重复编写常规功能的测试用例，耗时又耗力；面对复杂业务逻辑，容易遗漏边缘场景；需求频繁迭代时，用例更新跟不上节奏，常常陷入“加班写用例、熬夜改用例”的内耗里。而现在，生成式AI的爆发的已经彻底改变了测试用例生成的传统模式——它能快速批量生成用例、覆盖更多人工易忽略的场景，还能适配需求迭代快速更新，将测试人员从重复劳动中解放出来，转向更核心的质量策略设计。但很多人尝试后却反馈：“把需求丢给AI，生成的用例驴唇不对马嘴”“看似全面，实际很多无法执行”。其实，AI生成测试用例的核心不是“输入→输出”的简单操作，而是“人机协同”的高效配合：AI负责规模化生产，人负责搭建框架、把控质量。今天就结合我的实测经验，手把手教你如何借助AI高效生成测试用例，避开常见坑，真正实现提效不内耗。一、先搞懂：AI生成测试用例的底层逻辑（避免踩错第一步）很多人用不好AI的核心原因，是误以为AI能“读懂所有需求”，其实它的本质是“基于已有规则和数据，模仿人类测试思维生成用例”。其底层主要依赖三大技术，

一个人就是一支影视团队：实测国内最强影视级 AI 视频创作平台 TapNow——告别抽卡，导演级精准控制

一个人就是一支影视团队：实测国内最强影视级 AI 视频创作平台 TapNow——告别抽卡，导演级精准控制

实测国内最强影视级 AI 视频平台 TapNow：告别“盲盒抽卡”，实现导演级精准调度在过去的一年里，文生视频赛道经历了爆发式增长。但对于真正需要将 AI 投入到生产环境中的创作者、产品经理和开发者来说，目前的 AI 视频工具普遍存在一个致命痛点——不可控。跑偏的物理规律、诡异的肢体形变、如同“开盲盒”般的提示词玄学，让很多原本充满创意的构想，最终沦为废弃的半成品。如果你也受够了这种低效的“抽卡式”创作，那么今天介绍的这款号称国内最强影视级 AI 视频创作平台——TapNow，或许能彻底重塑你的工作流。核心痛点突破：从“AI 幻觉”到真正的物理一致性技术社区的受众深知，评价一个 AI 视频大模型底座的强弱，不仅看它能生成多惊艳的单帧，更要看它在长镜头下的时空一致性。 TapNow 在底层架构上进行了深度优化，重点解决了以下三个核心问题： 1. 极高保真度的物理交互：无论是光影在水面的流动、烟雾的自然消散，

whisper-large-v3-turbo实战突破：零基础部署与8倍速语音识别解密

在语音识别技术日新月异的今天，whisper-large-v3-turbo以其惊人的8倍速度提升和卓越的识别精度，正在重新定义智能语音处理的效率标准。这款基于OpenAI Whisper架构的优化版本，在保持原有识别质量的同时，通过创新的模型压缩技术实现了处理速度的质的飞跃，为开发者提供了前所未有的高性能语音转写解决方案。【免费下载链接】whisper-large-v3-turbo 项目地址: https://ai.gitcode.com/hf_mirrors/openai/whisper-large-v3-turbo 技术架构深度解析：从32层到4层的智能精简核心优化策略 🧠 传统语音识别模型往往存在计算冗余的问题，whisper-large-v3-turbo通过精密的层数优化，将解码层从32层缩减至4层，同时引入智能补偿算法，确保识别准确率损失控制在0.3%以内。这种设计理念类似于现代建筑中的"少即是多"哲学，在保证结构稳固的前提下实现最大化的效率提升。性能对比实测数据 * 处理速度：相比原版提升8倍 * 内存占用：降低60%以上 * 准确率保持：99.7

VSCode + Copilot

VSCode + Copilot

1、Copilot的介绍 Git Hub Copilot是一款人工智能协作编程工具，它能帮助我们更快速、更高效地编写代码。 2、Copilot安装 (1)Copilot是以VSCode的插件形式存在，直接搜索下载安装即可。 * 第一次使用时VSCode会自动安装Copilot的插件。 (2)在VSCode中安装Copilot时，会获得两个扩展程序： * GitHub Copilot：在我们输入代码时会提供即时的代码建议。 * GitHub Copilot Char：一款配套插件，可提供基于人工智能的对话式辅助服务。 3、插件配置 (1)插件下载后需要登录账号才能使用，建议登录GitHub账号。 (2)登录GitHub账号可能需要kexue上网。 4、插件功能及使用 (1)代码补全功能。 (2)聊天会话功能。 (3)缺陷：现在可以免费使用，但是有一定的额度。