llama.cpp加载多模态gguf模型

优质文章学习记录

06 Apr 2026 — 1 min read

llama.cpp预编译包还不支持cuda12.6

llama.cpp的编译，也有各种坑

llama.cpp.python的也需要编译

llama.cpp命令行加载多模态模型

llama-mtmd-cli -m Qwen2.5-VL-3B-Instruct-q8_0.gguf --mmproj Qwen2.5-VL-3B-Instruct-mmproj-f16.gguf -p "Describe this image." --image ./car-1.jpg

**模型主gguf文件要和mmporj文件从一个库里下载，否则会有兼容问题，建议从ggml的官方库里下载
Multimodal GGUFs官方库

llama.cpp.python加载多模态模型

看官方文档
要使用LlamaChatHandler类，官方已经写好了不少多模态模型的加载类，比如qwen2.5vl的写法：

from llama_cpp import Llama

把 Vivado 项目放心交给 Git：一篇 FPGA 工程师必读的实战指南

之前分享过一篇文章《FPGA 版本管理三种方式：你会选哪一种？》，评论区很多人都推荐使用Git进行版本管理，今天这篇文章主题就是使用Git进行备份指南。在 FPGA 开发中，掌握 Git 等源码管理工具已经是必备技能。当然，在使用 Vivado 时，我们不仅需要处理源代码控制，还需要处理以 IP 为中心的设计产品。 Vivado 的工程通常是 IP 为中心的设计，包含： * IP Integrator Block Diagram * 各类 IP 实例（独立 IP 或 BD 内 IP） * 自动生成的包装文件与工程产物这让很多 FPGA 工程师一开始会觉得： “Vivado 项目到底该怎么和 Git 一起用？” 好消息是，从 Vivado

高飞团队新作！基于高阶CBF的端到端无人机，实现7.5m/s丛林穿越，突破RL安全瓶颈

「强化学习高速避障新范式」目录 01 主要方法 1. 训练阶段：基于物理先验的奖励塑形 1. Dijkstra全局引导奖励 2. 基于控制障碍函数的安全惩罚 2. 部署阶段：基于高阶控制障碍函数的实时滤波 02 实验结果 1.仿真训练与消融实验 2.基准测试 3.实机飞行验证 03 总结在无人机高速避障领域，Ego-Planner等传统的模块化规划方法受限于感知-规划-控制的累积延迟，往往难以兼顾高速与安全；而RL等纯端到端的强化学习虽然敏捷，却因缺乏理论上的安全保障而被视为黑盒。浙江大学高飞老师团队的这项工作，最令人振奋之处在于巧妙地构建了一套混合架构。 * 在训练阶段，利用 Dijkstra 势场引导 RL 智能体跳出局部极小值陷阱，实现了全局可达性； * 在部署阶段，则引入了基于高阶控制障碍函数（HOCBF）的安全滤波器，将神经网络输出的动作实时投影到可行域内。这种设计不仅在数学上给出了碰撞避免的严谨证明，更在实测中实现了高达 7.5m/s

仿生新势力：Openclaw开源仿生爪，如何革新机器人抓取？

仿生新势力：Openclaw开源仿生爪，如何革新机器人抓取？引言在仓储、农业乃至家庭服务中，机器人如何像猫一样灵巧、自适应地抓取千变万化的物体？这曾是行业难题。如今，一个名为 Openclaw 的开源仿生机械爪项目，正以其独特的被动适应性设计和亲民的成本，在机器人末端执行器领域掀起波澜。本文将深入解析Openclaw的仿生奥秘、实现原理、应用场景及未来布局，带你全面了解这款来自开源社区的“仿生新势力”。一、核心揭秘：从猫爪到机械爪的实现原理本节将拆解Openclaw如何将生物灵感转化为工程现实。 1. 仿生学设计理念 Openclaw的核心灵感源于猫科动物爪部。当猫抓取物体时，其爪趾会自然地包裹贴合物体表面，这种能力主要依赖于其肌腱和骨骼的被动结构，而非大脑的实时精密控制。Openclaw借鉴了这一思想，核心是被动适应性机制。它无需依赖复杂的传感器反馈和实时力控算法，仅凭精巧的机械结构即可根据物体形状自动调整接触点和抓取力，从而极大地简化了控制系统。配图建议：猫爪与Openclaw的对比图，或Openclaw抓取不同形状物体的动态示意图。 2. 欠驱动与

FPGA读写DDR4 (一)MIG IP核控制信号

前言这几个星期在倒腾DDR4内存的读写控制，期间看了不少资料，这几天终于完工了于是想着把做过的内容总结一下，于是有了这篇文章，由于控制DDR4的内容很多，这一篇文章就只讲基础的，也就是DDR4的控制IP核 MIG的控制信号。主要参考内容：【正点原子】MPSoC-P4之FPGA开发指南_V2.0，[XILINX] pg150-ultrascale-memory-ip-en-us-1.4 MIG IP核控制信号 IP核创建界面 MIG IP核（memory interface generator）是用户与DDR4进行沟通的桥梁，因为如果我们自己去写直接DDR4代码的话，其内容将会非常复杂，而且即便写出来其性能可能也不会好，以XILINX提供的MIG IP核为例，在综合布线后查看utilization，能发现MIG IP核足足使用了约7500个LUT和9000个register资源，足以看出其编写的复杂，不过对于我们普通用户，能够操作MIG提供的用户接口就我觉得就算差不多了，既然要使用IP核，我们就从IP核的创建界面开始说起，