GLM-4v-9b 实战指南:基于 llama.cpp GGUF 在消费级 GPU 部署多模态模型 | 极客日志