本地服务器部署Text generation并添加code llama实现远程多人协作

优质文章学习记录

11 Apr 2026 — 9 min read

文章目录

前言
1. 本地部署Text generation Web UI
2. 安装CodeLlama大模型
3. 实现公网远程使用Code Llama
4. 固定Text generation Web UI公网地址

前言

本篇文章介绍如何在本地部署Text generation Web UI并搭建Code Llama大模型运行,并且搭建Code Llama大语言模型，结合Cpolar内网穿透实现公网可远程使用Code Llama。

Code Llama是一个可以使用文本提示生成代码的大型语言模型 (LLM)。可以使当前开发人员的工作流程更快、更高效，并降低学习编码人员的进入门槛。 Code Llama 有潜力用作生产力和教育工具，帮助程序员编写更强大、文档更齐全。

Text generation Web UI部署非常简便，不仅在github主页上直接提供了一键部署安装包，同时由于是web UI形式，直接通过浏览器即可操作，不过本地化部署，无法远程访问，这里我们结合cpolar工具实现从安装到最后实现远程访问。

那么接下来先在本地部署一个Text generation Web UI界面。

1. 本地部署Text generation Web UI

本篇文章测试环境：Windows10专业版

首先我们需要在本地部署Text generation Web UI，是一个基于Gradio的LLM Web UI开源项目，可以利用其快速搭建部署各种大模型环境。

github地址：https://github.com/facebookresearch/codellama

点击download,一键下载文件到本地

解压文件夹，然后打开文件，双击运行start_windows进行自动下载

安装过程中会有一次确认，根据自己的显卡和系统选择就可以了，这里我选择A（英伟达显卡）

安装完成后，可以看到本地地址是：http://127.0.0.1:7680，Ctrl+c终止它。

2. 安装CodeLlama大模型

接下来要下载CodeLlama模型，在Hugging face上直接下载转换好的模型

Hugging face格式模型 https://huggingface.co/codellama

选择Base Model

然后依次下载下方红框中的文件

下载好后，然后选中这九个文件剪切，回到 text-generation-webui 目录中，进入 models 目录中，新建要给文件夹，名为 codellama-7b

把刚才9个文件，都粘贴到这个新文件夹中

然后回到text-generation-webui 目录中，双击打开 start_windows

然后打开一个浏览器，输入localhost:7680，可以看到进入到了Text generation Web UI中

点击上方model切换到模型配置页面，在模型下拉列表这里选择 codellama-7b

然后点击Load加载模型，接下来可以测试提出问题

然后把右侧上方的代码使用vscode测试一下，是否能得出结果

可以看到，显示出了正确结果，目前我们在本机部署了 Text generation Web UI，并且还添加了code llama大模型，如果想团队协作多人使用，或者在异地其他设备使用的话就需要结合Cpolar内网穿透实现公网访问，免去了复杂得本地部署过程，只需要一个公网地址直接就可以进入到Text generation Web UI中。

接下来教大家如何安装Cpolar并且将 Text generation Web UI实现公网访问。

3. 实现公网远程使用Code Llama

下面是安装cpolar步骤：

Cpolar官网地址: https://www.cpolar.com

点击进入cpolar官网，点击免费使用注册一个账号，并下载最新版本的Cpolar

登录成功后，点击下载Cpolar到本地并安装（一路默认安装即可）本教程选择下载Windows版本。

Cpolar安装成功后，在浏览器上访问http://localhost:9200，使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

接下来配置一下 text-generation-webui 的公网地址，

登录后，点击左侧仪表盘的隧道管理——创建隧道，

首先创建一个 LobeChat 的公网http地址隧道

隧道名称：可自定义命名，注意不要与已有的隧道名称重复
协议：选择http
本地地址：7860 (本地访问的地址)
域名类型：免费随机域名
地区：选择China Top

点击创建

隧道创建成功后，点击左侧的状态——在线隧道列表,查看所生成的公网地址，有两种访问方式，一种是http 和https

我们接下来使用http公网地址访问，可以看到我们访问到了 Text generation Web UI 界面，这样一个公网地址访问就创建好了。

小结

如果我们需要长期进行团队协作的话，由于刚才创建的是随机的地址，24小时会发生变化。另外它的网址是由随机字符生成，不容易记忆。如果想把域名变成固定的二级子域名，并且不想每次都重新创建隧道来访问Text generation Web UI，我们可以选择创建一个固定的http地址来解决这个问题。

4. 固定Text generation Web UI公网地址

由于以上使用cpolar所创建的隧道使用的是随机公网地址，24小时内会随机变化，不利于长期远程访问。因此我们可以为其配置二级子域名，该地址为固定地址，不会随机变化【ps：cpolar.cn已备案】

注意需要将cpolar套餐升级至基础套餐或以上，且每个套餐对应的带宽不一样。【cpolar.cn已备案】

登录cpolar官网，点击左侧的预留，选择保留二级子域名，地区选择china vip top，然后设置一个二级子域名名称，填写备注信息，点击保留。

保留成功后复制保留的二级子域名地址：

登录cpolar web UI管理界面，点击左侧仪表盘的隧道管理——隧道列表，找到所要配置的隧道，点击右侧的编辑。

修改隧道信息，将保留成功的二级子域名配置到隧道中

域名类型：选择二级子域名
Sub Domain：填写保留成功的二级子域名
地区: China VIP

点击更新

更新完成后，打开在线隧道列表，此时可以看到随机的公网地址已经发生变化，地址名称也变成了保留和固定的二级子域名名称。

最后，我们使用固定的公网地址访问Text generation Web UI界面可以看到访问成功，一个永久不会变化的远程访问方式即设置好了。

接下来就可以随时随地进行异地公网来使用Code Llama大模型了，把固定的公网地址分享给身边的人，方便团队协作，同时也大大提高了工作效率！自己用的话，无需云服务器，还可以实现异地其他设备登录！以上就是如何在本地安装Code Llama以及在本地部署 Text generation Web UI 可视化界面的全部过程。

亲测BGE-M3 WebUI：多语言语义匹配效果超预期

亲测BGE-M3 WebUI：多语言语义匹配效果超预期你有没有遇到过这样的问题：用户搜索“手机充电慢”，知识库却只返回“电池续航差”的文档；客服系统把“退款申请”和“换货流程”当成完全无关的请求；跨语言产品文档中，英文FAQ和中文帮助页无法自动关联…… 这些不是模型不够聪明，而是传统关键词匹配早已力不从心。直到我点开这个镜像——🧠 BAAI/bge-m3 语义相似度分析引擎，输入两段看似无关的文字，按下“分析”键，屏幕上跳出一个数字：87.3%。那一刻我才真正意识到：AI终于开始“理解”文字背后的意思了。这不是理论推演，也不是参数堆砌，而是一个开箱即用、无需代码、连CPU都能跑得飞快的Web界面。今天这篇实测笔记，不讲原理、不列公式，只说三件事：它到底能做什么、在哪些场景下真的好用、以及你第一次打开时最该注意什么。 1. 为什么说这是目前最实用的语义匹配工具？ 1.1 不是“

web期末作业网页设计——火影忍者主题网站（附完整源码）

目录 ⭐效果展示：项目概述技术栈解析实现步骤详解步骤 1：项目结构设计步骤 2：基础样式设计步骤 3：页面布局实现步骤 4：功能模块实现步骤 5：动画效果实现项目亮点特色 ⭐项目源码： ⭐效果展示：火影忍者web网页项目概述本次开发的火影忍者主题网站是

Git-RSCLIP智能相册开发：Vue前端+Node.js后端全栈实现

Git-RSCLIP智能相册开发：Vue前端+Node.js后端全栈实现你是不是也有过这样的经历？手机里存了几千张照片，想找一张“去年夏天在海边拍的、有红色遮阳伞和狗狗”的照片，结果翻了半小时也没找到。传统的相册应用只能按时间、地点或手动添加的标签来搜索，一旦标签没打好，照片就像石沉大海。现在，情况不一样了。想象一下，你只需要在搜索框里输入“红色汽车的照片”，或者“有彩虹的风景照”，系统就能瞬间从成千上万张照片中精准地找到它们。这听起来像是科幻电影里的场景，但今天，我们就要用Git-RSCLIP模型，结合Vue3和Node.js，亲手把它变成现实。这篇文章，我就带你一步步搭建一个基于自然语言搜索的智能相册系统。我们不用去理解复杂的深度学习算法，而是聚焦于如何将前沿的AI能力，通过一套清晰、可落地的全栈技术方案，变成一个真正能用的产品。无论你是前端开发者想了解如何接入AI能力，还是后端工程师想学习向量数据库的应用，都能在这里找到答案。 1. 为什么我们需要智能相册？在开始敲代码之前，我们先聊聊为什么传统的相册管理方式已经不够用了。我自己的手机里大概有8000多张照

Qwen3Guard-Gen-WEB部署教程：开源安全审核模型一键部署实战

Qwen3Guard-Gen-WEB部署教程：开源安全审核模型一键部署实战 1. 引言 1.1 业务场景描述随着大语言模型在内容生成、智能客服、社交平台等领域的广泛应用，用户生成内容（UGC）的安全性问题日益突出。不当言论、敏感信息、恶意诱导等内容可能对平台声誉和合规运营带来巨大风险。因此，构建高效、精准的内容安全审核机制成为AI应用落地的关键环节。阿里云推出的 Qwen3Guard-Gen 是一款专为大模型输出内容设计的开源安全审核模型，能够自动识别并分级处理潜在风险内容，适用于多语言、高并发的生产环境。本文将详细介绍如何通过镜像方式快速部署 Qwen3Guard-Gen-WEB 版本，实现可视化网页端的安全内容检测功能。 1.2 痛点分析传统内容审核方案存在以下典型问题： * 规则引擎覆盖有限：依赖关键词匹配，难以应对语义变体和上下文隐含风险。 * 第三方服务成本高：商用API调用费用随流量增长而上升，长期使用负担重。 * 响应延迟高：远程调用存在网络开销，影响实时交互体验。 * 不支持私有化部署：数据需上传至外部服务器，存在隐私泄露风险。基于以上