Streamlit WebUI 实战：适配 Nanbeige、Qwen 与 Llama 大模型的方法

Streamlit WebUI 实战：适配 Nanbeige、Qwen 与 Llama 大模型的方法 | 极客日志

# 创建虚拟环境
python -m venv nanbeige-ui
source nanbeige-ui/bin/activate
# 安装依赖
pip install streamlit torch transformers accelerate

from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "Nanbeige/Nanbeige4-3B"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
model.save_pretrained("./nanbeige-model")
tokenizer.save_pretrained("./nanbeige-model")

MODEL_PATH = "/home/username/models/nanbeige-4.1-3b"

streamlit run app.py

user_html = f"""<div class="user-mark"><span></span><div>{message}</div></div>"""
st.markdown(user_html, unsafe_allow_html=True)
ai_html = f"""<div><div>{message}</div></div>"""
st.markdown(ai_html, unsafe_allow_html=True)

.message-wrapper:has(.user-mark) { flex-direction: row-reverse; }
.message-wrapper:has(.user-mark) .message-bubble { background-color: #007AFF; color: white; }
.message-bubble.ai { background-color: white; box-shadow: 0 2px 8px rgba(0,0,0,0.1); }


#### 3.3 流式输出的平滑实现
使用 `st.empty()` 占位符更新内容避免闪烁：
```python
import threading
from transformers import TextIteratorStreamer
def stream_response(prompt):
    inputs = tokenizer(prompt, return_tensors="pt").to(device)
    streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True)
    generation_kwargs = dict(inputs, streamer=streamer, max_new_tokens=1024, temperature=0.7)
    thread = threading.Thread(target=model.generate, kwargs=generation_kwargs)
    thread.start()
    placeholder = st.empty()
    generated_text = ""
    for text in streamer:
        generated_text += text
        placeholder.markdown(f'<div>{generated_text}</div>', unsafe_allow_html=True)
    return generated_text

if model_type == "Qwen":
    tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH, trust_remote_code=True)
    model = AutoModelForCausalLM.from_pretrained(MODEL_PATH, trust_remote_code=True, torch_dtype=torch.float16, device_map="auto")

messages = [{"role": "system", "content": "你是一个有帮助的助手"}, {"role": "user", "content": "你好"}]
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

elif model_type == "Llama":
    tokenizer.pad_token = tokenizer.eos_token
    # Llama3 对话模板处理...

class ChatProcessor:
    def __init__(self, model_type="Nanbeige"):
        self.model_type = model_type
        self.setup_model()
    def setup_model(self):
        if self.model_type == "Qwen": self.load_qwen()
        elif self.model_type == "Llama": self.load_llama()
        else: self.load_nanbeige()
    def format_messages(self, messages):
        if self.model_type == "Qwen": return self.format_qwen(messages)
        elif self.model_type == "Llama": return self.format_llama(messages)
        else: return self.format_nanbeige(messages)

用户：计算斐波那契数列
AI：<details><summary>查看思考过程</summary>...</details>
```python
def fibonacci(n): ...

用户：描述夏天
AI：夏日的阳光洒在波光粼粼的湖面上...

model_choice = st.selectbox("选择 AI 模型", ["Nanbeige 4.1-3B", "Qwen 7B", "Llama 3 8B"])
if model_choice != st.session_state.get("current_model"):
    # 重新加载模型逻辑

Streamlit WebUI 实战：适配 Nanbeige、Qwen 与 Llama 大模型的方法

Streamlit WebUI 实战：适配 Nanbeige、Qwen 与 Llama 大模型的方法

1. 项目核心亮点

1.1 极简现代的视觉设计

1.2 智能的思考过程处理

1.3 流畅的流式输出体验

1.4 简洁部署

2. 快速上手：搭建专属聊天界面

2.1 环境准备

2.2 获取项目代码

2.3 准备模型权重

2.4 修改配置文件

2.5 启动服务

3. 核心技术解析：CSS 魔法改造 Streamlit

3.1 动态聊天气泡对齐

3.2 思考过程的智能折叠

4. 通用改造：适配 Qwen、Llama 等其他模型

4.1 适配 Qwen 系列模型

4.2 适配 Llama 系列模型

4.3 通用对话处理器

4.4 界面适配注意事项

5. 实际应用与效果展示

5.1 Nanbeige 4.1-3B 实际效果

5.2 适配 Qwen 模型效果

5.3 多模型切换体验

6. 总结与扩展建议

6.1 核心收获

6.2 扩展方向

6.3 开发者建议

更多推荐文章

相关免费在线工具

Streamlit WebUI 实战：适配 Nanbeige、Qwen 与 Llama 大模型的方法

Streamlit WebUI 实战：适配 Nanbeige、Qwen 与 Llama 大模型的方法

1. 项目核心亮点

1.1 极简现代的视觉设计

1.2 智能的思考过程处理

1.3 流畅的流式输出体验

1.4 简洁部署

2. 快速上手：搭建专属聊天界面

2.1 环境准备

2.2 获取项目代码

2.3 准备模型权重

2.4 修改配置文件

2.5 启动服务

3. 核心技术解析：CSS 魔法改造 Streamlit

3.1 动态聊天气泡对齐

3.2 思考过程的智能折叠

4. 通用改造：适配 Qwen、Llama 等其他模型

4.1 适配 Qwen 系列模型

4.2 适配 Llama 系列模型

4.3 通用对话处理器

4.4 界面适配注意事项

5. 实际应用与效果展示

5.1 Nanbeige 4.1-3B 实际效果

5.2 适配 Qwen 模型效果

5.3 多模型切换体验

6. 总结与扩展建议

6.1 核心收获

6.2 扩展方向

6.3 开发者建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具