VibeThinker-1.5B-APP：小模型在编程与数学推理中的优势与部署

VibeThinker-1.5B-APP：小模型在编程与数学推理中的优势与部署 | 极客日志

测试集	VibeThinker-1.5B-APP	DeepSeek R1（>600B）
AIME24（数学推理）	80.3	79.8
HMMT25（高中数学竞赛）	50.4	41.7
LiveCodeBench v6（编程能力）	51.1	——
Magistral Medium（同规模对比）	超出 0.8 分	——

# 中文输入可能触发模糊匹配 "写个函数找两个数加起来等于目标值" 
# 英文输入直接命中训练样本分布 "Write a function to find two numbers that sum up to target"

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# 加载本地模型
model_path = "/root/model/vibethinker"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16, # 半精度降低显存占用
    device_map="auto" # 自动分配 GPU 资源
)

# 明确角色设定：告诉模型'你是谁'
system_prompt = "You are a programming assistant specialized in solving LeetCode-style algorithm problems."
user_question = "Given an array of integers nums and an integer target, return indices of the two numbers such that they add up to target. You may assume that each input would have exactly one solution, and you cannot use the same element twice."

# 拼接输入
full_input = f"{system_prompt}\n\n{user_question}"
inputs = tokenizer(full_input, return_tensors="pt").to("cuda")

# 生成响应
outputs = model.generate(
    inputs['input_ids'],
    max_new_tokens=512,
    temperature=0.7, # 控制多样性
    top_p=0.9, # 核采样，过滤低概率词
    do_sample=True,
    pad_token_id=tokenizer.eos_token_id
)

# 解码并提取模型生成部分
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("Model Response:\n", response[len(full_input):])

[前端界面]
↓ (HTTP 请求)
[FastAPI 服务层] → 处理认证、限流、日志记录
↓
[提示词管理模块] ← 注入动态 role prompt（如'数学专家'）
↓
[模型推理引擎] ← 加载 VibeThinker-1.5B-APP 实例
↓
[后处理流水线] ← 提取代码块、格式化、沙箱测试
↓
[结构化结果返回客户端]

VibeThinker-1.5B-APP：小模型在编程与数学推理中的优势与部署

VibeThinker-1.5B-APP：小模型如何在编程与数学推理中超越大模型？

从 Transformer 到专用推理引擎

它到底有多强？看几个硬核指标

为什么英文输入效果更好？

如何调用？一个完整的 Python 示例

实际系统怎么搭建？不只是调 API

使用经验：那些踩过的坑和最佳实践

✅ 必须设置系统提示词

✅ 中文问题建议先翻译成英文

✅ 输入要精简，避免冗余信息

✅ 启用缓存 + 静态检查闭环

✅ 部署方式按场景选择

它不适合做什么？

更深远的意义：专用模型时代的来临

更多推荐文章

相关免费在线工具

VibeThinker-1.5B-APP：小模型在编程与数学推理中的优势与部署

VibeThinker-1.5B-APP：小模型如何在编程与数学推理中超越大模型？

从 Transformer 到专用推理引擎

它到底有多强？看几个硬核指标

为什么英文输入效果更好？

如何调用？一个完整的 Python 示例

实际系统怎么搭建？不只是调 API

使用经验：那些踩过的坑和最佳实践

✅ 必须设置系统提示词

✅ 中文问题建议先翻译成英文

✅ 输入要精简，避免冗余信息

✅ 启用缓存 + 静态检查闭环

✅ 部署方式按场景选择

它不适合做什么？

更深远的意义：专用模型时代的来临

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具