Python 调用大模型（LLM）的四种方式

Python 调用大模型（LLM）的四种方式 | 极客日志

# 请求体结构
data = {
    "model": "/models/Qwen2___5-32B-Instruct-AWQ",
    "messages": [
        {"role": "user", "content": "分析当前全球经济形势，并提出你的见解"}
    ],
    "max_tokens": 2048,
    "temperature": 0.7,
    "top_k": 1,
    "top_p": 0.75,
}

import requests
import json

# 本地服务的 API 端点
url = "http://127.0.0.1:6790/v1/chat/completions"

# 请求头
headers = {
    "Content-Type": "application/json",
    # "Authorization": "Bearer your_api_key"  # 如果需要的话
}

# 请求体
data = {
    "model": "/models/Qwen2___5-32B-Instruct-AWQ",
    "messages": [
        {"role": "user", "content": "分析当前全球经济形势，并提出你的见解"}
    ],
    "max_tokens": 2048,
    "temperature": 0.7,
    "top_k": 1,
    "top_p": 0.75,
}

# 发送 POST 请求
response = requests.post(url, headers=headers, data=json.dumps(data))

# 解析并打印回复内容
if response.status_code == 200:
    response_data = response.json()
    print(response_data['choices'][0]['message']['content'])
else:
    print(f"请求失败，状态码：{response.status_code}")
    print(response.text)

def llm_inference(prompt_list: list, model_name: str):
    # 根据模型名称选择不同的服务器配置
    if model_name == "qwen2.5_32b_awq":
        llm_server = {
            "server_url": "http://127.0.0.1:6790/v1/completions",
            "path": "/psd/models/Qwen2___5-32B-Instruct-AWQ"
        }

# -*- coding: utf-8 -*-
import requests
import json

def llm_inference(prompt_list: list, model_name: str):
    if model_name == "qwen2.5_32b_awq":
        llm_server = {
            "server_url": "http://127.0.0.1:6790/v1/completions",
            "path": "/models/Qwen2___5-32B-Instruct-AWQ"
        }
    elif model_name == "qwen2.5_7b_awq":
        llm_server = {
            "server_url": "http://127.0.0.1:6791/v1/completions",
            "path": "/models/Qwen2___5-7B-Instruct-AWQ"
        }
    else:
        llm_server = {
            "server_url": "http://127.0.0.1:6790/v1/completions",
            "path": "/models/Qwen2___5-32B-Instruct-AWQ"
        }

    rewrite_server_url = llm_server["server_url"]
    rewrite_server_headers = {'Content-Type': 'application/json'}
    rewrite_server_data = {
        'model': llm_server["path"],
        'prompt': prompt_list,
        'max_tokens': 4096,  # 生成长度
        'top_k': 1,
        'top_p': 0.75,
        'temperature': 0,
        'stop': ["<|im_end|>"]
    }

    response = requests.post(rewrite_server_url, headers=rewrite_server_headers, data=json.dumps(rewrite_server_data))
    return response.json()

if __name__ == "__main__":
    prompt_list = [
        f"<|im_start|>system\n{'你是围城智能机器人'}<|im_end|>\n<|im_start|>user\n{'你是谁'}<|im_end|><|im_start|>assistant\n"
    ]
    answer = llm_inference(prompt_list, "qwen2.5_32b_awq")
    for i in range(len(prompt_list)):
        print(answer['choices'][i]['text'])

client = OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)
response = client.chat.completions.create(
    model=model_name,
    messages=messages,
    temperature=0.0
)

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
""" 极简化的 API 请求测试脚本 只保留发送请求的核心功能 """
from openai import OpenAI

def send_test_request(client, model_name, test_message="im testing, response me latter 'test' only"):
    """ 发送测试请求
    Args:
        client: OpenAI 客户端
        model_name: 模型名称
        test_message: 测试消息
    Returns:
        str: 响应内容
    """
    # 构建消息列表
    messages = [{"role": "user", "content": "你叫什么名字！"}]
    response = client.chat.completions.create(
        model=model_name,
        messages=messages,
        temperature=0.0
    )
    print(f"Response: {response}")
    return response.choices[0].message.content

if __name__ == "__main__":
    # API 配置
    openai_api_key = "YOUR_API_KEY"
    openai_api_base = "https://www.api.com/v1"
    model_name = "gpt-4o"  # gemini-2.5-pro gpt-4o Claude 3.5 Sonnet o3-mini

    # 初始化客户端
    client = OpenAI(
        api_key=openai_api_key,
        base_url=openai_api_base,
    )
    test_message = "你好"

    # 发送测试请求
    try:
        response_content = send_test_request(client, model_name, test_message)
        print(f"Success! Response content: {response_content}")
    except Exception as e:
        print(f"Error: {e}")

openai.api_key = "YOUR_API_KEY"
openai.api_base = "https://www.api.com/v1"
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[{"role": "user", "content": "你叫什么名字！"}],
    max_tokens=512,
    temperature=0.7
)

import openai

# 设置 API 密钥（如果本地服务需要）
openai.api_key = "YOUR_API_KEY"

# 设置 API 基础 URL 为本地模型服务的地址
# openai.api_base = "http://127.0.0.1:6790/v1"
openai.api_base = "https://www.chataiapi.com/v1"

# 指定要使用的模型名称
# model_name = "/models/Qwen2___5-32B-Instruct-AWQ"
model_name = "gemini-2.5-pro"

# 创建聊天完成请求
response = openai.ChatCompletion.create(
    model=model_name,
    messages=[{"role": "user", "content": "你叫什么名字！"}],
    max_tokens=512,
    temperature=0.7
)

print("response:", response)
# 打印生成的回复内容
print(response['choices'][0]['message']['content'])

特性	llm_request.py	api_inference.py	llm_openai.py	llm_request_local.py
灵活性	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
易用性	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
可维护性	⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐
功能丰富度	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐
学习成本	⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐

Python 调用大模型（LLM）的四种方式

前言

1. 原生 HTTP 请求方式

1.1 核心特点

1.2 关键代码分析

1.3 优势和适用场景

1.4 完整代码

2. 封装式 API 调用

2.1 核心特点

2.2 关键代码分析

2.3 优势和适用场景

2.4 完整代码

3. OpenAI SDK 方式

3.1 核心特点

3.2 关键代码分析

3.3 优势和适用场景

3.4 完整代码

4. 传统 OpenAI 库方式

4.1 核心特点

4.2 关键代码分析

4.3 优势和适用场景

4.4 完整代码

5. 对比分析

总结

更多推荐文章

相关免费在线工具

Python 调用大模型（LLM）的四种方式

前言

1. 原生 HTTP 请求方式

1.1 核心特点

1.2 关键代码分析

1.3 优势和适用场景

1.4 完整代码

2. 封装式 API 调用

2.1 核心特点

2.2 关键代码分析

2.3 优势和适用场景

2.4 完整代码

3. OpenAI SDK 方式

3.1 核心特点

3.2 关键代码分析

3.3 优势和适用场景

3.4 完整代码

4. 传统 OpenAI 库方式

4.1 核心特点

4.2 关键代码分析

4.3 优势和适用场景

4.4 完整代码

5. 对比分析

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具