一个使用 OpenAI Python SDK 进行 API 调用的示例脚本

Ne0inhk

23 Mar 2026 — 12 min read

一、程序文件概述与核心功能

一个典型的、结构清晰的客户端应用程序，其主要功能是与一个部署在特定基础URL上的大型语言模型（本例中为 "QwQ-32B"）进行交互。程序的核心任务是向模型发送一个预设的自然语言查询（"请列举近三年提出的漏洞检测技术的文献"），并完整地接收、计时并处理模型返回的文本响应。同时，它具备完善的异常处理机制，能够优雅地应对网络超时、API服务端错误以及其他未知问题。

从软件架构的角度看，该脚本扮演了客户端的角色，它通过 HTTP 协议与远端的 API 服务器 通信。其工作流程遵循典型的请求-响应模式：构建请求 -> 发送请求 -> 等待并接收响应 -> 解析响应 -> 输出结果/处理错误。

二、代码结构与逐行解析

1. 模块导入 (`import`)

import openai import time

openai: 这是 OpenAI 官方提供的 Python 客户端库。它封装了与 OpenAI API 交互的底层细节，如 HTTP 请求的构建、认证头的添加、响应数据的解析等，为开发者提供了高级、易用的抽象接口。使用这个库，开发者无需直接处理原始的 HTTP 请求和 JSON 数据。
time: Python 的标准库模块，用于处理时间相关的操作。在本脚本中，其 time()函数被用来获取当前时间戳，从而计算 API 调用的总耗时，这是一种简单的性能监控手段。

2. 客户端初始化 (`client = openai.OpenAI(...)`)

client = openai.OpenAI( base_url="Your_url", api_key="Your_api_key" )

这行代码是程序的基础，创建了一个 API 客户端实例。openai.OpenAI是一个类，实例化时需要两个关键参数：

base_url: 指定 API 服务端的基础地址。这里的 "Your_url" 是一个占位符，表明该程序并非连接至 OpenAI 的官方端点，而是连接到一个自定义部署或第三方兼容API的服务。这常见于以下场景：
1. 使用云服务商（如 Azure OpenAI Service）的终端节点。
2. 连接部署在公司内部或本地服务器的模型服务。
3. 使用其他提供了 OpenAI API 兼容接口的开源模型服务（如 vLLM、Ollama 等）。
api_key: 用于身份验证的 API 密钥。类似于一把钥匙，服务器通过此密钥来验证客户端的身份，并据此进行计费和访问控制。"Your_api_key" 是需要替换为真实密钥的占位符。

这个 client对象是后续所有 API 调用的入口点，它内部管理着会话、认证和连接池等信息。

3. 核心 API 调用与异常处理 (`try-except`块)

这是脚本最核心的部分，它使用了一个 try-except结构来执行可能失败的操作。

A. 计时开始 (start_time = time.time())

在发起请求前，记录当前时间（自纪元开始的秒数，浮点数），标志着计时的开始。

B. 发起聊天补全请求 (completion = client.chat.completions.create(...))

这是最关键的调用，它向服务器发送请求并等待响应。client.chat.completions.create方法接收多个参数来配置此次请求：

model="QwQ-32B":
- 功能：指定要调用的语言模型。模型名称 "QwQ-32B" 暗示这可能是一个参数量为 320 亿（32 Billion）的特定模型。与 base_url结合来看，这明确指出了请求的目标是部署在自定义端点上的 "QwQ-32B" 模型。
- 重要性：不同的模型在能力、性能、成本和支持的参数上可能有显著差异。此参数直接决定了服务器将加载和使用哪个模型来处理请求。
messages=[...]:
- 功能：定义对话的历史和当前用户的输入。这是一个由字典（dict）组成的列表（list），每个字典代表一条消息。
- 数据结构：每条消息字典包含两个键：
  1. "role": 表示发言者身份。常见角色有：
    - "system": 用于在对话开始时设定模型的背景、行为或指令（本例未使用）。
    - "user": 代表最终用户的问题或指令。本例中使用了此角色。
    - "assistant": 代表模型之前的回复。在多轮对话中，需要将之前的问答历史按顺序放入此列表。
  2. "content": 消息的实际文本内容。
- 本例分析：消息列表只包含一条用户消息，内容为 "请列举近三年提出的漏洞检测技术的文献"。这是一个典型的单轮问答场景。
timeout=300:
- 功能：设置整个请求的超时时间，单位为秒。这里设置为 300 秒（5 分钟）。
- 工作机制：这个超时是客户端超时。它意味着从客户端发出请求开始，如果在 300 秒内没有从服务器收到完整的响应，客户端库会主动中断等待并抛出一个 openai.APITimeoutError异常。
- 适用场景：较长的超时时间适用于以下情况：
  1. 模型是首次被调用，服务器需要时间从冷启动加载模型（"冷启动"）。
  2. 查询非常复杂，模型需要较长的推理和生成时间。
  3. 网络延迟较高，或者服务器负载较重。
  4. 请求或响应的数据量很大。

C. 计时结束与结果输出 (end_time = time.time(), print)

请求成功完成后，记录结束时间，并计算差值，得到此次 API 调用的总耗时。随后，打印出耗时和模型返回的文本内容。

completion.choices[0].message.content:
- completion: 是 create方法返回的响应对象，是一个 ChatCompletion类型的对象。
- choices: 是响应中的一个列表，通常包含一个或多个生成结果。即使请求中未指定 n参数（要求生成多个结果），它也是一个列表。choices[0]获取第一个（也是默认唯一一个）生成结果。
- message: 是 choices[0]中的一个属性，代表模型生成的消息对象，其结构与请求中的 messages列表中的消息字典类似。
- content: 最终提取出模型生成的文本字符串。

D. 异常处理 (except)

脚本定义了三种异常捕获分支，体现了良好的鲁棒性编程实践：

openai.APITimeoutError:
- 触发条件：请求超过 timeout=300设置的时间仍未完成。
- 处理：打印友好的超时提示信息，帮助用户判断问题可能出在模型加载慢或网络连接上，而非代码逻辑错误。
openai.APIError as e:
- 触发条件：服务器返回了一个 HTTP 错误状态码（如 401 认证失败、429 请求过频、500 服务器内部错误等）。
- 处理：使用 f-string格式化字符串打印出具体的错误信息 e，这对于调试非常有用，可以快速定位是 API 密钥错误、额度不足还是服务端故障。
Exception as e:
- 触发条件：捕获所有其他未被前两个 except块处理的异常。这是一个兜底方案。
- 处理：打印出异常的类型 (type(e)) 和具体信息 (str(e))，有助于发现一些意想不到的问题，如本地环境配置错误、库版本冲突等。

三、算法与工作流程分析

该脚本本身不包含复杂的机器学习或数学算法，其核心是网络 I/O 操作和事件循环的协调。其算法可以描述为以下顺序逻辑：

初始化阶段：导入依赖库，配置客户端参数。时间复杂度 O(1)。
请求构建阶段：在 client.chat.completions.create方法内部，库会将传入的 Python 参数（model, messages等）序列化为符合 OpenAI API 标准的 JSON 格式的 HTTP 请求体。并添加必要的 HTTP 头（如 Authorization: Bearer Your_api_key, Content-Type: application/json）。
网络传输与等待阶段（核心）：客户端通过底层的 HTTP 客户端（如 requests或 httpx）将请求发送到 base_url。此后，程序进入阻塞等待状态，CPU 时间片会让给其他进程。脚本的性能几乎完全取决于网络延迟和服务器端的处理速度。这是整个流程中耗时最长的部分。
响应处理阶段：收到 HTTP 响应后，客户端库会解析状态码和响应体。如果成功（HTTP 200），则将 JSON 数据反序列化为 ChatCompletion对象，方便以面向对象的方式访问数据。如果失败，则抛出相应的异常。
结果提取与展示阶段：从响应对象中沿着 completion -> choices[0] -> message -> content的路径提取出最终的文本。
异常处理流程：如果在第 3 或第 4 阶段发生错误，程序流程会立即跳转到对应的 except块，执行错误处理逻辑，而不会继续执行 try块中后续的代码（如打印结果）。

四、数据结构深度剖析

脚本中涉及的数据结构主要分为两类：Python 原生数据结构和 OpenAI 客户端库提供的对象模型。

1. Python 原生数据结构：

list(列表): 用于存储 messages。这是一个有序的可变集合。
dict(字典): 用于表示单条 message。键值对结构，键是字符串（"role", "content"），值是字符串或任何可序列化的类型。
float(浮点数): time.time()返回的结果，用于表示时间戳。
str(字符串): 用于所有文本内容，如 base_url, api_key, model, message的内容等。

2. OpenAI 库对象模型（高层次抽象）：

openai.OpenAI: 客户端类，封装了配置和连接信息。
ChatCompletion: 响应对象类。其重要属性包括：
- id: 本次请求的唯一标识符。
- created: 请求创建的时间戳（通常由服务器返回）。
- model: 实际用于处理请求的模型名称（可能与请求的模型名略有不同）。
- usage: 一个对象，包含 prompt_tokens（提示消耗的 token 数），completion_tokens（生成消耗的 token 数），total_tokens（总 token 数），用于计费和监控。
- choices: 一个列表，其元素为 ChatCompletionChoice对象。
ChatCompletionChoice: 代表一个生成选项。其重要属性包括：
- index: 选项的索引。
- message: 一个 ChatCompletionMessage对象。
- finish_reason: 生成结束的原因（如 "stop"遇到停止符，"length"达到生成长度限制）。
ChatCompletionMessage: 代表一条消息。其属性与请求中的消息字典对应：
- role: 发言者（如 "assistant"）。
- content: 消息文本。

这种对象模型的封装极大地简化了开发，开发者无需手动解析复杂的 JSON 结构。

五、程序的设计优点与潜在改进点

设计优点：

清晰简洁：代码逻辑直接，易于理解和维护。
鲁棒性强：完备的异常处理使其能够应对各种边缘情况，避免程序因网络或服务端问题而崩溃。
可观测性：通过计时功能，可以直观地了解每次 API 调用的性能，对于监控和优化很有帮助。
灵活性基础：当前结构很容易扩展，例如添加循环进行多轮对话、从文件或命令行读取提示词、将结果保存到数据库等。

潜在改进点：

增加重试逻辑：对于瞬态错误（如网络抖动、服务器临时过载），可以增加自动重试机制。OpenAI 库本身或使用 tenacity等重试库可以轻松实现。
结果结构化处理：如果期望模型的返回是 JSON 等结构化数据，可以在请求中设置 response_format参数（如果模型支持），并编写代码来验证和解析。
日志记录：使用 Python 的 logging模块替代 print语句，可以更专业地记录信息、警告和错误，并支持输出到文件、控制台等不同目标。
异步支持：对于需要高并发或非阻塞 I/O 的应用程序，可以考虑使用 openai.AsyncOpenAI客户端和 async/await语法，以提高程序的整体吞吐量。

配置外部化：将 base_url和 api_key等敏感信息硬编码在代码中是不安全且不灵活的。最佳实践是使用环境变量或配置文件来管理它们。

import os client = openai.OpenAI( base_url=os.getenv("OPENAI_BASE_URL"), api_key=os.getenv("OPENAI_API_KEY") )

六、总结

总而言之，一个功能完整、实现规范的 AI 模型调用客户端示例。它成功地演示了如何利用 OpenAI Python SDK 的核心功能：包括客户端的配置、聊天补全 API 的调用、请求超时的控制、响应数据的提取以及多种异常情况的处理。虽然代码量不大，但它涵盖了生产环境应用所需的关键要素。通过对其代码结构、数据流、算法逻辑和设计模式的深入分析，我们可以将其视为一个可靠的模板，在此基础上进行定制和扩展，以构建更复杂、更健壮的 AI 应用集成方案。

源代码

import openai import time client = openai.OpenAI( base_url="Your_url", api_key="Your_api_key" ) try: start_time = time.time() completion = client.chat.completions.create( model="QwQ-32B", messages=[ {"role": "user", "content": "请列举近三年提出的漏洞检测技术的文献"} ], timeout=300 ) end_time = time.time() print("响应时间:", end_time - start_time, "秒") print("返回结果:", completion.choices[0].message.content) except openai.APITimeoutError: print("请求超时（30秒），可能是模型加载慢或网络问题") except openai.APIError as e: print(f"API 错误: {e}") except Exception as e: print(f"未知错误: {type(e)} - {str(e)}")

一个使用 OpenAI Python SDK 进行 API 调用的示例脚本

Ne0inhk

一、程序文件概述与核心功能

二、代码结构与逐行解析

1. 模块导入 (`import`)

2. 客户端初始化 (`client = openai.OpenAI(...)`)

3. 核心 API 调用与异常处理 (`try-except`块)

三、算法与工作流程分析

四、数据结构深度剖析

五、程序的设计优点与潜在改进点

六、总结

源代码

Read more

Whisper-large-v3内容创作工具：短视频配音自动识别+多语字幕同步

一篇了解Copilot pro使用的笔记

win10升级后总会弹出365 Copilot窗口如何禁用和关闭

会议记录自动化实战：用Whisper镜像快速生成多语言转录

一、 程序文件概述与核心功能

二、 代码结构与逐行解析

1. 模块导入 (import)

2. 客户端初始化 (client = openai.OpenAI(...))

3. 核心 API 调用与异常处理 (try-except块)

三、 算法与工作流程分析

四、 数据结构深度剖析

五、 程序的设计优点与潜在改进点

六、 总结

源代码

Read more

Whisper-large-v3内容创作工具：短视频配音自动识别+多语字幕同步

一篇了解Copilot pro使用的笔记

win10升级后总会弹出365 Copilot窗口如何禁用和关闭

会议记录自动化实战：用Whisper镜像快速生成多语言转录

一、程序文件概述与核心功能

二、代码结构与逐行解析

1. 模块导入 (`import`)

2. 客户端初始化 (`client = openai.OpenAI(...)`)

3. 核心 API 调用与异常处理 (`try-except`块)

三、算法与工作流程分析

四、数据结构深度剖析

五、程序的设计优点与潜在改进点

六、总结