Python 调用大模型 API 接口开发指南

Python 调用大模型 API 接口开发指南 | 极客日志

import os
print(os.environ.get("OPENAI_API_KEY")) # 应输出你的密钥

# 基础：请求库
pip install requests httpx

# 主流 SDK（推荐）
pip install openai anthropic groq huggingface-hub litellm

# 可选：异步/流式（高性能）
pip install aiohttp asyncio

# 集成框架（高级）
pip install langchain streamlit

提供商	核心模型示例	优势	定价（输入/输出 per 1K tokens）	Python SDK	免费额度
OpenAI	GPT-4o, GPT-4o-mini	多模态（文本 + 图像 + 音频），工具调用强	$2.5/$10 (GPT-4o)	openai	$5 试用
Anthropic	Claude 3.5 Sonnet	大上下文（200K+ tokens），安全	$3/$15	anthropic	免费试用限速
Groq	Llama 3.1 70B, Mixtral	超快推理（LPU 硬件），开源模型	$0.24/$0.24 (Mixtral)	groq	免费 API 限额
Hugging Face	Llama 3, Mistral	开源模型免费推理，自定义	免费/付费（Inference API）	huggingface-hub	无限免费（限速）
Google Gemini	Gemini 1.5 Pro	多模态 + 搜索集成	$0.5/$1.5	google-generativeai	免费试用
Mistral AI	Mistral Large 2	高效多语言	$2/$6	mistralai	免费社区模型
Cohere	Aya 23B	企业级自定义	$0.5/$1	cohere	免费试用
ElevenLabs	Voice AI (非纯文本)	语音合成	$0.18/min	elevenlabs	免费 10K chars

import os
from openai import OpenAI
client = OpenAI(api_key=os.environ["OPENAI_API_KEY"])
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role":"user","content":"解释量子计算，简短点。"}]
)
print(response.choices[0].message.content)

import os
from anthropic import Anthropic
client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
response = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=100,
    messages=[{"role":"user","content":"写一首关于 AI 的短诗。"}]
)
print(response.content[0].text)

import os
from groq import Groq
client = Groq(api_key=os.environ["GROQ_API_KEY"])
response = client.chat.completions.create(
    model="llama3-70b-8192",
    messages=[{"role":"user","content":"Python 如何处理异常？"}]
)
print(response.choices[0].message.content)

import os
from huggingface_hub import InferenceClient
client = InferenceClient(token=os.environ["HF_TOKEN"])
response = client.text_generation(
    "meta-llama/Llama-3.2-3B-Instruct",
    "描述 Hugging Face 的作用。",
    max_tokens=50
)
print(response)

stream = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role":"user","content":"讲个笑话。"}],
    stream=True
)
for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

import asyncio
from openai import AsyncOpenAI

async_client = AsyncOpenAI(api_key=os.environ["OPENAI_API_KEY"])

async def async_call(prompt):
    response = await async_client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role":"user","content": prompt}]
    )
    return response.choices[0].message.content

async def main():
    tasks = [async_call("提示 1"), async_call("提示 2")]
    results = await asyncio.gather(*tasks)
    print(results)

asyncio.run(main())

# OpenAI 工具示例
tools = [{"type":"function","function":{"name":"add_numbers","description":"加两个数","parameters":{"type":"object","properties":{"a":{"type":"number"},"b":{"type":"number"}},"required":["a","b"]}}}}]
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role":"user","content":"3+5=?"}],
    tools=tools
)
# 如果调用工具，执行函数
if response.choices[0].message.tool_calls:
    tool_call = response.choices[0].message.tool_calls[0]
    if tool_call.function.name == "add_numbers":
        args = json.loads(tool_call.function.arguments)
        result = args["a"] + args["b"]
        print(result)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role":"user","content":[{"type":"text","text":"描述这张图。"},{"type":"image_url","image_url":{"url":"https://example.com/image.jpg"}}]}])
print(response.choices[0].message.content)

from litellm import completion
import os
os.environ["OPENAI_API_KEY"]="..."
os.environ["ANTHROPIC_API_KEY"]="..."

# 调用 OpenAI
response = completion(model="gpt-4o-mini", messages=[{"role":"user","content":"Hi!"}])

# 切换到 Claude
response = completion(model="claude-3-5-sonnet-20241022", messages=[{"role":"user","content":"Hi!"}])
print(response.choices[0].message.content)

from langchain_groq import ChatGroq
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

llm = ChatGroq(model="llama3-70b-8192", api_key=os.environ["GROQ_API_KEY"])
prompt = PromptTemplate(input_variables=["topic"], template="解释 {topic}。")
chain = LLMChain(llm=llm, prompt=prompt)
print(chain.run("区块链"))

优化点	做法示例	收益参考
限速处理	用 time.sleep() 或 retry 库	避免封禁
成本控制	计算 tokens（tiktoken 库），用 LiteLLM 跟踪	节省 20-50%
错误重试	pip install tenacity；@retry 装饰器	鲁棒性 ↑
监控/日志	用 Langfuse 集成（e.g., Groq）。	追踪使用
安全	环境变量存密钥；输入过滤防注入	—
批量处理	batch API（OpenAI 支持）	5-10x 快

import streamlit as st
from groq import Groq
import os

client = Groq(api_key=os.environ["GROQ_API_KEY"])
st.title("Groq 聊天机器人")

if "messages" not in st.session_state:
    st.session_state.messages = []

for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

prompt = st.chat_input("说点什么？")
if prompt:
    st.session_state.messages.append({"role":"user","content": prompt})
    with st.chat_message("user"):
        st.markdown(prompt)
    with st.chat_message("assistant"):
        stream = client.chat.completions.create(
            model="mixtral-8x7b-32768",
            messages=[{"role": m["role"],"content": m["content"]} for m in st.session_state.messages],
            stream=True
        )
        response = st.write_stream([chunk.choices[0].delta.content or "" for chunk in stream])
        st.session_state.messages.append({"role":"assistant","content":"".join(response)})

阶段	重点	资源
入门	基本调用、流式	OpenAI/Groq 官方 docs；本教程
中级	工具/多模态、LangChain	LangChain 教程；Hugging Face 课程
高级	微调/代理、RAG	'From Zero to LLM Hero' 指南； LiteLLM GitHub
专家	网关/观测、自定义模型	Helicone/BricksLLM； PyTorch 集成

Python 调用大模型 API 接口开发指南

Python 调用大模型 API 接口开发指南

0. 环境准备

1. 主流大模型 API 提供商速览

2. 基本调用

2.1 OpenAI 示例

2.2 Anthropic (Claude) 示例

2.3 Groq 示例

2.4 Hugging Face Inference API 示例

3. 高级技巧

3.1 流式响应（Streaming）

3.2 异步调用（Async，高并发）

3.3 工具调用（Function Calling）

3.4 多模态（图像/音频）

4. 统一多提供商：LiteLLM SDK

5. 集成框架：LangChain（链式/代理开发）

6. 性能优化与最佳实践

7. 完整项目实战：Streamlit 聊天机器人

8. 进阶学习路线

更多推荐文章

相关免费在线工具

Python 调用大模型 API 接口开发指南

Python 调用大模型 API 接口开发指南

0. 环境准备

1. 主流大模型 API 提供商速览

2. 基本调用

2.1 OpenAI 示例

2.2 Anthropic (Claude) 示例

2.3 Groq 示例

2.4 Hugging Face Inference API 示例

3. 高级技巧

3.1 流式响应（Streaming）

3.2 异步调用（Async，高并发）

3.3 工具调用（Function Calling）

3.4 多模态（图像/音频）

4. 统一多提供商：LiteLLM SDK

5. 集成框架：LangChain（链式/代理开发）

6. 性能优化与最佳实践

7. 完整项目实战：Streamlit 聊天机器人

8. 进阶学习路线

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具