指定路径下载 Whisper 模型:从 base 到 large-v3 的代码实现与链接

Whisper 模型下载指南

Whisper 是 OpenAI 开源的语音识别模型,支持多语言转录。以下是使用 Hugging Face Hub 下载从 base 到 large-v3 所有版本的完整实现方案:

安装依赖
pip install transformers huggingface_hub 

Python 下载代码
from huggingface_hub import snapshot_download # 模型版本列表 model_versions = [ "openai/whisper-base", "openai/whisper-small", "openai/whisper-medium", "openai/whisper-large", "openai/whisper-large-v2", "openai/whisper-large-v3" ] # 指定本地存储路径 download_path = "./whisper_models" for model_id in model_versions: # 创建版本子目录 version_dir = f"{download_path}/{model_id.split('/')[-1]}" # 下载模型文件 snapshot_download( repo_id=model_id, local_dir=version_dir, local_dir_use_symlinks=False, resume_download=True ) print(f"✅ {model_id} 下载完成") 

关键参数说明
  1. local_dir:自定义存储路径
  2. resume_download=True:支持断点续传

文件结构示例:

whisper_models/ ├── whisper-base ├── whisper-small ├── whisper-medium ├── whisper-large ├── whisper-large-v2 └── whisper-large-v3 
模型规格对比
版本参数量磁盘占用适用场景
base74M~150MB移动端部署
small244M~500MB实时转录
medium769M~1.5GB通用场景
large1550M~3GB高精度转录
large-v21550M~3GB多语言优化
large-v31550M~3GB最新版本
官方模型链接
  • 所有 Whisper 模型主页
  • 直接下载地址:
    • Base: https://huggingface.co/openai/whisper-base
    • Small: https://huggingface.co/openai/whisper-small
    • Medium: https://huggingface.co/openai/whisper-medium
    • Large: https://huggingface.co/openai/whisper-large
    • Large-v2: https://huggingface.co/openai/whisper-large-v2
    • Large-v3: https://huggingface.co/openai/whisper-large-v3
注意:完整下载需约 10GB 磁盘空间使用 VPN 可加速下载首次运行会自动创建目录结构支持增量下载,重复执行只下载缺失文件

Read more

除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了

除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了

🔥 个人主页:杨利杰YJlio❄️ 个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》《Python》《Kali Linux》《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更简单,让重复的工作自动化 除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了 * 除了 OpenClaw,今天 AI 热榜还有什么值得看?我把 5 个重点方向讲清楚了 * 1. 我先说结论:今天这波 AI 热榜,最重要的不是“谁最火”,而是“风向变了” * 2. GoogleCloudPlatform / generative-ai:平台生态正在成为真正的护城河 * 3. MiroFish:群体智能和多智能体,开始从概念走向更具体的产品叙事

By Ne0inhk
Python+AI 实战:搭建属于你的智能问答机器人

Python+AI 实战:搭建属于你的智能问答机器人

欢迎文末添加好友交流,共同进步! “ 俺はモンキー・D・ルフィ。海贼王になる男だ!” 引言 * 在数字化转型浪潮中,智能问答机器人正成为企业客服、知识库检索乃至个人助理等场景的关键交互入口。它能让员工秒级获取技术解答、客户即时获得业务支持、学习者随时得到个性化辅导,极大提升信息获取效率与用户体验。 * 为何选择 Python 与开源 AI 模型?Python 拥有成熟的 AI 生态——Hugging Face Transformers、LangChain、FAISS 等工具大幅降低开发门槛;而本地部署的开源大模型(如 Phi-3、Mistral、Llama 系列)则保障了数据隐私、规避了 API 成本,特别适合对安全性或离线能力有要求的场景。 * 本文将手把手带你从零构建一个基于 RAG(检索增强生成)架构的本地智能问答系统:使用 Sentence-BERT 实现语义检索,FAISS 作为向量数据库,并集成轻量级开源语言模型生成答案。

By Ne0inhk
人工智能:自然语言处理在医疗领域的应用与实战

人工智能:自然语言处理在医疗领域的应用与实战

人工智能:自然语言处理在医疗领域的应用与实战 学习目标 💡 理解自然语言处理(NLP)在医疗领域的应用场景和重要性 💡 掌握医疗领域NLP应用的核心技术(如电子病历分析、疾病诊断辅助、药物相互作用检测) 💡 学会使用前沿模型(如BioBERT、ClinicalBERT)进行医疗文本分析 💡 理解医疗领域的特殊挑战(如医疗术语、数据隐私、法规要求) 💡 通过实战项目,开发一个电子病历文本分类应用 重点内容 * 医疗领域NLP应用的主要场景 * 核心技术(电子病历分析、疾病诊断辅助、药物相互作用检测) * 前沿模型(BioBERT、ClinicalBERT)在医疗领域的使用 * 医疗领域的特殊挑战 * 实战项目:电子病历文本分类应用开发 一、医疗领域NLP应用的主要场景 1.1 电子病历分析 1.1.1 电子病历分析的基本概念 电子病历(Electronic Health Records, EHR)是医疗领域的核心数据之一,包含了患者的基本信息、诊断记录、

By Ne0inhk