Buzz语音转文字离线免费版安装使用（含Whisper最新模型）

优质文章学习记录

07 Apr 2026 — 2 min read

简介：

Buzz1.2.0（2024年12月24日更新的，是2025年7月最新版本）

Buzz有python编写的，在您的个人计算机上离线转录和翻译音频。由 OpenAI 的 Whisper 提供支持。

应用场景：

歌曲提取歌词，音频/视频提取文字

软件下载（windows为例）：

github下载地址：

Release v1.2.0 · chidiwilliams/buzzhttps://github.com/chidiwilliams/buzz/releases/tag/v1.2.0

文章最后有百度云盘离线下载地址（含模型）

软件安装：

exe文件直接安装即可

软件使用：

当前支持的模型：

如果没有【查看文件位置】

C:\Users\用户\AppData\Local\Buzz\Buzz\Cache\models\whisper

放置到该位置即可

真实使用反馈：

cpu为i5-12400，没有显卡

解析25-30分钟的语音，

使用最小模型，错别字比较多，需要费心的重新编译

使用Small及以上，识别情况就很优秀了，具体还是要看电脑配置和使用场景了。

Buzz1.2.0+模型下载

百度网盘链接：百度网盘请输入提取码buzz百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固，支持教育网加速，支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com/s/1WCZfCbnw9BQiV-pao8t32Q?pwd=buzz

Read more

全开源，自主可控！这款 AI + 无人机一体化平台，多行业刚需场景直接拉满！

全开源，自主可控！这款 AI + 无人机一体化平台，多行业刚需场景直接拉满！

项目地址： https://gitee.com/haishi-tech 引言低空经济产业化加速推进，无人机行业应用却常被设备管控难、作业效率低、数据碎片化三大痛点卡脖子。专为专业场景打造的亥时无人机系统，以 “智能管理 + AI 监测 + 精准控制” 全流程闭环解决方案，打破行业应用壁垒，成为电力、安防、测绘等专业用户的共同选择！核心优势：全面开源，成熟可控系统简介 1. 一体化架构，告别零散适配烦恼亥时无人机系统深度集成设备管理、飞行控制、AI 监测与巡检业务四大核心模块，构建 “端 - 边 - 云” 全链路技术支撑。无需额外开发适配，从设备接入、飞行操控到数据分析、报告生成实现无缝衔接，彻底解决传统方案多系统割裂、数据不通的痛点，让作业流程更顺畅。 1. 2. AI 监测中台，让智能贯穿全流程

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Transformer LM Architecture Implement

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Transformer LM Architecture Implement

目录 * 前言 * 1. Problem (linear): Implementing the linear module (1 point) * 2. Problem (embedding): Implement the embedding module (1 point) * 3. Problem (rmsnorm): Root Mean Square Layer Normalization (1 point) * 4. Problem (positionwise_feedforward): Implement the position-wise feed-forward network (2 points) * 5. Problem (rope): Implement RoPE (2 points) * 6. Problem

SenseVoice Small多场景落地：博物馆导览语音→多语种AR字幕实时生成

SenseVoice Small多场景落地：博物馆导览语音→多语种AR字幕实时生成你有没有在博物馆里，一边盯着珍贵文物，一边手忙脚乱翻手机查讲解词？或者站在异国展馆前，听不懂导览员的外语解说，只能靠猜？更别提那些中英混杂、带方言口音的现场录音——传统语音转写工具要么卡住不动，要么识别错得离谱。今天要聊的，不是又一个“理论上能用”的AI模型，而是一个真正跑在本地、开箱即用、专为真实场景打磨过的语音转文字服务。它不靠云端API，不依赖稳定网络，不挑音频格式，甚至能在没有外网的展厅设备上安静运行。它的名字叫SenseVoice Small——但这次，我们把它从实验室搬进了博物馆的玻璃柜之间。 1. 为什么是SenseVoice Small？轻量不等于将就很多人一听“Small”，下意识觉得是阉割版、凑数款。但SenseVoice Small恰恰相反：它是阿里通义千问团队针对边缘部署和实时交互场景，专门精简优化的语音识别模型。参数量仅约2亿，却在保持95%以上主流语种识别准确率的同时，把单次推理耗时压到300毫秒以内（RTF < 0.15）。关键不在“

华为OD机试双机位C卷-机器人活动区域(Py/Java/C/C++/Js/Go)

华为OD机试双机位C卷-机器人活动区域(Py/Java/C/C++/Js/Go)

机器人活动区域 2026华为OD机试双机位C卷 - 华为OD上机考试双机位C卷 100分题型华为OD机试双机位C卷真题目录点击查看: 华为OD机试双机位C卷真题题库目录｜机考题库 + 算法考点详解题目描述现有一个[机器人]，可放置于 M × N 的网格中任意位置，每个网格包含一个非负整数编号，当相邻网格的数字编号差值的绝对值小于等于 1 时，机器人可以在网格间移动。问题：求机器人可活动的最大范围对应的网格点数目。说明：网格左上角坐标为 (0,0) ,右下角坐标为(m−1,n−1)，机器人只能在相邻网格间上下左右移动输入描述第 1 行输入为 M 和 N * M 表示网格的行数 * N 表示网格的列数之后 M 行表示网格数值，每行 N 个数值（