Buzz语音转文字离线免费版安装使用(含Whisper最新模型)

Buzz语音转文字离线免费版安装使用(含Whisper最新模型)

简介:

Buzz1.2.0(2024年12月24日更新的,是2025年7月最新版本)

Buzz有python编写的, 在您的个人计算机上离线转录和翻译音频。由 OpenAI 的 Whisper 提供支持。

应用场景:

歌曲提取歌词,音频/视频提取文字

软件下载(windows为例):

github下载地址:

Release v1.2.0 · chidiwilliams/buzzhttps://github.com/chidiwilliams/buzz/releases/tag/v1.2.0

文章最后有百度云盘离线下载地址(含模型)

软件安装:

exe文件直接安装即可

软件使用:

当前支持的模型:

如果没有【查看文件位置】

C:\Users\用户\AppData\Local\Buzz\Buzz\Cache\models\whisper

放置到该位置即可

真实使用反馈:

cpu为i5-12400,没有显卡

解析25-30分钟的语音,

使用最小模型,错别字比较多,需要费心的重新编译

使用Small及以上,识别情况就很优秀了,具体还是要看电脑配置和使用场景了。

Buzz1.2.0+模型下载

百度网盘链接:百度网盘 请输入提取码buzz百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com/s/1WCZfCbnw9BQiV-pao8t32Q?pwd=buzz

Read more

全开源,自主可控!这款 AI + 无人机一体化平台,多行业刚需场景直接拉满!

全开源,自主可控!这款 AI + 无人机一体化平台,多行业刚需场景直接拉满!

项目地址: https://gitee.com/haishi-tech 引言 低空经济产业化加速推进,无人机行业应用却常被设备管控难、作业效率低、数据碎片化三大痛点卡脖子。专为专业场景打造的亥时无人机系统,以 “智能管理 + AI 监测 + 精准控制” 全流程闭环解决方案,打破行业应用壁垒,成为电力、安防、测绘等专业用户的共同选择! 核心优势:全面开源,成熟可控 系统简介 1. 一体化架构,告别零散适配烦恼亥时无人机系统深度集成设备管理、飞行控制、AI 监测与巡检业务四大核心模块,构建 “端 - 边 - 云” 全链路技术支撑。无需额外开发适配,从设备接入、飞行操控到数据分析、报告生成实现无缝衔接,彻底解决传统方案多系统割裂、数据不通的痛点,让作业流程更顺畅。 1. 2. AI 监测中台,让智能贯穿全流程

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Transformer LM Architecture Implement

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Transformer LM Architecture Implement

目录 * 前言 * 1. Problem (linear): Implementing the linear module (1 point) * 2. Problem (embedding): Implement the embedding module (1 point) * 3. Problem (rmsnorm): Root Mean Square Layer Normalization (1 point) * 4. Problem (positionwise_feedforward): Implement the position-wise feed-forward network (2 points) * 5. Problem (rope): Implement RoPE (2 points) * 6. Problem

SenseVoice Small多场景落地:博物馆导览语音→多语种AR字幕实时生成

SenseVoice Small多场景落地:博物馆导览语音→多语种AR字幕实时生成 你有没有在博物馆里,一边盯着珍贵文物,一边手忙脚乱翻手机查讲解词?或者站在异国展馆前,听不懂导览员的外语解说,只能靠猜?更别提那些中英混杂、带方言口音的现场录音——传统语音转写工具要么卡住不动,要么识别错得离谱。 今天要聊的,不是又一个“理论上能用”的AI模型,而是一个真正跑在本地、开箱即用、专为真实场景打磨过的语音转文字服务。它不靠云端API,不依赖稳定网络,不挑音频格式,甚至能在没有外网的展厅设备上安静运行。它的名字叫SenseVoice Small——但这次,我们把它从实验室搬进了博物馆的玻璃柜之间。 1. 为什么是SenseVoice Small?轻量不等于将就 很多人一听“Small”,下意识觉得是阉割版、凑数款。但SenseVoice Small恰恰相反:它是阿里通义千问团队针对边缘部署和实时交互场景,专门精简优化的语音识别模型。参数量仅约2亿,却在保持95%以上主流语种识别准确率的同时,把单次推理耗时压到300毫秒以内(RTF < 0.15)。 关键不在“

华为OD机试双机位C卷-机器人活动区域(Py/Java/C/C++/Js/Go)

华为OD机试双机位C卷-机器人活动区域(Py/Java/C/C++/Js/Go)

机器人活动区域 2026华为OD机试双机位C卷 - 华为OD上机考试双机位C卷 100分题型 华为OD机试双机位C卷真题目录点击查看: 华为OD机试双机位C卷真题题库目录|机考题库 + 算法考点详解 题目描述 现有一个[机器人],可放置于 M × N 的网格中任意位置,每个网格包含一个非负整数编号,当相邻网格的数字编号差值的绝对值小于等于 1 时,机器人可以在网格间移动。 问题: 求机器人可活动的最大范围对应的网格点数目。 说明:网格左上角坐标为 (0,0) ,右下角坐标为(m−1,n−1),机器人只能在相邻网格间上下左右移动 输入描述 第 1 行输入为 M 和 N * M 表示网格的行数 * N 表示网格的列数 之后 M 行表示网格数值,每行 N 个数值(