Dify 工作流集成 TTS：低代码实现语音输出

Dify 工作流集成 TTS：低代码实现语音输出 | 极客日志

+---------------------+
|  用户浏览器         |
|  (WebUI 界面操作)    |
+----------+----------+
           v
+---------------------+
| Flask HTTP Server   |
| - 提供网页交互入口  |
| - 接收 POST /tts 请求|
+----------+----------+
           v
+---------------------+
| Sambert-Hifigan 模型|
| - 文本转频谱        |
| - 频谱转波形        |
+----------+----------+
           v
+---------------------+
| 输出.wav 音频文件     |
| 或 Base64 编码数据返回|
+---------------------+

ImportError: numpy.ndarray size changed, may indicate binary incompatibility
ValueError: scipy 1.13+ is not supported

docker run -d -p 5000:5000 --name tts-service \
  your-tts-image:sambert-hifigan-chinese

属性	值
方法	`POST`
地址	`http://localhost:5000/tts`
Content-Type	`application/json`

{
  "text": "今天天气真好，适合出去散步。",
  "emotion": "happy",
  "speed": 1.0
}

参数	类型	是否必填	说明
`text`	string	是	待合成的中文文本，建议不超过 500 字
`emotion`	string	否	情感类型：`neutral`, `happy`, `sad`, `angry`, `surprised` 等
`speed`	float	否	语速调节，默认 1.0（范围 0.8~1.2）

{
  "status": "success",
  "audio_url": "/static/audio/tts_20250405_120001.wav",
  "download_url": "/static/audio/tts_20250405_120001.wav?download=1"
}

// 解析 TTS 返回的 JSON
const response = JSON.parse(nodeData['http_request'].response);
if (response.status === 'success') {
  return {
    audio_url: 'http://host-ip:5000' + response.audio_url,
    download_link: 'http://host-ip:5000' + response.download_url
  };
} else {
  throw new Error('TTS synthesis failed');
}

🤖 已为您生成语音回复： <audio controls src="{{audio_url}}"></audio> 📥 [点击下载语音文件]({{download_link}})

API 鉴权：在 Flask 层添加 Token 验证

@app.route('/tts', methods=['POST'])
def tts():
    token = request.headers.get('Authorization')
    if token != 'Bearer your-secret-token':
        return {'status': 'error', 'msg': 'Unauthorized'}, 401

限流控制：使用 flask-limiter 防止滥用
CORS 策略：仅允许指定域名访问 WebUI

Dify 工作流集成 TTS：低代码实现语音输出

Dify 工作流集成 TTS：低代码实现语音输出

📌 背景与需求：让 AI 应用'开口说话'

🎙️ Sambert-HifiGan 中文多情感语音合成服务详解

技术选型依据：为何选择 Sambert-Hifigan？

系统架构设计：WebUI + API 双模式服务

🔧 关键改进点

🚀 快速部署与 API 调用指南

步骤一：启动 TTS 服务容器

步骤二：调用 HTTP API 实现程序化集成

API 端点信息

请求体格式（JSON）

字段说明

成功响应示例

💡 Dify 工作流集成实战

场景设定

Step 1：配置 HTTP 节点调用 TTS API

Step 2：解析响应并构造语音输出

数据提取节点（JavaScript 脚本）

Step 3：设置最终回复内容

🛠️ 常见问题与优化建议

❌ 问题 1：合成失败，返回 500 错误

⏱️ 问题 2：首次合成延迟较高（>5 秒）

🔐 安全增强建议

✅ 总结：打造可落地的低代码语音应用

📚 下一步建议

更多推荐文章

相关免费在线工具

Dify 工作流集成 TTS：低代码实现语音输出

Dify 工作流集成 TTS：低代码实现语音输出

📌 背景与需求：让 AI 应用'开口说话'

🎙️ Sambert-HifiGan 中文多情感语音合成服务详解

技术选型依据：为何选择 Sambert-Hifigan？

系统架构设计：WebUI + API 双模式服务

🔧 关键改进点

🚀 快速部署与 API 调用指南

步骤一：启动 TTS 服务容器

步骤二：调用 HTTP API 实现程序化集成

API 端点信息

请求体格式（JSON）

字段说明

成功响应示例

💡 Dify 工作流集成实战

场景设定

Step 1：配置 HTTP 节点调用 TTS API

Step 2：解析响应并构造语音输出

数据提取节点（JavaScript 脚本）

Step 3：设置最终回复内容

🛠️ 常见问题与优化建议

❌ 问题 1：合成失败，返回 500 错误

⏱️ 问题 2：首次合成延迟较高（>5 秒）

🔐 安全增强建议

✅ 总结：打造可落地的低代码语音应用

📚 下一步建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具