文本转语音 (OpenAI)

用于OpenAI,通过手动触发将文本转换为语音,支持自定义输入文本和语音选项,生成的音频文件为.mp3格式,便于快速集成和使用。

2025/7/8
8 个节点
中等
手动中等便签api集成
分类:
Manual TriggeredMedium Workflow
集成服务:
Sticky Note

适用人群

此工作流适合以下人群:
- 开发者:需要将文本转换为语音的开发者,尤其是在构建聊天机器人或语音助手时。
- 内容创作者:希望将书面内容转化为音频格式的博主、播客制作人和视频创作者。
- 教育工作者:需要为学生提供音频教材的教师,尤其是视觉障碍学生的辅助工具。
- 企业:希望在客户服务中使用语音响应系统的公司。

解决的问题

此工作流解决了将文本转换为语音的需求,特别是通过 OpenAI 的 TTS API。它可以帮助用户快速生成音频文件,省去手动录音的时间和精力,提升工作效率。

工作流程

  • 手动触发工作流:用户点击"测试工作流"按钮,启动工作流。
    2. 设置输入文本和语音:在"设置输入文本和 TTS 语音"节点中,用户可以指定要转换的文本(例如:"The quick brown fox jumped over the lazy dog.")和使用的语音(默认是 alloy)。
    3. 发送 HTTP 请求:工作流通过"发送 HTTP 请求到 OpenAI 的 TTS 端点"节点,将文本和语音配置信息发送到 OpenAI 的 API。
    4. 获取音频输出:OpenAI 的 TTS 端点返回一个 .mp3 格式的音频文件,用户可以下载或使用该音频文件。
  • 自定义指南

    用户可以根据以下方式自定义和调整此工作流:
    - 修改输入文本:在"设置输入文本和 TTS 语音"节点中,替换 input_text 值为所需文本。
    - 选择不同的语音:在"设置输入文本和 TTS 语音"节点中,修改 voice 值为其他可用语音,具体选项可参考 OpenAI TTS 文档
    - 调整工作流触发方式:可以替换手动触发器为其他触发器类型,如定时触发或事件触发,以适应不同的应用场景。