Skip to content

hrygo/ai-content-studio

Repository files navigation

VoiceForge

把你的文章、报告、新闻变成像广播节目一样的对话音频——有多个角色、有讨论节奏、听起来像真实的人在聊天。

通过自然语言指令即可触发全流程自动处理。


快速安装 (AI Agent 极速)

如果你正在使用 AI 编程助手(如 Claude Code / OpenCode),只需将 INSTALL.md 发送给它,让它自行阅读并完成所有安装和 API 配置:

请阅读 https://github.com/hrygo/voiceforge/blob/main/INSTALL.md 并帮我完成安装


核心功能与场景

需求场景 功能实现
把这篇文章做成播客 两个人深度对谈,有提问、有反驳、有总结
快速摘要一下这份报告 单人专业播报,简洁清晰
专家点评一下这篇评测 含优点和不足的建设性评析
做一个辩论节目 正反方对辩,有主持人引导
加上背景音乐 轻柔背景音乐,人声时自动压低音量
立体声效果 不同角色左右声道分离,更有空间感

开始使用

支持自然语言指令触发:

帮我把这篇研究报告做成播客节目
把这篇新闻做成辩论,正反方对辩
把这份周报摘要一下,做成专业播报
帮我把产品评测生成语音,要专家点评风格

系统将自动完成全流程:理解内容 → 匹配风格 → 生成脚本 → 合成语音 → 输出 MP3。


常见表达

提示词关键词 实际效果
"做成播客 / 对话" 深度播客模式,模拟真实讨论
"摘要 / 播报" 单人简报,清晰精炼
"点评 / 评论" 专家评析,含优缺点
"辩论 / 对辩" 正反方对辩
"立体声" 不同角色左右声道分离
"加背景音乐" BGM 混音,人声时自动压低

场景示例

Tip

下列示例中的 /voiceforge 前缀为可选。直接在对话框输入需求即可,但带上前缀能引导 AI 助手直接加载对应的 Skill 以获得更精准的响应。

把公众号文章做成播客

/voiceforge 帮我把这篇文章做成播客节目,两个人对话的形式,要有提问和反驳

快速摘要

/voiceforge 把这份研报摘要一下,做成专业播报的形式

产品评测

帮我把产品评测报告做成专家点评,要包含优点和缺点分析

辩论节目

把这两个观点做成辩论,正反方对辩,有主持人

加背景音乐

生成播客音频,同时加上 ambient 背景音乐

关于 API Key

运行该 Skill 需要配置 DashScope(阿里云百炼)或 MiniMax 的 API Key。 系统首次运行时将自动从 ~/.config/opencode/opencode.json 读取,同时也支持通过环境变量进行覆盖。

Tip

🚀 MiniMax Token Plan 深度赋能: 本工具推荐使用 MiniMax T2A V2 引擎。如果您正在使用 OpenCode 或类似的 "编码套餐" (Token Plan),该套餐的额度通常可直接复用,从而大幅降低生成成本。

现在参与计划还可享双重好礼:

  • 开发者福利:立享 9 折 专属优惠,解锁 Builder 权益(优先支持、社群特权)。
  • 全能创作:新增语音、音乐、视频和图片生成权益,助力全媒体内容开发。
  • 👉 立即参与并获取 9 折优惠

🏗️ 新架构特性(v2.0)

基于 minimax_aipodcast 项目的架构经验,完成了全面的架构优化:

核心改进

  1. 分层架构 - src/core/ + src/services/ 清晰分层
  2. 统一 API 客户端 - 自动重试、详细错误处理
  3. 音量标准化 - 统一到 -18 dB,提升音频质量
  4. 配置管理 - JSON 配置文件 + 环境变量支持
  5. 并发优化 - 生产者-消费者模式,提升性能

使用新架构

from services.api_client import create_minimax_client
from services.audio_processor import normalize_volume

# API 调用(自动重试)
client = create_minimax_client()
audio_bytes = client.text_to_speech("你好,世界!")

# 音量标准化
normalize_volume("input.mp3", "output.mp3", target_dbfs=-18.0)

详见:


常见问题

Q: 支持中文还是英文? A: 两者都支持,也可以中英混用。

Q: 音色可以调吗? A: 可以。支持 36+ 种预设音色,不同风格的声音适用于不同场景。

Q: 生成失败怎么办? A: 系统会自动在多个引擎之间切换重试。如果仍然失败,可能是 API Key 无效或额度用完。


参考

About

Professional AI audio content creation tool. Transform articles, reports, and news into broadcast-quality podcast audio with multi-character dialogues and high-fidelity TTS.

Topics

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors