📺 音色管理操作演示
如何进入
点击顶部导航栏 「🎙 音色模型」 Tab。页面左侧为添加面板,右侧为音色库。
音色模式
页面顶部会显示当前的音色模式,由管理员配置:
| 模式 | 存储位置 | 说明 |
|---|---|---|
| 💻 本地版 | 程序目录 voices/ | 音色模型保存在本机,使用本地 GPU 克隆音色 |
| ☁️ 在线版 | 云端服务器 | 音色数据上传到服务器,使用云端处理 |
添加音色
1 点击 「上传参考音频」 区域,选择一段音频文件(WAV / MP3)
2 在 「音色名称」 输入框中输入一个容易辨认的名字
3 (仅本地版)系统自动识别音频内容并填入「音频内容」输入框,如识别不准确请手动修改
4 点击 「💾 保存」
5 保存成功后,音色自动同步到工作台步骤 2 的音色下拉框

添加音色面板 — 上传音频 + 命名 + 保存
参考音频要求
| 项目 | 建议要求 |
|---|---|
| 时长 | 3~10 秒(建议 5~15 秒效果最佳) |
| 环境 | 安静无噪音的录音环境 |
| 人声 | 单一人声,不要有背景音乐或多人对话 |
| 音量 | 音量适中,不要过大或过小 |
| 格式 | WAV 或 MP3 |
| 内容 | 正常说话语速,包含完整句子 |
💡 参考音频的音质直接影响合成效果。高质量的参考音频 = 更逼真的语音克隆效果。
⚠️ 避免使用嘈杂环境、带背景音乐、声音过小或爆音的音频。
同步在线音色(仅在线版)
在线版用户可以点击 「🔄 同步在线音色」 按钮,从服务器拉取最新的音色列表,确保本地显示与云端一致。
音色库
页面 右侧 以卡片展示所有已保存的音色:
- 点击卡片 → 在下方试听区播放该音色的参考音频
- 点击卡片上的 🗑️ → 删除该音色

音色库卡片展示 + 试听区
常见问题
Q:上传后音频内容识别不正确?
A:本地版会自动识别音频中的文字内容。如果识别不准确,请手动修改为音频中实际说的话,这会影响合成质量。
Q:保存后工作台看不到新音色?
A:切换一次 Tab 后再回到工作台,音色下拉框会自动刷新。也可以点击步骤 2 中的刷新按钮。
Q:音色合成效果不理想怎么办?
A:建议更换更高质量的参考音频。时长 5~15 秒、安静环境、清晰人声的音频效果最好。