🎙️ 音色管理

上传参考音频创建自定义音色,管理音色库

📺 音色管理操作演示

如何进入

点击顶部导航栏 「🎙 音色模型」 Tab。页面左侧为添加面板,右侧为音色库。

音色模式

页面顶部会显示当前的音色模式,由管理员配置:

模式存储位置说明
💻 本地版程序目录 voices/音色模型保存在本机,使用本地 GPU 克隆音色
☁️ 在线版云端服务器音色数据上传到服务器,使用云端处理

添加音色

1 点击 「上传参考音频」 区域,选择一段音频文件(WAV / MP3)

2「音色名称」 输入框中输入一个容易辨认的名字

3 (仅本地版)系统自动识别音频内容并填入「音频内容」输入框,如识别不准确请手动修改

4 点击 「💾 保存」

5 保存成功后,音色自动同步到工作台步骤 2 的音色下拉框

添加音色

添加音色面板 — 上传音频 + 命名 + 保存

参考音频要求

项目建议要求
时长3~10 秒(建议 5~15 秒效果最佳)
环境安静无噪音的录音环境
人声单一人声,不要有背景音乐或多人对话
音量音量适中,不要过大或过小
格式WAV 或 MP3
内容正常说话语速,包含完整句子
💡 参考音频的音质直接影响合成效果。高质量的参考音频 = 更逼真的语音克隆效果。
⚠️ 避免使用嘈杂环境、带背景音乐、声音过小或爆音的音频。

同步在线音色(仅在线版)

在线版用户可以点击 「🔄 同步在线音色」 按钮,从服务器拉取最新的音色列表,确保本地显示与云端一致。

音色库

页面 右侧 以卡片展示所有已保存的音色:

音色库

音色库卡片展示 + 试听区

常见问题

Q:上传后音频内容识别不正确?
A:本地版会自动识别音频中的文字内容。如果识别不准确,请手动修改为音频中实际说的话,这会影响合成质量。
Q:保存后工作台看不到新音色?
A:切换一次 Tab 后再回到工作台,音色下拉框会自动刷新。也可以点击步骤 2 中的刷新按钮。
Q:音色合成效果不理想怎么办?
A:建议更换更高质量的参考音频。时长 5~15 秒、安静环境、清晰人声的音频效果最好。