应用介绍
#AI语音 #语音大模型 #开源项目 #语音克隆 #文本转语音 #多方言
最近本地跑了一遍 VoxCPM2,最让我意外的不是它会说粤语、河南话,而是它让我感觉到:声音正在变成一种可以编辑的内容。
过去大家关注的是 AI 说得像不像真人,现在它开始迈向另一个方向——能不能按照你的要求去“表演”。只需要一段提示词,就可以控制年龄、音色、情绪、语速等表达方式;如果再上传一段参考音频,还能尽可能保留原有音色,同时改变表达风格。
软件功能
文本生成语音:输入文本即可生成自然语音,并支持丰富的表达控制。
提示词控制声音风格:可以通过提示词指定年龄、音色、情绪、语速等生成效果。
参考音频复刻音色:上传参考语音后,可在保留音色特征的基础上调整表达方式。
多方言支持:支持普通话之外,还能够生成粤语、河南话等不同方言语音。
声音表达能力增强:不仅追求音色相似度,更关注语气、情绪和表现力,让语音更具可控性。
适用场景丰富:可用于 AI 配音、有声内容制作、数字人、语音助手、教育培训等场景。