扣子工作流之语音合成大模型音色设置详解
扣子工作流的普及,现在已经非常实用了,也是超哥能看AI到落实到工作上的一个很实际的应用,很多小伙伴通过扣子的工作实现了自动生成原创视频的效果,而且无论是在YouTube还是在国内的抖音上效果都还是蛮不错的而且超哥也发现扣子的工作流中一些音色的效果要比简应中带的音色效果也好,所以说也就特别整理了一期记录一下语音合成大模型资料和链接。
和剪映的渠道不同,工作流中的音色大部分都是来自于火山引擎的,而且他们的印色有不同的情绪比较大,可以详细的去设置出除了音色以外的阅读之后的情绪,这是一个亮点,如果说你是需要一个详细的视频音色模型的话,无论是复刻原生还是用他们的音色,都是可以设置出五花八门的效果。
在扣子里,他是语言合成的插件:https://www.coze.cn/open/docs/guides/text_to_speech_plugin,另外这里有详细的开发说明,也包含现有音色列表:https://www.volcengine.com/docs/6561/1257536,最大的亮点是基于音色之外的情感参数。
情感参数(emotion):
括号内为对应的情感参数:
中文音色:开心(happy),悲伤(sad),生气(angry),惊讶(surprised),恐惧(fear),厌恶(hate),激动(excited),冷漠(coldness),中性(neutral),沮丧(depressed),撒娇(lovey-dovey),害羞(shy),安慰鼓励(comfort),咆哮/焦急(tension),温柔(tender),讲故事 / 自然讲述(storytelling),情感电台(radio),磁性(magnetic),广告营销(advertising),气泡音(vocal – fry),低语 (ASMR),新闻播报(news),娱乐八卦(entertainment),方言(dialect)
英文音色:中性(neutral),愉悦(happy),愤怒(angry),悲伤(sad),兴奋(excited),对话 / 闲聊(chat),低语 (ASMR),温暖(warm),深情(affectionate),权威(authoritative)
而且,现在无论是剪映还是火山引擎,都有英文的音色合成,说白了就是做海外内容的话,也可以轻松实现。赵如超哥截图中的展示,如果说你在剪映中没有你想使用的音色,可以直接新建一个工作流直接输入内容,让你想要的应色直接下载下来就可以后将下载的音频放在剪影中编辑。
当然,这只是一个简单的思路,如果说你要处理的文字过多的话,有可能需要分段删除掉一些空白符号这些工作流的使用发挥卡在互联网上有很多,如果你需要具体的哪一步骤都可以通过复制别人家工作的这一流程,来整合到自己的工作流中,还是你需要一个创意内容的目标目标去做生产的技术上的问题和资源上的问题基本上是取之不尽用不完的。
随着开发者越来越多,使用的人越来越多,未来但模型的应用会越来越广,这也是AI在于内容生产上的质的跨越。相信未来一个合格的视频创造者,有可能他根本就不需要去剪辑视频,他只需要为一个企业量身定制一个稳定,且可以长期输出的原创内容,只需要把企业所银行表达的内容通过工作流的形式,自动发布自动账号即可,企业则需要对接的客户来精心的服务就好。
原创文章,作者:超哥,如若转载,请注明出处:https://www.chaoneo.cn/archives/3820.html
如果您觉得超哥分享对您有所帮助的话,记得打赏给我😀