文本一导入,软件就蹦出提示,“监测到您的文本类型为剧本,是否切换为广播剧模式?”
切换之后,整个窗口布局大变样,被分成了五个模块。
左上是文本时间轴,一行一句文本,对应着音频时间线。左下是角色窗口,从剧本中自动识别出的几个角色已经整整齐齐排列在里面,点开之后是自定义角色卡,包括该角色的音色、情感滤镜、语速语气等等。
右上是属性编辑器,右下是音效素材库。
整个页面最下方是一条多轨道时间轴,可以对音频进行整体的编辑。
这么一看,这个软件就已经专业得不行,UI设计功力不逊于adobe系列。
第一步依旧是选择音色,但不再直接输出音频,而是选好音色后,填到角色卡里。
邵逸明选完第一个角色的音色就悟了,他应该先把这些角色卡填满,然后再去调整生成的音频参数。
除了常规的语速语气等,角色卡里还有“情感滤镜”选项,可以选预置的,也可以自定义。自定义窗口里足有二十多个情感维度,开心、同情、嫉妒、失望……二十多个滑条看得人眼花缭乱。
一个角色不可能永远高兴或永远悲伤,邵逸明填完第一个角色,想了想,复制出一份,在角色名字后面加了个括号(低落),微调了一下参数,换了一个滤镜,用来表示该角色不开心时的状态。
很快,各个角色以及它们的复制体建立完毕,可以开始编辑详细语句了。
每一句的可编辑参数都显示在右侧属性编辑器里,和角色卡里的参数几乎一模一样,也有情感滤镜选项。邵逸明立刻意识到,所谓的角色卡,其实就是一个参数模型。
属性编辑器里,唯一和角色卡不一样的,就是音频液化曲线,像手机app一样,可以对某一个句子的不同时间点,进行最细微的调整。
编辑完角色、编辑完语句,软件自动合成音频,这段音频显示在右下方的音效素材库里,可以拖入多轨道编辑器进行剪辑。音效素材库链接到云端,用户可以从中下载所需要的任何音效。当然,也可以自己导入。
到这里为止,这个软件只是普通的配音软件而已,功能无非是模仿人类的声音,细化了各种可调参数。
用这个软件来做广播剧的话,只要设定好角色,输入剧本就可以输出音频。但这样做出来的广播剧非常“标准化”,用邵逸明的话说就是“平平无奇、没有灵魂。”
如果对广播剧进行精细化的微调,可以达成很好的效果,甚至能调出专业配音都达不到的水平,但那样又太慢了,要一点一点抠到天荒地老。