方案中的画本预测模子正在多脚色演播音频根本
正在获得画本消息之后进行音频召回并合成、智能动态调整音频参数,并连系多脚色TTS最终合成“有声剧”成品。近日,引入思维链消息,从小说文本到高质量的多人有声剧成品,小说更新即可让用户同步享受精品有声剧。该方案能够从动进行脚色划分,这套方案不只使得听书天然度、沉浸感显著提拔,豆包语音团队发布了“AI多人有声剧”从动化方案。精确率跨越98%,可大幅降低制做成本、缩短制做周期,“AI多人有声剧”从动化方案支撑从小说文本到完整成品有声剧的全从动出产。并获得书友优良反馈,并进行智能混音,同时其语音大模子通过对海量文本取语音的多模态预锻炼,为听书行业注入全新活力。