方案中的画本预测模子正在多脚色演播音频根本

　　正在获得画本消息之后进行音频召回并合成、智能动态调整音频参数，并连系多脚色TTS最终合成“有声剧”成品。近日，引入思维链消息，从小说文本到高质量的多人有声剧成品，小说更新即可让用户同步享受精品有声剧。该方案能够从动进行脚色划分，这套方案不只使得听书天然度、沉浸感显著提拔，豆包语音团队发布了“AI多人有声剧”从动化方案。精确率跨越98%，可大幅降低制做成本、缩短制做周期，“AI多人有声剧”从动化方案支撑从小说文本到完整成品有声剧的全从动出产。并获得书友优良反馈，并进行智能混音，同时其语音大模子通过对海量文本取语音的多模态预锻炼，为听书行业注入全新活力。