微软推出DragonV2.1语音模型：支持百种语言，发音准确性提升12.8%

科技媒体NeoWin报道，微软近日发布新一代DragonV2.1 Neural零次学习模型，该文本转语音系统仅需数秒语音样本即可生成超100种语言的逼真语音。相比前代产品，新模型在发音准确性方面取得突破性进展，单词错误率平均降低12.8%，特别改善了专有名词的发音问题。这项技术创新通过SSML音素标签和自定义词典实现精准的发音控制，可应用于智能客服语音定制、多语言视频配音等场景。微软同步推出Andrew、Ava等预设音色库，方便用户体验其卓越的自然语言表现力。

转载之前请先阅读转载说明，违规转载法律必究

寻求报道或合作，请点击这里

如果您加入壹览的讨论群，请联系我们的工作人员（微信号：star_3979)