快讯详情
微软推出DragonV2.1语音模型:支持百种语言,发音准确性提升12.8%
亿恩网| 2025-07-31 14:12:58

科技媒体NeoWin报道,微软近日发布新一代DragonV2.1 Neural零次学习模型,该文本转语音系统仅需数秒语音样本即可生成超100种语言的逼真语音。相比前代产品,新模型在发音准确性方面取得突破性进展,单词错误率平均降低12.8%,特别改善了专有名词的发音问题。这项技术创新通过SSML音素标签和自定义词典实现精准的发音控制,可应用于智能客服语音定制、多语言视频配音等场景。微软同步推出Andrew、Ava等预设音色库,方便用户体验其卓越的自然语言表现力。

转载之前请先阅读转载说明,违规转载法律必究
寻求报道或合作,请点击这里
如果您加入壹览的讨论群,请联系我们的工作人员(微信号:star_3979)