中科大11项语音合成指标世界第一

30.07.2014  10:46

  7月29日,记者从中国科学技术大学获悉,在刚刚结束的国际语音合成大赛上,该校语音及语言信息处理国家工程实验室报送的参赛系统,在25项测试指标中11项居世界第一,取得了所有参赛系统中最好的综合表现,进一步稳固了中科大语音合成技术在世界上的领先地位。

  作为国际上规模最大、最具影响力的语音合成比赛,国际语音合成大赛每年吸引了美国卡耐基-梅隆大学等众多语音技术领域的世界知名机构参赛。与往届相比,本届大赛首次将主要测试语种由英语转换到非英语语种,要求提交的合成系统包括印地语、阿萨姆语等6种印度语种,并增加这些语种与英文混读情况下的合成测试,进一步提高了测试的难度。

  在比赛中,中科大研究团队充分发挥在语音合成核心技术上的优势,采用基于统计声学模型的单元挑选与参数合成技术方案,提出并实现基于深度神经网络的合成新方法,进一步提高了合成语音质量。最终,中科大提交的参赛系统获得印地语合成语音相似度与可懂度、印地语英语混读合成语音相似度与自然度等11个指标的第一名。

  中科大语音及语言信息处理国家工程实验室,由国家发改委于2011年6月批准成立,中科大与科大讯飞公司联合共建,是我国语音产业界唯一的国家级研究开发平台。(记者 桂运安)