让中国语音响遍世界

23.04.2015  14:15

  司机小杨没有想到,这段时间伴他一路同行的“志玲姐姐”语音导航服务中,“女神”甜美的娃娃音竟然大部分是合成的!同小杨一样,很多人不知道,高德导航应用中除“向左转弯”“前方摄像头”等固定语句采用原声外,地名、距离、速度等提示也是依据林志玲咬字和发音方式,运用语音合成技术制作而成。这一技术提供商正是有“中国语音产业国家队”美誉的科大讯飞。

  从被外界讥笑的“草台班子”到亚太地区最大的语音上市公司,从中国语音产业的拓荒者到世界语音产业的领军者,16年来,科大讯飞以源源不断的自主创新经受住市场的淬炼,诠释了什么是产业报国,何为凤凰涅槃。

  看着今天的科大讯飞在语音市场上的纵横驰骋,可能有人叹息生不逢时,没有像它一样幸运。但鲜为人知的是,彼时科大讯飞选择中国语音产业化之旅,在别人看来简直是异想天开。

  质疑并非毫无来由。1999年科大讯飞成立伊始,中国语音市场几乎百分之百由IBM、微软等国外IT巨头垄断;而在国内,虽有科研机构从事相关研究,却都是单打独斗,迟迟未见成果面市,更令人不安的是,语音技术人才毕业后进入跨国公司几乎成了一种惯例。

  这样的背景下,胡郁、胡国平、陈涛,还有科大讯飞发起者——彼时26岁的中科大博士研究生刘庆峰,一群尚未完全摆脱稚气的毛头小伙子偏偏要试一试。语音是文化的基础和民族的象征,不能被外国人掐住喉咙!中国的语音产业要由中国人来掌握。这个只有18个人的团队开始了跌跌撞撞的语音产业化苦旅。

  2003年,科大讯飞荣获“国家科技进步奖”,牵头制定具有自主知识产权的中文语音标准;2006年至2014年,连续9年在英文语音合成国际大赛中夺冠;2008年摘得国际说话人识别评测大赛桂冠,并在语音识别技术领域一举超越全球最大的语音技术公司Nuance;2009年获得国际语种识别评测大赛高难度混淆方言测试指标冠军;2013年,通过麦克风阵列技术将语音识别的距离拓展到5米以外,在高抗噪语音识别技术领域取得突破,100km/h车速下仍保持90%以上的识别率,显著领先;2014年,继续获得通用全球中文语音识别测评综合指标第一名。

  而在与语音技术平行的另一条历史轴线上,科大讯飞的语音产业化之旅也愈走愈顺:2008年成为中国语音产业唯一的上市公司,将Nuance“挤出”中国;如今为全行业2000多家企业提供语音核心技术,占据中国语音主流市场70%以上的份额,并成为亚太地区最大的语音公司;面向移动互联网时代率先推出语音云平台,用户数已突破6.8亿,开发应用申请超过6万个,逐步形成以科大讯飞为核心的语音产业链,成为业界公认的“语音产业国家队”;目前,讯飞语音学习软件已在国外孔子学院得到普遍应用,并成为新加坡等国中英文语音学习门户的主流技术。

  很多业内人士都对科大讯飞竖起大拇指:“如果没有科大讯飞,中国语音产业现在还会控制在国外公司手中,也不可能有今天的蓬勃发展。