科大讯飞|从语音产业的拓荒者到领头羊,科大讯飞智能语音的探索和突破

科大讯飞|从语音产业的拓荒者到领头羊,科大讯飞智能语音的探索和突破

文章图片

科大讯飞|从语音产业的拓荒者到领头羊,科大讯飞智能语音的探索和突破

文章图片

科大讯飞|从语音产业的拓荒者到领头羊,科大讯飞智能语音的探索和突破

文章图片



始终保持每年技术进步30% , 这是科大讯飞对技术的要求 , 也是公司每一位科研人员的自我要求 。
作者 | 维克多
编辑 | 岑峰
巴别塔本是犹太教是《圣经·旧约·创世记》中的一个故事 , 说的是人类产生不同语言的起源 。 在这个故事中 , 人类联合起来兴建希望能通往天堂的高塔;为了阻止人类的计划 , 上帝让人类说不同的语言 , 使人类相互之间不能沟通 , 计划因此失败 , 人类自此各散东西 。
语言是作为最自然便捷的交流方式 , 是人类社会的瑰宝 , 传承文明 , 承载文化 。 让机器听懂语言 , 延伸人类的能力 , 实现人和机器交互直至万物互联 , 一直是人类的远大梦想 。
而语音在未来人机交互中则起到关键性的作用 。 1952年 , 贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统;70年代以后 , 在小词汇量、孤立词的识别方面取得了实质性的进展;80年代 , 逐渐由孤立词识别转向连接词识别;90年代以后 , 大词汇量连续语音识别得到优化 。
科大讯飞便是这个时间创立的 。 1999年以前的中文语音市场几乎全部掌握在跨国公司手中 。 当时微软、IBM等国际巨头纷纷在中国设立语音研究基地 , 国内语音技术人才毕业后基本外流 。 从中国语音产业的拓荒者 , 到如今成为国际知名的智能语音与人工智能上市公司 , 从追赶到领跑 , 科大讯飞成功改写了由外国巨头控制的中国语音市场格局 。
“做属于中国人自己的核心技术 , 用顶尖的技术引领世界变革”的梦想也一直藏在熊世富的心底 。 在技术理想主义者熊世富看来 , 科大讯飞便是实现自己梦想最好的舞台 。
在智能语音和人工智能产业中 , 技术革新很快 , 想要赢得领跑局面就必须从源头技术上保持领先 。 而保持领先的秘密是“甘坐十年冷板凳“的决心 , 是对企业科研人员反复实验 , 去穷尽每一种可能 , 推动技术上的微小改变的耐心 , 也是直面失败的恒心 。
正如创立22年的科大讯飞在探索人工智能实现路径上的曲折 , 作为“年轻后浪“的熊世富在接下科大讯飞语音识别技术这个接力棒以来 , 失败也是他最常面对的事情 。
1
不是天才
人工智能被很多人称之为改变未来的颠覆性技术 , 而深度学习则是加速人工智能发展的颠覆性创新 。
2010年以前 , 语音识别的主流方式是使用高斯混合模型(GMM)来建模 , 虽然语音识别的错误率有效的降低了 , 但GMM在自然场景下却无法达到实用的级别 。 想要实现语音识别技术更广泛的商用 , 必须有新的突破 。 2010年 , 微软通过研究如何利用深层神经网络改善大词汇量语音识别 , 成功地使得大规模的语音识别得到突破性进展 , 而这一研究也改变了世界语音识别业界格局 。
而科大讯飞也成为除了微软总部以外 , 第一批接触深度学习并着手开始研究的团队 。 一年后 , 科大讯飞已经将深度神经网络(DNN)成功应用到中文语音识别领域 , 并通过语音云平台提供给广大开发者使用 。
熊世富便是在那个技术引领变革的时代 , 开启了对人工智能语音领域的深入探索 , 从一个代码小白一步步蜕变为行业专家 。

相关经验推荐