格力电器|格力手机申请声纹识别专利,但这条路并不好走( 二 )





目前 , 手机行业的生物识别技术其实只有两大流派 , 即iPhone坚持的Face ID人脸识别以及Android阵营的指纹识别 , 声纹识别技术则并未得到广泛的应用 。 但需要注意的是 , 声纹识别并不等于语音识别 , 前者是个性识别 , 是通过提取语音中的声纹特性来判断说话的人是谁 , 也就是解决“谁在说话”的问题 , 而后者则是共性识别 , 判断的是说话的内容 , 解决“说了什么”的问题 。
对着手机说一句话就能解锁、甚至进行支付 , 看似是一个不错的卖点 , 但主流手机厂商并未使用这一技术显然是有所顾虑的 。
从技术方面来说 , 声纹识别的门槛很高 。 为了避免出现“安静!吵到我用tnt了”这样的尴尬 , 高精度的声纹识别需要具备准确捕捉到复杂声学环境下用户声音的能力 。 谷歌与亚马逊等公司在智能音箱上使用的方法是定向人声分离 , 通过卷积神经网络搭配声纹识别编码器 , 来准确捕捉目标用户的声音 , 再辅以出色的端点检测模块(VAD)判断声音的起点和结束点 , 最终实现声纹识别 。 那么问题来了 , 格力有媲美这两家互联公司的技术能力吗?



即便格力的研发团队突然间就获得了这样实力 , 但声纹识别在智能手机上的阻碍还不止技术 。 谷歌为什么不在Pixel系列机型上使用声纹识别呢 , 三星为什么在Galaxy S4时代使用这一技术、到了如今的Galaxy S22系列却又没有了呢?其实用“安全”二字就可以解释 。
声纹识别技术的局限性就在于假冒声音攻击 , 而想要避免录音重放、语音合成 , 还是波形拼接攻击 , 前提都是活体检测 。 3D面部识别和指纹识别都可以做到生物识别和活体检测同时完成 , 但声纹识别暂时还很难同时且无感完成这一点 , 并且在验证声纹的同时还需要验证内容的方法 , 显然非常影响用户体验 。



换句话来说 , 声纹识别如今的缺陷就是技术门槛高 , 同时安全性无法妥善解决 。 所以如果格力选择声纹识别作为差异化的产品卖点 , 或许距离做成手机又远了几步 。

相关经验推荐