您现在所在位置:东央 > 新闻中心 > 公司资讯 >

公司资讯

行业动态

常见问题

智能语音技术的突破仍需时间

发布日期:2020-09-27 09:27浏览次数:

2017年,生物识别技术已经在改变着一些人的生活方式,指纹识别在手机上已经商用多年、人脸识别也在这一年9月出现在苹果公司发布的iPhone X上。

东央关注音频技术多年,是否能够通过在线生物识别方式解决养老金领取时的认证问题?

这是印尼当地政府当时在考虑的问题。

随后,印尼当地政府开始尝试引入人脸识别、指纹识别、声纹识别这些生物识别技术。其中,声纹识别技术采购的正是刚刚成立不久的声扬科技的技术。

我记得非常清楚,当时我们两位同事去印尼采集数据时看到,即使是雅加达(印尼首都),交通也是非常不方便,老人家用传统现场验证的方法领取养老金虽然一定程度上避免了冒领骗保问题,却给这些老人带来诸多不便。

他们有的已经七八十岁,有的人甚至还坐着轮椅……

他们回来后,发自内心地和我说:我们这个项目就算不赚钱也要把它做好。

正是这样的原始驱动力,让张伟彬和他的团队开始在这一项目中全力奋战。

在实际深入到这一项目后,张伟彬和他的团队感受到了声纹识别技术在落地过程中实实在在遇到的三个难题:

第一,噪声。这个问题虽然算不上特别,在任何场景下做语音技术都不可避免会遇到,但对识别准确率还是会造成影响;

第二,极短语音文本声纹比对。在这个项目中,认证时,居民需要对着手机念出手机界面上随机出现的12个印尼数字,然后系统会同时验证内容和声纹,12个数字大概需要三四秒,需要用这么短的语音比对出是否是本人;

第三,跨信道。现场注册时,居民用的是拾音效果较好的专业麦克风,日常认证用的则是普通电话上的麦克风,传统固定电话采样率又有所受限,4kHz采样的语音数据,这就形成鲜明对比——原始声音是高质量的声音信息,验证的时候由于传输信道比较恶劣,声纹信息质量就会下降,这也是一方面挑战。

东央在2018年推出的DoiYun(东央云)方案,其中的听录和语音识别即是也是基于智能化音频处理逻辑,在视频会议方向,尽管东央的发展速度足够快,但在智能语音技术商用方向的突破仍有阻碍。

最终,在2018年5月,这一系统正式上线,开始服务250万印尼退休人员——他们每个月只需要通过手机APP在家中就能实现在线认证。

4009942400