原标题:AI浪潮推动超千亿声纹市场落地:个人ID时代来临
来源:21世纪经济报道
继指纹、面部、虹膜之后,声纹作为象征我们个人ID的一部分,也陆续开启了商用大潮。
近日,中国工商银行开始把声纹识别技术应用于信用卡反欺诈场景,在其位于北京、湖北、四川、山西的四家分行正式上线,在同业中率先开启了风险管控的新模式。
声纹识别从单纯技术本身来说,在20世纪便有了相关研究和落地的探索,近年来,部分比较成熟的方案开始被境内外一些银行系统采用,那是声纹识别技术应用落地的初级阶段。
真正走向成熟,核心还是依托于21世纪AI技术取得的突破。尤其是年初数月的疫情背景下,市场对这种非接触且高准确度的技术应用需求突然放大甚至与日俱增。
据前瞻产业研究院分析,当下全球生物识别产业规模庞大,仅语音生物识别(即声纹识别)这一细分方向的市场规模2020年有望超过1400亿元人民币(约200亿美元),占整个生物识别市场的22.4%。
声扬科技CTO陈东鹏向21世纪经济报道记者表示,未来随着5G、大数据、云计算等新技术发展愈发成熟、语音的入口更普及,可利用的语音数据会越来越多。声纹识别技术有望在金融、公安、智能硬件、IoT等领域中发挥越来越重要的作用。
逐层技术演进
提到声纹,很容易被理解为容易被模仿的声线,其实二者不能等同。
有行业人士向记者分析道,声纹很难被伪装,因为其识别的内容主要包括声带振动频率、声道等特征组成的语音模型,能被伪装的只在于口头禅等行为特征。
“每个人说话时的音调、音色等习惯几乎独一无二,这些信息通过电声学仪器测量并分析,就构成了不同的声波频谱,所以用声纹来认证身份具有唯一性和稳定性。”他续称。
清华大学人工智能研究院听觉智能研究中心发布的一份声纹识别技术白皮书显示,目前市场上主流的生物识别方案包括掌纹、虹膜、视网膜、人脸、声纹等。从易仿冒程度来看,虹膜和视网膜是极难的,声纹被评定为难,其余则均为一般。
基于这些背景,关于声纹的研究其实早已有之,只是随着底层技术的迭代,应用过程能够更加无感,同时达到较高准确度。
陈东鹏向21世纪经济报道记者分析道,早期的声纹识别技术,为了节省时间并提升用户体验,会要求用户念一段固定的文本,此后每次验证都是朗读同一段文本。
这被称为固定文本的认证方式。“但会造成两个问题,第一是用户体验不好,每次都被要求生硬地念一段文本,无法做到与用户在自然交流中无感地完成身份认证;第二是容易被录音攻击,因为每次朗读的都是同一段内容,犯罪分子有可能通过提前偷录他人的声音,然后通过录音回放攻击系统。”他进一步表示,这导致初期的技术落地会存在较大风险。
大约在2000年开始,声纹识别技术进入相对成熟期,在此期间诞生了一批老牌语音厂商,科大讯飞就在其中。
前述行业人士向记者指出,这一阶段的声纹识别技术要点在于,将录入的声音压缩成固定的矢量进行匹配,准确率已经能够达到约95%的水平,不足之处在于容易因外部干扰而影响结果,因此还没到适合商用的标准。
从2015年开始,随着AI技术的深化,不少以该项技术为背景的创业公司专门投身声纹识别领域,不仅如此,在这两年来,BAT等巨头也相继在这一领域入局。
“如今声纹识别技术的进步,得益于深度学习技术的成熟,以及传感器、麦克风、通信信道(如5G、4G VoLTE高清通话)等技术的进步。”陈东鹏介绍道,目前声扬科技的声纹识别技术可以保证在高噪声环境下声纹识别的鲁棒性、在很短时间内完成语音认证,也无需设置固定交流内容。
应用场景扩围
虽然当前已经可以在较好体验的情况下落地商用,但声纹识别技术还有更长远的路要走。
业内认为,当前阶段的声纹识别技术已经能够满足部分行业特定场景的应用需求,当然从商用门槛的成熟,到未来体验的成熟,依然有很大提升空间。
对诸多生物识别技术来说都是如此。即便是目前已经十分普及到手机端的屏下指纹识别技术,历经多年商用迭代,也依然可以在识别时间、精准度、模组大小等方面继续优化。
陈东鹏向记者坦言,声纹识别技术的下一步挑战主要包括两方面:远场识别、跨信道识别的优化。
“虽然声扬科技已经可以做到两米左右这种远场的识别,但我们的目标是做到像‘人耳’一样,可以距离很远就通过声音识别人的身份。”他进一步解释。
而所谓跨信道识别,是指早期仅能通过手机或者电脑麦克风采集信号,但未来可以进一步扩大到更多设备中。陈东鹏续称,“现在还是会受信道的影响,随着通讯技术进步、数据积累、训练模型鲁棒性更高,相信这个问题能得到更好解决。”
此次能够在金融场景落地,也与行业的积极拥抱并出台相关标准有关。
2014年公安部便首次针对声纹识别的应用技术要求和安全等级制定标准,在2019年确定了关于声纹数据库建设、信息采集指引的细化内容。
在金融行业,2018年中国人民银行发布声纹识别相关行业标准,2019年声纹识别系统还成为唯一一个入选金融科技产品认证目录的生物识别技术,为今天的探索落地奠定了基础。
前文提到的银行信用卡反欺诈场景,其应用主要是通过电话银行,在线上办理信用卡申请、启卡、尽调等环节时,远程在线建立个人声纹ID档案并为后续身份识别、欺诈风险判断提供依据。
可想而知,疫情期间对于无接触的需求突然大增,声纹识别技术也迎来更多落地机会。陈东鹏介绍,比如门禁、电梯、回访平台等,都可以用到声纹技术。“我们在疫情期间做了几款相关的产品,比如声纹门禁、远程健康回访系统,这个系统也最先被南山粤海街道办采用。”
“声纹的一大优势,是它蕴含在人们交流所需的语音当中,这些语音包含着极为丰富的个人信息,如性别、年龄、地域、环境、情绪、职业、偏好等,声纹揭示的身份信息,是将这些个人化的信息聚集在一起的中心点,这将是很多行业提供‘以用户为中心’服务所必须掌握的。”他如此总结道。
(作者:骆轶琪 )
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“融道中国”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。
延伸阅读
版权所有:融道中国