声纹识别研究综述

摘 要:声纹识别是移动设备中最容易实现、最有应用性和经济性最高的生物特征。本文叙述了声纹识别的特点,历史与现状,影响声纹识别性能的因素,声纹识别系统框架的搭建,以及声纹识别的应用前景,指出声纹识别必将掀起移动设备和移动互联网新的篇章。

关键词:声纹识别;生物特征;移动设备

1前言

当今,随着移动设备以及移动互联网的发展,各种生物特征技术逐渐从国防安全领域走入移动互联网领域,比尔・盖茨说:“以人类生物特征(指纹、语音、脸相等)进行身份验证的生物识别技术,在今后数年内将成为IT产业最为重要的技术***。”

声纹识别技术是身份验证技术-生物特征识别技术的一种,与其他身份验证技术相比,声纹识别更加方便、自然,且具有比较低的用户侵犯性,这是声纹识别技术在应用上的显著优势。另外,语音的采集设备比较简单,获取语音的识别成本低廉,使用简单。现在无处不在的语音通信网络,如固定电话、移动通信和互联网等,语音的获取非常方便,这为声纹识别技术的应用提供了良好的条件。而且声纹识别技术的算法复杂度较低,这也是其他身份验证技术所不可比拟的。

2 声纹识别研究

2.1声纹识别定义

声纹识别,简单来说就是根据语音来自动识别说话人身份的技术。根据实际应用,声纹识别通常可以被划分为两种具体任务,分别为:声纹辨识(Speaker Identification)和声纹确认(Speaker Verification)[4]。

声纹辨识任务的目的是将输入的未标记的语音样本确定为一组已知的说话人中的某一个,是一对多的问题。

声纹确认的目标是确定输入的测试语音中是否存在某一声明的说话人,这是一个一对一的问题,可以被看成是一个判决结果为“True”和“False”的两类判决问题。

声纹识别按照是否受语音内容(文本)的限制又可以分为文本相关声纹识别和文本无关声纹识别。文本相关说话人识别要求说话人提供指定语音的语义内容,可以用在使用者比较配合的场合,例如关键部门的出入控制,并且语义内容(如密码)可以通过语音识别后作为说话人身份认证的补充信息来增加系统的安全系数,另外文本内容的固定,可以一定程度上提高声纹识别系统的性能;而文本无关声纹识别不关心语音的具体语义内容,这与实际应用中的大多数情况相符,但正是由于其与文本无关的特点,决定了其识别判决的难度加大,因此训练和测试时都需要较长的语音。

2.2影响声纹识别性能的因素

对于人的个体来说,随着时间的变化、年龄的增长或者健康状况的变化等,不同时间所产生的语音都会随之发生或多或少的变化,这些都是影响声纹识别的因素。我们很容易就能感受到早晨刚起床时的声音和白天工作时的声音有着些许差异,人年轻时的声音和年老时的声音差异更加明显,另外由于说话人的声音是由个人的声道决定的,当人处于生病、紧张、高兴、愤怒等不同的健康状况和心理状态时,语音也会出现与平时明显的不同,从而影响声纹识别的性能。

但是,目前的大多数的研究工作中针对的主要是另外两个影响声纹识别性能的重要因素:信道影响(譬如不同的手机麦克风的影响)和噪声影响。

2.3声纹识别系统基本框架

和大多数模式识别问题类似,声纹识别也包括两部分:注册和测试。在注册部分,需要为系统提供注册语音样本,系统从这些语音样本里提取与说话人相关的信息(特征参数),通过模型训练算法为目标人建立语音模型。在测试部分,需要待测试的说话人提供测试语音样本,系统提取测试语音的与说话人相关的特征参数,来与声明的目标人模型进行模式匹配,从而做出判决。

2.4声纹识别技术的应用

近些年来声纹识别获得了非常多的关注和广泛的应用,其重要应用主要有以下几个方面:

(1)信息安全。在通信语音数据中,对恐怖不法分子进行检索、追踪及监控,帮助安全部门快速发现有价值的迹象和情报,在危机来临之前,能够做出迅速反映,及时阻止恐怖或者非法事件的发生,维护国家安全及稳定。美国在追踪本拉登等的过程中就广泛的使用声纹识别技术。

(2)电话银行及网上用户登录等领域说话人身份核对。鉴于密码的安全性不高,为了提高安全性,还可以采取一些其他措施,如密码和声纹识别双保险,目前很多应用场景是密码+短信验证,如果使用声纹验证代替短信验证,可以节省一定的运营成本。

(3)公安司法。对于各种电话勒索、绑架、电话人身攻击等案件,声纹识别技术可以在一段录音中查找出嫌疑人或缩小侦察范围;声纹确认技术还可以在法庭上提供身份确认的旁证。

(4)***事和国防上的应用。国际***事战略通信情报收集,对国际特定的(***事单位(如美国中央情报局,联邦调查局,国家安全局等重要情报中心)和***事行***机构(各国大使馆,国家***府),重要***事研究机构,***事基地的语音通讯进行自动监控;对***府***等特定人进行监控;在通过电话发出***事指令时,可以对发出命令的人的身份进行确认(敌我指战员鉴别)。目前该技术在国外***事方面已经有所应用。

(5)保安和证件防伪。如机密场所的门禁系统。又如声纹确认技术可集成到信用卡、银行自动取款机、门、车的钥匙卡、授权使用的电脑、以及特殊通道口的身份卡上,使之成为具备自动鉴别能力的智能卡。持卡人将自己的语音信息记录在卡上,使用时持卡人只要将卡插入专用机的插口上,并读出指定密码,只有在身份确认通过后,持卡人才能进行其它操作。同样可以把含有某人语音特征的芯片嵌入到证件之中,通过上面所述的过程完成证件防伪。

(6)多媒体信息检索。随着网络和各种媒体娱乐技术的发展,人们想对对特定人的音视频内容进行快速检索,从而能够快速定位到我们感兴趣的人的节目内容。基于声纹识别技术的说话人分割、聚类技术对于在大型数据语音库和电视广播新闻中的信息查询和检索是非常有用的,使得根据说话人的身份在海量存储的多媒体数据中来检索特定的音视频片段成为可行的方法。

3总结

声纹识别作为人类生物特征识别的一个重要方向,属于人工智能的重要分支,相信在未来,随着人工智能技术的发展,会有更多的畅想空间,更多的产品服务于人类。

参考文献

[1] G. Doddington, “Speaker recognitionDIdentifying people by their voices,”Proceedings of the IEEE, vol. 73, no. 11, pp. 1651C1664, 1985.

[2] J. Campbell Jr, “Speaker recognition: A tutorial,” Proceedings of the IEEE, vol. 85, no. 9, pp. 1437C1462, 1997.

[3] D. Reynolds, T. Quatieri, and R. Dunn, “Speaker verification using adapted Gaussian mixture models,” Digital signal processing, vol. 10, no. 1-3, pp.19C41, 2000.

转载请注明出处学文网 » 声纹识别研究综述

学习

气象要素影响人体健康

阅读(26)

气象要素是表征大气状态的基本物理量和基本的天气现象,主要有大气温度、大气压力、空气湿度、风向风速、降水和太阳辐射等。气象要素的突变,直接或间接地影响着人类的生活和人体健康。气温对人体健康的影响气温是表示空气冷热程度的物理量

学习

“天下第一名楼”

阅读(18)

本文为您介绍“天下第一名楼”,内容包括天下第一名寺,天下第一名楼地理位置。花萼相辉楼代表了盛唐宫廷建筑的最高成就,在当年号称大唐第一楼,是各种庆典活动的中心,尤其是有唐玄宗与民众同欢共乐的动人故事,并展现过无数气势恢弘的宫廷乐舞

学习

浅议企业成本费用分析

阅读(24)

成本和费用是减少利润的因素,其数额高低直接影响企业的盈利能力。在营业收入一定的情况下,成本费用越低,企业利润就越高,企业盈利能力就越强。因此,降低成本,节约费用,是企业提高盈利能力的有效途径,成本费用分析是财务分析的重要内容。本文对企

学习

CLIL理念在英语写作教学中的运用

阅读(27)

通过观摩英国大学里CLIL教学模式,作者思考CLIL理念在英语写作教学中的运用,并提出一个简单的课堂设计,旨在构建丰富、积极的课堂教学环境。关键词:CLIL英语写作教学运用2009年,我赴英国西苏格兰大学实地观摩部分课程的课堂教学,也对各国留学生

学习

人生几何,醉酒当歌!

阅读(18)

本文为您介绍人生几何,醉酒当歌!,内容包括对酒当歌人生几何寓意,人生几何对酒当歌文案。人的一生,说来也真是不容易,途中有山有河,有风有浪,有高兴也有苦恼,有幸福也有悲伤,有顺达也有坎坷,有欢聚也有分离,有所得也有所失……但不管怎样,人,总得一

学习

反恐战争第二战场

阅读(24)

阿富汗战争、第二次海湾战争对于美国来说都是目标明确的速决战,而在反洗钱领域的战争则将是一场看不清对手的持久战阿富汗战争、第二次海湾战争对于美国来说都是目标明确的速决战,而在反洗钱领域的战争,则将是一场看不清对手的持久战。继阿

学习

《诗经》“彤管”意象本义新解

阅读(22)

内容《诗经・邶风・静女》所见“彤管”,历来众说纷纭,未有定谳。概言之,有四种观点影响比较大,即管笔说、管乐说、针管说和管草说。根据文字学、训诂学、植物学和民俗学等方面的线索,“管”或即“兰”,“彤管”即“红色的兰草”。关键词:《诗经

学习

炸完食物的剩油怎么处理

阅读(20)

生活中,很多人都会遇到种情况――炸完食物的剩油是丢掉呢,还是继续炒菜用?营养专家提醒消费者,油脂最好不要反复高温加热。首先,反复加热会大大加快油脂酸败的速度,而油脂酸败会让油品的味道变劣,产生刺喉的辛辣味;其次,油脂酸败的产物,如小分子

学习

AIX操作系统的安全管理与优化措施

阅读(17)

本文为您介绍AIX操作系统的安全管理与优化措施,内容包括aix操作系统常用命令,aix系统管理手册。【摘要】AIX是一种流行的操作系统,广泛应用于金融、电力、电信等行业。随着应用的不断深入,AIX的安全问题也日益突出。为此,本文从私有数据的

学习

有关夏代文字的研究

阅读(33)

文字是人们用来记录语言符号和交流思想的工具。恩格斯在《家庭、私有制和国家的起源》一书中指出:“人类从铁矿的冶炼开始,并由于文字的发明及其应用于文献记录而过渡到文明时代。”美国的亨利·摩尔根在其《古代社会》中也曾说过:“没

学习

你见过的“那话儿”

阅读(22)

几年前,黄真真拍过两部纪录片,分别是《女人那话儿》和《男人那话儿》。题目很容易让人产生联想啊,以为是部生理卫生的科教片。但事实上,人家在关注一些两性的哲学。但抛开那些沉重的话题,关于男女“那话儿”,也是大有讲究的,甚至,也是很有趣味的

学习

数量化选股——以alpha模型为例

阅读(20)

本文为您介绍数量化选股——以alpha模型为例,内容包括什么是alpha量化选股,alpha量化选股怎么样。一、引言随着资产管理学科的不断更新和发展,数量化资产管理的策略如今被广泛的运用,越来越多的基金管理人采用了这一成本较低、客观性较强

学习

成功的感觉真好

阅读(32)

成功的感觉真好陈佳雯我有一个梦想,就是在我第一次演出的时候,能够获得成功。结果,一个晴朗的星期六,我的机会终于到来了。就在静静的教室内,特长班的老师大声地告诉我们:“同学们,我们这一学期学的拉丁舞就在下一个星期六晚上演出。当然,学钢琴

学习

美国孕妇的选择

阅读(23)

她把生唐氏儿看得和生男孩女孩一样的区别,只是一种选择而已。女友的美国同事做孕期的血液检查时,医生怀疑孩子有可能是唐氏儿(先天性痴呆儿)。后来给她做了羊水穿刺,确认孩子确实是,也确定了性别,是个女孩。她在午餐时很随意地告诉了同事们这个

学习

资产剥离对公司价值的影响研究

阅读(24)

本文为您介绍资产剥离对公司价值的影响研究,内容包括负债经营对公司价值的影响讨论,上市公司剥离资产是利好还是利空。一、资产剥离概述资产剥离是指对一个部门的清理或者放弃对某一子公司的控制权,即企业将其所拥有的资产、产品线、经营

学习

描写性翻译研究及其在文学翻译批评中的应用

阅读(20)

本文为您介绍描写性翻译研究及其在文学翻译批评中的应用,内容包括小说的翻译批评与赏析,浅谈文学翻译中的比喻。本文对描写性翻译研究作了概述,指出该研究范式在研究的对象、角度、方法和目的方面分别具有宽容、宏观、实证和客观的特点,并

学习

一对一市场营销模式对旅行社传统业务流程影响的研究

阅读(18)

互联网的出现使得旅游一对一营销在网络中找到了生存的空间。因而,因特网这一新的分销渠道前途光明,一对一的旅行社营销模式将促进商务旅游和散客个性旅游市场的全面繁荣。关键词:大众营销一对一营销营销模式互联网一、旅行社市场营销从大众

学习

垂直搜索引擎系统研究与实现

阅读(17)

搜索引擎是一种互联网数据信息检索工具,它可以从复杂无序的信息中检索出用户需要的有用信息,将杂乱的信息变得有序、清晰。但由于网络上有着大量信息,搜索到的信息难免不够全面与精准,可能存在过多垃圾信息。为了很好地解决以上问题,一种新型

学习

伦理研究方式探索

阅读(27)

本文为您介绍伦理研究方式探索,内容包括伦理学探索之路论文集,伦理学专题研究。一、引言现代经济学自马歇尔尤其是罗宾斯以来,在很长的一段时间里,将伦理经济学的研究排斥在主流经济学之外,认为作为市场主体的人无需所谓的道德关怀,应该是纯

学习

SEO网站搜索引擎优化关键技术研究

阅读(22)

本文为您介绍SEO网站搜索引擎优化关键技术研究,内容包括什么是googleseo搜索引擎优化,seo搜索引擎优化重点。【摘要】在网络推广领域,搜索引擎优化就具有举足轻重的作用。通过掌握SEO技术,可以提高网站被搜索引擎捕捉质量,在检索结果中获得

学习

旅游资源开发研究

阅读(15)

本文为您介绍旅游资源开发研究,内容包括旅游资源开发研究,旅游资源开发与研究论文。当前我国居民的生活水平在不断的提升,人们对于旅游消费也更加的青睐,旅游业在国家支持和居民消费热情高涨的情况下快速发展。根据国家旅游局公布的统计数

学习

关于学前教育的研究

阅读(28)

本文为您介绍关于学前教育的研究,内容包括学前教育的政策文献,自考学前教育研究方法。笔者提出了关于学前教育几个问题的探讨,新世纪,社会的发展给学前教育注入了新的内涵,提出了更新更高地要求。因此,奠定人的全面发展的基本品质是其追求的