人脸表情识别方法研究进展

摘要:随着计算机技术的进步,人工智能与模式识别技术得到很快的发展。人脸表情识别(FER)作为智能化人机交互技术中的一个重要组成部分,有着广泛的应用前景和潜在的市场价值,近年来得到了广泛的关注。本文介绍了人脸表情识别常的用方法,并对未来的人脸表情识别发展方向进行了展望。

关键词:人脸表情识别;特征提取;表情分类

引言

心理学家Mehrabian指出,在人们的日常交流中,通过语言来传递的信息占7%,通过声音来传递的信息占38%,而通过面部表情来传递的信息则达到55%。由此可见表情信息在人们交流中的重要性。人脸表情识别是人机交互与情感计算研究的重要组成部分,涉及心理学、社会学、人类学、生命科学、认知科学、计算机科学等研究领域,对人机交互智能化和谐化极具科学意义,并将促进相关学科的发展。

20世纪70年代人们已经从心理学和生物学方面对表情识别进行了研究和分析。生物学家Darwin首先对人类和动物的面部表情进行了研究和比较,揭示了表情在不同性别、不同种族的人群中的一致性。1978年Ekman和Frisen提出面部表情编码系统(FACS),用44个运动单元(AU)来描述人脸表情变化,并定义了6种基本情感类别:惊奇、恐惧、厌恶、愤怒、高兴、悲伤。这一系统得到了广泛的认同,并成为后来很多表情识别研究工作的基础。

随着计算机技术的发展,人脸表情识别技术也逐渐发展起来。20世纪90年代,人脸表情识别成为非常活跃的研究方向。国外较为著名的研究机构有麻省理工学院、卡内基梅隆大学、匹兹堡大学、马里兰大学等。国内的研究始于20世纪90年代末,近几年很多高校和研究机构开始对人脸表情识别进行研究。本文主要针对人脸表情识别的常用方法进行了总结,并对未来的发展方向进行了展望。

1、人脸表情识别系统概述

人脸表情识别系统主要包括三个部分:人脸检测与定位、特征提取及表情分类。如***1所示。建立一个FER系统,首先要通过外部器件如摄像头等获取***像,在***像中进行人脸检测,确定输入***像中是否有人脸,在有人脸的情况下确定人脸的位置和大小。这一环节的研究已成为一个***的方向;然后对人脸进行特征提取,得到反映表情特征的关键信息。最后对得到的表情特征向量进行分类,得到表情所属的类别,如AU组合或基本表情类别。

2、表情特征提取方法

表情特征提取是人脸表情系统中最重要的部分,有效的表情特征提取工作将使识别的准确率和性能大大提高。按照***像的类型可以分为两大类:基于静态***像的表情特征提取和基于动态***像序列的表情特征提取。其中典型的特征提取方法有:主成分分析法、活动外观模型法、Gabor小波变换法,光流法等。

主元分析法(PCA)又称K-L变换,是一个非常有效的降维的方法,特征脸(Eingen Face)方法在人脸识别领域成为举足轻重的一个分支。这种方法根据像素间的二阶相关性,将包含表情人脸的***像区域看作一个随机向量,采用K-L变换得到正交变换基,其中较大的特征值对应的基底(特征脸)就组成了表情特征空间的一组基,然后利用这组基底的线性组合就可以描述、表达人脸表情。Andrew、calder[2]等详细的介绍了PCA在面部表情识别方面的应用。主成份分析现已成功用于人脸识别和表情识别,但是由于主成份分析只考虑到***像数据当中的两阶统计信息,并未利用高阶统计信息。

活动外观模型AAM是目前广泛应用的基于混合特征的特征提取方法。AAM方法结合形状和纹理信息建立对人脸的参数化描述。Edward等人用活动外观模型(AAM)来解析人脸***像和***像序列。左坤隆[3]选取70幅***像作为AAM训练集,在每幅***像标记了57个特征点,实验得到的识别率为93.5%。

近来,基于Gabor小波[3]的方法被广泛应用于人脸表情识别,它能检测多尺度、多方向的纹理变化,同时受光照影响较小。Wen在一系列手工标定的局部小区域提取平均Gabor小波系数作为纹理特征,同时引入了在人脸合成中使用的基于比例***的方法来对纹理提取区域进行预处理,以降低不同人脸差异和光照引起的人脸反照度不均的影响。Jingfu Ye[4]等采用二维Gabor小波核函数提取表情特征,分别在不同的光照环境及不同测试者的条件下提取与表情有关的Gabor小波特征。实验表明Gabor小波变换能有效地提取与表情变化有关的特征,这种特征对光照变化不敏感,且能屏蔽个人特征差异的影响。

光流是运动特征提取法中的一种,所谓光流是指亮度模式引起的表观运动,理想的情况是这种表观运动反映了实际的运动。光流场在运动估计、运动分割等领域得到广泛的应用,也是表情特征提取的一种非常有效的算法。Mase等研究表明利用光流进行运动估计,并使用面部肌肉运动模型描述了面部的运动。Cohn等提出了一种基于光流的方法,对眉毛、眼睛、嘴唇等区域的运动单元进行分辩,提出了面部的局部参数运动模型,同时构建了面部运动的中级描述,并使用启发式规则对6种表情进行了分类。光流法的缺点是受光照不匀和脸部非刚体运动等因素影响特征提取结果,且计算量较大,不适合实时处理。

3、表情分类方法

表情分类指定义一组类别,并设计相应的分类机制对表情进行识别,归入相应类别。目前用于表情分类的方法主要有人工神经网络、支持向量机和AdaBoost算法等成为主流的表情分类方法。

人工神经网络(ANN)是一种模拟人脑神经元细胞的网络结构,它是由大量简单的基本元件―神经元,相互连接成的自适应非线性动态系统。在静态***像的人脸表情识别中有很多运用。Gueorguieva使用多层感知的神经网络来进行表情识别,训练并测试了4种网络,得出S形函数和径向基函数的神经单元混合能较好地适合于前馈神经网络的结论。神经网络方法的缺点在于,需要大量的训练样本和训练时间,很难满足实时处理要求。

支持向量机(SVM)是在统计学习理论的基础上发展起来的一种分类方法,在解决小样本、非线性和高维问题上有很多优势。目前支持向量机是机器学习中应用最多的分类器之一,近年来也被应用于表情识别中。SVM算法结构简单,具有全局最优性和较好的泛化能力等优点,但其计算复杂度较高,需要大样本统计学习。

AdaBoost算法方法将多个弱分类器结合起来训练形成强分类器,不同分类器针对不同的特征,通过训练可以达到特征选择的目的,在模式识别领域如***像检索和人脸检测中都有成功的应用。Bartlett使用AdaBoost选择特征与SVM分类相结合的AdaSVM方法进行分类,取得较好的识别结果。

4、未来研究重点

人脸表情识别是一个具有挑战性的课题,尽管已经取得了很大进展,但目前仍处于研究

探索阶段,依然存在很多问题亟待解决:(1)特征提取和表情分类的方法有待改进,计算机要达到实时、自动的识别表情变化,必须在保证识别率的前提下尽可能提高识别效率;(2)某些表情易于识别,而某些表情不易识别,且多数研究仍停留在基本表情识别的研究上,但基本表情不涵盖人类的主要表情,因此需要识别更多的表情(如细微表情、混合表情、非基本表情)(3)目前的研究多是在特定条件下进行的识别,表情识别可能会因为发型、光线变化等外在条件变的困难,因此提高表情识别的鲁棒性也是当前要解决的问题。

参考文献:

1.Andrew J,Calder A, Burton M,etal,A Principal Component Analysis Of Facial Expression[J].Vision Research,2001,41(9):1179一1208.

2.左坤隆,刘文耀.基于活动外观模型的人脸表情分析与识别[J].光电子.激光,2004,15(7):853-857.

3.朱健翔,苏光大,李迎春.结合Gabor特征与Adaboost的人脸表情识别[J].光电子・激光,2006,17(8):993―998.

4.叶敬福,詹永照.基于Gabor小波变换的人脸表情特征提取[J].计算机工程.2005,31(15):172―174.

注:本文中所涉及到的***表、注解、公式等内容请以PDF格式阅读原文

转载请注明出处学文网 » 人脸表情识别方法研究进展

学习

当代大学生热衷研读“厚黑学”现象透视

阅读(24)

今天的这一类书却把李宗吾老先生唾弃的“厚黑”,捧起来加点时尚的化学原料,变成“面膜”朝今天年轻人的脸上涂。因为人到中年,我家有儿子正上大学,即将毕业走向职场,走向社会,因此,对于目前流行于社会、学校和家庭中的所谓“励志江湖”、“职场

学习

遥远的《间谍之桥》

阅读(18)

在美联航的飞机上看见新片《间谍之桥》,一下被上面的美国国旗和镰刀斧头的苏联国旗吸引了,特别是在这两个国旗之间汤姆・汉克斯那张严肃的脸。我不知道这会是一部什么样的电影,可是他一定会和冷战有关系。当一些空镜头落在纽约布鲁克林的街

学习

企业研发项目

阅读(10)

本文为您介绍企业研发项目,内容包括研发企业项目立项政策,企业研发项目完整资料。从协同创新的理论出发,认为在科技进步日新月异、计算机技术日益普及的新形势下,企业要想提高竞争力,必须进行研发项目的协同创新,即使用信息化设备和技术,通过

学习

庆祝π节吃个派

阅读(29)

π,就是圆周率。圆是无处不在的形状,简单的圆形之中,隐藏着怎样的秘密呢?公元5世纪时,我国数学家祖冲之发现,所有的圆的周长除以直径,得到的数值是一个恒定的无限不循环小数。他把这个数值推算到了小数点后7位,即3.1415927。这就是我们现在讲的

学习

传统新闻传播

阅读(20)

本文为您介绍传统新闻传播,内容包括传统的新闻传播活动的完整过程,传统信息传播的形式。在媒体的新闻传播中,媒介市场化竞争态势不断加剧,为了赢得市场竞争的优势,媒体新闻传播的内容和传播形式也在不断的改进,这其中网络媒体和传统媒体在形

学习

浅析当代高腰线服装的流行与搭配

阅读(14)

本文为您介绍浅析当代高腰线服装的流行与搭配,内容包括今年最流行的高腰衣,选择服装时候更推荐高腰款式。高腰线服装一直是服装史上一个非常重要的流行样式,在当代高腰线服装渐渐衍变出各种风格,都体现了人们对女性人体美的歌颂。就算没有

学习

集客营销:为网站创造更多的销售机会

阅读(13)

本文为您介绍集客营销:为网站创造更多的销售机会,内容包括集客营销精准方案,如何线上营销集客。除了内容营销、广告活动、SEM、社交媒体等,还有哪些集客营销渠道可以通过不断监测和客户互动,增加品牌忠诚度,提升销售机会呢?InboundMarketing

学习

中国经济发展阶段分析

阅读(114)

本文为您介绍中国经济发展阶段分析,内容包括疫情后经济发展分析最新,中国经济发展swot分析。从历史的视角即纵向维度看,新中国六十年的经济增长,超过了旧中国以往的任何一个历史时期,可以分为四个阶段和三级再生产循环。关键词:经济发展GDP

学习

肯德基“苏丹红事件”

阅读(3187)

本文为您介绍肯德基“苏丹红事件”,内容包括肯德基苏丹红处理措施,肯德基苏丹红事件简单简述。2005年2月18日,英国在食品中发现“苏丹红”,下架食品达500多种。2005年2月23日,中国国家质检总局发出紧急通知,重点检控进口产品中的“苏丹红1号

学习

教会你如何运营电商

阅读(30)

本文为您介绍教会你如何运营电商,内容包括电商运营没经验怎么入行,抖音电商运营免费培训课。在当下电商泡沫泛滥,并逐一破灭的情况下,《三双鞋》向人们揭示了成功电商不可或缺的决定因素。在运营纯粹的B2C电子商务企业的过程中会遇到很多

学习

年号、谥号、庙号的区别

阅读(31)

本文为您介绍年号、谥号、庙号的区别,内容包括清朝皇帝年号庙号和谥号,年号庙号谥号是什么意思。高中历史课本中,皇帝有着不同的叫法,如:秦始皇、汉文帝、汉武帝、唐太祖、宋太祖、唐太宗、宋高宗,明清的洪武、康熙、乾隆等。中国古代的皇帝

学习

湖南桃江县“三棒鼓”的艺术特征

阅读(95)

本文为您介绍湖南桃江县“三棒鼓”的艺术特征,内容包括湖南桃江县三棒鼓,湖南省益阳市桃江县三棒鼓。内容“三棒鼓”的流行区域以桃江县乍埠回族乡为主,是流传于马迹塘、大栗港、三堂街一带的一种走唱艺术形式。探索“三棒鼓”的历史源流

学习

舌尖上的年味

阅读(17)

本文为您介绍舌尖上的年味,内容包括舌尖上的年味文案,舌尖上的年味作文。有人说年的味道就是食物的味道。这句话一直被我奉为真理。孩子们过年期待的事莫过于三项:假期、食物和压岁钱。对于我一个“吃客”来说,年的味道永远是在舌尖上绽放

学习

公文语言中动宾结构受事宾语前置现象分析

阅读(24)

本文为您介绍公文语言中动宾结构受事宾语前置现象分析,内容包括公文中主谓结构与动宾结构,动宾短语宾语前置之类的总结。本文论述了动宾结构中受事宾语前置现象在公文语言中的大量存在性和作为句子的内嵌成分的可生成性。动宾结构受事宾

学习

轻松识别血象

阅读(26)

本文为您介绍轻松识别血象,内容包括血象报告单怎么看,血象检查什么项目。一天夜里,隔壁老王家的宝贝儿子突发高烧,这让老王手足无措。慌忙之中叩响了我的房门让我给瞧瞧。我一看:体温38.5℃,舌苔薄白,舌尖微红,咽后壁红而未肿,精神尚可,除此之外

学习

语音识别技术综述

阅读(28)

本文为您介绍语音识别技术综述,内容包括语音识别综述范文,语音识别论文综述。摘要:语音识别是以语音为研究对象,让机器通过识别和理解过程把语音信号转变为相应的文本或命令,使人机能自然地进行语音交流的技术。语音识别涉及到生理学、

学习

核壳量子点研究进展

阅读(22)

本文为您介绍核壳量子点研究进展,内容包括什么是核壳量子点,为什么要发展核壳型量子点。核壳量子点是半导体材料研究热点之一。介绍了核壳量子点各种结构及其应用,着重综述了近年来有机合成路线制备核壳量子点方法,包括高温入注法、交替离

学习

植物根系研究进展

阅读(18)

本文为您介绍植物根系研究进展,内容包括植物根系的研究方法和思路,如何促进植物根系生长。根系是植物吸收水分、养分的重要器官。根系的生长发育以及活力直接影响着植物体地上部的生长发育、营养状况。本文从根系构型研究、生理生化、细

学习

隧道振动响应研究进展

阅读(21)

本文为您介绍隧道振动响应研究进展,内容包括隧道地表沉降测量频率,隧道爆破振动范围多长。通过研究铁路隧道振动问题研究的进展得出目前研究中存在的主要问题是:计算模型不完善;缺乏对隧道结构长期动力特性的研究、对高速铁路隧道动力响应

学习

义齿基托材料―丙烯酸树脂20年研究进展

阅读(42)

本文为您介绍义齿基托材料―丙烯酸树脂20年研究进展,内容包括义齿基托树脂的调制方法,全口义齿基托用树脂好还是钢托好。甲基丙烯酸甲酯(methymethacrylate,简称MMA)义齿基托材料因其具有金属基托义齿所不能比拟的仿真美学效果、拥有各

学习

农药缓释剂研究进展概述

阅读(26)

本文为您介绍农药缓释剂研究进展概述,内容包括农药缓释剂研究进展,缓释剂农药的使用方法。农药缓释剂是目前应用比较成功的农药制剂,它的产生使传统的农药产品剂型结构发生了重大变化。综述了农药缓释剂的特点、分类,介绍了几种常见的农药

学习

激光陀螺仪的研究进展

阅读(25)

本文为您介绍激光陀螺仪的研究进展,内容包括激光导航和陀螺仪导航哪个好,激光陀螺仪发展。本文概述了激光陀螺仪的国内外发展概况、与传统机械陀螺仪相比下的优缺点、需要突破的技术及其改进方案,重点分析了激光陀螺仪的物理原理,闭锁现象