问题:
关键词:人脸识别,表情特征,离散小波变换,离散余弦变换,奇异值分解
● 参考解析
人脸识别是一种重要的生物识别技术,也是当前非常热门的一个生物特征识别领域。与其他人体生物特征识别系统相比,人脸识别系统具有更加直接、方便、友好、易于为用户所接受的优点。它涵盖了图像处理、模式识别、人工智能、计算机视觉、计算机图形学、神经网络、认知科学、生理学、心理学等诸多学科,对各个学科提出了很高的理论和技术要求。在人机交互、安全监视、机器人、身份认证等方面有着广泛的应用前景。
表情是人际交往中信息传达、情感交流不可缺少的手段,也是了解他人主观心理状态的客观指标。作为情感状态、内心活动、意图、个性的外在表现,表情传达的是一种非口头语言信息,可以帮助交谈双方更好地理解隐藏在话语下面的潜在意图,在人类个体交往过程中发挥了重要的作用。公认的基本表情分为7类:高兴(Happiness)、悲伤(Sadness)、惊讶(Surprise)、恐惧(Fear)、愤怒(Anger)、厌恶(Disgust)和中性(Neutral)表情。目前人脸表情识别率已经比较高,本文在结合人脸固有的各种表情来提高人脸在复杂条件下的识别率方面进行了初步的尝试性研究。具体研究内容可概括为:
①全面分析了人脸识别和表情识别的研究现状,简要介绍了人脸及表情特征提取方法和表情分类方法,说明了人脸识别的研究意义和应用前景。在图像预处理方面,首先介绍了常用的人脸数据库和表情数据库。接着介绍了图像预处理的两种方法:几何规范化和灰度规范化。几何规范化是通过仿射变换来实现的,常用的仿射变换包括:平移、旋转、缩放等。常用的灰度规范化包括:图像平滑、直方图均衡化、直方图规定化等。本文所用图像为标准数据库中图像,只进行了灰度规范化处理:直方图均衡化。经过直方图均衡化后的图像细节更加清晰,灰度等级分布更加均匀。
②在分析二维离散小波变换、二维离散余弦变换、奇异值分解基本原理的基础上,提出了基于DWT-DCT-SVD组合的表情识别方法,取得了良好的表情分类效果。图像为256×256像素大小,格式为tiff的灰度图像。每种表情学习样本20幅图像,测试样本30幅。不论是学习样本还是测试样本特征提取过程都是一样的。每幅图像经过两次小波变换后成为64×64大小,数据量大大降低,但没有改变原图像的主要信息部分。然后对变换后的每幅图像平均分割成4块×4块,每块为16×16像素大小的子图像,对每块子图像进行二维离散余弦变换(2DCT),由于余弦变换具有聚能作用,其能量主要集中在变换后的左上角。我们可以按“之”字形顺序(如图4-3)提取每块子图像左上角的K个DCT系数。然后按照先左后右,自上而下得到每幅图像对应的16×K的矩阵。接着对该矩阵进行奇异值分解,得到相应的奇异值特征向量,最后采用最近邻决策规则判别表情所属分类,决策时以欧氏距离作为度量标准。
③给出了基于表情特征提取的人脸识别方法。图像为112×92像素大小,格式为pgm的灰度图像。将表情识别时的每种表情20幅学习样本图像分别作为新的样本,特征提取方式同前面实验中方法一样。对人脸数据库进行识别。不论是学习样本还是测试样本,最后都转化为对应的奇异值特征向量,以欧氏距离度量它们之间的相似性。每幅图像两边各去两列像素(不影响识别),变为112×88。同样的,对每幅图像进行直方图均衡化预处理,然后进行1次小波分解,得到56×44大小的图像,然后将图像平均分割成4块×4块。每块为14×11像素大小的子图像,对每块子图像进行二维离散余弦变换(2DCT),由于余弦变换具有聚能作用,其能量主要集中在变换后的左上角。我们可以按“之”字形提取每块图像左上角的K个DCT系数,得到每幅图像对应的16×K的矩阵。接着对该矩阵进行奇异值分解,得到奇异值特征向量,最后采用欧氏距离作为度量与每种表情特征学习样本间的距离。以10幅景物图像拒识率达到80%的最大值作为阈值,来判断是否为人脸,取得了良好的识别效果。
相关内容
相关标签