当前位置:问答库>论文摘要

问题:

题目:SpikeNet的研究及其在图像识别中的应用

关键词:机器视觉、SpikeNet、排序编码、前馈式神经网络

参考答案:

  参考解析


随着数字图像技术的不断发展,图像识别及智能化技术显得越来越重要。现代机器视觉的研究核心主要集中在对图像的识别率和识别速度这两大问题上。在诸多的识别技术中,神经网络应用了数学方法模拟人脑思维的决策过程,从而实现目标的识别,代表了图像识别的前沿技术。
本文研究的SpikeNet被称为新一代神经网络。是一个用于模拟大型神经网络的模拟器,它可以使用有限的参数来模拟神经元的各种特征(如阈值,敏感系数等)。SpikeNet中运用了基于激发(spike)原理的排序编码(rank order coding)的编码模式来管理其大量的神经元,以异步神经传导的方式对神经元中的信息进行处理,在速度上达到实时的神经计算,进而在机器视觉中实现实时目标识别。
本文系统的对SpikeNet网络进行了研究,主要目的在于根据电生理学的研究成果,通过计算机构造与人脑相似的神经元及其网络拓扑结构来模拟人脑的思维过程,进而学习人脑对外界事物的反应过程,实现对图像中的兴趣区域识别和智能处理。
本中的主要研究内容和成果如下:
(1)在神经网络设计上,可以采用简单的前馈式网络,每一层通过不同的映射才筛选激发的神经元。训练方法上根据神经元的特点和排序编码的原理一层层向前逐次设定网络权值,基本原理是:设定的权值顺序只有和特定的神经元相匹配时,神经元最容易激发(fire)。
(2)以人脸的定位和识别为例来描述面向图像的SpikeNet的设计方法。其中,人脸定位实验中,采用的是四层的前馈式网络,采用图片的像素值为参考权值,而在人脸识别实验中,采用的是三层前馈式网络,采用网络训练学习的方法获取权值。在相关实验中,分别介绍了这两种网络的设计以及实验的流程和结果。
(3)针对路牌识别的需求,本文将SpikeNet应用于路牌分类识别,在系统设计上,采用了两套SpikeNet网络。前者主要用于对路牌图像的分类,通过分类后的图像再放入各自的神经网络中识别。这样做的主要目的是为了提高图像的识别率。在众多的图像中,内部有相似图案的比较多,因而需要首先通过对外形的鉴别来对路牌归类,即判断其为警示标志,还是禁令标志,或者指示标志,然后再对其通过蒙板,去除外形的共同性,从而单个识别。后者重复第一个SpikeNet网络的工作,获取识别结果。识别过程和分类过程的区别仅限于最后的网络权值是根据不同的样本训练而成,因而识别结果不同。
综上所述,本文详细的描述了SpikeNet思想在图像处理中的应用方法与策略,并首次创新的应用SpikeNet网络构建了路牌识别系统。我们对84种特征路牌在不同亮对比度和噪声情况下共1680张图片做了一系列的测试,实验结果证明,我们的系统能很好地克服对比度和噪声的影响,获得比较理想的实验效果。

在线 客服