日期:2023-01-24 阅读量:0次 所属栏目:计算机网络
摘 要:视网膜的视生理功能、机制及其数学建模等一直是视觉及其应用领域的研究热点。本文对人们在视网膜的视觉生理功能研究上的发现进行了提炼和分析;对基于视网膜视生理机制的数学建模及其在图像处理/理解中的应用做了回顾和总结。首先对人们已经发现的关于视网膜在目标边缘与轮廓的提取、图像编码和运动检测等三个方面的功能及其机制进行论述,然后就视网膜功能机制的神经网络建模以及相关神经网络模型在图像处理中性能进行了分析、比较和总结,最后就视网膜的不同生理功能之间、神经网络模型与视网膜生理功能之间的关系进行了讨论。
关键词:视网膜的生理功能;数学模型;图像处理
一、引言
视网膜是位于视觉系统最前端的具备感光功能并能对所接受到的刺激信号进行初步处理的组织。它由若干层神经细胞通过不同的突触连接形成复杂的网络,完成初级的视觉功能。对视网膜(以及对整个视觉系统)进行研究一方面可以帮助人们认识视觉的机理,同时又有着广泛的工程应用背景,图像处理和识别、计算机视觉等领域的关键问题的最终解决或都将依赖于人们对生物视觉机制的揭示。揭示视觉系统的机理并从中获取有益的启示,目前仍然是计算机视觉领域既具吸引力又有挑战性的工作之一。
生物(包括人类自身)的视觉系统是视觉(图像)信号处理的一个典范。作为视觉系统信息处理的最前端,视网膜首当其冲成为脑科学等领域的研究热点之一。对视网膜的研究始于20世纪初人们对细胞认识的深入,如H. Fer. Hartline于1938年首先明确了感受野(receptive field)的概念和侧抑制(lateral inhibition)机制,1953年Stephen Kufler对感受野的定义作出了更精细的描述并阐述了猫眼视网膜神经节细胞(ganglion cell)感受的同心圆模型。1962年David Hubel和Torsten Wiesel揭示了感受野高度依赖于所采用的视觉刺激图形的特性,这对感受野的定义产生了重要影响。1966年,Enroth-Cugell和Robson把神经节细胞分为X-cell和Y-cell等等。
二、视网膜的视觉信息加工功能综述
视网膜起源于前脑的一小块胚胎组织,因此被认为是脑组织的一部分而又被称为外周脑,它大约包括了十层细胞,这十层细胞构成了一个复杂的细胞网络,具有初步的视觉信息处理功能。迄今为止,人们已经发现视网膜具有边沿提取、预编码以及运动检测等三大功能,现分别简述如下。
2.1 视网膜的目标边缘和轮廓提取功能
边沿与轮廓提取在图形—背景分离乃至整个生物视觉过程中都起着非常关键的作用。在视觉系统中,视网膜对于图像边缘的提取能够达到非常高的精度,研究表明这是因为人的视网膜中存在着的大量的分层排列的视觉细胞和存在于层内细胞之间侧抑制作用。Hartline及其同事对鲎鱼的复眼进行了30年的细致研究,在鲎鱼的视觉系统中发现了侧抑制机制,成功地解释了马赫带等一系列视觉现象。在视觉信号的预处理和传输阶段,侧抑制原理被认为起着关键性的作用。侧抑制使得光照较亮区域中强烈兴奋的感受器对光照较暗区域中兴奋较低的感受器所施加的抑制作用要比后者对前者的抑制作用强,因此视网膜影像中陡的强度梯度——边缘/边界就被凸显出来。
2.2 视网膜的图像编码、预编码功能
物质世界是由离散的物体所组成的,这些物体表面的反射率都相当地一致,因此无论是在空间上还是在时间上相邻的两个图像点都有着非常相似的亮度。这些冗余信息使得视网膜高效地编码视觉图像。视网膜的编码功能是由神经节细胞来完成的。视网膜中许多类型的神经节细胞所具有的中心-周围拮抗式同心圆结构感受野是视网膜具有编码功能的物质基础,这种同心圆结构使得视觉系统能充分利用自然景象中空间相关性将固有噪声的影响降到最低来编码空间信息——即利用感受野中心亮度与周围亮度的对比关系,通过细胞间的侧抑制作用使得神经节细胞剔除冗余信息而只编码有用的信息。
2.3 视网膜的目标运动检测功能
实现对运动目标的检测是视觉系统的重要功能之一。研究发现这一过程是由视网膜来完成的,因为视网膜中存在着这样的一群神经节细胞:当这些神经节细胞感受野的中心与周围的激励具有不同的运动轨迹(即相对运动)时感受野的中心就具有检测运动的能力,并且这些细胞对相对运动的选择性是不依赖于相对运动的方向。
三、视网膜视神经机制的数学建模及其在图像处理中的应用
尽管目前人们对视网膜的生理功能及其机制还不完全清楚,但关于视网膜的一系列发现给我们理解和应用视觉机制提供了非常宝贵和有益的启示。本节将就人们在视网膜的视觉机制建模方面的研究做一简单回顾。
3.1 视网膜边缘和轮廓提取模型
目前人们就基于视网膜中细胞间的侧抑制机制和无意识眼球运动特性建立了如下视网膜模型。图像的边缘检测和轮廓提取一直是图像信息处理中的重要研究内容,而基于侧抑制理论的边缘与轮廓提取模型是人们研究的重要内容之一。根据侧抑制作用具体方式的不同,侧抑制作用的数学模型可以分为减法型和分流型两类。
1965年,Rodieck定量地分析了猫的视网膜神经节细胞对光刺激反应的时间特性,建立了如下神经节细胞感受野的减法型数学模型:
(1)
其中,对应感受野的中心位置,和分别表示兴奋和抑制权重,和分别为同心圆结构感受野中心区和周围区的半径。
1966年,Enroth-Cugell和Robson运用Rodieck提出的减法型数学模型来计算细胞的正弦激励的空间频率响应,基于其特性建立起来的频率分析方法在今后的几十年中的工程应用领域(系统理论、滤波和控制论等)方面得到了广泛的应用。
2009年,Francisco Barranco等将视网膜减法型数学模型和多尺度与等级序列编码计算结合的方法来对运动信息进行估计,该方法不仅能准确的检测到目标运动,而且还能检测到运动目标的颜色和纹理等信息。
Sperling在1970年提出了具有分流型抑制机制的模型,该模型可用下式微分方程表示:
(2)
式中为空间中任意一点在时间时刻的兴奋输入,为抑制输入,为输出。该模型能够很好地说明视网膜具有的某些非线性特性,用该模型在处理平面图像时能够得到类似马赫带的响应,因而对于图像边缘的增强和检测很有帮助。
2004年,陈薇薇等根据细胞神经网络(CNN)理论,提出了一种具有分流型抑制机制的视网膜神经细胞网络模型(SIRCNN),
并将其运用到图像边缘检测中,试验证明,与传统方法如Sobel算子和Prewitt算子等边缘检测方法相比较,在保持边缘信息及边缘的连贯性方面都取得了非常好的效果。
2007年,András Róka等人提出了一种基于无意识视网膜—眼球系统运动的视网膜边缘检测模型——它通过运用生物视觉系统中的眼睛无意识运动来实现由非重叠感受野结构而引起的信息丢失补偿。在非重叠模型中,输入图像用表示,神经节细胞的感受野用滤波矩阵表示,和分别表示传统的以卷积为基础和以非重叠滤波方式得到的输出,若输入为二维图像,则输入输出关系可用如下公式表示:
, (3)
通过这种方法,每一个输出像素通过运动特性从相邻像素中提取边缘信息。与静态非重叠方法相比,运动非重叠方法使包含在输入图像中的轮廓信息不丢失并被整合到输出图像中,这就使得输出图像包含了必要的轮廓信息以完成更进一步图像处理任务。
该模型的基本原理与上一节提出模型的基本原理是完全不同的:前者是运用生物视觉系统中眼睛的无意识抖动通过时间来补偿重叠的缺乏,调和了视网膜生理学与重叠结构算法之间的矛盾的边缘检测算法;而后者是以侧抑制理论为基础的。
3.2 视网膜编码的数学模型
视觉信息由视神经传达到大脑,试验研究发现视网膜中大约有1.3亿个由杆体细胞和椎体细胞形成的神经突触,而视神经突出大约只有0.012亿个,这一事实表明视网膜具有压缩信息的能力——即编码功能。
1982年,M. V. Srinivasan等提出了一个基于视网膜细胞间的侧抑制作用和图像空间相关性的视网膜编码模型,利用感受野中心亮度与周围亮度的对比关系,通过细胞间的侧抑制作用使得神经节细胞剔除冗余信息而只编码有用的信息。
2005年,Toshihiko Hosoya等在M. V. Srinivasan等的理论基础上,通过试验发现神经节细胞对激励的方向和时间、时间—空间结构都有着适应性,提出了反Hebbian视网膜模型,该模型详细的描述了神经节细胞所具有的中心-周围拮抗式同心圆感受野结构, 可用如下数学公式表示:
(4)
式中为双极细胞的响应,为神经节细胞的响应,为抑制参数,为兴奋参数,兴奋性突触通过给神经节细胞一个兴奋值,抑制性突触根据输入激励的类型通过来削弱或增强这个兴奋值,从而得到神经节细胞的总响应。
2006年,Eizaburo Doi等提出了关于视网膜小型神经节细胞编码的理论模型。他们认为视网膜中小型神经节细胞的计算目标是表示原始的、没被干扰的图像信号的最大数量的视觉信息,使之适应于有限的编码精度和神经元数量。该模型可以看做是Wiener 滤波和鲁棒编码的结合体,它的一个重要特征是能最佳利用任意一组数量的神经元来保存最大数量的信号信息。
3.3 视网膜运动检测数学模型
2008年Stephen A. Baccus等提出了计算运动目标的视网膜电路。完成这种计算的视网膜细胞由某些双极细胞、无长突细胞和神经节细胞组成,可由如下数学模型表示:
(5)
式中为OMS(Object Motion Sensitive)神经节细胞对相对运动的预测响应;
为非线性转换函数;
为激励在时刻的点亮度值;
为产生最佳预测转换系数;
为双极细胞在点时间的响应;
为最优增益因子;
为无长突细胞的膜电位(其值介于0到1之间)。
当目标的运动轨迹和背景的运动轨迹相同时,对背景区域响应的无长突细胞对神经节细胞的抑制作用增强(无长突细胞的膜电位值增大接近于1),这时非线性转换函数中自变量的值小于其最低门限值,使得非线性转换函数的函数值为零,也即神经节细胞的响应为零;当目标的运动轨迹和背景的运动轨迹不相同即存在相对运动时,无长突细胞对神经节细胞的抑制作用减弱(无长突细胞的膜电位值减小接近于0),这时非线性转换函数中自变量的值大于其最低门限值,非线性转换函数的函数值不为零,神经节细胞有响应。
四、小结与讨论
对人类以及其它生物视觉系统的功能和机制进行研究无论是在工程还是科学上都有重要意义,在图像处理、模式识别、计算机视觉、机器人技术等领域具有广泛的应用前景。视网膜作为视觉系统信息处理的最前端,是视觉及其应用领域研究的热点之一。
今天,虽然人们在视网膜的生理功能和数学建模上已经取得了一系列的研究成果,但远未达到令人们满意的程度。生物视觉系统的功能和结构都极其复杂,以目前的技术条件要弄清楚其中的大部分细节还存在着巨大的挑战;但人们对包括视网膜在内的视觉系统的认识正在日益深入,而且随着技术手段的不断进步,这种深入的程度和速度必将日益加快,终有一天,脑科学和计算机视觉等学科的相互促进和发展会为我们揭开视觉系统神经机制的神秘面纱。
参考文献:
David H., Hubel, “EVOLUTION OF IDEAS ON THE PRIMARY VISUAL CORTEX, 1955-1978:A BIASED HISTORICAL ACCOUNT”, Bioscience Reports, 2(7): 435~469,1982; 本文链接:http://www.qk112.com/lwfw/jsjlw/jsjwl/238426.html
上一篇:谈中职计算机教学方法的优化
下一篇:基于关键词集合的关联网络构建探讨