时间:2023-04-03 10:03:26
引言:寻求写作上的突破?我们特意为您精选了12篇图像处理技术论文范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
1.引言
近20多年来,医学影像已成为医学技术中发展最快的领域之一,其结果使临床医生对人体内部病变部位的观察更直接、更清晰,确诊率也更高。20世纪70年代初,X-CT的发明曾引发了医学影像领域的一场革命,与此同时,核磁共振成像象(MRI:MagneticResonanceImaging)、超声成像、数字射线照相术、发射型计算机成像和核素成像等也逐步发展。计算机和医学图像处理技术作为这些成像技术的发展基础,带动着现代医学诊断正产生着深刻的变革。各种新的医学成像方法的临床应用,使医学诊断和治疗技术取得了很大的进展,同时将各种成像技术得到的信息进行互补,也为临床诊断及生物医学研究提供了有力的科学依据。
在目前的影像医疗诊断中,主要是通过观察一组二维切片图象去发现病变体,往往需要借助医生的经验来判定。至于准确的确定病变体的空间位置、大小、几何形状及与周围生物组织的空间关系,仅通过观察二维切片图象是很难实现的。因此,利用计算机图象处理技术对二维切片图象进行分析和处理,实现对人体器官、软组织和病变体的分割提取、三维重建和三维显示,可以辅助医生对病变体及其它感兴趣的区域进行定性甚至定量的分析,可以大大提高医疗诊断的准确性和可靠性。此外,它在医疗教学、手术规划、手术仿真及各种医学研究中也能起重要的辅助作用。
本文对医学图像处理技术中的图像分割、纹理分析、图像配准和图像融合技术的现状及其发展进行了综述。
2.医学图像三维可视化技术
2.1三维可视化概述
医学图像的三维可视化的方法很多,但基本步骤大体相同,如图.。从#$/&’(或超声等成像系统获得二维断层图像,然后需要将图像格式(如0(#1&)转化成计算机方便处理的格式。通过二维滤波,减少图像的噪声影响,提高信噪比和消除图像的尾迹。采取图像插值方法,对医学关键部位进行各向同性处理,获得体数据。经过三维滤波后,不同组织器官需要进行分割和归类,对同一部位的不同图像进行配准和融合,以利于进一步对某感兴趣部位的操作。根据不同的三维可视化要求和系统平台的能力,选择不同的方法进行三维体绘制,实现三维重构。
2.2关键技术:
图像分割是三维重构的基础,分割效果直接影像三维重构的精确度。图像分割是将图像分割成有意义的子区域,由于医学图像的各区域没有清楚的边界,为了解决在医学图像分割中遇到不确定性的问题,引入模糊理论的模糊阀值、模糊边界和模糊聚类等概念。快速准确的分离出解剖结构和定位区域位置和形状,自动或半自动的图像分割方法是非常重要的。在实际应用中有聚类法、统计学模型、弹性模型、区域生长、神经网络等适用于医学图像分割的具体方法。
由于可以对同一部位用不同的成像仪器多次成像,或用同一台仪器多次成像,这样产生了多模态图像。多模态图像提供的信息经常相互覆盖和具有互补性,为了综合使用多种成像模式以提供更全面的信息,需要对各个模态的原始图像进行配准和数据融合,其整个过程称为数据整合。整合的第一步是将多个医学图像的信息转换到一个公共的坐标框架内的研究,使多幅图像在空间域中达到几何位置的完全对应,称为三维医学图像的配准问题。建立配准关系后,将多个图像的数据合成表示的过程,称为融合。在医学应用中,不同模态的图像还提供了不互相覆盖的结构互补信息,比如,当CT提供的是骨信息,MRI提供的关于软组织的信息,所以可以用逻辑运算的方法来实现它们图像的合成。
当分割归类或数据整合结束后,对体数据进行体绘制。体绘制一般分为直接体绘制和间接体绘制,由于三维医学图像数据量很大,采用直接体绘制方法,计算量过重,特别在远程应用和交互操作中,所以一般多采用间接体绘制。在图形工作站上可以进行直接体绘制,近来随着计算机硬件快速发展,新的算法,如三维纹理映射技术,考虑了计算机图形硬件的特定功能及体绘制过程中的各种优化方法,从而大大地提高了直接体绘制的速度。体绘制根据所用的投影算法不同加以分类,分为以对象空间为序的算法(又称为体素投影法)和以图像空间为序的算法!又称为光线投射法",一般来说,体素投影法绘制的速度比光线投射法快。由于三维医学图像的绘制目的在于看见内部组织的细节,真实感并不是最重要的,所以在医学应用中的绘制要突出特定诊断所需要的信息,而忽略无关信息。另外,高度的可交互性是三维医学图像绘制的另一个要求,即要求一些常见操作,如旋转,放大,移动,具有很好的实时性,或至少是在一个可以忍受的响应时间内完成。这意味着在医学图像绘制中,绘制时间短的可视化方法更为实用。
未来的三维可视化技术将与虚拟现实技术相结合,不仅仅是获得体数据的工具,更主要的是能创造一个虚拟环境。
3.医学图像分割
医学图像分割就是一个根据区域间的相似或不同把图像分割成若干区域的过程。目前,主要以各种细胞、组织与器官的图像作为处理的对象,图像分割技术主要基于以下几种理论方法。
3.1基于统计学的方法
统计方法是近年来比较流行的医学图像分割方法。从统计学出发的图像分割方法把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,观察到的图像是对实际物体做了某种变换并加入噪声的结果,因而要正确分割图像,从统计学的角度来看,就是要找出以最大的概率得到该图像的物体组合。用吉布斯(Gibbs)分布表示的Markov随机场(MRF)模型,能够简单地通过势能形式表示图像像素之间的相互关系,因此周刚慧等结合人脑MR图像的空间关系定义Markov随机场的能量形式,然后通过最大后验概率(MAP)方法估计Markov随机场的参数,并通过迭代方法求解。层次MRF采用基于直方图的DAEM算法估计标准有限正交混合(SFNM)参数的全局最优值,并基于MRF先验参数的实际意义,采用一种近似的方法来简化这些参数的估计。林亚忠等采用的混合金字塔Gibbs随机场模型,有效地解决了传统最大后验估计计算量庞大和Gibbs随机场模型参数无监督及估计难等问题,使分割结果更为可靠。
3.2基于模糊集理论的方法
医学图像一般较为复杂,有许多不确定性和不精确性,也即模糊性。所以有人将模糊理论引入到图像处理与分析中,其中包括用模糊理论来解决分割问题。基于模糊理论的图形分割方法包括模糊阈值分割方法、模糊聚类分割方法等。模糊阈值分割技术利用不同的S型隶属函数来定义模糊目标,通过优化过程最后选择一个具有最小不确定性的S函数,用该函数表示目标像素之间的关系。这种方法的难点在于隶属函数的选择。模糊C均值聚类分割方法通过优化表示图像像素点与C各类中心之间的相似性的目标函数来获得局部极大值,从而得到最优聚类。Venkateswarlu等[改进计算过程,提出了一种快速的聚类算法。
3.2.1基于模糊理论的方法
模糊分割技术是在模糊集合理论基础上发展起来的,它可以很好地处理MR图像内在的模糊性和不确定性,而且对噪声不敏感。模糊分割技术主要有模糊阈值、模糊聚类、模糊边缘检测等。在各种模糊分割技术中,近年来模糊聚类技术,特别是模糊C-均值(FCM)聚类技术的应用最为广泛。FCM是一种非监督模糊聚类后的标定过程,非常适合存在不确定性和模糊性特点的MR图像。然而,FCM算法本质上是一种局部搜索寻优技术,它的迭代过程采用爬山技术来寻找最优解,因此容易陷入局部极小值,而得不到全局最优解。近年来相继出现了许多改进的FCM分割算法,其中快速模糊分割(FFCM)是最近模糊分割的研究热点。FFCM算法对传统FCM算法的初始化进行了改进,用K-均值聚类的结果作为模糊聚类中心的初值,通过减少FCM的迭代次数来提高模糊聚类的速度。它实际上是两次寻优的迭代过程,首先由K-均值聚类得到聚类中心的次最优解,再由FCM进行模糊聚类,最终得到图像的最优模糊分割。
3.2.2基于神经网络的方法
按拓扑机构来分,神经网络技术可分为前向神经网络、反馈神经网络和自组织映射神经网络。目前已有各种类型的神经网络应用于医学图像分割,如江宝钏等利用MRI多回波性,采用有指导的BP神经网络作为分类器,对脑部MR图像进行自动分割。而Ahmed和Farag则是用自组织Kohenen网络对CT/MRI脑切片图像进行分割和标注,并将具有几何不变性的图像特征以模式的形式输入到Kohenen网络,进行无指导的体素聚类,以得到感兴趣区域。模糊神经网络(FNN)分割技术越来越多地得到学者们的青睐,黄永锋等提出了一种基于FNN的颅脑MRI半自动分割技术,仅对神经网络处理前和处理后的数据进行模糊化和去模糊化,其分割结果表明FNN分割技术的抗噪和抗模糊能力更强。
3.2.3基于小波分析的分割方法
小波变换是近年来得到广泛应用的一种数学工具,由于它具有良好的时一频局部化特征、尺度变化特征和方向特征,因此在图像处理上得到了广泛的应用。
小波变换和分析作为一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测,典型的有如Mallat小波模极大值边缘检测算法[6
3.3基于知识的方法
基于知识的分割方法主要包括两方面的内容:(1)知识的获取,即归纳提取相关知识,建立知识库;(2)知识的应用,即有效地利用知识实现图像的自动分割。其知识来源主要有:(1)临床知识,即某种疾病的症状及它们所处的位置;(2)解剖学知识,即某器官的解剖学和形态学信息,及其几何学与拓扑学的关系,这种知识通常用图谱表示;(3)成像知识,这类知识与成像方法和具体设备有关;(4)统计知识,如MI的质子密度(PD)、T1和T2统计数据。Costin等提出了一种基于知识的模糊分割技术,首先对图像进行模糊化处理,然后利用相应的知识对各组织进行模糊边缘检测。而谢逢等则提出了一种基于知识的人脑三维医学图像分割显示的方法。首先,以框架为主要表示方法,建立完整的人脑三维知识模型,包含脑组织几何形态、生理功能、图像灰度三方面的信息;然后,采用“智能光线跟踪”方法,在模型知识指导下直接从体积数据中提取并显示各组织器官的表面。
3.4基于模型的方法
该方法根据图像的先验知识建立模型,有动态轮廓模型(ActiveContourModel,又称Snake)、组合优化模型等,其中Snake最为常用。Snake算法的能量函数采用积分运算,具有较好的抗噪性,对目标的局部模糊也不敏感,但其结果常依赖于参数初始化,不具有足够的拓扑适应性,因此很多学者将Snake与其它方法结合起来使用,如王蓓等利用图像的先验知识与Snake结合的方法,避开图像的一些局部极小点,克服了Snake方法的一些不足。Raquel等将径向基网络(RBFNNcc)与Snake相结合建立了一种混合模型,该模型具有以下特点:(1)该混合模型是静态网络和动态模型的有机结合;(2)Snake的初始化轮廓由RBFNNcc提供;(3)Snake的初始化轮廓给出了最佳的控制点;(4)Snake的能量方程中包含了图像的多谱信息。Luo等提出了一种将livewire算法与Snake相结合的医学图像序列的交互式分割算法,该算法的特点是在少数用户交互的基础上,可以快速可靠地得到一个医学图像序列的分割结果。
由于医学图像分割问题本身的困难性,目前的方法都是针对某个具体任务而言的,还没有一个通用的解决方法。综观近几年图像分割领域的文献,可见医学图像分割方法研究的几个显著特点:(1)学者们逐渐认识到现有任何一种单独的图像分割算法都难以对一般图像取得比较满意的结果,因而更加注重多种分割算法的有效结合;(2)在目前无法完全由计算机来完成图像分割任务的情况下,半自动的分割方法引起了人们的广泛注意,如何才能充分利用计算机的运算能力,使人仅在必要的时候进行必不可少的干预,从而得到满意的分割结果是交互式分割方法的核心问题;(3)新的分割方法的研究主要以自动、精确、快速、自适应和鲁棒性等几个方向作为研究目标,经典分割技术与现代分割技术的综合利用(集成技术)是今后医学图像分割技术的发展方向。
4.医学图像配准和融合
医学图像可以分为解剖图像和功能图像2个部分。解剖图像主要描述人体形态信息,功能图像主要描述人体代谢信息。为了综合使用多种成像模式以提供更全面的信息,常常需要将有效信息进行整合。整合的第一步就是使多幅图像在空间域中达到几何位置的完全对应,这一步骤称为“配准”。整合的第二步就是将配准后图像进行信息的整合显示,这一步骤称为“融合”。
在临床诊断上,医生常常需要各种医学图像的支持,如CT、MRI、PET、SPECT以及超声图像等,但无论哪一类的医学图像往往都难以提供全面的信息,这就需要将患者的各种图像信息综合研究19],而要做到这一点,首先必须解决图像的配准(或叫匹配)和融合问题。医学图像配准是确定两幅或多幅医学图像像素的空间对应关系;而融合是指将不同形式的医学图像中的信息综合到一起,形成新的图像的过程。图像配准是图像融合必需的预处理技术,反过来,图像融合是图像配准的一个目的。
4.1医学图像配准
医学图像配准包括图像的定位和转换,即通过寻找一种空间变换使两幅图像对应点达到空间位置上的配准,配准的结果应使两幅图像上所有关键的解剖点或感兴趣的关键点达到匹配。20世纪90年代以来,医学图像配准的研究受到了国内外医学界和工程界的高度重视,1993年Petra等]综述了二维图像的配准方法,并根据配准基准的特性,将图像配准的方法分为两大类:基于外部特征(有框架)的图像配准和基于内部特征(无框架)的图像配准。基于外部特征的方法包括立体定位框架法、面膜法及皮肤标记法等。基于外部特征的图像配准,简单易行,易实现自动化,能够获得较高的精度,可以作为评估无框架配准算法的标准。但对标记物的放置要求高,只能用于同一患者不同影像模式之间的配准,不适用于患者之间和患者图像与图谱之间的配准,不能对历史图像做回溯性研究。基于内部特征的方法是根据一些用户能识别出的解剖点、医学图像中相对运动较小的结构及图像内部体素的灰度信息进行配准。基于内部特征的方法包括手工交互法、对应点配准法、结构配准法、矩配准法及相关配准法。基于内部特征的图像配准是一种交互性方法,可以进行回顾性研究,不会造成患者不适,故基于内部特征的图像配准成为研究的重点。
近年来,医学图像配准技术有了新的进展,在配准方法上应用了信息学的理论和方法,例如应用最大化的互信息量作为配准准则进行图像的配准,在配准对象方面从二维图像发展到三维多模医学图像的配准。例如Luo等利用最大互信息法对CT-MR和MR-PET三维全脑数据进行了配准,结果全部达到亚像素级配准精度。在医学图像配准技术方面引入信号处理技术,例如傅氏变换和小波变换。小波技术在空间和频域上具有良好的局部特性,在空间和频域都具有较高的分辨率,应用小波技术多分辨地描述图像细貌,使图像由粗到细的分级快速匹配,是近年来医学图像配准的发展之一。国内外学者在这方面作了大量的工作,如Sharman等提出了一种基于小波变换的自动配准刚体图像方法,使用小波变换获得多模图像特征点然后进行图像配准,提高了配准的准确性。另外,非线性配准也是近年来研究的热点,它对于非刚性对象的图像配准更加适用,配准结果更加准确。
目前许多医学图像配准技术主要是针对刚性体的配准,非刚性图像的配准虽然已经提出一些解决的方法,但同刚性图像相比还不成熟。另外,医学图像配准缺少实时性和准确性及有效的全自动的配准策略。向快速和准确方面改进算法,使用最优化策略改进图像配准以及对非刚性图像配准的研究是今后医学图像配准技术的发展方向。
4.2医学图像融合
图像融合的主要目的是通过对多幅图像间的冗余数据的处理来提高图像的可读性,对多幅图像间的互补信息的处理来提高图像的清晰度。不同的医学影像设备获取的影像反映了不同的信息:功能图像(SPECT、PET等)分辨率较差,但它提供的脏器功能代谢和血液流动信息是解剖图像所不能替代的;解剖图像(CT、MRI、B超等)以较高的分辨率提供了脏器的解剖形态信息,其中CT有利于更致密的组织的探测,而MRI能够提供软组织的更多信息。多模态医学图像的融合把有价值的生理功能信息与精确的解剖结构结合在一起,可以为临床提供更加全面和准确的资料。
医学图像的融合可分为图像融合的基础和融合图像的显示。(1)图像融合的基础:目前的图像融合技术可以分为2大类,一类是以图像像素为基础的融合法;另一类是以图像特征为基础的融合方法。以图像像素为基础的融合法模型可以表示为:
其中,为融合图像,为源图像,为相应的权重。以图像特征为基础的融合方法在原理上不够直观且算法复杂,但是其实现效果较好。图像融合的步骤一般为:①将源图像分别变换至一定变换域上;②在变换域上设计一定特征选择规则;③根据选取的规则在变换域上创建融合图像;④逆变换重建融合图像。(2)融合图像的显示:融合图像的显示方法可分成2种:空间维显示和时间维显示。
目前,医学图像融合技术中还存在较多困难与不足。首先,基本的理论框架和有效的广义融合模型尚未形成。以致现有的技术方法还只是针对具体病症、具体问题发挥作用,通用性相对较弱。研究的图像以CT、MRI、核医学图像为主,超声等成本较低的图像研究较少且研究主要集中于大脑、肿瘤成像等;其次,由于成像系统的成像原理的差异,其图像采集方式、格式以及图像的大小、质量、空间与时间特性等差异大,因此研究稳定且精度较高的全自动医学图像配准与融合方法是图像融合技术的难点之一;最后,缺乏能够客观评价不同融合方法融合效果优劣的标准,通常用目测的方法比较融合效果,有时还需要利用到医生的经验。
在图像融合技术研究中,不断有新的方法出现,其中小波变换在图像融合中的应用,基于有限元分析的非线性配准以及人工智能技术在图像融合中的应用将是今后图像融合研究的热点与方向。随着三维重建显示技术的发展,三维图像融合技术的研究也越来越受到重视,三维图像的融合和信息表达,也将是图像融合研究的一个重点。
5.医学图像纹理分析
一般认为图像的纹理特征描述物体表面灰度或颜色的变化,这种变化与物体自身属性有关,是某种纹理基元的重复。Sklansky早在1978年给出了一个较为适合于医学图像的纹理定义:“如果图像的一系列固有的统计特性或其它的特性是稳定的、缓慢变化的或者是近似周期的,那么则认为图像的区域具有不变的纹理”。纹理的不变性即指纹理图像的分析结果不会受到旋转、平移、以及其它几何处理的影响。目前从图像像素之间的关系角度,纹理分析方法主要包括以下几种。
5.1统计法
统计分析方法主要是基于图像像素的灰度值的分布与相互关系,找出反映这些关系的特征。基本原理是选择不同的统计量对纹理图像的统计特征进行提取。这类方法一般原理简单,较易实现,但适用范围受到限制。该方法主要适合医学图像中那些没有明显规则性的结构图像,特别适合于具有随机的、非均匀性的结构。统计分析方法中,最常用的是共生矩阵法,其中有灰度共生矩阵(graylevelco-occurrencematrix,GLCM)和灰度—梯度共生矩阵。杜克大学的R.Voracek等使用GLCM对肋间周边区提取的兴趣区(regionofinterest,ROI)进行计算,测出了有意义的纹理参数。另外,还有长游程法(runlengthmatrix,RLM),其纹理特征包括短游程优势、长游程优势、灰度非均匀化、游程非均匀化、游程百分比等,长游程法是对图像灰度关系的高阶统计,对于给定的灰度游程,粗的纹理具有较大的游程长度,而细的纹理具有较小的游程长度。
5.2结构法
结构分析方法是分析纹理图像的结构,从中获取结构特征。结构分析法首先将纹理看成是有许多纹理基元按照一定的位置规则组成的,然后分两个步骤处理(1)提取纹理基元;(2)推论纹理基元位置规律。目前主要用数学形态学方法处理纹理图像,该方法适合于规则和周期性纹理,但由于医学图像纹理通常不是很规则,因此该方法的应用也受到限制,实际中较少采用。
5.3模型法
模型分析方法认为一个像素与其邻域像素存在某种相互关系,这种关系可以是线性的,也可以是符合某种概率关系的。模型法通常有自回归模型、马尔科夫随机场模型、Gibbs随机场模型、分形模型,这些方法都是用模型系数来表征纹理图像,其关键在于首先要对纹理图像的结构进行分析以选择到最适合的模型,其次为如何估计这些模型系数。如何通过求模型参数来提取纹理特征,进行纹理分析,这类方法存在着计算量大,自然纹理很难用单一模型表达的缺点。
5.4频谱法
频谱分析方法主要基于滤波器理论,包括傅立叶变换法、Gabor变换法和小波变换法。
1973年Bajcsy使用傅立叶滤波器方法分析纹理。Indhal等利用2-D快速傅立叶变换对纹理图像进行频谱分析,从而获得纹理特征。该方法只能完成图像的频率分解,因而获得的信息不是很充分。1980年Laws对图像进行傅氏变换,得出图像的功率谱,从而提取纹理特征进行分析。
Gabor函数可以捕捉到相当多的纹理信息,且具有极佳的空间/频域联合分辨率,因此在实际中获得了较广泛的应用。小波变换法大体分金子塔形小波变换法和树形小波变换法(小波包法)。
小波变换在纹理分析中的应用是Mallat在1989年首先提出的,主要用二值小波变换(DiscreteWaveletTransform,DWT),之后各种小波变换被用于抽取纹理特征。传统的金字塔小波变换在各分解级仅对低频部分进行分解,所以利用金字塔小波变换进行纹理特征提取是仅利用了纹理图像低频子带的信息,但对某些纹理,其中高频子带仍含有有关纹理的重要特征信息(如对具有明显的不规则纹理的图像,即其高频子带仍含有有关纹理的重要特征)得不到利用。使用在每个分解级对所有的频率通道均进行分解的完全树结构小波变换提取特征,能够较全面地提取有关纹理特征。
由于医学图像及其纹理的复杂性,目前还不存在通用的适合各类医学图像进行纹理分析的方法,因而对于各类不同特点的医学图像就必须采取有针对性地最适合的纹理分析技术。另外,在应用某一种纹理分析方法对图像进行分析时,寻求最优的纹理特征与纹理参数也是目前医学图像纹理分析中的重点和难点。
6.总结
随着远程医疗技术的蓬勃发展,对医学图像处理提出的要求也越来越高。医学图像处理技术发展至今,各个学科的交叉渗透已是发展的必然趋势,其中还有很多亟待解决的问题。有效地提高医学图像处理技术的水平,与多学科理论的交叉融合、医务人员和理论技术人员之间的交流就显得越来越重要。多维、多参数以及多模式图像在临床诊断(包括病灶检测、定性,脏器功能评估,血流估计等)与治疗(包括三维定位、体积计算、外科手术规划等)中将发挥更大的作用。
参考文献
[1]P.Suetens.FundamentalsofMedicalImaging[M].CambridgeUniversityPress,2002.
[2]刘俊敏,黄忠全,王世耕,张颖.医学图像处理技术的现状及发展方向[J].医疗卫生设备,2005,Vol26
(12):25-26.
[3]田娅,饶妮妮,蒲立新.国内医学图像处理技术的最新动态[J].电子科技大学学报,2002,Vol31(5):
485-489.
[4]周刚慧,施鹏飞.磁共振图像的随机场分割方法[J].上海交通大学学报,2001,Vol35(11):1655.
[5]ZhangHM,YuanZJ,CaiZM.SegmentationofMRIusinghierarchicalmarkovrandomfield[J].Journalof
Software,2002,Vol13(9):1779.
[6]林亚忠,陈武凡,杨丰.基于混合金字塔吉布斯随机场模型的图像分割[J].中国生物医学工程学报,
2004,Vol23(1):79.
[7]聂生东,陈瑛,顾顺德.磁共振颅脑图像快速模糊聚类分割算法研究[J].中国生物医学工程学报,2001,
Vol20(2):104.
[8]江宝钏,张钧良.基于BP神经网络的MRI分割[J].微机发展,2000,Vol1:67.
[9]AhmedMN,FaragA.Two-stageneuralnetworkforvolumesegmentationofmedicalimages[J].Proceedings
ofIEEEInternationalConferenceonNeuralNetworks,1997,Vol28(3):1373.
[10]黄永峰,岑康,司京玉等.模糊神经网络在颅脑磁共振图像分割中的应用研究[J].中国生物医学工程
学报,2003,Vol22(6):508.
[11]CostinH,RotariuCR.Knowledge-basedcontourdetectioninmedicalimagingusingfuzzylogic[J].
InternationalSymposiumonSCS’03,2003,1:273.
[12]谢逢,罗立民,田雪琴.基于知识的人脑三维医学图像分割显示方法[J].生物医学工程学杂志,1997,
Vol14(2):124.
[13]王蓓,张立明.利用图像先验知识与Snake结合对心脏序列图像的分割[J].复旦大学学报(自然科学
版),2003,Vol42(1):81.
[14]RaquelVC,VeronicaMB,OscarYS.Couplingofradial-basisnetworkandactivecontourmodelformulti
spectralbrainMRIsegmentation[J].IEEETransactionsonBiomedicalEngineering,2004,Vol51(3):459.
[15]LuoXP,TianJ,LinY.Analgorithmforsegmentationofmedicalimageseriesbasedonactivecontour
model[J].JournalofSoftware,2002,Vol13(6):1050.
[16]HallpikeL,HawkesDJ.Medicalimageregistration:Anoverview[J].BrInstituteRadiol,2004,Vol14(6):
455-463.
[17]PetraA,ElsenV.MedicalImagemaching:Areviewwithclassification[J].IEEETransMedImage,1993,
Vol12(3):26-39.
[18]LuoShuo-qian,LiXiang.Implementationofmutualinformationbasedmulti-modalitymedicalimage
registration[A].EngMedBillSocProc22ndAnnIntConfIEEE[C].NavyPierConventionCenterChicago,
Illinois,USA:TheInstituteofElectricalandElectricalandElectronicsEngineers,Ind,2000,2:1447-1450.
[19]SharmanR,TylerJM,PianykhOL,etal.Afastandaccuratetomethodtoregistermedicalimagesusing
waveletmodulusmaxima[J].PattRecogLett,2000,21:447-462.
[20]LesterH,ArridgeSR.ASurveyofhierarchiclnon-linearmedicalimageregistration[J].PatternRecognition,
1999,32:129-149.
[21]卢健,胡志忠,杨如乃.医学图像融合技术的研究[J].上海生物医学工程,2006,Vol27(3):163-167.
[22]王新成.高级图像处理技术[M].北京:中国科学技术出版社,2001.
[23]RVoracek,HPMcAdams,puterAidedDiagnosisofInterstitialLungDisease:aTexture
2新技术
网络作为第四媒体,其显示终端可能是计算机,平板,电视或智能手机,为了页面兼容等原因,前端设计出现了很多新技术,如div+css技术,Javascript技术等,为了方便管理,一般采用对象的结构、表现和行为分开。结构是对象的内容,表现是其外观,而行为是与浏览者的交互,或者说是浏览者进行鼠标点击或输入内容等操作时,页面的反应。在进行网页设计过程中,图像对象也是如此,利用代码可以对图像进行一些效果的处理,起到资源占用少,页面维护容易等目的,还可以达到一些用基本图像处理技术不易实现的效果。用div+css结合Javascript技术可以实现在网页前端一些设计效果和逻辑处理功能,比如图像轮播和验证码校验功能。在一个存在后台管理的网站中,网页的很多内容来自于后台数据库,一些图片也不例外,内容需要和后台交互,根据数据库的内容和页面的特定逻辑,决定图像的外观。这是基本图像处理技术无法实现的,需要设计者了解动态页面设计技术,常见的技术有,php和jsp技术等。
2计算机图像处理技术在网页设计中的应用
在网页设计的过程中,图像的处理和美化是其中最重要的环节之一,在一些较为复杂的网页中,可能会包含一些动态的图像以及flash元素等,这些元素的存在无疑增加了网页的特色,同时,也会提高客户体验,为了保持这些元素的鲜明性就需要将计算机图像处理技术很好的应用到网页设计中,提高网页质量的同时,增加网页的特点。
2.1满足网页设计中对于图片格式的需求
满足网页设计中对图片格式的需求是网页设计过程中最基础的环节,在网页设计中,需要各种不同的元素来组成一个完整的、特色鲜明的网页,从而让浏览者瞬间获取自己所需要的信息和资源,同时,网页设计必须具有一定的便捷性,这样才能有效的增加用户体验,同时增强用户浏览体验的感受,由此可见,图像的处理是网页设计中最基础的内容,所以,计算机图像处理技术首先需要处理的就是网页设计中的图像问题,其中jpeg是最为常用的图片格式,而gif可以实现图像的动态效果,由于这两种的网络图像格式所需要的参数和规格是不尽相同的,所以在应用计算机图像处理技术时,应该满足其格式的不同需求。
2.2对网页设计中图像的大小进行控制
众所周知,计算机的长度和宽度是有限的,这在一定程度上就决定了网页设计的图像也应该是有一定的规格,同时,为了保障网页浏览的清晰度和流畅度,就需要对网页中的图像进行一些特定的处理来限制其图像的大小,由于图像的大小与其所展现的清晰度有直接关系,所以,需要借助计算机图像处理技术来进行处理,以此来缓解清晰度和图像大小之间的矛盾,在追求图片高清晰度的同时,提高网页加载的速度和质量,同时提高网页浏览的效果。计算机图像处理技术主要是一种针对jpeg图片进行处理来权衡加载速度和网页浏览效果的一种技术,从而提高网页设计的浏览效果和网页质量。
2.3对网页设计进行进一步的开发
只有综合运用计算机图像处理技术对网页设计进行进一步的开发和应用,才能从根本上提高网页设计效果,近年来,计算机图像处理技术主要是以软件为主,photoshop是目前最为常用的图片处理软件,但是,随着网页设计的不断普及和发展,出现了更多网页个体设计者,为了满足不同个体对网页设计的个性化需求,同时带动个体成为网页设计的主流,丰富网页的内容和色彩,就需要适当的降低计算机图像处理技术的技术水平,以此满足社会大众的需求,其中photoshop的图片处理功能相对强大,但是photoshop主要是针对专业的网页设计人员开发的一种技术处理软件,所以,对于那些非专业的网页设计者,这个软件具有一定的难度,这在一定程度上限制了网页设计的普及和发展,所以,为了满足更多网页开发者的设计体验,要不断开发出一些相对简单和实用的计算机图像处理技术,进而推动计算机图像处理技术的革新和技术升级。
2探索Photoshop图像处理多种方法
2.1加强对Photoshop图像处理应用案例分析总结就是一种间接的自我学习,通过案例分析总结可以让自己展开丰富的想象力,加强对Photoshop图像处理应用。如图3,这是一组人居环境适宜的景观设计效果处理前后变化展示,前一张图片是用3Dmax配合V-ray插件进行渲染的最终效果,为了进一步美化效果图,这是就需要Photoshop图像处理,结合中间这一张照片,采用图层处理、素材插入、调整图层、图层蒙版、创建亮度\对比度调整层等方式最终合成想要的效果。在案例分析过的成中,应注意多观察多总结多思考,设计最终效果的高低,一方面是和自己所拥有的知识水平有关,另一方面还和自己的审美能力高低有关,这就需要告诫我们平时多注意学习,学习不仅仅局限在书本上,还应该多参观欣赏较好的作品,从中得到审美能力的提高。
2.2模仿和创造相结合,提高Photoshop图像处理动手能力模仿是人的本能天性,是人类进行各种学习活动的最基本方法。在平时的Photoshop图像处理模仿使用中,通常就是通过网上视频,如金鹰视频来自己分析Photoshop软件的各个功能。在视频观看的过程,可以根据视频中的实例操作,最终达到理解,这个过程就是模仿。例如:模仿给图片添加阴影效果,通常情况下,可以选择Photoshop菜单栏图层—图层样式—阴影就可以完成。而通过视频模仿,就可以快速的通过浮动图层菜单,选定此图片图层,并把鼠标快速放到缩略蓝色区域双击就可以打开图层样式浮动菜单完成阴影效果。在提高Photoshop图像处理动手能力上,还要发挥自己的创造能力。例如给此图片添加完阴影后,图层样式还有内外阴影、内外发光、光泽、斜面和浮雕、颜色叠加等方式,我们尝试可以根据图片实际情况试着添加,达到最佳效果。这里就需要发挥创造性对图片处理创新性在里面。
2.3结合科研项目,带动Photoshop图像处理实践能力如在科研项目:西部山地型小城市人居环境问题及保护策略研究——以商洛市商州区为例上,需要收集大量的本地环境有关的图片素材并进行美化处理,这就可以亲自参与商州区大气质量恶化、丹江主要河流体固体废物污染、交通混乱等图片的处理,如图4是一组人居环境的照片,上一组为未处理时的照片,下一组为处理后的照片。这里的美化是对图片效果的美化。
2.4参与企业设计,增强Photoshop图像处理灵活性参与企业设计,就是参与设计公司的工作。例如:在商洛市西街片区的旧城改造过程中,学生负责收集照片,并对旧城的原始照片进行处理规范化。如图5,是旧城改造前的图片收集整理。
作者简介:宁纪锋(1975-),男,陕西韩城人,西北农林科技大学信息工程学院,副教授。(陕西 杨凌 712100)
基金项目:本文系西北农林科技大学教学改革研究项目(项目编号:JY1102077)、西北农林科技大学本科优质课程建设项目的研究成果。
中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)34-0122-02
“数字图像处理”是西北农林科技大学(以下简称“我校”)信息工程学院为计算机科学与技术、软件工程、信息与计算科学等多个理工科专业所开设的一门专业必修课。该课程涵盖数学、物理、信号处理、心理学、计算机科学等多个领域的知识,与本科阶段的高等数学、线性代数、概率论、面向对象编程、数据结构、算法分析等多门课程密切相关,对后续的特征提取和图像理解等高级计算机视觉处理课程具有重要的基础作用。同时,它在“模式识别”、“人工智能”和“机器学习”等专业课程体系中起着重要的作用。[1-3]
一、课程改革的必要性
由于图像处理理论性强,内容抽象,算法较多,涉及的理论和方法既包含时域(空域)、变换域(频域为主)、数学形态学、地理学(如分水岭算法),还涉及到模式识别理论的一些知识,学生理解起来有一定难度,在解决实际问题时,面临着无从下手的困难。同时,图像处理技术应用较为广泛,随着数字成像设备的广泛使用和智能手机的普及,社会对图像处理人才的需求也日益增加,这些都对课程教学提出了更高的要求。在教学过程中发现“数字图像处理”的传统教学模式中,在课程定位、教学模式和教学内容上存在一些问题。
1.课程定位不明确
“数字图像处理”在本科教学过程中有着两种比较冲突的定位,导致课程教学过程存在两种倾向。一是不顾本科学生实际情况向研究生课程看齐,将重点放在数字图像处理理论内容。但这些内容与实际应用联系并不紧密,忽视它的应用性和实践性强的特点,从而导致理论与实践脱节,造成学生在编程能力上的欠缺。二是过分强调应用技能,把数字图像处理等同于讲授Photoshop等应用软件的使用,或以讲授MATLAB和Open CV图像处理函数为主,不重视原理和算法,忽略了对本科生科学素质和研究能力的培养。
2.传统教学模式与授课对象差异性的矛盾
“数字图像处理”通常要求先研修“高等数学”、“线性代数”、“概率论与数理统计”和“数字信号处理”等课程,但是一些本科专业并没有完整开设这些课程。例如,我校计算机科学与技术专业学习“数字信号处理”课程,但软件工程和信息与计算科学专业未开设该类课程。此外,在实验环节中,教师根据教学大纲设置的实验内容通常比较固定,而未考虑学生专业和背景知识的差异、统一的实验环境模式,使得有的专业学生因为知识储备不足,学习起来有一定困难;而有的专业学生则感觉学习内容简单、缺乏挑战性,使得教师讲授时在调动学生积极性、提高学生实践能力方面难以协调。
3.教材与学科发展不一致
数字图像处理内容涉及到矩阵运算、信号处理、概率论与数理统计等多个内容交叉学科,与新兴学科的发展密切相关。当前,在人工智能、模式识别和机器学习等新兴学科的推动下,数字图像处理技术发展越来越快。传统的教材或过于偏重推导理论,与应用实践偏离,或成为图像处理软件或函数(如 Photoshop、MATLAB或Open CV)的使用说明书,使得学生难以深入学习图像处理知识,影响对该门课程的掌握。
二、课程改革方法
根据授课专业对象的实际情况,在教学内容、教学方法、完善实验教学和考核等方面对该门课程进行一系列改革,充分利用图像处理实践性强的特点,依托我校在数字图像处理方面长期积累的理论和研究资源,将理论方法与实践应用有机结合,构建了全面系统的数字图像处理教学体系。多年教学效果表明,该教学模式有效克服传统数字图像处理教学存在的局限,极大增强了学生的学习兴趣,提高了学生的动手能力和创新素养。
1.完善课程内容体系,适应图像处理发展
数字图像处理是一门发展中的课程,每年都有许多新的研究理论和方法不断涌现,需对课程不断进行完善,以适应图像处理学科的发展。在保持图像处理课程核心内容的基础上,注重将最近的该学科具有代表性的成果纳入教学。精简和更新一些陈旧的和目前图像处理实际中很少使用的一些方法。其次,将一些现代经典的科研论文,以补充教材的形式,作为教学内容。将一些理论性较强,对数学基础要求较高的内容,如主动轮廓分割模型和目标跟踪方法等作为选学内容,供有兴趣的学生学习。
考虑到OpenCV和MATLAB的广泛使用,图像文件的读写已非常简单,因此,减少对图像文件格式的讲解;在图像分割与边缘检测中,删掉投影法与差影法内容,因为该方面内容在实际中已很少使用;在频域处理中,淡化对傅里叶变换理论和算法的讲解,重点放在其思想和应用上。
2.应用全方位教学手段,构建立体化教学资源
针对“数字图像处理”课程理论性和实践性较强、可视化程度较高的特点,综合利用图像、视频信息、可视化编程软件和网络资源等现代化教育技术,从课堂、实验、应用实践等诸多环节探索立体化教学资源。结合不同专业需求,运用MATLAB、Open CV等软件工具包开发图像处理实验平台,建立网络化辅助教学系统,使抽象概念和算法形象化,激发学生思维。例如,建立图像处理标准测试库,包括了图像去噪、图像分割、图像变换和特征提取与识别等核心内容涉及到的测试数据;在参考教材方面,提供了国内外知名大学出版的数字图像处理和计算机视觉教材及计算机视域的专著;在多媒体课件方面,提供多年从国内外知名大学网站上搜集到多个数字图像处理和计算机视觉的电子课件,供学生学习;在代码方面,提供了数字图像处理方面的经典和最新的一些科研成果的源代码或可执行软件,学生自己运行代码并分析实验结果,加深对图像处理课程的认识。
3.以学生发展为本,建立多元化的考核评价标准
在传统方式下,教师常以期末考试和出勤率来评价学习效果,忽略了对学生参与学习活动和学习过程的评价。大部分学生往往在考试前突击学习,没有真正掌握扎实的知识。因此,本教学改革以过程控制为中心,以能力提高为目标,对考核方式进行改革,实行常规考核与过程性考核相结合的方式,准确把握学生的真实成绩,全面衡量和控制教学质量,既要考学生的基本理论,更要考他们运用知识和方法设计图像处理方案、完成图像处理实际任务的能力。在授课过程中,注重课堂考察环节,加强师生交互,动态掌握学生对授课内容的理解。开展专题讨论课程,让学生大胆提问,锻炼学生创新思维能力,对表现突出的学生增加平时分。
4.开展研究性课堂教学探索
在教学改革中,精选了若干图像处理经典和前沿专题讨论,包括论文、程序源代码和辅助材料。在课程一开始就布置任务给学生课下自学,并安排学生上台讲授,其他学生提问,教师给予点评,并组织学生一起讨论,加深对图像处理课程的认识,培养学生综合运用知识的能力,提高创新素养。
例如,在图像分割专题讨论中,以经典Mean Shift分割为主要内容,Graph Cut和交互式分割两个方向作为补充内容,开展专题讨论。因为这些广泛使用的算法涉及到高等数学、线性代数、概率论、数据结构和算法设计等多门所学课程。通过自学、上课讨论和教师点评,学生对以前所学基础和专业知识有了更深层次的理解。同时,这些算法都面向彩色图像,克服了教材中以灰度图像为主要分割对象的不足。
5.开展研究性实践教学
传统“数字图像处理”课程实践教学强调基本算法的实现,未强调算法之间的逻辑联系,忽略了数字图像处理基本算法的综合训练。在改革中,保留图像处理基本核心算法,将科研项目融入教学实践中,通过设计研究性综合实践项目,注重学生对所学知识的综合理解和提升。例如,“图像去雾”综合训练实践,以如何有效果去除图像中的雾增强图像质量为目标。该任务以2009年国际计算机视觉和模式识别会议(CVPR)的最佳论文《基于暗通道通先验的单幅图像去雾》[4]为主要内容,涉及到图像处理的多个基本算法,同时也包含了物理学和光学的一些知识。通过将新的实践教学手段应用到教学中,突出对学生思维能力、科研能力和创新能力的培养。
三、结论
通过分析数字图像处理目前存在的课程定位模糊、传统的教学模式与授课对象差异性的矛盾和教材内容与学科发展脱节等问题,笔者根据学科专业特点,结合授课教师的科研项目,从完善课程内容体系、构建立体化教学资源、多元化考核评价标准和开展研究性教学探索等五个方面进行开展数字图像处理教学改革。多年教学效果表明,该教学方法克服传统教学方法所存在的弊端,极大地提高了学生的自主学习能力。学生较好地掌握数字图像处理的核心内容,了解当代图像处理的代表性成果和前沿趋势,综合应用能力和创新素养明显增强,为培养具有较强适应能力的应用型和创新型人才打下坚实的基础,适应了新世纪对信息技术人才的培养要求。
参考文献:
[1]何东健.数字图像处理[M].西安:西安电子科技大学出版社,2008.
在工业生产中,测量是进行质量管理的手段,是贯彻质量标准的技术保证。机械零件的尺寸检测作为产品加工的一个关键环节,其检测结果不仅影响产品的质量,而且对后续零件的再加工和装配产生决定性的作用。目前,常规的零件尺寸测量手段主要采用游标卡尺、激光测量仪和轮廓仪等完成检测环节。以上零件尺寸测量方法要么受测量工具限制,其测量精度有限;要么检测仪器过于昂贵且操作复杂,同时其准确率往往受人为因素的影响。
鉴于当前机器视觉技术的快速发展以及其在工业检测方面的成功应用,论文构想利用摄像机替代人眼,让计算机替代人脑,从而研制出一套针对零件常规尺寸的自动化y量系统。
1 系统概述
在充分遵循系统的完整性、可靠性、经济性和实时性等原则的基础上,本文设计出了一套基于机器视觉的零件常规尺寸测量系统。该测量系统主要由图像摄取、图像处理、图像特征提取和分析、图像常规尺寸测量和结果输出几部分组成。其工作原理图如图1所示。
2 硬件设计
基于机器视觉的零件常规尺寸测量系统的硬件主要包括:照明装置、摄像机、计算机和透明工作台。各部件的主要功能是:照明装置主要为零件图像采集提供合适的光照环境;摄像机用来采集零件数字图像并传送到计算机,然后保存为相应图片格式;计算机通过系统软件实现对零件图像的预处理、边界提取、特征提取、相机标定和常规尺寸计算;透明工作台用来承载被测零件。
3 算法设计
图像处理算法对机器视觉测量系统会产生决定性的影响。为了能满足零件尺寸测量的要求,针对零件产品图像的特点,我们设计了一套合理的图像处理算法流程。其流程图如图2所示。
首先对获取的零件图像进行预处理,包括图像灰度化、图像去噪、图像分割和边界提取;然后提取零件的几何特征;最后通过对系统的标定,实现了零件图像常规尺寸的测量和结果显示。
3.1 图像预处理
3.1.1 图像灰度化
经过摄像机采集到的零件图像是24位真彩色RGB图像,该图像中的每个像素由R、G、B三个分量决定,而灰度图像的每个像素由一个值确定。为了减少后续操作过程中的计算量,需要对采集到的零件图像进行灰度化处理。
3.1.2 图像去噪
采集系统获取的待检零件图像由于受照明程度、环境温度、电源变化、电磁辐射和振动等随机因素的干扰,图像会包含大量的噪声,表现为图像模糊、失真和大量斑点等。为了消除和抑制噪声对零件图像后续处理的影响,必须对图像进行滤波处理。由于中值滤波既能消除噪声又能保持图像的细节,符合本系统检测的需求。
3.1.3 图像分割
在所采集到的零件图像中,我们只对零件区域本身感兴趣,对于图像中的其他要素则要尽量消除。图像分割就是指把图像分成各具特性的区域,并提取出感兴趣目标的技术和过程。经过大量的实验验证,本文采用迭代阈值分割法实现对零件图像的分割,达到了预期的处理效果。
3.1.4 边界提取
轮廓是对物体形状的有力描述,对图像分析和识别十分有用,而通过边界提取算法就可以得到物体的边界轮廓。目标图像边界提取的方法很多,主要包括链码表示法、标记图法以及多边形近似法等。论文采用8连通链码法对待测零件进行了边界提取,为后续零件尺寸的检测奠定了很好的基础。
3.2 图像分析
3.2.1 特征检测
要测量零件的尺寸,首先应该检测出零件所包含的直线和圆等基本的几何特征。目前常用的几何特征检测方法有Hough变换法、拟合法和模板匹配法等。本文采用最小二乘法实现了对直线和圆的拟合,其拟合具体过程如下:
(1)采用最小二乘法实现对直线的拟合。
(2)采用最小二乘法实现对圆和圆弧的拟合。
采用最小二乘法对圆和圆弧的拟合过程与直线的拟合求解过程类似。设所求拟合圆的方程为:。根据最小二乘法应满足的条件,可以求出拟合圆的三个参数:u、v和r。
这样,通过基于最小二乘法的直线和圆拟合方法,可以顺利检测到直线和圆弧几何特征,为后续零件尺寸的测量奠定了基础。
3.2.2 系统的标定
相机拍摄到的图像是以像素为单位的,要得到待检零件的实际尺寸,需要将像素尺寸转换为长度尺寸,这个过程称为系统的标定。本文使用0级精度量块,采用二次标定法实现了对系统的标定过程。被测零件的实际尺寸L与像素尺寸N之间应满足如下关系式:L=KN+b
式中,b为系统误差,K为标定系数;
在摄像机固定的情况下,求取参数K和b值的具体步骤如下:
(1)在被测位置放置一长度为L1的标准量块;
(2)对标准量块进行扫描、处理,得到对应的像素尺寸N1;
(3)在被测位置放置另一长度为L2的标准量块,重复步骤2,得到对应像素尺寸N2;
(4)求取参数值:
4 软件设计
本着稳定、可靠、合理、高效、简洁和易于操作的原则,我们采用面向对象的Matlab程序语言,实现了基于Matlab GUI的测量系统软件的设计。
本测量系统软件主要包括用户登录模块、文件管理模块、图像处理模块、参数设置模块、数据浏览模块和帮助模块等。其中,用户登录模块可以完成用户的注册、登陆、密码修改和账号管理;文件管理模块主要包括待测零件图像的打开、关闭和保存等功能;图像处理模块不仅包含文中所涉及到的算法,还增加了其他算法功能;参数设置模块可以实现对摄像机、零件和图像参数的设置;数据浏览模块可以完成对实时数据、历史数据和操作记录的查看;软件帮助模块主要用来说明软件的使用和系统的更新问题。
5 实验结果
为了验证测量系统的适应性、稳定性和可靠性,本文选用工作面距离为1.49mm的0级量块和直径为2.03mm的标准环规对系统进行了可靠性测试。实验的测量结果如表1所示。
采用概率与数理统计的方法对测量结果进行了处理。由处理结果可以看到,采用本测量系统,其测量精度可以达到微米级,可以满足在线实时测量的需要。
6 结论
作者设计了一套基于机器视觉的零件几何尺寸在线检测系统,克服当前人工检测的不足,提高了产品的检测精度。同时,完成了系统硬件、软件和图像处理算法的设计。实验结果表明:该测量系统的测量精度可以达到2um以下,满足零件尺寸非接触在线测量要求,具有很好的应用前景。
参考文献
[1]王保军.基于机器视觉的药瓶封装缺陷检测系统研究[D].沈阳:东北大学(硕士学位论文),2014.
[2]李岩,花国梁.精密测量技术[M].北京:中国计量出版社,2001.
[3]章毓晋.图像工程(上册)――图像处理和分析[M].北京:清华大学出版社,1999,5-120.
[4]张铮,王艳平,薛桂香.数字图像处理与机器视觉[M].北京:人民邮电出版社,2012(12):63-160.
作者简介
0引言
叶片面积的大小直接影响到植物生产力的高低,叶片面积的变化也直接影响植物水分生理的变化过程。测定植物叶片面积,往往是研究一些与植物叶片面积相关的生理生化指标首要解决的问题。例如,对小面积叶片的光合速率进行测定时,需要知道这些叶片的实际面积,以此换算标准光合速率。
叶片的面积的测定经历了网格法、称重法、系数法以及使用叶面积仪进行测定,前三种方法需要进行破坏性测量,而叶面积仪价格昂贵,且当叶片面积很小时,测得的面积与实际面积间会产生较大偏差。游明安等[1]介绍了采用叶长×叶宽与叶片面积间的回归关系来测定叶片的叶面积,然而在建立回归关系前,还需对抽样后的叶片进行面积测定。当需要在田间进行非破坏植株的叶面积测定时,可以采用基于机器视觉技术的图像处理方法来求得叶面积,该方法可以有效的实现无损测量。
本文利用机器视觉知识,基于参照物的叶面积测量方法,通过对目标图像进行区域分割,分别对其计算区域面积,最终求得比较准确的大豆叶片参数值。论文格式。
1、测定原理
数字图像有许多像素点组成,每个像素点代表一定的实际面积值,而其所代表的实际面积值可以由已知参照物面积求得[2]。因此叶面积可由下列公式求得:
(1)
其中S代表叶片面积,S0代表参考物体的实际面积,通过图像处理得到叶片面积S1,参考物体面积S2。这种方法在测量叶片面积时,需要在严格的物距下进行叶片的采样,以保证每个像素代表的真实面积不变,而且要求光学器件的线性度高,镜头的焦距不可变,可见此方法难度较大。
拍摄图像时让数码相机离被测叶片尽量远,通过数码相机的变焦功能使被测叶片的像尽量大,相当于在尽量长的焦距下拍摄,误差就会有效地减少。测量时要求将被测叶片与标准测度参照物同时拍摄,从而按比例获得绝对尺寸,被测叶片和标准物体要求拍摄到同一幅图像上。
2、图像的获取
叶面积的测量系统硬件部分主要有成像设备、计算机、参照物以及测量叶片时所需的夹具一套。论文格式。成像设备选用普通的数码相机,参照物是测量中一个关键的设备,本研究中选用一个黑色圆片,它必须要能与与叶片有很大的颜色差别。参照物圆片要足够远,圆片的面积将直接影响测量的精度。测量所用夹具需要以下特点:能够构建一个与叶片颜色有很大差别的背景,选择白色的纸板。并能使参照物固定在背景纸板上。
借助于数码相机来获取图像,可以不破坏作物的群体结构,真正地检测叶片的生长规律而不只依靠统计规律,但是需要对测量系统进行标定,而且要求被测叶片和标准参照物必须同时拍摄,所以影响测量精度的因素很多。
3、叶面参数的测量方法
如图1所示,极为叶面参数计算的工作流程图。在对原图像进行预处理以后,将图像转化为灰度图像,将转换后的灰度图像进行图像分割、边缘提取、最后经过计算求出叶面的基本参数。
图1 系统工作流程
3.1图像预处理
由于受到外界光线以及噪声的干扰,使得图像想上出现一些噪声点,需要对其进行处理,才能使图像清晰,更加准确的表征事实。预处理过程包括对图像进行亮度、对比度调整和平滑滤波。亮度和对比度的调整可以使图像特征明显,易于识别;平滑滤波的目的则是去掉尖锐不连续的噪音。
3.2图像分割
要获取图像中参考物的面积及图像中作物叶片的参数,首先要讲参考物目标和叶片目标从原图像中分割出来。目前,用于图像分割的方法很多,其中双峰阀值处理是最常用的一种。阀值处理时将所有灰度值大于或等于某阀值的像素都被判定属于物体,所有灰度值小于该阀值的像素被排除在物体之外,即为背景。
利用迭代阈值法对图像进行分割[3]。论文格式。该方法具体步骤如下:
① 选择灰度阈值T的初始估计值。
② 用T分割图像。这样就会生成两组像素:G1由所有灰度值大于T的像素组成,而G2由所有灰度值小于或等于T的像素组成。
③ 对区域 G1和 G2中的所有像素计算平均灰度值μ1和μ2。
④ 计算新的门限值:
T = (μ1+μ2)/2(2)
⑤ 重复②到④,直到逐次迭代所得的T值之差小于事先定义的参数T0。
图2目标直方图
将图像的最大灰度值和最小灰度值的均值作为灰度阈值T的初始估计值。迭代得到灰度阈值T后,将大于T的像素的灰度值设为1,其余像素的灰度值设为0,这样便得到了二值图像,使得参考物目标和叶片目标从原图像中分离了出来。
3.3去噪处理
采用阀值分割后的二值化图像,其叶片周围常存在若干噪声斑点,需要进行去噪处理,中值滤波是一种去除噪声的非线性处理方法,能够在抑制噪声的同时很好的保护边缘轮廓信息[4],采用开运算将参照物内部填充完整。
3.4目标参数的获取
设d为实际参照物的直径,则实际参照物的面积S0可以通过下式得到:
(4)
用实际的参照物面积除以图像中参照物的面积S1得到一个比例系数k,即
(5)
根据图像中叶片面积A、最小外接矩形的长L和宽W,以及比例系数,可计算得到实际的叶片面积AR、叶长LR和叶宽WR,它们分别由式(6)—式(8)计算得到[1][5]:
;(6)
;(7)
;(8)
4结果和分析
实验选用了大豆叶片为待检测的目标,并以一元硬币作为参照物,利用三星S1050数码相机获取原始图像,用1.73GHz Pentium微机、在Window XP平台上用Matlab编程实现。试验中,使用游标卡尺测量出参照物的实际直径为d=2.500cm.,T0=0。
图3给出了实验中图像处理的过程与结果,其中(a)为相机拍摄的原始灰度图像,(b)为对原始图像进行迭代阀值法分割后的二值图像,(c)为对二值图像进行开运算后的结果,(d)是从(c)中分离出来的大豆叶片目标,(e)是从(c)中分离出来的叶片外接矩形图像。(f)是从(c)中分离出来的参照物图像。
(a)原始灰度图像(b)二值图像(c)开运算效果图
(d)分离后叶片对象 (e)叶片外接矩形 (f)参照物对象
图3图像处理的过程与结果
使用图像处理技术计算得到的叶片面积为12.3825cm2,叶片长为4.6478cm、宽为3.6149cm。计算的中间数据如下:
摘 要:针对数字图像处理课程基础理论抽象、实用性强的特点,分析和探讨该课程教学中存在的若干问题及原因,从师资力量建设、课程标准制定、教学方法与设计、考核方法4个方面阐述数字图像处理课程的教学优化改革方案。
关键词 :数字图像处理;教学优化改革;师资力量;课程标准
基金项目:全军学位与研究生教育研讨会研究课题“军队院校研究生教育中的导师与研究生关系研究”(YJZX14C14)。
第一作者简介:孔韦韦,男,讲师,研究方向为图像处理,kwwking@163.com。
0 引 言
数字图像处理[1-2]是信息处理领域的重要分支,通过该课程我们可以完成图像的几何变换、算术处理、图像增强、图像复原、图像重建、图像编码、模式识别、图像理解等多个方面的工作。目前,随着计算机软硬件处理能力的不断提升,数字图像处理技术已被广泛应用于医学检测、反恐处突、弹道导弹精确制导等多个军(民)用领域。由于该门课程的特殊地位和广泛应用,国内外几乎所有信息类专业都开设了该课程,许多专家、学者也针对课程的教学方式提出了自己的观点[3-8]。
军队院校作为高等院校中的一类特殊群体,无论在课程设置还是人才培养需求上均与地方高等院校有很大的不同。军队院校自身的特殊属性要求培养出的人才不仅要有扎实的理论基础和科研能力,还能运用这些知识对作战以及日常训练中出现的问题加以解决,因此,军队院校对人才的理论与实践结合能力提出了更高也更为严格的要求。
武警部队负责维护国家安全和社会稳定,有效打击国内外各种恐怖势力,保障人民安居乐业。当前,世界各国都将“反恐”作为维护国家稳定和保卫人民生命财产安全的一项重要任务。反恐图像目标的识别和监视能力更体现了一个国家的反恐技术力量和能力水平,其关键在于反恐图像目标的识别。因此,有效地将数字图像处理技术应用于反恐处突领域,不仅有助于提升针对恐怖势力的打击力度,还可以有效减少伤亡,最大限度地保障国家和人民的生命财产安全。
1 数字图像处理课程的特点
数字图像处理课程主要有以下几个特点:①理论基础要求高,涉及高等数学、信号与信息系统、信息论、计算机编码等多个领域的知识;②数字图像处理课程覆盖的内容广泛,知识点繁杂零碎;③新兴理论的不断出现要求广大学者能够敏锐把握数字图像处理技术的发展前沿;④数字图像处理技术的应用领域不断拓展,处理方法也更为复杂。
2 军队院校数字图像处理课程教学中存在的问题
2.1 课程设置不灵活
相比地方高等院校,军队院校的课程设置自由度十分受限,具体体现为课程的教学内容、学时安排、课堂组织形式甚至是开课时间均有严格的规定和限制,不能根据学生理论基础和学习能力的实际情况做自适应的调整。
尽管研究生有自己的导师和研究方向,且很多研究生日后学位论文的研究方向可能与数字图像处理领域并无关联,然而,由于许多信息类专业院校的研究生培养方案均严格限定该课程为学位必修课,导致一些研究生为了学分和学位只得选择一门与自己研究领域完全无关的课程,无形中造成了教学资源的浪费。
2.2 课时少内容多
数字图像处理课程是国内外几乎所有信息类专业的必修课。地方高等院校通常会开设50个学时,而军队院校大多只开设40学时,有的学校甚至只将其作为学位选修课开设20学时。众所周知,该课程涉及的教学内容非常繁杂且对相关课程的理论基础提出了较高要求,这类课程即使安排50学时也很难将重点内容讲授完毕,军队院校课程课时不足无疑对该课程的教学质量造成重大影响。
2.3 教学形式单一
军队院校的特殊属性在一定程度上约束了课堂多种教学形式的存在与发展,传统的教师主体式教学法是主流。这种过于单一和机械的教学形式将对研究生的学习积极性造成不利影响。另外,军队中上下等级关系往往扼杀了研究生质疑教师的勇气和可能,使研究生不敢对教师的见解有所质疑,不敢擅自踏入教师未首肯的领域中积极主动地发现问题、分析问题和解决问题,导致研究生的学习完全处于被动境地。
3 教学优化改革
3.1 师资力量建设
数字图像处理课程专业性强、理论难度大,涉及的基础学科门类较多,因此,在条件允许的情况下应尽可能安排科研方向或理论研究方向属于图像处理领域的教师担任任课老师。一方面,长期从事该领域的教师对课程的基本内容和理论了如指掌,基本功非常扎实,授课更为流畅、自然;另一方面,教材中介绍的只是图像处理领域的基础理论和经典模型,长期从事该领域研究的老师在研究过程中往往对课程中的概念及理论模型有更深刻的理解,在授课过程中必然会附带介绍本人在该领域内的研究现状和最新进展,有利于开阔研究生视野,激发学习兴趣,提高授课质量。
3.2 课程标准的制定
结合军队院校课时不足的教学实际以及人才培养类型的定位需求,我们完全有必要重新制定数字图像处理课程的教学标准,在保证理论系统性完整的基础上,侧重实践能力以及解决实际问题能力的培养和提升。具体措施如下:①教学对象精确定位,扭转以往研究生课程频频出现的“被选课”现象,切实保障“选修权”,允许研究生按照自己学位论文的研究需求选课;②由于学时有限,在制定课程标准时必须全面分析和研究教学内容,梳理与课程内容相关的知识目标、技能目标和素质目标,适当地删减一些非重点内容,重新划分各章节的学时;③数字图像处理虽然是一门理论性很强的课程,但学习的最终目的还是应用,因此,在制定课程标准时必须为研究生学员留有一定的实践操作以及课堂研讨课时;④要反映部队特色,在授课过程中重点介绍能够直接应用于部队实际的模型和方法,譬如模式识别、图像理解版块,并要求研究生动手实践;⑤紧跟发展前沿,保持知识的先进性,充分利用网络资源,以完善的学习资料、丰富的课程资源、真实的实践环境作为课程的基础和支撑。
3.3 教学方法与设计
结合课程标准,我们拟将整个教学过程分解为4个阶段:①基本理论讲授;②专题讨论;③专题讲座;④实践操作。
3.3.1 基本理论讲授
教师对教学内容中的基本理论加以讲解,旨在为研究生扫清基本理论障碍。该部分的讲解并非只是对课本内容的简单复制和重申,而是在介绍基本理论的基础上,对基本概念中涉及的各层次知识点和潜在疑问加以梳理和阐释,为下一阶段的专题讨论做铺垫。该阶段以教师讲授为主体,采取案例式教学和启发式教学相结合的授课方式。
3.3.2 专题讨论
所谓专题讨论,就是基于教师先前讲授的某一个或某一类基本理论,探讨具体应用效果以及可能影响最终图像处理效果的若干因素。这一环节将彻底打破经典教学模式中的“教师主体”模式,转变为“教师确定讨论范围—研究生为讨论主体—教师最后总结”的模式。在整个过程中,教师和研究生的角色完全转换,由研究生基于自身掌握的知识充分发挥自己的想象,针对若干问题展开探讨或者辩论。譬如,教师在探讨前先介绍图像去噪理论的相关知识,包括噪声产生的原理、噪声的种类、噪声在图像中的表现、几类经典图像去噪方法等,上述部分内容讲授完毕后确定3个问题,即均值去噪和中值去噪方法的原理有何不同?各自的优缺点何在?各自在去噪过程中可能影响最终效果的因素有哪些?下一次课教师可安排专题讨论,并将研究生在讨论中的表现作为课程成绩的一项重要依据。
在该门课程课代表的组织下,研究生被分成若干小组,大家利用课余时间分别对两种去噪方法展开了深入研究,并通过Matlab软件仿真验证,记录诸如峰值信噪比PSNR等相关指标值,初步得出可能会影响最终去噪效果的若干因素;几位同学针对一些不太一致的观点展开激烈的讨论;最后,由教师进行内容总结和答疑解惑,一些研究生还对教师的某些结论提出质疑。
专题讨论完毕后,教师和研究生普遍感觉以往枯燥又不合时宜的教学方法得到了彻底改变,研究生内心的求知热情得到了极大的激发。此外,整个专题讨论过程也锻炼了他们的逻辑思维,为了说服“对手”,他们必须要找到支撑自己观点的科学依据,包括权威论坛上的答疑解惑以及仿真软件仿真出来的实际结果等。有了这些证据后,他们还要对数据进行分析研究、组织语言、理清思路,而在以往的教学模式下,研究生并不会主动花费时间查找资料,教师由于课时的关系也不可能对每一种理论都进行仿真演示。
3.3.3 专题讲座
担任数字图像处理课程任务的教师必须从事图像处理领域研究,因此,在教学过程中,适时安排1~2次专题讲座,由任课教师将自己在本领域的研究成果或是研究体会以讲座的形式向研究生进行报告。在讲座过程中,教师将从一个较高的层次,把一些新的内容介绍给研究生,同研究生一起分享图像处理领域最新的发展动态和研究成果,开拓研究生的视野,为研究生动态更新最新的前沿知识。另一方面,由于课程标准制定过程中教学对象已实现了精确定位,凡是选修数字图像处理课程的研究生日后均要从事该领域的研究,因此专题讲座的开展也在一定程度上为研究生日后的学位论文撰写提供灵感和研究方向。显然,专题讲座是课程教学强大而又有益的补充。
3.3.4 实践操作
由教师从教学内容中选取若干重难点且与部队作战(训练)密切关联的内容,交由研究生自行仿真实现,记录主客观评价指标数值,对仿真结果进行比较与分析,并得出结论;对仿真结果中的不足展开讨论,给出可能的解决方案。显然,该阶段侧重课程标准中“反映部队特色”的宗旨,要求学员学以致用,切实将书本中的理论知识运用到部队实际中,为部队服务,提高作战能力,体现军队院校“向部队靠拢,向实战靠拢”的办学宗旨。
在实际操作中,为了贴合武警部队反恐处突场景的作战实际,教师为学生布置了模式识别版块中的图像融合仿真实验,给出了国际TNO组织提供的联合国营地源图像,源图像取自同一场景,一幅由灰度可见光图像传感器获得,另一幅由红外图像传感器获得。该实践场景十分类似于武警部队对潜藏在树林中的恐怖分子进行围捕的场景,要求研究生对现行资料中融合效果较好的6种融合方法进行仿真,记录仿真结果并加以分析讨论。
通过这一阶段的训练,研究生将书本中的理论知识与实际应用进行了有机结合,取得了良好的效果,并为日后将相应方法应用于部队作战(训练)提供了理论基础和支持。
3.4 考核方法
课程考核采取百分制,并综合考虑研究生在笔试、专题讨论、实践操作3个环节中的表现,3者的比例为0.30:0.35:0.35。在考核中,教师更看重研究生在该门课程中针对实际问题的分析能力和实践动手能力,以期学生真正理解和消化书本中的理论知识。笔试采取开卷方式进行,侧重考核研究生对该门课程中的基本理论、概念、公式的掌握情况,因此,同以往的纯闭卷考试相比,该考核方法灵活度更高,考核效果也更理想。在最终考核中,由于采取了更为有效的考核方式,学生只要认真参与教学活动,必然可以顺利通过考试并拿到高分。如今,两年的教学改革已经使该课程在研究生中小有名气,从往日学员们的“黑名单”课程转而成为“热销品牌”。
4 结 语
两年的实践结果表明,相比传统的授课方式,该改革方案更符合高等院校的教学规律和实际情况,尤其是将部队的实战需求充分融入课程标准的制定过程,更加贴近了当前军队院校的人才培养需求,充分体现了军队院校“向部队靠拢,向实战靠拢”的办学宗旨。
参考文献:
[1] 冈萨雷斯. 数字图像处理[M]. 北京: 电子工业出版社, 2014.
[2] 贾永红. 数字图像处理[M]. 武汉: 武汉大学出版社, 2010.
[3] 杨淑莹, 张桦.“数字图像处理”理论与实践相结合教学模式[J]. 计算机教育, 2009(24): 84-86.
[4] 周海芳.“数字图像处理”课程研讨式教学[J]. 计算机教育, 2010(24): 93-97.
[5] 周耿烈, 鲁逢兰. 图像处理技术精品课程建设[J]. 计算机教育, 2010(18): 101-104.
[6] 何楚, 冯倩, 杨芳, 等. 数字图像处理课程实验教学过程设计[J]. 计算机教育, 2011(18): 74-77.
1 引言
噪声主要在数字图像的获取和传输过程中产生,一般是不可预测的随机信号,只能用概率统计的方法去识别。噪声对图像处理十分重要,其会影响图像处理的输入、采集、处理的各个环节以及输出结果的全过程。其中,椒盐噪声一般是由于传输误差或比特丢失造成的。椒盐噪声与其他的像素点有明显的区别,一般是邻域中的像素值的极值点。但是极值点并不一定是噪声点。椒盐噪声在图像上表现出黑白相间的亮暗点,会严重影响图像的质量。传统中值滤波算法(SMF)[1]能够减弱或消除傅里叶空间的高频分量,但是同时会影响低频分量。由于高频分量对应图像中的边沿灰度值具有较大较快变化的部分,所以SMF算法可将这些分量滤除,使图像平滑,破坏图像的边缘和细节。
文献[2]提出了模糊开关中值滤波算法(FSM),FSM算法处理效果比SMF算法要好一点。文献[3]提出了自适应模糊开关中值滤波(NAFSM)算法。文献[4]提出了EDPA算法。文献[5]和文献[6]提出基于神经网络的模糊中值滤波算法,对于受密度噪声污染的图像取得了不错的效果,但是计算量很大。文献[7]、文献[8]、文献[9]、文献[10]提出了一种自适应模糊中值滤波算法(AFM)。AFM算法对傅里叶空间的低频分量具有较好的滤除效果,但对高频分量的处理效果不是很好,主要是没有考虑椒盐噪声对图像的污染程度。所以本文在AFM的基础上提出了一种双阈值模糊中值滤波算法,该算法能很好地保护图像的细节,具有高效地处理椒盐噪声的能力。
2 算法的基本思想和实现
2.1 建立模糊系统
利用模糊系统(如图1所示),计算输入参数的模糊系数权值。因为处理的是椒盐噪声,所以只需输入滤波窗口中原值与中值的差,最后通过去模函数去模糊化,滤波输出。
图1 模糊滤波系统设计
滤波窗口S由w×w(w默认值为3,一般为奇数)的方阵组成。对S里的像素点值进行快排序,可得滤波窗口中像素的最小值为Smin,最大值为Smax,中值为Smed,均值为Smean。x(i,j)表示噪声图像在(i,j)的灰度值。模糊系统首先是计算参数S1(i,j)=x(i,j)-Smed。在图像处理的时候一般对像素的污染程度进行阈值的设置。这里假设最小阈值为Tmin,最大阈值为Tmax,同时设置参数S2=|x(i,j)-Smean|。当S2Tmax时,认为像素点严重污染,这时就用最近邻域已处理的像素点求均值代替。
设当前像素的灰度值为x(i,j),滤波后的像素的灰度值为y(i,j),模糊滤波系数为P。则模糊隶属函数为:
(1)
如果S2
y(i,j)=S(i,j) (2)
如果Tmin≤S2≤Tmax时,则:
y(i,j)=P×S(i,j)+(1-P)×Smed (3)
如果S2>Tmax时,则:
, i=0,j=0 (4)
,i>0,j=0 (5)
,i=0,j>0 (6)
,
i>0,j>0 (7)
2.2 算法实现
定义S(i,j)是以点(i,j)为中心,大小为w×w的方形窗口,可表示为S(i,j)={(k,l)||k-i|
具体方法如下:
设最大窗口为wmax×wmax,输出图像为y(i,j)。自适应双阈值模糊中值滤波算法的基本思想是通过判断窗口中心点是否为噪声来调节窗口的大小,以克服中值滤波对细节的破坏。
具体算法如下:
初始化窗口大小,令w=3。
计算窗口S(i,j)中像素的最小值Smin,最大值Smax,中值Smed及均值Smean。
如果Smin
如果w≤wmax跳到第2步,否则说明是噪声点,用邻域已处理点灰度值均值代取y(i,j)。
如果Smin
2.3 实验实现与分析
在win7系统和vs2010+opencv环境下,经过大量的仿真实验,最终得到Tmin=5,Tmax=13可以达到很好的去噪效果。实验分别对加入30%、80%的椒盐噪声的Lena.jpg进行处理。具体如图2、图3、图4所示:
图2 无噪声的原图
观察图3(a~e)到图4(a~e)可以发现,噪声轻度污染时各算法去噪能力没有明显差别;当噪声严重污染时SMF基本不能保护图像的细节,AFM、FSM能够适当地保护图像的细节,但是噪声点还是很多,论文算法能够很好地保护图像细节并去除噪声。
采用峰值信噪比(PSNR)归一化均方误差(NMSE)度量处理图像效果的好坏,定义如下:
(8)
(9)
式中y(i,j)表示去噪后的图像各像素点的灰度值,I(i,j)表示原始无噪图像各像素点的灰度值。M、N分别表示图像的高和宽。表1为几种算法的NMSE比较,表2为几种算法的PSNR的比较。
各种算法的NMSE如图5所示,各种算法的PSNR如图6所示。
从表1、表2、图5和图6可以看出论文算法去噪和其他算法相比优势非常明显。在加入小于40%的噪声时各算法的去噪效果差别不是很大。随着噪声的加大,其他算法处理能力明显下降,但是论文算法却达到一种趋衡的状态。
表1 几种算法的NMSE比较
噪声密度/
% 不同算法处理的NMSE
SMF AFM EDPA 论文算法
10 0.0022 0.0006 0.0012 0.0006
20 0.0048 0.0014 0.0021 0.0011
30 0.0171 0.0022 0.0029 0.0021
40 0.0457 0.0042 0.0066 0.0041
50 0.1096 0.0097 0.0149 0.0042
60 0.2156 0.0267 0.0271 0.0043
70 0.3673 0.0712 0.0734 0.0044
80 0.5661 0.1791 0.1578 0.0047
90 0.7968 0.4175 0.3785 0.0051
表2 几种算法的PSNR的比较
噪声密度/
% 不同算法的PSNR
SMF AFM EDPA 论文算法
10 32.2789 37.4440 36.7873 37.4440
20 28.8538 34.3215 33.2178 35.2321
30 23.3064 32.2061 30.1963 32.2624
40 19.0506 29.4123 27.2338 29.4182
50 15.2454 25.7989 23.7133 29.4086
60 12.3090 21.3828 20.7634 29.3226
70 9.99450 17.1203 17.2960 29.1659
80 8.11600 13.1141 13.4691 28.9376
90 6.63180 9.43800 10.2843 28.5508
图5 各种算法的NMSE
图6 各种算法的PSNR
3 结束语
本文在AFM算法的基础上提出了一种自适应双阈值模糊中值滤波算法。和其他去噪算法相比,论文算法具有极强的去噪性,同时很好地保护了图像的细节,并且算法具有稳定性,是去除椒盐噪声的好算法。
参考文献:
[1] Pitas I, Venetsanopoulos A N. Order statistics in digital image processing[J]. Proceeding of the IEEE, 1992,80(12): 1893-1921.
[2] H Ibrahim, K K V Toh, M N Mahyuddin. Salt-and-pepper noise detection and reduction using fuzzy switching median filter[J]. IEEE Transaction on Consumer Electronics, 2008,54(4): 1956-1961.
[3] K K V Toh, N A M Isa. Noise Adaptive Fuzzy Switching Median Filter for Salt-and-Pepper Noise Reduction[J]. IEEE Signal Processing Letters, 2010,17(3): 281-284.
[4] Nibong Tebal, Penang. Fuzzy Multipass Filter for Impulse Noise Removal in Digital Images[C]. Signals and Information Technology, 2013.
[5] M E Yuksel. A hybrid neuro-fuzzy filter for edge preserving restoration of images corrupted by impulse noise[J]. IEEE Transactions on Image Processing, 2006,15(4): 928-936.
[6] S Schulte, M Nachtegael, V D Witte, et al. A fuzzy impulse noise detection and reduction method[J]. IEEE Transactions on Image Processing, 2006,15(5): 1153-1162.
[7] T Palabas, A Gangal. Salt and pepper noise reduction in images using adaptive fuzzy filter[C]. SIU, 2012: 1-4.
引言
随着科学技术的飞速发展,互联网的广泛应用,重要部门(机场、银行、军政机关、重点控制地区)的进出需要可靠的身份鉴别。传统身份识别方式的弊端日益彰显,根据人体生理特征和行为特征来识别身份的生物特征识别日益兴起。人脸识别是计算机模式识别研究领域中一项热门的研究课题,人脸的面部特征是最自然的、方便的身份辨认手段,易为用户所接受。随着计算机技术和数字图像技术的迅猛发展,人脸自动识别在技术上成为可能。
1图像预处理
一个典型的人脸识别过程包括三个步骤:人脸检测、特征提取与人脸识别。在实现过程中,首先要获取图像,然后进行人脸模块检测。如果检测到人脸图像,则进行特征点定位及归一化处理,特征提取后送入分类器进行识别,最终获得识别结果。
预处理是人脸识别过程中一个重要环节,其主要目的是消除图像中的冗余信息,滤除干扰、噪声,增强有关信息的可检测性,从而提高识别的可靠性。在预处理阶段,对图像进行优化,尽可能去除或者减小外部环境对预处理图像的干扰,为后续处理提高质量。
2预处理方法的研究
2.1 直方图均衡化
直方图是图像的最基本的统计特征,它反映的是图像的灰度值的分布情况。直方图反映了图像的明暗分布规律同态滤波,可以通过图像变换进行直方图调整,获得较好的视觉效果。直方图均衡化是在每个灰度级上都具有相同的象素点数的过程,目的是使图像在整个灰度值动态变化范围内分布均匀化,改善图像的亮度分布状态,增强图像的视觉效果。
均衡化处理的步骤为:
(1)对给定的待处理图像统计其直方图,求出
(2)根据统计出的直方图采用累积分布函数做变换,,求变换后的新灰度;
(3)用新灰度代替旧灰度,求出,这一步是近似过程,应根据处理的目的尽量做到合理,同时把灰度值相等或近似的合并到一起。
2.2 灰度拉伸
灰度拉伸又叫对比度拉伸,它是最基本的一种点操作,根据原始图像中每个像素的灰度值,按照某种映射规则,将其变换为另一种灰度值。通过对原始图像中每个像素赋一个新的灰度值来达到增强图像的目的。一般有线性变换(最常用的是按比例线性变换和分段线性变换)和非线性变换(常用对数扩展和指数扩展)。
2.3中值滤波
中值滤波是一种非线性滤波方法,在一定条件下可以克服线性滤波器处理图像细节模糊的问题,但是对点、线、尖顶等细节较多的图像,则会引起图像信息的丢失。中值滤波的基本思想是把局部区域的像素按灰度等级进行排序,取该邻域中灰度的中值作为当前像素的灰度值。它对滤除脉冲干扰和图像扫描噪声非常有效论文范文。
中值滤波的步骤:
(1)将滤波模板在图像中漫游,并将模板中心与图中某个像素位置重合;
(2)读取模板中各对应像素的灰度值;
(3)将这些灰度值从小到大排列;
(4)取这一列数据的中间数据赋给对应模板中心位置的像素;
由以上步骤可以看出,中值滤波对孤立的噪声像素即椒盐噪声、脉冲噪声具有良好的滤波效果。由于它不是简单的取均值,所以产生的模糊比较少。
2.4 同态滤波
当光源照射物体时,由于物体各部分的反射,通过视觉和其他感光面形成图像。因此,图像生成与光源的照射特性和物体的反射特性有关。
设光源的照度函数为,景物各点的反射系数为,则图像的亮度函数为。上式表明,图像各点亮度,决定于照射分量和反射系数的乘积。
同态滤波就是将图像乘积形式的亮度模型(非可加性),变成可加形式,以便进行滤波增强处理。经过同态滤波后其结果会改变图像光强度和反射光强度的特性,因此可以做到同时降低图像动态范围,又增加对比度的结果。
同态滤波的步骤:
(1) 对亮度函数两边作对数变换,再取傅氏变换;
(2) 通过一滤波器;
(3) 对滤波器的输出取傅氏饭变换,再取指数变换;
选取合适的滤波器,可以适当压缩照度分量的动态范围,同时适当提升反射度分量,可以改善图像对比度,突出物体轮廓。
3 仿真实现
取一幅92*112的人脸图像,通过matlab函数对其进行直方图均衡化处理同态滤波,可以得到处理前后的直方图对比。通过仿真我们可以清楚的看出,均衡化后图像获得了较好的视觉效果,图像变的更加的清楚,图像中的一些细节也突出了。如图3-1所示。
图3-1 处理前后的直方图对比
对同一副人脸图像进行灰度拉伸,仿真结果如图3-2所示。
图3-2 原始图像以及灰度拉伸处理后的效果
由两幅图像处理前后的效果变化可以看出灰度拉伸后增强了图像的对比度,使得图像细节更加的突出。
同样,对人脸图像分别进行中值滤波和同态滤波进行预处理,其仿真图分别如图3-3和3-4所示。
图3-3原始图像与中值滤波后的效果图
由原始图像和中值滤波后的图像对比可以看出,处理之后,人脸图像中的斑点得到了去除。
图3-4原始图像与同态滤波后的效果图
对图像进行同态滤波处理之后,由两幅图像对比可以看出,图像对比度得到增强,像素灰度的动态范围也得到增强。处理之后图像较暗的地方变得更清楚,图像中的一些细节也更加突出。
结束语
本文主要针对人脸识别中图像预处理进行研究,通过图像预处理的一些方法,如直方图均衡化、灰度拉伸、中值滤波、同态滤波,对读入的人脸图像进行处理。消除图像中无关的信息,从而使图像增强,细节突出,进一步改善了图像质量,为下一步图像的特征提取、分割、匹配和识别打下可靠的基础。
参考文献:
[1]阮秋琦.数字图像处理学[M].北京: 电子工业出版社, 2000.4
[2]王耀南.计算机图像处理与识别技术[M]. 北京:高等教育出版社, 2001.6
[3]章毓晋.图像工程[M].北京: 清华大学出版社, 2001.9
[4]罗良正.数字图像处理[M].南京: 东南大学出版社, 1999.8
[5]周激流,张晔.人脸识别理论研究进展[J].计算机辅助设计与图形学学报.1993,
1.1 数字图象处理的特点
随着计算机科学的发展与工控程度的提高,图像处理技术被越来越广泛的运用。在颗粒检测识别领域,图像处理技术有着得天独厚的优势。它减少了单纯的人工操作量,降低了测量过程中的粗糙性。提供了对复杂细微颗粒处理的可行性,加快了分析处理速度并且可以直接或间接的获取人们所需要的信息。实现过程的实时监测和控制。
1.2 煤堆颗粒的图像识别系统框架
图像识别系统主要包括图像采集和图像处理两部分。图像采集主要由图像传感器来完成,图像处理主要由计算机和相应的系统软件来完成。框架如图1。
在煤堆里取样,用粉碎机磨制好煤粒粗样后得到煤的颗粒样本如图2。然后通过CCD图像传感器采集到图像,lunwen. 1KEJI AN. COMlunwen. 1KEJI AN. COM提供写作论文和发表服务,欢迎您的光临进行数字化处理后存入计算机,获取煤粒原始图像。再利用软件对数字图像进行相应处理得到相关图像参数,最后根据所得参数数据分析得出煤粒特性结论。
这里选用CCD传感器来获取数字图像如图3所示。CCD图像传感器是一种特殊的半导体材料又名电荷耦合器[2]。它由大量按矩阵排列的独立光敏元件构成。可直接将光信号转换为电信号,然后电信号经放大和模数转换后,实现图像的获取、存储、传输、处理和复现等操作。由CCD摄像设备采集的光学图像转成模拟信号经图像模数转换器进行数字化后,得到数字图像交由计算机处理。它最显著的优点是噪声低、响应速度快、像素分辨率高等。
1.3 煤堆颗粒图像的数字化处理
在计算机中利用软件对原始颗粒图像(图4)进行预处理。对于一张图像来说,往往需要提取目标物,所以先作灰度变换减少图像噪声,保证图像质量。每一副图像相当于一个矩阵,矩阵的行和列确定图像中的每一个点,矩阵中的元素值对应该点的灰度级。图像矩阵中的每个元素就是像素。颗粒本体灰度值与背景图层灰度值较为均匀,进行灰度变化后效果较好,灰度图有无明显的双峰。灰度变换不足以达到最终效果,需要对图像作二值化处理。手动改变图像阈值,颗粒图像二值化效果发生改变,当观测图像变化效果最为理想时停止改变,确定一个最佳的门限阈值。二值化处理后颗粒如图5。另外也可以选择自适应阈值分割,但是无法同步观察变化过程,且计算量相对较大耗时长,无法达到背景图层与颗粒本体二值化图像最佳效果。
2 煤堆颗粒特性分析
2.1 颗粒的形态描述
从颗粒的形态学切入,分析颗粒粒度及形状。粒度是颗粒在空间范围所占大小的线性尺度。通常表面光滑的球体颗粒的粒度用直径表示,立方体颗粒的粒度用边长表示。对不规则的矿物颗粒,可将与矿物颗粒有相同行为的某一球体直径作为该颗粒的等效直径。对许多取向混乱的颗粒按一定方向测量平均线度的统计作为当量径。由于获取的是颗粒投影图像,则可按二维投影规则对煤粒度进行定义[3]。
2.2 煤堆颗粒粒度相关参数
颗粒面积的计算,通过对图像像素点的统计得到。统计获得颗粒像素的个数后,还需要用一个标准单位来标定。通过比例换算得到目标颗粒实际面积大小。采用逐行扫描的方式对图像中每一个颗粒进行标号确定单个颗粒参数。这样每一个目标颗粒的参数都有一个归属,不容易产生混乱。
颗粒周长的计算可以通过对二值图像中目标物的边缘像素计算获得。依然可以采用顺序逐行扫描的方式对图像进行扫描。对图像边缘像素跟踪累加,统计像素个数可得周长。因此颗粒的当量直径可以根据颗粒粒度定义由面积和周长求得。此外还可以利用计算机图像系统对颗粒进行自定义多方向扫描,获取每一个方向上的粒径值再进行平均。用该平均值对粒径大小作粗估计值,这里并没有对此种方法加以详细证明。
这样就可以根据不同粒径的颗粒物在颗粒总体中所含的百分比来确定粒度分布。此外还可以根据颗粒粒度来进lunwen. 1KEJI AN. COMlunwen. 1KEJI AN. COM提供写作论文和发表服务,欢迎您的光临行颗粒分级,明确颗粒的层次关系。
3 煤堆颗粒与分形理论
3.1 分形理论的定义
分形理论是时下非常流行的新理论。分形理论的最基本特点是用分形分维的数学工具来描述研究客观事物。它跳出了一维的线、二维的面、三维的立体乃至四维时空的传统藩篱[4],更加接近客观事物和复杂系统的真实属性。
3.2 颗粒粒度的分形分析
在颗粒的形态特征中,主要讨论了分形分维的方法。把分形维数作为颗粒形态描述的一个重要角度。分形维数在一定程度上体现了颗粒的某些化学物理特性。实际测定分维的办法有很多,如根据尺度、测度关系、相关函数等。针对颗粒的不同特征可以建立不同的分形模型。对于无规颗粒具有如下分形特征式:
①根据边缘进行分形分析,颗粒的无归边缘曲线可利用盒维数[5]计算得分形维数。与边缘线相交的正方形个数记为盒子数N(如图6盒子数为16),盒子大小为k*k,k即盒子的边长。存在推导关系式:-;D记为分形维数,B为常数。通过推导关系计算拟合数据可得到分形维数D。在对k取值时,k值越小所能取到的盒子数也越多,边缘分形结果越精确。理论上颗粒边缘复杂程度越大,分形维数值越大。边缘分形维数体现颗粒的轮廓曲线特点。这里取了4个不同颗粒样本进行了图像处理后,经过计算分别得出4个样本的分形维数,进行比较。
从表1中可以看出颗粒边缘分形维数变化不是特别明显,原因可能与所取的盒子边长k有关。还需要结合其他形状参数来进行特征描述。说明仅仅利用颗粒边缘分形分维作为煤粉颗粒特性标准描述有待改进。
②根据颗粒粒径分形有关系式:-。是粒径分布分形维数,R是粒径大小,为粒径大于R的颗粒数。同样可以通过拟合数据计算得到颗粒粒径分布分形维数。在选取了3组颗粒图像进行了颗粒粒径分布分形维数计算后得到相关参数如表2。
从表2来看,粒径分布分形很大程度上与颗粒数目有关。分形维数是根据统计粒径R以及对应的颗粒数目N进行拟合后得到的直线斜率。尽可能的选取较多的颗粒图进行计算,分形维数越准确粒径分布分形偏差越小。颗粒粒径与分布分形维数呈负相关关系,粒径越小分布分形维数越大,粒径分布随粒径减小呈现的分形特征越明显,反映煤堆颗粒粒径分布越复杂。
5 结语
对于煤堆颗粒的识别,采用数字图象处理技术能够提高识别检测的速度,同时还可以减小大量人为干预造成的误差,避免检测重复性低等缺点。对于煤炭行业提高燃煤利用率和降低污染有着重要的意义。本文主要通过图像灰度变换、图像分割等方法对煤粒图像做处理。同时结合分形理论进行分析,得到煤堆颗粒粒lunwen. 1KEJI AN. COMlunwen. 1KEJI AN. COM提供写作论文和发表服务,欢迎您的光临径分布分形等参数,说明了颗粒分形的可行性并对煤的颗粒分形特征进行描述。但是在粒度形态识别中只是对二维投影图颗粒粒径做了说明,还可以从形状因子等参数考虑,综合描述颗粒特征。对颗粒分布分形也不完善,需要做进一步研究。此外,如何更好的提取颗粒的边缘轮廓,找到颗粒新的参考特性以及分形与工业分析之间的关系是下一步探讨的方向。
参考文献
[1] 苗春卫,李玉祥,王克家,等.基于数字图像处理的煤粉颗粒检测[J].应用科技,2003(2):1-3.
中图分类号:TP391.41 文献标志码:A 文章编号:1006-8228(2016)11-17-04
Research on the image recognition of target sheet with MATLAB
Wang Weiyang, Ding Jiayue, Wang Penghong, Lu Zhengyong
(School of Imformation & Electronic Engineering, Zhejiang Gongshang University, Hangzhou, Zhejiang 310018, China)
Abstract: According to the shooting competition when a real-time and accurate detection of the shooting results is required, a research on image recognition of target sheet with MATLAB is presented in this paper. An image processing algorithm based on MATLAB is used in order to analyse the ring number of impact point on the target sheet captured by digital camera. Grayscale conversion, median filtering, and binariztion of the target sheet image are used in the image pretreatment. Sobel operator is used to extract image edge, so the amount of computation is dramatically reduced. And the bullet hole is recognized and located by using improved Hough transform, image subtraction method and morphological algorithm. The experimental results show that the image processing algorithm has fast speed and good accuracy.
Key words: MATLAB; pretreatment; Hough transform; mension reduction; morphology
0 引言
随着科技的发展,射击比赛时采用自动报靶系统,将会越来越普遍。这种方式不仅能减少人力物力支出、提高报靶效率,还能减小由于人为带来的不确定因素。目前已有不少单位研究出多种自动报靶系统[1-4]。基于机器视觉的自动报靶系统,应用环境要求特殊,还未得到普及[1-4]。本文基于MATLAB函数工具箱实现靶纸弹孔检测的数字化方法,在射击时对靶纸图像进行采集,通过基于MATLAB的图像处理技术对靶纸图像进行处理分析,并模拟图像进行成绩输出。
1 靶纸图像采集读取
靶纸图像采集可以有多种方式,本实验采用最高像素值为300万的数码相机拍摄,图像采集简便,便于推广应用。MATLAB中提供的imread()函数用于实现图像的读取操作,可读取JPG、TIF、GIF、HDF、XWD和CUR等多种图像格式。调用该函数后将得到一个存储图像数据的矩阵,后期对图像的各种处理正是基于该数据矩阵来完成。
2 靶纸图像预处理[1]
2.1 图像灰度化
数码相机拍摄的图像为彩色图像,图像中每个像素都包含有R(红色)、G(绿色)、B(蓝色)三种基色分量信息,每种基色分量均需要占用八位来表示基色强度,数据量较大。为减轻计算机工作量,去除掉部分无用信息,将图像进行灰度化处理,减少后续处理分析耗时。
在MATLAB中采用rgb2gray()函数对图像进行灰度化处理,该函数中三基色的权重系数取值为(0.299,0.587,0.114)[5]。
2.2 图像增强
对靶纸图像增强是为了突出图像中的有用信息,同时对噪声等无用信息进行一定的消除,类似信号处理中的滤波器。图像噪声常常表现为孤立像素点,如果不去除噪声,会对边缘检测、图像变换以及后续的弹孔定位带来影响。MATLAB中提供了平滑滤波器、中值滤波器以及锐化滤波器这三种图像增强滤波器[6]。平滑滤波器本质上类似低通滤波器,只对信号的低频部分有很好地选通性。靶纸图像中对属于高频部分的圆环边缘提取十分重要,采用平滑滤波器将对其造成破坏。锐化滤波器有时会导致输出图像灰度值出现负值,还需要进行相应灰度转换,增加处理工作量。本文采用中值滤波器对靶纸图像进行滤波处理,能有效去除类似斑点噪声及椒盐噪声的孤立像素点,同时较好地保留了图像的边缘信息[2]。这是一种非线性的去噪方法,其基本原理是在图像中一个像素周围确定一个邻域,以该邻域中各像素点灰度值的中值来代换该像素点自身的灰度值[4]。
MATLAB中提供medfilt2()函数用于对图像信息进行中值滤波,二维滤波窗口可以为方形、圆形、菱形等,由图像像素点构成,可在函数中设置窗口形状,默认为像素点的方形窗口[5]。
2.3 靶纸图像二值化
由于对靶纸图像的处理主要是对圆环和弹孔的识别提取,对于图像灰度值并没有特定的要求,所以进一步对图像二值化以去除无用信息。所选取的阈值需要能够有效保留图像特征,保证后续处理的可靠性。对灰度化后的靶纸图像绘制灰度直方图,如图1所示。
从直方图看出灰度值集中在Y220范围内,其中Y220对应白色背景以及白色圆环部分,所以阈值TG取值应在30/255
3 基于Hough变换的靶心定位
3.1 Hough变换圆检测原理[2,7]
Hough变换将二维图像平面转换为三维参数空间,采用类似“投票”模式的判断方法。三个参数值分别为圆心的行坐标a,圆心列坐标b,以及半径r。对于图像平面中的任何一个像素点(x,y)都要在三维参数空间内进行遍历运算,若运算结果满足关系式,则对应三维空间中的参数点票数加一。完成运算后,三维空间中“票数”最多(或满足一定数量)的参数点,其参数即为检测到的圆所对应圆心坐标以及半径值。Hough变换检测圆三个参数间的一般关系如下式:
3.2 用于靶纸圆环提取的Hough变换降维算法
从Hough变换原理可知,其运算过程中将会有大量的时空消耗,减少运算维度和参与运算的像素点数可以提高Hough变换效率。前期已对靶纸图像进行预处理得到图像的二值图,减少了参与Hough变换的像素点数。接着,采用Sobel算子对靶纸圆环进行边缘提取。图像边缘是图像局部特征不连续的表现,出现在两个不同图像区域的交界,常常是灰度突变的结果,在灰度突变处进行微分运算将产生高值[8]。MATLAB中通过调用edge()函数进行边缘提取,函数计算结果为和输入图像一样大小的二值图。边缘提取对图像的特征信息进行提取,进一步减少Hough变换算法的工作量,减少运算时间。
由于靶纸圆环均为同心圆环,只存在一个位置固定的圆心。经边缘提取后的图像是由像素点组成的多个同心圆环,圆环特征较为明显,考虑降低Hough变换的计算维度来提高计算速度[9],先进行靶纸圆心的提取,将圆心横纵坐标分别提取。首先是横坐标的提取,以平行于X轴的扫描线,自图像顶部向下纵向扫描。此时靶纸上圆环边缘点值为“1”,背景为“0”,因此每向下扫描一行,记录该行i中间距最大的两个“1”值像素点的横坐标分别为、,直至扫描完图像。接着,以平行于Y轴的扫描线,自图像左边向右横向扫描,记录像素点纵坐标分别为ali、a2i,直至扫描完图像。若某行只存在一个“1”值点,则跳过该行。距离最远的两“1”值点为最外圈圆环上的点,坐标中值(ami,bmi)即为对应圆心坐标,计算公式如下:
由于边缘提取后的圆环边缘不完全连续,且可能存在弹孔边缘信息以及噪声点,若以文献[10]中尽量多弦交点的简单统计平均来计算坐标,将引入上述影响因素,导致圆心定位出现误差。因此,采用类似Hough变换证据积累的判断方法,对每行/列扫描得出的中值坐标采取投票的积累方式,出现相同的中值点坐标时则对该坐标对应“票数”Na[ami]加1,当遍历完整幅图像时,找出“票数”最多的中值点坐标ammax。此处,可设置一个阈值Ta,考虑到图像像素点的离散化以及边缘提取带来的影响,将中值坐标满足
内的对应点ami求和,接着求取平均值,此平均值记为圆心坐标a。同理得b。通过这种方法可以有效减少非最外圈圆环上弦交点即错误点或者噪声点的干扰的影响。MATLAB中调用sum()函数用于求和,调用max()函数用于求取最大值。坐标关系式如下:
上述算法的部分MATLAB代码如下:
%BW为边缘提取后靶纸图
[rows,cols]=find(BW); %搜索1值像素点
mount=size(rows); number=mount(1);
i=1; j=1;
while(i
xjd(j,1)=rows(a);
while(i
if(cols(i)==cols(i+1))
xjd(j,2)=rows(i+1);i=i+1;
else
i=i+1; j=j+1; break;
end
end
end
number=length(xjd); Na=zeros(1,number);
for n=1:number%for循环计算中值及票数
zz(n)=round((xjd(n,1)+xjd(n,2))/2);
Na(zz(n))=Na(zz(n))+1;
end
[amax,id]=max(Na); %找出票数最多中值点
a=(Na(id)*id+Na(id-Ta)*(id- Ta)+Na(id+Ta)*(id+Ta))/
sum(Na(id-Ta:id+Ta))%基于阈值Ta计算均值得坐标a
根据机器视觉中的ROI(Region Of Interest)理论,恰当选取ROI能有效减少图像运算的计算量[11]。根据先验知识图像采集时圆心处于图像中部区域,将待验证像素点所处范围设定为图像中部的矩形区域,该矩形区域边长设为图像边长的1/4,由此进一步减少参与运算的像素点。本算法将圆的参数方程写为极坐标形式:
已知圆心坐标,根据先验知识设定r的可能取值范围,遍历计算感兴趣区域中的边缘点,采用上述Hough变换证据积累的方法得到r[9],且设定一个阈值Tr,减少离散数据带来的误差。阈值的设定使得对于一些存在干扰的靶纸图像也能有效地进行圆环检测,例如靶纸存在一定形变或者是子弹击中内圆环带来的干扰,提高了算法的鲁棒性。
4 基于图像差影法的弹孔定位[12]
4.1 图像差影算法[2,4]
本文在弹孔定位的分析上,将弹孔视为一个运动目标,每次射击后弹着点都不同,近似为目标的运动过程。运动目标的检测算法有帧间差分法、背景差分法以及基于光流场的检测方法,图像差影法是利用当前图像与初始图像进行减运算来提取目标的一种检测方法[13]。首先,采集射击前的靶纸图像以及本次射击后的靶纸图像,将两幅图像视为视频中的前后两帧图像,接着采用帧间差分法获得弹孔信息,并将弹孔图像二值化处理。
4.2 形态学滤波处理[3]
提取的弹孔图像可能会包含噪声,将会导致弹孔定位出现误差,对该图像进行先腐蚀后膨胀处理的开运算[5]。在MATLAB中调用imerode()函数对图像进行腐蚀操作,去除图像中小而无意义的噪声像素点;接着调用imdilate()函数对图像进行膨胀操作,使弹孔区域恢复至原始大小,即消除由于腐蚀对弹孔面积带来的影响。两个函数均采用strel()函数定义一个结构元素,其在形态学中的作用好比滤波器中的滤波窗口,该函数支持创建线形、矩形、方形、球形和自定义类型等的结构元素。
实现弹孔提取及定位的部分MATLAB代码如下:
b=imread('current.jpg'); %靶纸读取
B=I-b; %射击前后的靶纸图像差影
B=im2bw(B,T); %基于阈值T进行二值化
subplot(221),imshow(B)
se=strel('square',2); %定义方形结构元素
imeBW=imerode(B,se); %图像腐蚀
subplot(222),imshow(imeBW)
imdBW=imdilate(imeBW,se); %图像膨胀
subplot(223),imshow(imdBW)
[row,col]=find(imdBW==1); %搜索弹孔
x=min(col); w=max(col)-x;
y=min(row); h=max(row)-y;
subplot(224),imshow(imdBW)
hold on; %图像保持
rectangle('Position',[x,y,w,h],'LineWidth',1,'EdgeColor',
'w'); %框弹孔区域
5 实验结果
仿真实验在2.3GHz,RAM为4GB的计算机上进行,采用MATLAB8.2语言编写代码。本次实验采用靶纸满环11环,且不同环数圆环半径差相同。实验结果如图2、图3和图4所示。
求得弹着点环数及误差。其中(a,b)为环心坐标,(xd,yd)为弹孔坐标,r为中心圆环半径,Hj为环数计算值,Sj为人工计算值(采用尺规法测量),ρ为环数相对误差。计算结果若为负数,则判为脱靶。靶纸测试结果如表1所示。
6 总结
基于MATLAB函数工具箱的图像处理,函数调用方便,程序设计高效。首先通过图像预处理去除无用信息,接着将Hough变换算法降维进行内圆环的定位,最后搜索定位弹孔,求出弹着点坐标,方案适用于圆环完整的靶纸识别。计算出的射击环数相比人工计算误差在0.1环以内,且计算速度较快。进一步,可考虑靶纸形变带来的影响或将方案转换为硬件系统以提高实时处理性能,可以应用于射击比赛中的自动报靶系统,免去人工报靶可能带来的不确定性因素,提高比赛的公正度和效率。
参考文献(References):
[1] 周晓伟.基于图像处理的自动报靶系统研究[D].中北大学硕
士学位论文,2011.
[2] 陈海萍.基于机器视觉技术的模拟射击训练系统研究与设计[D].
厦门大学硕士学位论文,2012.
[3] 罗真.基于图像处理的自动报靶系统设计[D].中南大学硕士
学位论文,2014.
[4] 谢殿强.基于ARM-Linux机器视觉的军用自动报靶系统的
研究[D].山东大学硕士学位论文,2009.
[5] 周品.MATLAB图像处理与图形用户界面设计[M].清华大学
出版社,2013.
[6] 叶雯.基于MATLAB的图像去噪研究[J].计算机时代,
2015.6:10-12
[7] 陈小艳,王强,李柏林.改进的Hough变换检测圆方法[J].计算
机系统应用,2015.8:197-201
[8] 蒋先刚.数字图像模式识别工程软件设计[M].中国水利水电
出版社,2008.
[9] 赵京东.用两步Hough变换检测圆[J].计算机应用,2008.7:
1761-1763
[10] 孙蓉蓉.图像处理技术在自动报靶系统中的应用研究[D].南
京理工大学硕士学位论文,2006.
[11] 孙国栋,赵大兴.机器视觉检测理论与算法[M].科学出版社,
2015.
[12] 崔亚琳.基于计算机视觉的射箭精确自动报靶系统研究[J].