时间:2023-12-27 10:28:41
引言:寻求写作上的突破?我们特意为您精选了12篇计算机视觉技术原理范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
中图分类号:TP391.41
受到CIMS的推动和影响,诸多企业的发展趋势逐步趋向于个性化以及自动化,这种大的发展趋势间接的对我国的计算机辅助技术提出了更高的要求,计算机相关技术的发展面临着更加严峻的挑战。就现阶段分析来看,计算机辅助检测技术在现代诸多企业中得到了广泛的应用。随着柔性制造系统的不断进步与发展,驱动图像处理软件、现场总线技术的日趋成熟,检测系统的灵敏性、智能化特点愈发受到人们的关注,在这种大的发展趋势之下,计算机视觉检测技术得到了较快的发展。基于计算机视觉系统现已经广泛应用于现场监控、工况监视等诸多环境之中。
1 关于对视觉技术的相关研究
1.1 基于计算机的视觉检测技术的原理分析和探究
图像技术主要指的就是通过各种途径所实现的对图像的获取以及进一步的深入加工和处理技术。根据视觉检测技术的抽象程度以及对图像处理方式的不同,可以大致将图像的处理和加工技术划分为三个最主要的层次,这三个层次分别是图像的加工处理、图像的分析以及对于图像的理解。将这三个层次进行进一步的结合,便是图像工程。计算机视觉检测技术是一门新兴的计算机检测技术,该技术建立在对计算机视觉研究的基础之上,吸收和借鉴相关的研究成果,借助于传感器来实施三维测量,进而有效获得被测物体的空间具置信息,故而可以很好的满足当代制造业的发展需求。区别于一般的图像处理系统,计算机视觉检测技术所获取的相关数据信息更为精准和迅速,其环境适应性更强。
基于计算机的视觉检测技术注重计算理论的辅导作用,以应用为目标进行视觉技术分析。自上世纪七十年代以来,我国关于对计算机视觉检测技术的研究又取得了显著的进步,并且逐步迈入更为实质性的研究阶段,在该阶段中,逐步开始从通过从多个角度(诸如光学角度、生理学角度以及投影射影角度等等)对其成像问题加以分析。以Marr为代表的专家更是建立了一些一般性的视觉性处理模型来辅助该技术的研究。
1.2 视觉检测技术中传感器的作用
在计算机的控制下配有相关的视觉检测系统,在该视觉检测系统中,主要有三个主要方面的主要作用:第一,对于视觉传感器模型的分析以及确定;第二,进行图像数据分散与整理的相关工作;第三,CAD模型的建立。传感器的主要作用就是对测量棒材的多个截面进行分析,将所收集得到的数据经由图像采集卡采集后,传到相关的图像处理系统中,进而进一步辅助准确的模型的建立。
2 基于计算机的视觉检测技术的应用研究分析
2.1 基于计算机的视觉检测技术的发展状况研究
在研究的初步阶段,相关技术人员借助于数字化的图像处理技术,主要就是为了进一步提高所获得的数字照片的清晰度和质量要求,进而更为精准、科学、规范的对照片所提供的信息加以辨别,为航空卫星图片的读取、识别和分类做准备。在这一系列的视觉工作中,其中最为主要和常见的工作主要是包括分类、识别判读以及三维结构的构建。
基于计算机的视觉检测技术借助于对计算机视觉技术,将所获得的被观察物品的相关信息加以信号转换,并传递给图像处理系统,图像处理系统通过甄别和判断不同照片像素的分布和亮度等讯息,将其进一步转换成为数字化信号,接下来由计算机的图像系统抽出符合目标特征的信号加以运算,对下一步的设备动作加以决定和执行。
就现阶段而言,我国的计算机视觉检测技术系统在诸多领域均有所应用,最为典型的领域诸如医学的辅助诊断、机器人的感应系统、智能化的人机接口等均是建立在该技术的基础之上。借助于计算机视觉技术这一手段,可以有效提高对产品检测的效率,提高精准度,这种新型的视觉检测技术相比较于传统的人眼在流水线上的跟进,其具有显著的优越性,其获取测量结构迅速、检测结果可以直接被观察、可以进行自动识别以及定位准确和实时性的特点,这就很好的避免了由于人的一些主观性因素所导致的误差出现。
二十世纪以来,基于生物特性的计算机视觉检测技术得到了空前的发展,具体表现在人脸识别、生硬识别、指纹识别以及虹膜的识别中,形式日趋灵活和复杂多变。借助于计算机的视觉检测技术,可以有效对用户的身份进行鉴定和识别、判定用户的特殊信息等。除此之外,还可以将基于计算机的视觉识别技术逐步推广到其他领域,如海关的安全检查以及出口、入口的安全控制等领域。
2.2 基于计算机的视觉检测技术的相关应用分析
2.2.1 数码相机中所采用的图像采集技术
视觉检测技术的一个显著特点就是有效提高了生产的柔性和自动化程度,本世纪以来,数码相机凭借其高分辨率,快速成像、显像,功能丰富多变以及性价比较高的特定风靡全球,逐步取代了传统的照相机,传统的照相机主要采用的是CCD 摄像头,其主要的核心及时采集卡,显然这种采集系统已经逐步落后于时展的脚步,现已逐步被淘汰。
2.2.2 微文字识别系统的相关研发和设计
随着科学技术的不断进步与发展,大规模集成电路得到了较快的进步,基于计算机的视觉检测系统的成本得到了极大的降低,基于计算机视觉检测技术的微文字识别系统的研发也被提到了日程中来。微文字识别系统的处理芯片大多是借助于数字信号处理芯片来实现图像的识别,进而借助先进的语音合成技术将朗读变为可能。此外,为了便于使用,该系统的体积被尽可能的缩小,并且可根据美观度和实用性等设计为各种形状。
2.2.3 特殊用纸水印在线检测系统
基于计算机的视觉检测技术可以在某一特定领域代替人的主观判断,诸如水印质量的自动检测方面。区别于普通的工作人员,计算机可以实现长时间工作,对于误差范围的控制可以通过设置等实现,而且在计算机执行任务期间,所受到的客观和主观因素相对较少,这就极大程度上避免了由于人的因素所导致的失误性操作,进而有效提高了工作效率以及检测的精准度。这一优点,在水印质量标准的认定中具有十分重要的意义和作用,通过研发一定的程序和软件,可以制定出一套操作性强、权威性较高的水印清晰度量化标准。
3 基于计算机的视觉检测技术的发展展望
综合分析来看,计算机视觉检测技术现已有大约四十年的历史,作为一种新兴的检测技术,该技术的显著优越性不言而喻,该检测技术以其高精度、反应灵敏迅速、智能化、自动化等特点被广泛应用于诸多领域和行业之中,并取得了显著的成,可以说,该技术具有十分广阔的发展前景。但是,不可否认,基于计算机的视觉检测技术并不是十分的成熟,在其设计和研发过程中仍然存在着诸多不足,而且视觉检测技术是一项设计到心理、生理等多方面知识的复杂性技术,涉及领域众多,更强大功能的实现需要人类知识的不断拓展和延伸,因此,必须意识到该检测技术发展道路上的困难和挑战。
4 结束语
随着科学技术的不断进步与发展,经济的发展对于新技术的研发提出了更高的挑战,再者由于广大人民群众生活质量的不断提高,对于生活水平也有了进一步的认识和了解。基于计算机的视觉检测技术的研发和进步,无疑更好推动了高速发展的经济,不断满足了人民群众日益提高生活需求。由此来看,深入对视觉检测技术的研究和探究无疑具有十分重要的作用,笔者衷心希望,以上关于对我国基于计算机的视觉检测技术的相关探究能够被相关负责人合理的吸收和采纳,进而更好的推动科学技术的创新和进步,推动经济的不断进步与发展。
参考文献:
[1]李旭港.计算机视觉及其发展与应用[J].中国科技纵横,2010(06):42.
(2)课程定位方面:现有课程体系中未能体现最新研究成果,而掌握世界最新工程应用成果是卓越工程师的基本要求之一。
(3)教学形式方面:传统计算机视觉课程侧重基本原理,尽管范例教学被引入到课堂教学中,在一定程度上帮助学生理解,但卓越工程师培养目标是培养学生解决实际工程问题的能力。针对卓越工程师培养目标,以及目前计算机视觉课程中存在的问题,本文提出工程应用导向型的课程内容、面向最新成果的课程定位、理论实例化与工程实践化的教学形式,以培养具有扎实理论基础及工程实践能力的卓越工程师。
1工程应用导向型的课程内容传统计算机视觉课程围绕Marr理论框架展开教学,其中部分原理仅在理想状态或若干假设下成立,不能直接运用到工程实践中。近年来已具备工程应用基础的原理及方法,在传统课程内容中较少出现,如已在工业测量、视频监控、游戏娱乐等领域中应用的主动式三维数据获取方法等。我们对工程应用价值高的课程内容,增加课时,充分讲解其原理及算法,并进行工程实例分析;对工程应用价值较低内容,压缩课时,以介绍方法原理为主。例如,在教授3D信息获取部分时,课时主要投入到工程应用价值较大的内容,如立体视觉、运动恢复结构、基于结构光的3D信息获取等;而对于基于阴影的景物恢复等缺乏应用基础的内容主要介绍其基本原理,并引导学生进行其工程应用的可行性分析,培养学生缜密的思维习惯,训练学生辩证的分析能力。
2面向最新成果的课程定位计算机视觉近十年来发展迅速,新方法和新理论层出不穷,在现有课程体系中未能得以体现。跟进世界最新成果是卓越工程师的基本要求之一,因此计算机视觉课程定位应当面向国际最新成果。为实现这一目标,我们主要从以下两方面入手。
(1)选用涵盖最新成果的教材。我们在教学中加入国际最新科研成果及应用范例,在教材选取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作为参考教材。该书是RichardSzeliski教授在多年MIT执教经验及微软多年计算机视觉领域工作经验基础上所著,涵盖计算机视觉领域的主要科研成果及应用范例,参考文献最新引用至2010年。这是目前最新的计算机视觉著作之一,条理清晰,深入浅出,特点在于对计算机视觉的基本原理介绍非常详尽,算法应用紧跟国际前沿。
(2)强化学生调研及自学能力。“授之以鱼”,不如“授之以渔”。在教授学生的同时,更重要的是培养学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。为强化学生的知识结构,培养学生跟踪国际前沿的能力,我们在教学中加入10%的课外学时,指导每位学生完成最近三年本领域的国际最新文献调研及工程应用新技术调研,并撰写相关调研论文。同时,设置2学时课内学时,让每位学生介绍调研成果,并进行课堂讨论。在调研基础上,选择相关算法进行了实验证明,进一步强化学习成果。实践证明,由于学生能够根据自己的兴趣,选择本领域感兴趣的课题进行深入调研,极大地调动了学生的积极性,强化了学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。
随着计算机技术的快速发展,计算机设备逐渐被应用到社会生活的各个方面,尤其是在当前计算机视觉技术和图像处理技术快速发展的时期,各个科技领域中的计算机视觉技术已经逐渐成熟。计算机视觉技术主要是利用计算机智能化来替代人眼,即对于客观存在的三维立体化世界的理解和识别,整个实现过程均是以计算机技术作为基础。随着计算机视觉技术的不断发展,现今其已逐渐成为了一门神经生理学、计算机工程、信号学、物理学、应用数学等综合性学科。计算机视觉技术系统其在高性能计算机基础之上来实现对大量数据的获取,并且通过智能算法来对获取数据进行处理,从而完成对数据集成。
一、视频中运动物体检测原理
对于视频中的运动物体检测主要分为两中方法,其一为宏观检测法;其二为微观检测法。宏观检测法是对获得的整幅图像进行检测,而微观检测法则是对所需要的区域进行图像检测。视觉技术在检测运动物体的时候,首先对图像进行采集,并对采集的信息数据进行预处理,将图像进行分割,然后分别提取运动物体的影象,从而实现参数的更新。图像采集过程中采用背景差分法,实现对背景图像的提取,其通过一定算法采用人为手段获取没有背景的图像。另外在进行运动物体检测的时候还可以采用帧间差分法,其主要是实时获取帧图,然后实现一帧一帧图像比值的比较,从而获取具有差值的图像。运动物体进行检测的时候需连续获取帧图,将这些帧图组合起来,其实就是物体的运动轨迹,然后同分割技术就能勾勒出物体的轮廓。随着计算机视觉技术的不断深入研究,发现此两种方法单独使用仍然存在的一些缺点,于是研究人员将二种检测方法进行融合,形成一种综合检测方法。综合检测法将两者检测方法的优势进行了融合,并将其灵活的应用到了生产和生活之中,取得了十分不错的效用。
二、基于Opencv的计算机视觉技术探究
(一)基于Opencv的运动物体检测
运动物体在进行检测的时候,基于Opencv的检测原理主要为:根据物体某项特定信息,例如,颜色、轮廓、性状等,在复杂背景中利用这些特定的信息将物体分离出来。整个图像的分离过程首先是进行视频流捕捉,然后是进行视频的格式转换,再将图像进行预处理,从而提取前景物体,减少环境因素对图像处理的误差,最后根据物体特征提取,并完成对运动物体的跟踪。从图像中提取所需的目标物体,其实质就是对整个屋里轮廓进行检测和分割,根据每个图像的帧差异来进行提取。
(二)基于Opencv图像预处理
视觉技术应用于复杂的环境之中,由于存在着光照的变化,其场景中所出现的环境因素对视频采集设备性能影响很大。环境因素会使得获取的图像信息的质量降低,并且在图像中无法避免的存在着噪点,这对于运动物体的检测和图像采集会造成很大的影响。当获取视频帧图像之后需对其数据进行预处理,通常有平滑度滤波处理、图像填充、图像背景更新等。
1.平滑度滤波处理
由于在进行视频图像采集的时候存在着噪点,那么我们就需要对其进行噪点处理,以求减小噪声。滤波平滑度滤波处理,其具有线性和非线性两种方式,其中线性方式进行处理器运算简单、运算速度快,但是在进行处理之后的图像都会呈现不清晰的情况。而非线性方式尽心给处理之后,虽然能够很好的减小噪点,确保信号的局部特点,但是其运算的速度会较慢。
2.图像填充
对于帧图像进行处理,通常采用检测边缘填充法或者是腐蚀膨胀法来完成,其中填充法是指当检测出目标物体之后,利用边缘检测方法来对物体进行辨识,然后利用形态学的漫水填充法进行填充。图像的腐蚀膨胀则主要是由于摄像机的性能等问题造成的。
3.实时背景更新
在进行图像差分之前,需要对背景图样进行确定,并且需要对其进行初始化处理。以方便以后在进行检测时候能够对实时背景图进行差分计算,只有这样,才能够获得极佳的前景效果。在进行图像差分时,首先需要根据指定法来确定第一帧背景的图像,并将其指定为第一张背景图片,然后在检测过程中根据算法对背景实施更新。整个图像在进行更新时,其主要的流程为:判断并读取图像是否为第一帧;将Opencv处理的图像转化为单通道灰度值;将实时采集的图像进行高斯平滑度处理,去除噪点;最后使用形态学滤波处理噪点。
(三)提取前景运动物体图像
检测运动物体的时候,只有在检测流程中确保精确度,才能够获取满意的前景跟踪效果。此过程中主要分为两个步骤,第一步为二值化图像之后进行分割;第二步,图像分析前处理,进行充分填充,确保前景图的完整性。其中,前景图的提取主要分为下面几个步骤:首先对前景图像和背景图像进行差分,然后对差分的图像进行二值化,再对背景中的前景图像边缘进行检测,根据轮廓进行填充图像。由于摄像头存在于不同的场景和环境之中,不论是室外或者是室内随着场景的变化都会对图像的采集产生影响。那么在前景图中提取目标就需要在检测系统中采用有效手段来完成背景实时更新。
阀值二值化分割法可以对检测的物体进行前景和背景差图分割,从而使目标物体能够分离出图像,且阀值分割先要确定每个像素的点是否处于灰度范围值之内。将图像中的像素灰度与确定的阀值进行比较,其结果解释所有像素点分为2类,一类像素的灰度小于阀值,另外一类就是大于阀值。阀值二值化分割时,确定分割的阀值T,然后分割图像。选取合适的阀值进行分割,可以有效的减少光照因素影响,常用的动态阀值主要有直方图来法与最大类方差法这另种分割方法。
三、计算机视觉三维技术
计算机视觉技术的核心为分割问题、运动分析、3D立体场景重构等,立体视觉主要是从多幅图像的参照中获取目标物体的三维几何信息。计算机视觉所模拟出的3D立体画面只需要摄像机从不同的角度同一时间针进行图像捕获,将2D信息进行3D重构,进而将计算机程序重建于真实的三维场景之中,以恢复物体的真实空间信息。
(一)视觉系统
视觉系统捕获图像的过程,实则可以看成为对大量信息进行处理过程,整个系统处理可以分为三个层次,其一,理论层次;其二,描述层次;其三,实现层次。在摄像机视觉系统之中,输入的是2D图像,但是输出为3D信息,而这就可以实现对图像的位置、距离等信息的如实描述。视觉系统分为三个进阶层次,第一阶段为基础框架;第二阶段为2.5D表达;第三阶段为三维阶段。在第二阶段中实现的2.5D表达,其原理是将不完整的3D图像信息进行表达,即以一个点为坐标,从此点看去某一些物体的部分被遮挡。第三阶段的三维阶段,则是人眼观察之后可以从不同的角度来观察物体的整体框架,从而实现了将2.5D图像信息的叠加重合运算,进一步处理之后得到了3D图像。
(二)双目视觉
人们从不同角度观看同一时间内的同一物体的时候,可以利用算法测量物体间的距离。此法被称为双目立体感觉,其依据的原理是视觉差原理,利用两台摄像机或者一台摄像机,对两幅不同的图像进行不同角度观察,并且对其观察的数据进行对比分析。实现双目立体视觉与平面视觉图像获取,其主要的步骤为:
(1)图像获取
从两台不同的摄像机,捕获帧图像,由于环境因素会造成图像差异困难。为了更好的跟踪目标、检测,当捕获图像之后,需要对图像进行预处理。
(2)摄像标定方式
获得真实坐标系中的场景点中的与平面成像点占比见的对应关系,借用三维立体空间中的三维坐标,标定之后确定摄像机的位置以及属性参数,并建立起成像的模型。
(3)特征提取方式
所谓的特征提取方式主要是为了提升检测、跟踪目标的准确性,需要对目标物体进行特征提取,从而实现对图像分割提取。
(4)深度计算
深度信息主要是根据几何光学原理,从三维世界进行客观分析,因为距离会产生不同的位置,会使得成像位置与两眼视网膜上有所不同。简单来说,客观景物的深度可以反映出双目的视觉差,而利用视觉差的信息结合三角原理进行计算,可呈现出深度的图像信息。
(三)摄像机模型
摄像机在标定过程中确定了其建立的基础为摄像机的模型,摄像机模型在标定过程中关系到三个不同坐标系的转换,分别为2D图像平面坐标系、摄像机自身坐标系以及真实的世界坐标系。摄像机在摄像的时候起本质是2D图像坐标转换,首先要定义摄像机的自身坐标系,将坐标系的原点设置为光心,X、Y、Z成立三维坐标系。其次则是建立平面的图像坐标系,用以透视模型表示,其原点也在广心的位置,称之为主点。实际应用中,物理的距离光心的位置d≠f焦距,而且会远远大于焦距,为了解决如此问题就提出了平面概念。在光轴z上设置一个虚拟的图像平面,然后在此位置于平面关于光心对称。接着,在设置的虚拟2D坐标系中,光轴和原点重合,并且摄像机与垂直平面的垂直方向相同,真实图像上的点影射到摄像机坐标系。
(四)3D重构算法
视频流的采集,主要是采用Kinect设备、彩色摄像头、红外发射摄像头、红外接收摄像头。使用微软提供API控制Kinect设备,在操作之前需调用NUI初始化函数,将函数的参数设置为用户信息深度图数据、彩色图数据、骨骼追踪图数据、深度图数据。上述的视频流的打开方式不同,既可以是一种打开方式,也可以是多种打开方式,尤其在进行Kinect传输数据处理的时候,需遵循三条步骤的运行管线。此三条管线分别为:第一条为处理彩色和深度数据,第二条为根据用索引添加颜色信息,并将其放入到深度图之中,第三条为骨骼追踪数据。
四、总结
随着计算技术的快速发展,视觉技术逐渐被广泛的应用于我们日常的研究之中。本文通过对视觉技术的相关问题进行分析,探究了图像处理、分割、前景提取、运动物体观测以及重构3D图等问题,为实现视觉技术更加深入研究做出了相应的贡献;为广大参与计算机视觉技术研究同仁提供一个研究的思路,为实现视觉技术的腾飞贡献薄力。
参考文献
引言
摄影测量学是一门古老的学科,若从1839年摄影术的发明算起,摄影测量学已有170多年的历史,而被普遍认为摄影测量学真正起点的是1851―1859年“交会摄影测量”的提出。在这漫长的发展过程中,摄影测量学经历了模拟法、解析法和数字化三个阶段。模拟摄影测量和解析摄影测量分别是以立体摄影测量的发明和计算机的发明为标志,因此很大程度上,计算机的发展决定了摄影测量学的发展。在解析摄影测量中,计算机用于大规模的空中三角测量、区域网平差、数字测图,还用于计算共线方程,在解析测图仪中起着控制相片盘的实时运动,交会空间点位的作用。而出现在数字摄影测量阶段的数字摄影测量工作站(digital photogrammetry workstation,DPW)就是一台计算机+各种功能的摄影测量软件。如果说从模拟摄影测量到解析摄影测量的发展是一次技术的进步,那么从解析摄影测量到数字摄影测量的发展则是一场技术的革命。数字摄影测量与模拟、解析摄影测量的最大区别在于:它处理的是数字影像而不再是模拟相片,更为重要的是它开始并将不断深入地利用计算机替代作业员的眼睛。[1-2]毫无疑问,摄影测量进入数字摄影测量时代已经与计算机视觉紧密联系在一起了[2]。
计算机视觉是一个相对年轻而又发展迅速的领域。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[3]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看做是计算机视觉的分支。
数字摄影测量的发展已经借鉴了许多计算机视觉的研究成果[4]。数字摄影测量发展导致了实时摄影测量的出现,所谓实时摄影测量是指利用多台CCD数字摄影机对目标进行影像获取,并直接输入计算机系统中,在实时软件的帮助下,立刻获得和提取需要的信息,并用来控制对目标的操作[1]。在立体观测的过程中,其主要利用计算机视觉方法实现计算机代替人眼。随着数码相机技术的发展和应用,数字近景摄影测量已经成为必然趋势。近景摄影测量是利用近距离摄影取得的影像信息,研究物体大小形状和时空位置的一门新技术,它是一种基于数字信息和数字影像技术的数据获取手段。量测型的计算机视觉与数字近景摄影测量的学科交叉将会在计算机视觉中形成一个新的分支――摄影测量的计算机视觉,但是它不应仅仅局限于地学信息[2]。
1. 计算机视觉与数字摄影测量的差异
1.1 目的不同导致二者的坐标系和基本公式不同
摄影测量的基本任务是严格建立相片获取瞬间所存在的像点与对应物点之间的几何关系,最终实现利用摄影片上的影像信息测制各种比例尺地形图,建立地形数据库,为各种地理信息系统建立或更新提供基础数据。因此,它是在测绘领域内发展起来的一门学科。
而计算机视觉领域的突出特点是其多样性与不完善性。计算机视觉的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息,因此直到计算机的性能提高到足以处理大规模数据时它才得到正式的关注和发展,而这些发展往往起源于其他不同领域的需要。比如在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用计算机来替代人工视觉。
由于摄影测量是测绘地形图的重要手段之一,为了测绘某一地区而摄影的所有影像,必须建立统一的坐标系。而计算机视觉是研究怎样用计算机模拟人的眼睛,因此它是以眼睛(摄影机中心)与光轴构成的坐标系为准。因此,摄影测量与计算机视觉目的不同,导致它们对物体与影像之间关系的描述也不同。
1.2 二者处理流程不同
2. 可用于数字摄影测量领域的计算机视觉理论――立体视觉
2.1 立体视觉
立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分[5]。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。
2.2 影像匹配
立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。
在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。
2.3 多目立体视觉
中图分类号:TP319文献标识码:A文章编号:16727800(2012)007014902
作者简介:许志雄(1968-),男,浙江绍兴人,江汉石油钻头股份有限公司工程师,研究方向为计算机多媒体。
0引言
计算机技术的应用在诸多领域占据了主要位置,并得到了人们的极大重视。在此形势下,摄像机的高清晰度亦成为了人们追逐的目标,而在计算机视觉中的定标方法有各种不同的处理方式,从而为摄像机的发展提供了一个绝好的机会。由此,计算机视觉中的摄像机定标方法成为当今世界摄像机研究领域里至关重要的一个方面,以摄像机得到的图像信息作为出发点来计算三维空间中自然场景的几何信息成为计算机视觉的基本任务之一,并且它的应用特点也得到了人们的密切关注。
1摄像机视觉投影原理
透镜成像的原理利用了光的折射现象,而摄像机的视觉投影原理和透镜的成像原理相差无几,只不过在一些细节上进行了相应的改变,使成像更加清晰,以更好地满足人们的需求。摄像机视觉投影原理就是利用镜头的光学原理进行视觉成像,而其中又有许多理论支持,包含镜头与焦距和视角。焦距是指镜头的焦点之间的距离,对于摄像机而言,就是指从镜头的中心位置到摄像管,也可以说是成像的位置之间的距离就是摄像机镜头的焦距,只有调整好了这两者之间的距离,才能保证摄像机的摄像效果,这也是保证摄像机正常工作的首要任务。视角要受到镜头焦距的限制,由镜头焦距对摄像的大小情况而决定,摄影师们就是通过对焦距的不断变换来改变对任务的造型,从而改变人们的视觉效果。对于拍摄相同距离的目标而言,镜头焦距越大,摄像的水平视角就会变得越窄,这样带来的后果就是拍摄到的目标的范围就越小,使得拍摄效果大打折扣,从而给摄像机带来不利的使用效益。因此,必须在两者达到一个较好的组合效果之时,才能够充分发挥摄像机的作用,并将摄像艺术发挥到极致。由此可见,计算机视觉中的摄像机定标方法将会给摄像机的拍摄效果带来巨大的转变。
2计算机视觉中的摄像机定标方法
2.1三维定标法
在人们的平常思维中,凡是物体的影像必定是三维的,本文的理论研究也同样基于这样的想法。在讨论单幅图像的设计标定之时,我们所追求的理论基础就是需要摄像机的定标物是人们所追求的那种三维的效果,在此基础上再进行相关的理论研究,以达到相得益彰的效果。在此过程中,首先要准确定位定标物上一些比较重要的点的三维坐标,这样才能够为后来的工作提供方便;然后在与定标物相对应的成像上找到相应的点的位置,这是至关重要的一步,这也决定了后面成像的具体设计方法;最后在那些比较重要的点的图像上标出其具体的三维坐标,达到定标物的实际成像效果图,这样就可以完全解决摄像机的成像问题了。这种定标方法的基本原理就是充分分析定标物的三维信息,同时与它的具体成像位置相关联,在这两者之间形成一种具体的相对应关系。由此我们可以充分利用计算机的快速运算,实现摄像的功能,并适时进行程序功能改进,优化定标物参数的获取方法,从而达到增加摄像机清晰度的目标。
2.2平面定标法
与上面的定标方法相对立的一种方法就是多幅图像的设计标定。在这样的时代背景下,人们的要求应尽可能得到满足,因而理论研究者会在这个方面下足功夫,弄懂这里面的个中玄机,利用多幅图像对平面的定标物来进行物体的标定工作,以达到摄像机定标的目的。这样的平面定标方法就是充分利用平面物体的运动特性,在它和摄像机之间找到一个平衡点,观察两者的相对运动,这样的定标方法也给拍摄运动中的物体带来了生机。此方法在实施之余也会带给人们不一样的感受,让人们充分体会到摄像的魅力。当然这种考虑运动的平面定标法会受到特征点的增多的影响,随着点的不断增加,定标情况就会越来越好,定标物的精度也会不断提高,于是在定标物相同的前提下,平面定标法自然就可以从定标物上获得更多的数据信息,为准确对定标物进行定位测量提供了更多的依据。因此,这种方法的效果要比前面的方法好很多,得到推广的力度也会大大增加,所得到的经济效益也会增加,设备的成本在原来的基础上还有降低的趋势。所以,理论研究者的研究领域就会逐渐向这一方面进行转变。
2.3两步定标法
有了前面的研究成果作支撑,摄像机定标方法的进一步研究就会显得异常容易,人们的进一步要求也会得到满足,可谓一举两得。理论研究者们在有了丰富的理论和实践基础之后,利用直接线性的定标方法进行摄像机参数的进一步优化提高,通过透视原理来修改以前的参数,然后将修正的参数进行初始值的确认,把它们作为现在研究阶段的起点,在这样的起点之上综合考虑各种外界因素,利用最优化的计算机算法进行摄像机成像程序的改进,把原来的程序进行升级处理,使得定标物的精确度得到进一步的提高,这就是我们所提到的两步定标法。它的基本原理其实很简单,只不过是充分利用了原有的理论,并进行了一定的创新而已。但就是这样的创新步伐的迈出,给计算机视觉中的摄像机定标方法带来了新的生机,也给摄像机镜头的优化带来了很多指导方法。在图像中心到图像点的距离保持不变的前提下,参数的数量会显著减少,这样不仅节省了材料的用量,而且还进一步提高了摄像机的摄像清晰度,有效弥补了以前清晰度不高的缺点。这样一来,摄像机的成像效果大大改进,于是才有了现代摄像机的高清效果,确实让人们享受到了科技带来的福音。
3计算机视觉中的摄像机定标方法的应用特点
3.1建立于主动视觉上的自我标定
由于计算机视觉中摄像机定标方法的不断推广,一些计算机技术在摄像机的制作过程中得到了较好的应用。但是在这之中必不可少地存在一些制作人员或设计人员的主观因素,这样摄像机的标定方法中就会形成形色各异的特点,而且彼此之间可能会出现较大的不同,特别是在主动视觉上的自我标定。在主动视觉中,我们所用到的摄像机可以在一个被控制的平台上被人们固定,利用计算机的高运算能力,计算机可以把平台上所出现的参数精确地读出来,我们只需要利用控制摄像机的运转顺序,让摄像机作一定的周期运动,就可以在这个过程中得到更多的图像,然后再利用所成的图像和固定的摄像机的运动参数来确定摄像机的运动情况。这种自我标定方法比较简单,但是必须为人们提供精确控制摄像机运动的平台,这种以主观意识为主的标定特点强化了个人的主观能动性,让人们更加易于接受。
3.2进行有层次划分的逐步标定
近年来,人们对摄像技术的理论研究已经日趋成熟,并根据自己的意愿进行相关的研究工作,把自己的想法融入到摄像机的设计中,真正做到有层次的逐步标定,把所要的标定物以逐个击破的方式实现有层次的程序算法,从而让人们在逻辑上能够有所认识,并且易于接受,从而达到有层次划分的逐步标定的目的。分层逐步标定法已为标定研究领域中普遍认同的方法之一,在实际的应用中逐渐取代了直接标定的方法。因为进行有层次划分的逐步标定是符合人们的想法的,而且这种方法的特点是以射影标定作为基础,以某一幅图像作为基准图像,进行其它图像的射影对齐工作,从而将摄相机中成像未知参数的数量减少,更易于为人们所接受。可以说,进行有层次划分的逐步标定是人们在实践中得出的一套符合大势所趋的标定方法,为世人所推崇。
4结语
综上所述,计算机视觉中摄像机定标方法在人们的不断认识中得以应用和推广,在时代的不断进步中逐渐向前发展。同时,摄像机标定方法的应用特点也大相径庭,各有千秋,从而实现百家争鸣的态势,进一步推动计算机视觉中的摄像机研究工作的向前发展。
中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2014)07-0001-01
随着科学技术的快速发展,计算机技术也得到了飞速的发展。将计算机技术应用于人类的视觉系统,并辅助人们观察到一些眼睛难以看到的东西,已经逐渐成为一门大家所热捧和追逐的技术。随着人们对视觉传感器技术越来越多的探索,人们也逐渐实现了古代时想拥有千里眼的梦想。目前,人们已经把视觉传感器技术和计算机技术良好的结合在一起,并把这些技术应用到食品、建筑、医药、电子、航天航空等众多领域当中。而该项技术的快速发展,也帮助人们解决了一些日常工作当中人类视觉存在盲区的问题,保证了人们工作过程的安全。视觉技术与IT技术的完美结合使得人们的生活变得更加便利,让人们亲身体会到了IT技术给人们生活带来的便捷。
1 双目立体视觉概述
双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。
双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。
视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。
2 双目立体视觉技术的原理
立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。
三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。
双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。
双目立体视觉在计算机技术中实现三维重建的大致流程
如下。
1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。
2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。
3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。
4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。
5)根据得到的视差图最终实现场景的三维图形的重建。
3 双目立体匹配技术的研究难点和未来的发展方向
尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。
立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。
1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。
2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。
3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。
从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。
4 结束语
人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。
参考文献
[1]高文,陈熙霖.计算机视觉算法与系统原理[M].北京:清华大学出版社,2002.
[2]明祖衡.双目立体视觉测距算法研究[M].北京:北京理工大学,2008.
[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SAD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.
计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。
二、计算机视觉检测的基本原理
要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computer vision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。
作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。
三、亚像素检测技术
随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。
边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。
四、计算机视觉检测技术在机加工零件检测中的应用要素与过程
(一)曲阵CCD相机
面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。
(二)工业定焦镜头
在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。
(三)数字图像采集卡
随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。
(四)标定板
为提高测量精度,需要进行摄像机标定。标定过程中,采用NANO公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。
(五)背光源
背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。
五、结语
随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。
中图分类号:TP274.4
计算机视觉分析理论是基于精密模式识别和人工智能程序化校验技能进行综合整编的方法,利用光学信息对真实物理结构的实时反映,配合人机协调手段进行二维图像的呈现。在工件表面进行质量检测和图片制备要素分析的系统环节中,阐述物体在空间环境之间的关系样式,争取三维场景的科学搭建。集合要素内容包括边缘、线条和曲面的配备,建立以工业部件为中心的坐标体系,并适当运用不同符号表现模式实现必要三维结构和空间关系的调整,促进精密仪器细节检验工作质量的不断提高。
1 计算机视觉检测技术的相关理论研究
1.1 技术原理分析
渗透性计算机辅助支持结构的视觉鉴定技术在被测实体中的图像显示支持功能基础形势上进行质量状况的把控,这其实就是根据既定的偏差标准实现规模物件的逐个排查。细致的检测工作在深度零件的诱导性特征和完整性配件的支持下,对整体完好效果的几何制备模型进行测量[1]。近阶段的视觉规范系统利用电耦合器件和摄像机进行主题元素的捕捉,并利用计算机内部程序的数字信号转化工具实现图像的并行处理。采用目标图像的特殊坐标记录,利用灰度分布图内的多种综合功能处理系统改善的要务。常规视觉下的检测过程相对比较繁琐,主要是将被检测物体放置于照明效果相对均匀的可控制背景环境中,联结CCD技术和图像卡实现被测部件和数字图像的共性要素融合,保证计算机自动化处理程序的录入。当然,这类研究系统是需要利用相关软体进行放大的,其主要必备功能就是进行图像的预处理、识别和有效分析,将整个过程内部的实际结果数值,包括被测部件的自身缺陷、尺寸等进行整理。
1.2 计算机视觉微小尺寸精密检测工业应用技术的现状
在科学设计信息内容和工业加工制备要领集成化对待的环节中,通常不会直接进行部件表面的接触,一般运用计算机程序下的扫描认知和图像即时呈现功能进行快速的比对检测,整体信号抗干扰能力较强,因此在现代工业生产技术领域内部广受好评。电子工业是在建立计算机视觉分析工艺之后表现最为活跃的行业类型,在此基础上衍生的印刷电板路和集成电路芯片就是利用标准模型的整改,实现规模工序的紧密排列。目前,时下流行的汽车生产、纺织、商品包装等也逐渐向这类手段靠拢,全面改善了现代化工业制备的应用效果。
2 应用视觉微小尺寸分析技术内部拓展机能的补充
灰度图像的主要分割方法包括灰度阈值校正、边缘检测制备等手段。
2.1 灰度阈值校正
这是区域分割方法中一种常见的手段,主要配合多个或单个阈值将图像自身的灰度级别划分为几个项目组,对相同像素的单位数据进行整编。根据实效范围进行分类,包括局部和全局阈值探究两种手段,全局规模下的阈值分析方法就是利用整幅图的灰度直方分布图进行内部最优阈值分割,包括单阈值和多阈值两种形式;同时还可以将初始分析的图像进行子元素的拆解,之后利用单个子图像的既定阈值范围进行最优化分割[2]。分割的基本原理公式为:
其中,合理阈值的选取是非常重要的,目前阈值确定的手段主要包括直方图双峰对照法和最大类间方差累积法等。这种利用灰度阈值实现精准质量的划分手段,计算执行工作相对比较简单,并且实际工作效率水平较高,即便是实际需要分割的物体与图像背景对比深度较强也可以收放自如,但唯一的缺点就是缺少对空间信息的掌控,涉及亮度不足的图像问题,这种阈值分割技术的施工质量往往不会太高。
2.2 边缘检测制备工序
图像内部元素的分割其实就是进行部件边界效益的提取,而边缘检测制备工序则是利用像元及邻域的整体状态进行物体边界相关结构的搭建。边缘检测分割制备技术具体包括并行和串行两种模式,并行手法是运用梯度信息的提取实现不同类别算子的整理;串行边界分割原理则是根据适当强度标准和相似走向的两个边缘端点位置实现连接,主要代表算法包括启发式智能搜索手段等。这种串行算法较并行边界积累统计原则来说具有更强的抗干扰能力,但实际的边缘检测同样不能完好地维持连续效果,需要利用其余技术内容进行边缘制备技巧的修复。
(1)原始图像 (2)Robert算子边缘检测 (3)Sobel算子边缘检测
(4)Prewitt算子边缘检测 (5)Kirsch算子边缘检测 (6)Gauss-Laplace算子检测
图1 微小双联齿轮边缘检测
3 视觉检测系统的创新性改进
根据以上现状问题,创新式视觉整改校验系统利用照明光源、摄像机和图像采集卡等结构实现计算机输出结果质量的补充。其主要运行过程如下:利用被测部件在均匀照明背景的全面优化控制基础,实现物体结构的全面清晰呈现,使用摄像机对相关图像信号进行梳理并转化为电荷信号,配合相关的图像资源采集卡进行部件数字化图像的格式转化;计算机内部软体操作程序将得到的数字图像进行处理和识别,并将最终结果数据输出,实现现代工业技术整体质量规模控制的既定要求。
系统硬件在实现部件转化图像信息的环节中,连接检测机理下的连续软件规划和照明光源等相关设备进行图像适当分辨率的调整,维持图像较为清晰的对比效果。全面控制获取数字图像的时间,抵抗不良因素的干扰影响,维持内部成本经济规模的合理控制,促进科技应用和可持续发展经济战略双重价值标准的同步进展。其中,光源设备的选择必须落实到部件既定的几何形状条件下,利用相关性能参数进行实际工作要求的提供,包括光源位置、亮度、寿命特性等因素的堆积,常用的可见光源包括水银灯、荧光灯等,但这类光源使用寿命有限,因此现下多配用LED光源进行快捷反应、小功耗标准的补充,并且长期使用后的照明效果比较稳定[3]。而摄像机等结构主要还是校正参数的表达方式,进行图像合理分辨率的整改,促进图像采集数字化协调功能的发展,提高系统工作速度等。
4 结束语
计算机视觉检测系统在进行一定部件性能评比的活动中有着很高的贡献,不仅配合硬件的照明、参数制备要领制备功能,同时促进数字化图像对比的速度,使得工业生产环节中的部件检查工序得到大范围整改,满足可持续发展战略规模的视觉意义,促进现代智能化分析处理技术的全面覆盖。
参考文献:
[1]陆春梅.基于数字图像处理技术的接杆激光环焊焊缝视觉检测系统研究[D].上海交通大学,2008.
双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。
双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。
视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。
2 双目立体视觉技术的原理
立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。
三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。
双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。
双目立体视觉在计算机技术中实现三维重建的大致流程
如下。
1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。
2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。
3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。
4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。
5)根据得到的视差图最终实现场景的三维图形的重建。
3 双目立体匹配技术的研究难点和未来的发展方向
尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。
立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。
1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。
2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。
3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。
从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。
4 结束语
人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。
参考文献
[1]高文,陈熙霖.计算机视觉算法与系统原理[M].北京:清华大学出版社,2002.
[2]明祖衡.双目立体视觉测距算法研究[M].北京:北京理工大学,2008.
[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SAD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.
[3] Computer vision[EB/OL]. [2016-12-26]. https://courses.cs.washington.edu/courses/cse576/16sp/.
在计算机等现代科学技术尚未出现以前,人们在获取外界信息时往往主要依赖视觉,而在我国计算机技术水平不断发展提升的背景之下,计算机视觉技术的出现使得人类肉眼视觉得到了进一步的发展延伸,尤其是在各种传感器技术的帮助之下,使得人们能够对保持运动状态的目标进行实时跟踪,从而准确掌握目标的具体形态属性。在此背景之下,本文将运动目标设定为运动的人脸,通过探究基于计算机视觉的运动目标跟踪算法,希望能够为相关研究人员提供相关参考和帮助。
1 Kalman filter目标跟踪算法的简要概述
Kalman filter目标跟踪算法是当前众多跟踪算法当中使用范围较广、使用频率比较集中的一种跟踪算法,这一算法最早可以追溯至上个世纪六十年代,人们通过将滤波理论与状态空间模型相集合,从而得到的一种递推估计的算法也就是卡尔曼滤波理论。其通过利用上一时刻获取的预估值以及当下获取的实际观测值,在信号与噪声状态空间模型当中不断更新状态变量,进而顺利完成估计预测并获得当前时刻估计预测值。经过不断的发展,在计算机图像处理以及其他运动目标跟踪当中经常会使用Kalman filter算法。如果在k时刻系统下的状态向量用xk表示,那么在t0时刻下初始化的状态预测方程为;在tk时刻下更新系统状态的具体方程为
,其中Hk、Zk分别表示测量矩阵m×n维以及转移矩阵n×n维的状态向量。但在跟踪计算机视觉运动目标譬如说视频目标时,由于相邻的两帧视频图像本身时间间隔非常短,因此目标在这一时间内难以发生明显的运动状态变化,此时我们可以通过将此间隔时间设定为单位时间,同时目标在单位时间内一直保持匀速运动状态,这时我们可以得到一个状态转移矩阵且
,定义系统观测矩阵即为
,定义噪声Wk以及Vk协方差矩阵则可以分别用
和表示。
如果在滤波器在经过若干次卡尔曼滤波后仍然能够恢复至原始状态,则其具有较好的稳定性,但如果在进行运动目标跟踪实验的过程当中,对于处于运动状态的被跟踪目标,一旦出现遮挡行为则将在第一时间内暂停估计参数,并将这一参数估计值直接代入到状态方程当中,使得运动目标无论是否被遮挡均可以对其进行精确跟踪。
2 基于计算机视觉的运动目标跟踪算法
2.1 建立颜色概率模型
颜色囊括了诸多的信息量光柱点,尤其是在人类的视觉世界从本质上来说也是一种用过感知自然界色彩以及明暗变化的世界,因此人们可以通过使用三基色原理获得RGB颜色空间。考虑到颜色与计算机视觉场景当中各个场景和目标之间有着紧密的关系,同时不同于目标的大小、形态等其他视觉特征,颜色特征鲜少会受到包括观察视角等在内各因素的干扰影响,从某种角度上来说基于颜色特征的运动目标具有较好的稳定性。为了能够保障目标跟踪既稳定又迅速,需要选择合适的颜色特征,否则将极有可能导致出现跟踪失败。在这一环节当中人们通常使用的是RGB颜色空间以及HSI颜色空间,但由于二者均具有一定的局限性,因此本文在对人脸特征尤其是颜色特征进行选取时,选择了rgI颜色直方图的方法,在解决两N颜色空间自身缺陷的同时,尽量避免目标人脸运动位置以及尺寸等变化因素对目标追踪造成的干扰影响。在rgI颜色直方图当中
,,,L=r+g+I其中R、G、B就是RGB颜色空间当中的三原色,r、g、I有着相同的取值范围即在0到1之间。保持间隔相等的情况下划分L值即可得到rgI颜色直方图。虽然rgI颜色直方图与物体相对应,但如果目标只是位置以及尺寸等出现变化,rgI颜色直方图并不会受到任何实质性影响,因此在理想情况下,利用rgI颜色直方图能够对视频图像中不同运动位置以及不同尺寸的人脸进行目标追踪。
2.2 跟踪算法
运动目标的不断变化将会使得模板图像随之发生相应变化,因此需要不断更新模板图像才能够有效完成对运动目标的连续跟踪,本文在对运动目标的实际运动范围进行预测过程中选择使用卡尔曼滤波,之后利用rgI颜色直方图在预测运动范围之内搜索和匹配相应目标,从而通过此举获得与目标模板有着最小欧式距离的区域,在此过程当中存在一个特定阈值T,如果两者的欧氏距离在进行相减时差值没有超过这个特定阈值,那么此时该区域就是运动目标所在的实际位置,利用在这一区域当中的rgI颜色直方图并将其充当下一帧运动目标的匹配模板,在不断重复的过程中模板能够实现不间断地更新。由于相邻的两帧视频图像之间,时间间隔并不长,因此目标人脸在极短的时间间隔当中基本上不会出现突然变化,此时我们可以认为运动目标人脸的运动连续性比较强,此时利用公式
可以进行欧式距离的计算并用以衡量匹配的模板。其中匹配区域和模板的rgI颜色直方图分别用l和l'表示,而rgI颜色直方图中的维数则用n进行表示。根据相关视频图像显示,通过不断更新模板确实可以对目标运动人脸进行实时跟踪显示。
3 结束语
总而言之,本文通过选择当前比较常见的目标跟踪算法即Kalman filter算法,利用卡尔曼滤波以及rgI颜色直方图完成对运动人脸的跟踪。事实证明,Kalman filter算法确实能够在对各目标之间的干扰进行明确区分的基础之上,准确描述运动人脸目标,从而较好地跟踪运动目标,但由于人脸之间本身存在一定的相似性,因此本文只是对理想状态下的运动人脸进行跟踪实验,日后还需要对计算机视觉技术和Kalman filter算法进行进一步优化以妥善解决多人脸目标以及相似性问题。
参考文献
[1]郑薇.基于双目视觉的运动目标跟踪算法研究及应用[D].哈尔滨:哈尔滨工程大学,2014.
[2]李慧霞,李临生,闫庆森,周景文.基于Mean Shift算法的目标跟踪综述[J].计算机与现代化,2017(01):65-70.
[3]李寰宇,毕笃彦,杨源,查宇飞,覃兵,张立朝.基于计算机视觉的运动目标跟踪算法研究[J].电子与信息学报,2015(09):2033-2039.
1.引言
随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。
人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。
2.视觉注意机制
研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。
研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。
对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。
3.计算机视觉注意模型
从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。
我们把引起注意的场景内容定义为注意焦点FOA(Focus of Attention)。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点FOA的变化具有四个特征,即单焦点性:同一时刻只能存在一个FOA;缩放性:FOA的空间范围可以扩大或者缩小;焦点转移性:FOA能够由一个位置向另一个位置转移;邻近优先性:FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即FOA转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。
4.视觉注意模型的研究现状
人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。
4.1自下向上的数据驱动注意模型研究及分析
在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型,Itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。
现有的自下而上的视觉注意计算模型中,Itti的显著图模型(简称Itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。
在动态场景之中,由于Itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如Wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。
我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。
4.2自上而下的任务驱动的注意模型研究及分析
自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。
目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。
5.计算机视觉注意模型研究的趋势
自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。
实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。
参考文献:
[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.
[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).
[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).