时间:2023-03-15 14:56:21
引言:寻求写作上的突破?我们特意为您精选了12篇图像分析论文范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
文化是一个非常复杂的概念,为了教学的需要,根据美国人类学传统,将其定义为“一群人共有的理解世界、并用符号表达这一理解的方法”。由此定义不难发现,海报是文化的重要载体,许多文化研究都选择海报作为切入点;关于文化的教科书也常常提到从分析海报入手理解一国文化。这种思路虽有意思,但在教学实践中却存在一个问题:以英语为外语的学生,要怎样才能可靠地找出海报所反映的观念,而不致让自己的解读沦为主观臆断呢?要回答这一问题,一个能解释海报工作原理的分析框架不可或缺。沿着这一思路,本研究在实践中尝试用不同的图像分析框架,包括著名的“图像语法”,来分析海报通过图像反映出的价值观,结果却发现这些框架均不能很好地实现这一目的。究其原因,似乎是因为现有图像分析框架过于注重图像系统的内在结构而忽视了图像与受众间的联系,直接导致它们无法解释海报如何做到通过图像实现其社会目的。鉴于此,本研究主研人开展了海报图像符号分析系统的相关研究工作,最终提出了一个简单有效的分析框架,用以解释海报通过图像系统推广新理念的机制在教学中,首先通过一组简单的例子说明图1所示的图像分析框架。然后,通过小组讨论的形式跟学生一起分析两组文化背景不同的海报,确保学生理解海报通过图像说服受众接受某一理念的机制。在此基础上,引导学生通过该框架发现不同文化符号表征间的同质性,并以此作为检验该分析框架可靠性和合理性的证据。
(二)数据来源
本研究的数据来源之一是学生的书面作业。按照课程要求,学生需选择感兴趣的话题进行研究,并在此基础上撰写相应的书面研究报告;具体到本话题,学生需要运用所学原理以学习小组为单位独立设计一份海报,并以书面报告的形式说明:(1)该海报的预期读者群及其特征;(2)海报设计的基本原理;(3)海报设计的效度评估。最终,超过一半的学生(56人)选择了上述题目作为研究话题。这些书面报告构成了本研究的原始数据。本研究的另一个数据来源就是有针对性的结构性访谈。为了更好地理解学习过程,在期末作业评分结束后,要求每一位选择该话题的学生带着自己作业来与教师面谈五分钟;研究者在访谈开始前明确告知学生本访谈不会影响成绩,要求他们诚实作答。面谈包括如下内容:(1)学生在完成本作业过程中的学习体验;(2)了解学生未在书面报告中展示的学习过程细节,如对基本理论的理解等。所有访谈内容都在征求学生同意的前提下被录制下来,并按照研究的一般程序进行分类和标注,供后续研究分析之用。
二、分析和讨论
在各国高等教育普遍重视创新能力培养的大环境下,与之相关的研究方兴未艾,大批专门测量创新能力的标准化量表相继问世,如常用的“Torrance测试”。遗憾的是,目前很少有量表能直接测量学生图像符号创新能力。尽管如此,已有研究对创新能力测量提出了一些原则,这些原则当能应用到本研究的分析中。经整合,本研究主要从以下两个方面衡量学生的图像符号创新能力:(1)图像符号系统的原创性;(2)图像符号原创性与思维过程间的因果关系。
当今的计算机设备都在追求高速性和高通用性,尤其在进行图像数据处理和传输时,数据的大指、高速、实时性对计算机与外设的接口提出了更高的要求。
目前新型总线接口有两种:USB和1394接口。它们都支持即插即用,具有易扩展、使用方便、成本低等特点。但在任何USB系统中,只能有一个主机,最多可接127个外设,在全速模式下的传输纺为500kbps~10Mbps。而相比之下1394显得更胜一筹。它支持点到点的传输,消除了主机处理器/内存瓶颈,具有可升级性,支持400Mbps、200Mbps和100Mbps传输率,单一总线支持63个节点,由于1394总线的高速性和独立于主机的操作能力,使它成为高多媒体设备接口的首选。
11394技术
IEEE1394起源于苹果公司,又名FireWire,是为家用电器研制的一种高速串行总线标准,其目的是为了解决对速度要求很高的宽带设备的传输问题。1995年12月,IEEE1394-1994高速总线标准正式被IEEE标准委员会批准。
1.11394的主要特点
a.支持点对点传输。串行总线设备能自主执行事务,而不需要主机CPU的干预。
b.可扩展总线。可以将新的串行设备连接入总线节点提供的端口从而扩展串行总线。
d.热插拔。不需要系统断电就可以动态地加入或删除设备。
e.即插即用。每次加入或删除设备时,总线节点会自动配置,并且配置时不需要主机系统的干预。
f.巨大的映射至内存的地址空间。每个节点拥有256T字节的地址空间,每条总线上有16P字节地址空间。
1.21394原理
1394原理主要定义了以下几点:
a.1394总线的拓扑结构。1394串行总线的拓扑结构可以分为两种环境:底板环境和电缆环境。不同环境间总线的连接需要总线桥。电缆环境下的物理拓扑结构是无环网络结构,由电缆连接各节点间的端口,呈分支扩展,形成树状或状的网络拓扑。底板环境中物理拓扑是多点接入(multidrop)的总线,总线上分布着多个连接器,允许节点直接插入,通过仲裁使各节点享用总线。
b.1394的物理接口。1394设备通过标准的六芯线缆来传输信号,如图1所示。其TPA/TPA*和TPB/TPB*为一对差分模式的信号线。VP、VG提供8~40V的电源,可以通过它们给其它的节点供电。
c.1394总线协议。在1394传输中,支持等时传输和异步传输事务,并将每次传输分解为一系列的小事和,有效地利用总线带宽。异步事务需要数据确认,总线协议要复杂些,它包括三种基本事务类型:读取、写入和锁定。每个事务由请求子事务和响应子事务组成。由于等时应用程序的性质,相关的总线事务十分简单,等时事务每隔125μs向目标节点发送数据并且需要任何回热。1394总线一共定义了12种事务类型的包格式,采用循环冗余校验(CRC)进行数据差错控制,有相应硬件和软件处理各类传输事务。
d.1394电源管理。电源管理涉及到单独节点或节点中元件的电源状态控制。1394定义了4种电源状态以及相应的CSR寄存器和ROM配置项,支持挂起/恢复机制,使节点在软件控制下处于低功耗。
2系统硬件设计
2.1图像传输系统总体设计
系统采用冗余备份的双路1394高速总线将数据传送给大容量存储器、数据加密器和信道编码器,如图2所示。
由于本地系统中普通采用PCI接口,为了最大限度地利用现有硬件资源,缩短开发周期,研制了1394-PCI的转接卡,来实现基于1394高速图像传输系统。该转接卡主要通过物理层和链路层控制芯片组实现,其中链路层控制芯片采用TI公司的TSB12LV23,支持开放主机控制器接口(OHCI)的PCI接口芯片。
2.2TSB12LV23/TSBAB03芯片组
TSB12LV23提供主机接口和物理层接口,实现CRC校验以及同步服务。在芯片中集成了中断寄存器、传送/接收FIFO和DMA通道。TSBAB03芯片完成1394总线协议中的物理层功能,实现仲载机制,对收发信号进行编码/解码。
链路层和物理层芯片的连接电路图如图3所示。
3系统软件设计
系统软件包括1394设备驱动程序、动态链路库和应用程序。
3.11394设备驱动程序开发
Windosw驱动模型(WDM)定义了驱动程序分层,以适应即插即用系统。1394系统驱动程序采用分层结构模型,其设备栈如图4所法。设备驱动位设备栈顶,通过发IRP给IEEE1394总线驱动来与设备通信。IEEE1394总线驱动为1394总线提供了独立于硬件的接口,并将一部分IRP传向端口驱动程序。
在分层模型中,1394总线驱动负责管理1394设备驱动程序与1394控制器之间的通信;加载及卸载设备驱动程序。设备驱动程序在功能层工作,它们不需要任何低层硬件资源,只需对总线驱动程序发请求,由总线驱动程序访问硬件来完成这些请求。
用DDK设计的1394设备驱动由4个模块组成:初始化模块、即插即用模块、电源管理模块以及I/O模块。
初始化模块提供设备驱动的入口点,从而将不同的IRP请求发向相应的执行模块。
即插即用模块用于实现1394设备的热插拔和动态配置。当总线驱动程序在加电或者添加/删除时检测到新设备,从设备中取出一个或多个标识符,用于检查所有可用的安装文件,发现合适的设备驱动程序。驱动程序被装入,调用AddDevice入口点,告诉它发现一个新设备,并创建功能设备对象(FDO)。总线驱动程序或者安装文件详细描述设备所需的硬件资源,使用仲裁器为每个设备分配资源。
电源管理模块负责设备的挂起和恢复。
I/O模块完成I/O请求的大部分工作。该模块定义了所需的I/O控制代码,从而为应用程序提供了调用系统驱程序的接口。
3.2动态链接库的设计
由于Windows具有与设备无关的特性,不提倡与机器底层的东西打交道。如果直接用Windows的API函数或I/O读写指令进行访问和操作,程序运行时往往就会产生保护模式错误甚至死机,更严重的情况会导致系统崩溃。用DLL技术可以方便地解决上述问题。而且DLL没有自己的堆栈,与调用它的应用程序采用有相同的堆栈式,减少了编程设计上的不便;一个DLL在内存中只有一个实例,使之能高效经济地使用内存;DLL的代码封装怀使得程序简洁明晰。
在1394API动态链接库中封装了所有的1394请求命令,如异步读/写、等时读/写等,从而可以很方便地在应用级实现1394传输。通过调用DeviceIoControl向设备发请求,由I/O管理器构造一个1394请求块传给总线驱动程序;由总线驱动程序完成该请求或者请求进一步传给端口驱动程序,然后返回执行状态。
3.3应用程序设计
1.引言
近20多年来,医学影像已成为医学技术中发展最快的领域之一,其结果使临床医生对人体内部病变部位的观察更直接、更清晰,确诊率也更高。20世纪70年代初,X-CT的发明曾引发了医学影像领域的一场革命,与此同时,核磁共振成像象(MRI:MagneticResonanceImaging)、超声成像、数字射线照相术、发射型计算机成像和核素成像等也逐步发展。计算机和医学图像处理技术作为这些成像技术的发展基础,带动着现代医学诊断正产生着深刻的变革。各种新的医学成像方法的临床应用,使医学诊断和治疗技术取得了很大的进展,同时将各种成像技术得到的信息进行互补,也为临床诊断及生物医学研究提供了有力的科学依据。
在目前的影像医疗诊断中,主要是通过观察一组二维切片图象去发现病变体,往往需要借助医生的经验来判定。至于准确的确定病变体的空间位置、大小、几何形状及与周围生物组织的空间关系,仅通过观察二维切片图象是很难实现的。因此,利用计算机图象处理技术对二维切片图象进行分析和处理,实现对人体器官、软组织和病变体的分割提取、三维重建和三维显示,可以辅助医生对病变体及其它感兴趣的区域进行定性甚至定量的分析,可以大大提高医疗诊断的准确性和可靠性。此外,它在医疗教学、手术规划、手术仿真及各种医学研究中也能起重要的辅助作用。
本文对医学图像处理技术中的图像分割、纹理分析、图像配准和图像融合技术的现状及其发展进行了综述。
2.医学图像三维可视化技术
2.1三维可视化概述
医学图像的三维可视化的方法很多,但基本步骤大体相同,如图.。从#$/&’(或超声等成像系统获得二维断层图像,然后需要将图像格式(如0(#1&)转化成计算机方便处理的格式。通过二维滤波,减少图像的噪声影响,提高信噪比和消除图像的尾迹。采取图像插值方法,对医学关键部位进行各向同性处理,获得体数据。经过三维滤波后,不同组织器官需要进行分割和归类,对同一部位的不同图像进行配准和融合,以利于进一步对某感兴趣部位的操作。根据不同的三维可视化要求和系统平台的能力,选择不同的方法进行三维体绘制,实现三维重构。
2.2关键技术:
图像分割是三维重构的基础,分割效果直接影像三维重构的精确度。图像分割是将图像分割成有意义的子区域,由于医学图像的各区域没有清楚的边界,为了解决在医学图像分割中遇到不确定性的问题,引入模糊理论的模糊阀值、模糊边界和模糊聚类等概念。快速准确的分离出解剖结构和定位区域位置和形状,自动或半自动的图像分割方法是非常重要的。在实际应用中有聚类法、统计学模型、弹性模型、区域生长、神经网络等适用于医学图像分割的具体方法。
由于可以对同一部位用不同的成像仪器多次成像,或用同一台仪器多次成像,这样产生了多模态图像。多模态图像提供的信息经常相互覆盖和具有互补性,为了综合使用多种成像模式以提供更全面的信息,需要对各个模态的原始图像进行配准和数据融合,其整个过程称为数据整合。整合的第一步是将多个医学图像的信息转换到一个公共的坐标框架内的研究,使多幅图像在空间域中达到几何位置的完全对应,称为三维医学图像的配准问题。建立配准关系后,将多个图像的数据合成表示的过程,称为融合。在医学应用中,不同模态的图像还提供了不互相覆盖的结构互补信息,比如,当CT提供的是骨信息,MRI提供的关于软组织的信息,所以可以用逻辑运算的方法来实现它们图像的合成。
当分割归类或数据整合结束后,对体数据进行体绘制。体绘制一般分为直接体绘制和间接体绘制,由于三维医学图像数据量很大,采用直接体绘制方法,计算量过重,特别在远程应用和交互操作中,所以一般多采用间接体绘制。在图形工作站上可以进行直接体绘制,近来随着计算机硬件快速发展,新的算法,如三维纹理映射技术,考虑了计算机图形硬件的特定功能及体绘制过程中的各种优化方法,从而大大地提高了直接体绘制的速度。体绘制根据所用的投影算法不同加以分类,分为以对象空间为序的算法(又称为体素投影法)和以图像空间为序的算法!又称为光线投射法",一般来说,体素投影法绘制的速度比光线投射法快。由于三维医学图像的绘制目的在于看见内部组织的细节,真实感并不是最重要的,所以在医学应用中的绘制要突出特定诊断所需要的信息,而忽略无关信息。另外,高度的可交互性是三维医学图像绘制的另一个要求,即要求一些常见操作,如旋转,放大,移动,具有很好的实时性,或至少是在一个可以忍受的响应时间内完成。这意味着在医学图像绘制中,绘制时间短的可视化方法更为实用。
未来的三维可视化技术将与虚拟现实技术相结合,不仅仅是获得体数据的工具,更主要的是能创造一个虚拟环境。
3.医学图像分割
医学图像分割就是一个根据区域间的相似或不同把图像分割成若干区域的过程。目前,主要以各种细胞、组织与器官的图像作为处理的对象,图像分割技术主要基于以下几种理论方法。
3.1基于统计学的方法
统计方法是近年来比较流行的医学图像分割方法。从统计学出发的图像分割方法把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,观察到的图像是对实际物体做了某种变换并加入噪声的结果,因而要正确分割图像,从统计学的角度来看,就是要找出以最大的概率得到该图像的物体组合。用吉布斯(Gibbs)分布表示的Markov随机场(MRF)模型,能够简单地通过势能形式表示图像像素之间的相互关系,因此周刚慧等结合人脑MR图像的空间关系定义Markov随机场的能量形式,然后通过最大后验概率(MAP)方法估计Markov随机场的参数,并通过迭代方法求解。层次MRF采用基于直方图的DAEM算法估计标准有限正交混合(SFNM)参数的全局最优值,并基于MRF先验参数的实际意义,采用一种近似的方法来简化这些参数的估计。林亚忠等采用的混合金字塔Gibbs随机场模型,有效地解决了传统最大后验估计计算量庞大和Gibbs随机场模型参数无监督及估计难等问题,使分割结果更为可靠。
3.2基于模糊集理论的方法
医学图像一般较为复杂,有许多不确定性和不精确性,也即模糊性。所以有人将模糊理论引入到图像处理与分析中,其中包括用模糊理论来解决分割问题。基于模糊理论的图形分割方法包括模糊阈值分割方法、模糊聚类分割方法等。模糊阈值分割技术利用不同的S型隶属函数来定义模糊目标,通过优化过程最后选择一个具有最小不确定性的S函数,用该函数表示目标像素之间的关系。这种方法的难点在于隶属函数的选择。模糊C均值聚类分割方法通过优化表示图像像素点与C各类中心之间的相似性的目标函数来获得局部极大值,从而得到最优聚类。Venkateswarlu等[改进计算过程,提出了一种快速的聚类算法。
3.2.1基于模糊理论的方法
模糊分割技术是在模糊集合理论基础上发展起来的,它可以很好地处理MR图像内在的模糊性和不确定性,而且对噪声不敏感。模糊分割技术主要有模糊阈值、模糊聚类、模糊边缘检测等。在各种模糊分割技术中,近年来模糊聚类技术,特别是模糊C-均值(FCM)聚类技术的应用最为广泛。FCM是一种非监督模糊聚类后的标定过程,非常适合存在不确定性和模糊性特点的MR图像。然而,FCM算法本质上是一种局部搜索寻优技术,它的迭代过程采用爬山技术来寻找最优解,因此容易陷入局部极小值,而得不到全局最优解。近年来相继出现了许多改进的FCM分割算法,其中快速模糊分割(FFCM)是最近模糊分割的研究热点。FFCM算法对传统FCM算法的初始化进行了改进,用K-均值聚类的结果作为模糊聚类中心的初值,通过减少FCM的迭代次数来提高模糊聚类的速度。它实际上是两次寻优的迭代过程,首先由K-均值聚类得到聚类中心的次最优解,再由FCM进行模糊聚类,最终得到图像的最优模糊分割。
3.2.2基于神经网络的方法
按拓扑机构来分,神经网络技术可分为前向神经网络、反馈神经网络和自组织映射神经网络。目前已有各种类型的神经网络应用于医学图像分割,如江宝钏等利用MRI多回波性,采用有指导的BP神经网络作为分类器,对脑部MR图像进行自动分割。而Ahmed和Farag则是用自组织Kohenen网络对CT/MRI脑切片图像进行分割和标注,并将具有几何不变性的图像特征以模式的形式输入到Kohenen网络,进行无指导的体素聚类,以得到感兴趣区域。模糊神经网络(FNN)分割技术越来越多地得到学者们的青睐,黄永锋等提出了一种基于FNN的颅脑MRI半自动分割技术,仅对神经网络处理前和处理后的数据进行模糊化和去模糊化,其分割结果表明FNN分割技术的抗噪和抗模糊能力更强。
3.2.3基于小波分析的分割方法
小波变换是近年来得到广泛应用的一种数学工具,由于它具有良好的时一频局部化特征、尺度变化特征和方向特征,因此在图像处理上得到了广泛的应用。
小波变换和分析作为一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测,典型的有如Mallat小波模极大值边缘检测算法[6
3.3基于知识的方法
基于知识的分割方法主要包括两方面的内容:(1)知识的获取,即归纳提取相关知识,建立知识库;(2)知识的应用,即有效地利用知识实现图像的自动分割。其知识来源主要有:(1)临床知识,即某种疾病的症状及它们所处的位置;(2)解剖学知识,即某器官的解剖学和形态学信息,及其几何学与拓扑学的关系,这种知识通常用图谱表示;(3)成像知识,这类知识与成像方法和具体设备有关;(4)统计知识,如MI的质子密度(PD)、T1和T2统计数据。Costin等提出了一种基于知识的模糊分割技术,首先对图像进行模糊化处理,然后利用相应的知识对各组织进行模糊边缘检测。而谢逢等则提出了一种基于知识的人脑三维医学图像分割显示的方法。首先,以框架为主要表示方法,建立完整的人脑三维知识模型,包含脑组织几何形态、生理功能、图像灰度三方面的信息;然后,采用“智能光线跟踪”方法,在模型知识指导下直接从体积数据中提取并显示各组织器官的表面。
3.4基于模型的方法
该方法根据图像的先验知识建立模型,有动态轮廓模型(ActiveContourModel,又称Snake)、组合优化模型等,其中Snake最为常用。Snake算法的能量函数采用积分运算,具有较好的抗噪性,对目标的局部模糊也不敏感,但其结果常依赖于参数初始化,不具有足够的拓扑适应性,因此很多学者将Snake与其它方法结合起来使用,如王蓓等利用图像的先验知识与Snake结合的方法,避开图像的一些局部极小点,克服了Snake方法的一些不足。Raquel等将径向基网络(RBFNNcc)与Snake相结合建立了一种混合模型,该模型具有以下特点:(1)该混合模型是静态网络和动态模型的有机结合;(2)Snake的初始化轮廓由RBFNNcc提供;(3)Snake的初始化轮廓给出了最佳的控制点;(4)Snake的能量方程中包含了图像的多谱信息。Luo等提出了一种将livewire算法与Snake相结合的医学图像序列的交互式分割算法,该算法的特点是在少数用户交互的基础上,可以快速可靠地得到一个医学图像序列的分割结果。
由于医学图像分割问题本身的困难性,目前的方法都是针对某个具体任务而言的,还没有一个通用的解决方法。综观近几年图像分割领域的文献,可见医学图像分割方法研究的几个显著特点:(1)学者们逐渐认识到现有任何一种单独的图像分割算法都难以对一般图像取得比较满意的结果,因而更加注重多种分割算法的有效结合;(2)在目前无法完全由计算机来完成图像分割任务的情况下,半自动的分割方法引起了人们的广泛注意,如何才能充分利用计算机的运算能力,使人仅在必要的时候进行必不可少的干预,从而得到满意的分割结果是交互式分割方法的核心问题;(3)新的分割方法的研究主要以自动、精确、快速、自适应和鲁棒性等几个方向作为研究目标,经典分割技术与现代分割技术的综合利用(集成技术)是今后医学图像分割技术的发展方向。
4.医学图像配准和融合
医学图像可以分为解剖图像和功能图像2个部分。解剖图像主要描述人体形态信息,功能图像主要描述人体代谢信息。为了综合使用多种成像模式以提供更全面的信息,常常需要将有效信息进行整合。整合的第一步就是使多幅图像在空间域中达到几何位置的完全对应,这一步骤称为“配准”。整合的第二步就是将配准后图像进行信息的整合显示,这一步骤称为“融合”。
在临床诊断上,医生常常需要各种医学图像的支持,如CT、MRI、PET、SPECT以及超声图像等,但无论哪一类的医学图像往往都难以提供全面的信息,这就需要将患者的各种图像信息综合研究19],而要做到这一点,首先必须解决图像的配准(或叫匹配)和融合问题。医学图像配准是确定两幅或多幅医学图像像素的空间对应关系;而融合是指将不同形式的医学图像中的信息综合到一起,形成新的图像的过程。图像配准是图像融合必需的预处理技术,反过来,图像融合是图像配准的一个目的。
4.1医学图像配准
医学图像配准包括图像的定位和转换,即通过寻找一种空间变换使两幅图像对应点达到空间位置上的配准,配准的结果应使两幅图像上所有关键的解剖点或感兴趣的关键点达到匹配。20世纪90年代以来,医学图像配准的研究受到了国内外医学界和工程界的高度重视,1993年Petra等]综述了二维图像的配准方法,并根据配准基准的特性,将图像配准的方法分为两大类:基于外部特征(有框架)的图像配准和基于内部特征(无框架)的图像配准。基于外部特征的方法包括立体定位框架法、面膜法及皮肤标记法等。基于外部特征的图像配准,简单易行,易实现自动化,能够获得较高的精度,可以作为评估无框架配准算法的标准。但对标记物的放置要求高,只能用于同一患者不同影像模式之间的配准,不适用于患者之间和患者图像与图谱之间的配准,不能对历史图像做回溯性研究。基于内部特征的方法是根据一些用户能识别出的解剖点、医学图像中相对运动较小的结构及图像内部体素的灰度信息进行配准。基于内部特征的方法包括手工交互法、对应点配准法、结构配准法、矩配准法及相关配准法。基于内部特征的图像配准是一种交互性方法,可以进行回顾性研究,不会造成患者不适,故基于内部特征的图像配准成为研究的重点。
近年来,医学图像配准技术有了新的进展,在配准方法上应用了信息学的理论和方法,例如应用最大化的互信息量作为配准准则进行图像的配准,在配准对象方面从二维图像发展到三维多模医学图像的配准。例如Luo等利用最大互信息法对CT-MR和MR-PET三维全脑数据进行了配准,结果全部达到亚像素级配准精度。在医学图像配准技术方面引入信号处理技术,例如傅氏变换和小波变换。小波技术在空间和频域上具有良好的局部特性,在空间和频域都具有较高的分辨率,应用小波技术多分辨地描述图像细貌,使图像由粗到细的分级快速匹配,是近年来医学图像配准的发展之一。国内外学者在这方面作了大量的工作,如Sharman等提出了一种基于小波变换的自动配准刚体图像方法,使用小波变换获得多模图像特征点然后进行图像配准,提高了配准的准确性。另外,非线性配准也是近年来研究的热点,它对于非刚性对象的图像配准更加适用,配准结果更加准确。
目前许多医学图像配准技术主要是针对刚性体的配准,非刚性图像的配准虽然已经提出一些解决的方法,但同刚性图像相比还不成熟。另外,医学图像配准缺少实时性和准确性及有效的全自动的配准策略。向快速和准确方面改进算法,使用最优化策略改进图像配准以及对非刚性图像配准的研究是今后医学图像配准技术的发展方向。
4.2医学图像融合
图像融合的主要目的是通过对多幅图像间的冗余数据的处理来提高图像的可读性,对多幅图像间的互补信息的处理来提高图像的清晰度。不同的医学影像设备获取的影像反映了不同的信息:功能图像(SPECT、PET等)分辨率较差,但它提供的脏器功能代谢和血液流动信息是解剖图像所不能替代的;解剖图像(CT、MRI、B超等)以较高的分辨率提供了脏器的解剖形态信息,其中CT有利于更致密的组织的探测,而MRI能够提供软组织的更多信息。多模态医学图像的融合把有价值的生理功能信息与精确的解剖结构结合在一起,可以为临床提供更加全面和准确的资料。
医学图像的融合可分为图像融合的基础和融合图像的显示。(1)图像融合的基础:目前的图像融合技术可以分为2大类,一类是以图像像素为基础的融合法;另一类是以图像特征为基础的融合方法。以图像像素为基础的融合法模型可以表示为:
其中,为融合图像,为源图像,为相应的权重。以图像特征为基础的融合方法在原理上不够直观且算法复杂,但是其实现效果较好。图像融合的步骤一般为:①将源图像分别变换至一定变换域上;②在变换域上设计一定特征选择规则;③根据选取的规则在变换域上创建融合图像;④逆变换重建融合图像。(2)融合图像的显示:融合图像的显示方法可分成2种:空间维显示和时间维显示。
目前,医学图像融合技术中还存在较多困难与不足。首先,基本的理论框架和有效的广义融合模型尚未形成。以致现有的技术方法还只是针对具体病症、具体问题发挥作用,通用性相对较弱。研究的图像以CT、MRI、核医学图像为主,超声等成本较低的图像研究较少且研究主要集中于大脑、肿瘤成像等;其次,由于成像系统的成像原理的差异,其图像采集方式、格式以及图像的大小、质量、空间与时间特性等差异大,因此研究稳定且精度较高的全自动医学图像配准与融合方法是图像融合技术的难点之一;最后,缺乏能够客观评价不同融合方法融合效果优劣的标准,通常用目测的方法比较融合效果,有时还需要利用到医生的经验。
在图像融合技术研究中,不断有新的方法出现,其中小波变换在图像融合中的应用,基于有限元分析的非线性配准以及人工智能技术在图像融合中的应用将是今后图像融合研究的热点与方向。随着三维重建显示技术的发展,三维图像融合技术的研究也越来越受到重视,三维图像的融合和信息表达,也将是图像融合研究的一个重点。
5.医学图像纹理分析
一般认为图像的纹理特征描述物体表面灰度或颜色的变化,这种变化与物体自身属性有关,是某种纹理基元的重复。Sklansky早在1978年给出了一个较为适合于医学图像的纹理定义:“如果图像的一系列固有的统计特性或其它的特性是稳定的、缓慢变化的或者是近似周期的,那么则认为图像的区域具有不变的纹理”。纹理的不变性即指纹理图像的分析结果不会受到旋转、平移、以及其它几何处理的影响。目前从图像像素之间的关系角度,纹理分析方法主要包括以下几种。
5.1统计法
统计分析方法主要是基于图像像素的灰度值的分布与相互关系,找出反映这些关系的特征。基本原理是选择不同的统计量对纹理图像的统计特征进行提取。这类方法一般原理简单,较易实现,但适用范围受到限制。该方法主要适合医学图像中那些没有明显规则性的结构图像,特别适合于具有随机的、非均匀性的结构。统计分析方法中,最常用的是共生矩阵法,其中有灰度共生矩阵(graylevelco-occurrencematrix,GLCM)和灰度—梯度共生矩阵。杜克大学的R.Voracek等使用GLCM对肋间周边区提取的兴趣区(regionofinterest,ROI)进行计算,测出了有意义的纹理参数。另外,还有长游程法(runlengthmatrix,RLM),其纹理特征包括短游程优势、长游程优势、灰度非均匀化、游程非均匀化、游程百分比等,长游程法是对图像灰度关系的高阶统计,对于给定的灰度游程,粗的纹理具有较大的游程长度,而细的纹理具有较小的游程长度。
5.2结构法
结构分析方法是分析纹理图像的结构,从中获取结构特征。结构分析法首先将纹理看成是有许多纹理基元按照一定的位置规则组成的,然后分两个步骤处理(1)提取纹理基元;(2)推论纹理基元位置规律。目前主要用数学形态学方法处理纹理图像,该方法适合于规则和周期性纹理,但由于医学图像纹理通常不是很规则,因此该方法的应用也受到限制,实际中较少采用。
5.3模型法
模型分析方法认为一个像素与其邻域像素存在某种相互关系,这种关系可以是线性的,也可以是符合某种概率关系的。模型法通常有自回归模型、马尔科夫随机场模型、Gibbs随机场模型、分形模型,这些方法都是用模型系数来表征纹理图像,其关键在于首先要对纹理图像的结构进行分析以选择到最适合的模型,其次为如何估计这些模型系数。如何通过求模型参数来提取纹理特征,进行纹理分析,这类方法存在着计算量大,自然纹理很难用单一模型表达的缺点。
5.4频谱法
频谱分析方法主要基于滤波器理论,包括傅立叶变换法、Gabor变换法和小波变换法。
1973年Bajcsy使用傅立叶滤波器方法分析纹理。Indhal等利用2-D快速傅立叶变换对纹理图像进行频谱分析,从而获得纹理特征。该方法只能完成图像的频率分解,因而获得的信息不是很充分。1980年Laws对图像进行傅氏变换,得出图像的功率谱,从而提取纹理特征进行分析。
Gabor函数可以捕捉到相当多的纹理信息,且具有极佳的空间/频域联合分辨率,因此在实际中获得了较广泛的应用。小波变换法大体分金子塔形小波变换法和树形小波变换法(小波包法)。
小波变换在纹理分析中的应用是Mallat在1989年首先提出的,主要用二值小波变换(DiscreteWaveletTransform,DWT),之后各种小波变换被用于抽取纹理特征。传统的金字塔小波变换在各分解级仅对低频部分进行分解,所以利用金字塔小波变换进行纹理特征提取是仅利用了纹理图像低频子带的信息,但对某些纹理,其中高频子带仍含有有关纹理的重要特征信息(如对具有明显的不规则纹理的图像,即其高频子带仍含有有关纹理的重要特征)得不到利用。使用在每个分解级对所有的频率通道均进行分解的完全树结构小波变换提取特征,能够较全面地提取有关纹理特征。
由于医学图像及其纹理的复杂性,目前还不存在通用的适合各类医学图像进行纹理分析的方法,因而对于各类不同特点的医学图像就必须采取有针对性地最适合的纹理分析技术。另外,在应用某一种纹理分析方法对图像进行分析时,寻求最优的纹理特征与纹理参数也是目前医学图像纹理分析中的重点和难点。
6.总结
随着远程医疗技术的蓬勃发展,对医学图像处理提出的要求也越来越高。医学图像处理技术发展至今,各个学科的交叉渗透已是发展的必然趋势,其中还有很多亟待解决的问题。有效地提高医学图像处理技术的水平,与多学科理论的交叉融合、医务人员和理论技术人员之间的交流就显得越来越重要。多维、多参数以及多模式图像在临床诊断(包括病灶检测、定性,脏器功能评估,血流估计等)与治疗(包括三维定位、体积计算、外科手术规划等)中将发挥更大的作用。
参考文献
[1]P.Suetens.FundamentalsofMedicalImaging[M].CambridgeUniversityPress,2002.
[2]刘俊敏,黄忠全,王世耕,张颖.医学图像处理技术的现状及发展方向[J].医疗卫生设备,2005,Vol26
(12):25-26.
[3]田娅,饶妮妮,蒲立新.国内医学图像处理技术的最新动态[J].电子科技大学学报,2002,Vol31(5):
485-489.
[4]周刚慧,施鹏飞.磁共振图像的随机场分割方法[J].上海交通大学学报,2001,Vol35(11):1655.
[5]ZhangHM,YuanZJ,CaiZM.SegmentationofMRIusinghierarchicalmarkovrandomfield[J].Journalof
Software,2002,Vol13(9):1779.
[6]林亚忠,陈武凡,杨丰.基于混合金字塔吉布斯随机场模型的图像分割[J].中国生物医学工程学报,
2004,Vol23(1):79.
[7]聂生东,陈瑛,顾顺德.磁共振颅脑图像快速模糊聚类分割算法研究[J].中国生物医学工程学报,2001,
Vol20(2):104.
[8]江宝钏,张钧良.基于BP神经网络的MRI分割[J].微机发展,2000,Vol1:67.
[9]AhmedMN,FaragA.Two-stageneuralnetworkforvolumesegmentationofmedicalimages[J].Proceedings
ofIEEEInternationalConferenceonNeuralNetworks,1997,Vol28(3):1373.
[10]黄永峰,岑康,司京玉等.模糊神经网络在颅脑磁共振图像分割中的应用研究[J].中国生物医学工程
学报,2003,Vol22(6):508.
[11]CostinH,RotariuCR.Knowledge-basedcontourdetectioninmedicalimagingusingfuzzylogic[J].
InternationalSymposiumonSCS’03,2003,1:273.
[12]谢逢,罗立民,田雪琴.基于知识的人脑三维医学图像分割显示方法[J].生物医学工程学杂志,1997,
Vol14(2):124.
[13]王蓓,张立明.利用图像先验知识与Snake结合对心脏序列图像的分割[J].复旦大学学报(自然科学
版),2003,Vol42(1):81.
[14]RaquelVC,VeronicaMB,OscarYS.Couplingofradial-basisnetworkandactivecontourmodelformulti
spectralbrainMRIsegmentation[J].IEEETransactionsonBiomedicalEngineering,2004,Vol51(3):459.
[15]LuoXP,TianJ,LinY.Analgorithmforsegmentationofmedicalimageseriesbasedonactivecontour
model[J].JournalofSoftware,2002,Vol13(6):1050.
[16]HallpikeL,HawkesDJ.Medicalimageregistration:Anoverview[J].BrInstituteRadiol,2004,Vol14(6):
455-463.
[17]PetraA,ElsenV.MedicalImagemaching:Areviewwithclassification[J].IEEETransMedImage,1993,
Vol12(3):26-39.
[18]LuoShuo-qian,LiXiang.Implementationofmutualinformationbasedmulti-modalitymedicalimage
registration[A].EngMedBillSocProc22ndAnnIntConfIEEE[C].NavyPierConventionCenterChicago,
Illinois,USA:TheInstituteofElectricalandElectricalandElectronicsEngineers,Ind,2000,2:1447-1450.
[19]SharmanR,TylerJM,PianykhOL,etal.Afastandaccuratetomethodtoregistermedicalimagesusing
waveletmodulusmaxima[J].PattRecogLett,2000,21:447-462.
[20]LesterH,ArridgeSR.ASurveyofhierarchiclnon-linearmedicalimageregistration[J].PatternRecognition,
1999,32:129-149.
[21]卢健,胡志忠,杨如乃.医学图像融合技术的研究[J].上海生物医学工程,2006,Vol27(3):163-167.
[22]王新成.高级图像处理技术[M].北京:中国科学技术出版社,2001.
[23]RVoracek,HPMcAdams,puterAidedDiagnosisofInterstitialLungDisease:aTexture
针对一般图书定价偏高从而引发消费者的诸多怨言,有些出版工作者认为,市场经济条件下,各出版社已走向市场,拥有独立的经济利益,对图书的定价有充分的自,图书定价是高是低,乃是市场行为,应顾其自然。笔者认为,正是因为图书定价虚高,价格与价值不相符导致了图书市场打折降价现象的产生。
(1)图书成本提高导致图书定价偏高。
首先,近几年纸价上涨是影响书价的一个重要因素。印刷用52克凸版纸每吨出厂价格,1984年为1350元,1994年为3786.6元,10年间上涨2.8倍。特别是1995年1-6月,52克胶印书刊纸每吨由年初的3768元上涨到6000多元,上涨幅度超过60%。纸张费用在图书生产成本中占70%以上,成为成本上升的首要原因。随着我国经济的发展,人均年用纸量已达15公斤,其需求量远大于供给量,由此造成纸价的大幅度上涨。而纸张费用一般会占到图书制作成本的50%以上,再加上油墨、稿费等各种费用都在涨,某些印量不大的图书如果不调整书价,必然会造成亏损。
其次,出版社运营费用高,带动成本上升。图书成本中,管理费用是必不可少的一个组成部分。据业内人士介绍,近年来,相当一部分出版社的管理费提高了一倍甚至更多。有的出版社内部经营管理粗放落后,水平低下,费用支出不合理。掌握不了科学的定价计算方法以及不能正确预测市场物价的发展趋势等,也导致部分图书价格明显不合理。目前不少出版社的新版图书分担的编录经费、管理费用、财务费用、销售费用等各种间接费用几乎可以和排、印、装、纸张等直接生产成本相持平。这些因素都不可避免地直接造成了图书价格的上涨。
(2)流通环节高折扣导致图书定价偏高。
20世纪80年代,图书发行折扣有较为严格的规定,根本不可能发生发行折扣高达50%的事。如今,发行折扣40%、50%已不是什么新闻了。发行折扣的提高,必然推动图书价格上涨。另一方面,目前行里行外都知道,发行单位对低价图书不感兴趣,往往要求出版单位提高图书定价,这其中,一个“利”字在作怪。图书定价低,发行利润所得必然少。既然是大众读物,有一定的销售市场,何不将价格定高一点,“趁机捞上一把”?
我国目前已形成新华书店、出版社、非国有书店三种成分共同发展的发行格局。国有和非国有书店发行渠道各自独立,环节较多。新华书店发行所、省店从出版社批发,基层店再从上一级店批发,也有从民营渠道批发的。大量的零售摊店从中间商批发,而且中间商又有一级、二级之分,可见图书流通环节之乱。这反映了目前我国图书流通领域的现状:环节多,无序。编、印、发上下游之间的分割和地区市场的分割,是我国出版业目前存在的最大问题,也正是这种无序和分割的状态导致了流通环节高折扣现象的产生。
2.盲目出书导致图书积压必然引发图书高折扣。
近年来,我国图书出版单位的库存图书积压现象严重,导致了库存成本的上升。去年北京市仅国有图书经销单位的库存图书,价值就达4亿多元,这还不包括各出版社的库存。有这么大数量的库存图书,必然要利用书市进行降价促销,这也导致了市场的恶性竞争。
近年出版社盲目“跟风”,重复出版严重。不少出版单位为追求经济效益获得高额利润,哪里热门、哪里赚钱就往哪里挤,造成图书品种简单的重复,有的书籍多达几十个版本,内容大同小异。以中国古代四大文学名著为例,最早是人民文学出版社出版,后来看到这套图书赚钱,各出版社纷纷上马,结果有100多家出版社出这套书。这样互相撞车,必然形成积压。全国出版医学类图书的出版社有400多家,这直接导致每种书印数下降。
(二)制度方面原因:
1.图书定价无人监管导致图书市场高折扣现象的产生。
国家有关部门对图书定价以及什么样的书可以打折销售等,都有明确规定,但是在实际执行过程中由于监管力度不够,使得一些规定形同虚设,为书商投机留下了空隙。尽管国家对图书定价有明确细致的标准和规定,但由于管理体制跟不上,政策得不到很好的落实,任由各出版社自由定价,定得再高,读者的呼声再大,也无人过问。由于我国正处于社会主义市场经济初期,各项监督机制尚未健全或建立,也没有监督措施,任其自由发展,因此在图书市场上,不仅要重视扫黄打非,同时也要注意整顿图书市场价格竞争秩序。
一位图书经营者透露道:“现在图书价格没人管,基本上是你想怎么定就怎么定。例如,以党政机关团体为销售对象的图书价格定得高一些的最大好处是,在销售时可以给对方以高额回扣,这样有利于促销。”
以一部以党政机关团体为销售对象的图书为例,定价258元,出书者投入30万元,印了5万册。如果书一上市就按半价出售,只要卖出去2000多册就可以把本钱赚回来,剩余的书无论以什么样的价格出售都可以,这使打折销售具有充分的运作空间。
2.垄断发行导致图书高折扣。
如果说目前许多大众读物价格偏高大多是发行单位推波助澜的结果的话,那么市场垄断类图书价格偏高则是出版社与各发行单位共同作用的结果。垄断发行主要是一些学习材料、统编文件、政治读物,其发行依靠行政权力自上而下,而购买者多为国家或地方政府机关。一边是凭借行政权力有恃无恐(不会因价高而销不出去)的发行者,一边是慷慨大方的国家或地方政府机关——购买者,结果图书定价失控。除此以外,近年来一些培训教材、考试用书价格也节节上升,其原因也是垄断。本来,这些教材、辅导读物面向个人购买者,不存在集体购买等行为,有些甚至面向在校学生,理应以薄利多销为经营宗旨,但由于主考单位指定参考用书,使这些教材成为“皇帝的女儿”——不怕卖不出去,各出版杜往往定以较高的价格以获取垄断利润。一般情况下,各出版社与发行单位在考虑图书市场销售时,都要考虑价格因素对市场的制约作用,然而,在上述图书发行过程中,由于发行的垄断,价格的这种制约作用丧失了,从而使价格失控,导致图书高折扣现象的产生。
3.非法出版活动导致图书高折扣。
尽管国家明令禁止,但盗版、盗印等非法出版活动在出版界屡见不鲜。盗版盗印由于是偷摘别人的劳动成果,因此即使以低于定价的50%的价格进行批销,仍然可以得到理想的利润。同时,法制的不健全,一些地方政府主管部门的麻木不仁,敷衍了事,狭隘的地方保护主义,也给其提供了生存发展的空间。
另外,书号交易现象的存在也加剧了图书价格的无序竞争。根据我国的有关规定,任何书籍出版都必须有书号,而这个书号只有正规的出版社才可以拥有。对于出版社来说,虽然拥有书号,但图书如果滞销,出版社无疑要承受损失;很多本应畅销的图书,新华书店的发行量却上不去。而书商买书号,不论图书赚赔都会向出版社支付管理费。所以尽管国家有关部门一再强调禁止买卖书号,但出版社还是愿意网开一面。由于个体书商低成本运作,能够以比较低的价格把图书出售给批发商。在这种情况下,批发商向出版社索取高额折扣,致使出版社不得不提高定价,以满足批发商的要求。这种折扣大战造成了恶性循环,使图书价格越来越高。
我国图书市场高折扣现象对策研究
图书市场高折扣现象的危害是显而易见的,它首先损害的是读者的利益,同时,对出版社和发行单位的利益也会构成损害。更为严重的是,它会引起图书市场的恶性竞争,从而扰乱图书市场乃至整个商品市场的稳定和秩序,因此整顿迫在眉睫。
1.健全法规,加强政府部门对图书市场的有序监管与调控。
有关部门要加快图书出版市场的立法,完善出版业市场运行机制,如市场进入、竞争和退出机制。培育和规范图书市场,加大管理力度,坚决取缔、严厉打击非法出版和盗版盗印活动,净化书刊市场。同时,要通过法律、行政、税收手段规范出版社的出版行为,抑制低水平重复出版。目前一般图书价格已经放开,因此,针对图书价格偏高的现状,各级管理部门当然不能简单地运用行政手段直接管理,然而,市场行为仍然需要政府的引导与约束。具体到图书定价问题上,管理部门也应制定较为严格的价格标准及浮动范围,并且在制定定价标准时,将发行量这一因素适当考虑进去。实施更加严格的定价标准和管理办法,使广大消费者真正得到实惠,从而刺激图书消费,活跃图书市场,推动社会文明和经济发展。
2.加强经营管理,改善企业管理的组织模式,降低生产成本和图书价格。
我国出版企业人才结构不合理,主要表现为编辑人才多,管理人才和营销人才相对缺乏。根据2000年对新闻出版署直属出版社人才资源现状的调查分析,出版社编辑人员的绝对数很大,编辑占总人数的40%,由于社领导和部门领导大多也是从事编辑工作的,因此实际从事编辑工作的人员比例高达62.3%;从事出版和发行工作的分别占12%和9%,两项之和仅为21%,明显偏低。从人员的文化状况看,从事编辑工作具有本科以上学历的占编辑人数的70.3%,从事出版工作具有本科以上学历的占出版部门人数的17%,从事发行工作具有本科以上学历的占发行部门人数的30%。出版社的成本居高不下,图书销售困难,与出版发行部门人员文化素质不高是有一定关系的。
3.改革图书出版定价制度。
关键词:资源共享边远地区公共馆促进
随着网络技术的发展和信息高速公路的延伸,21世纪的人类社会已经进入了信息时代,信息资源数量呈几何级飞速增长,全世界的文献已经打破了地域限制展现在所有人的面前。面对日益增加的信息资源,相对于发达地区已经普遍实现了自动化管理和信息化服务的图书馆,西部边远地区的公共图书馆仍受制于区域经济落后使图书馆缺少必需的经费支持、基础设施落后使获得信息的渠道不畅、自然条件艰苦使人才不易安心工作的三大难题。绝大多数的图书馆依然停留在传统的手工管理阶段,门庭冷落、社会效益低下。
文献信息资源共建共享,是解决图书馆文献信息资源贫乏、提高服务能力的最佳途径。对图书馆的建设水平和工作的开展起到了极大的促进作用。毫无疑问,实现文献信息资源共建、共知、共享之后,边远地区图书馆必将成为受益最大的群体。
一、资源共享对图书馆硬件建设的促进。
共享工程开辟了一个不受地域、时空限制的崭新的文化传播渠道,在互联网浏览海量信息资源的方式打破了阅读纸质书籍文献的局限性,但同时也对图书馆的硬件建设提出了更高的要求。笔者所在的图书馆是一个边远地区的县级公共馆,区域经济的落后导致经费严重不足,地方财政难以给图书馆建设提供充足的经费支持。导致图书馆长期陷于经费无保障、馆舍面积不足、藏书数量少质量差的困境。实施资源共享工程后,我馆已初步接收上级匹配的图书3000本(册),电影、电视剧光碟1800张,几乎相当我馆以往3年的藏书购买量,极大的丰富了馆藏。同时接收了电视机、DVD等设备,建成了电教播放室。安装了卫星接收设备,接收共享工程的卫星节目。作为共享工程的基层中心,为实现共享信息的浏览使用,势必要求我们引入互联网,建立电子阅览室,目前这两项工作也都列入了建设日程当中。电子网络建设也将促进图书馆工作采用计算机管理,实现业务流程自动化。共享工程同时还要求对现有资源进行整合,与全国农村党员干部现代远程教育、中小学现代远程教育开展共建共享,这无形中也使边远地区公共图书馆可应用资源数量得到极大的扩充,实施共享工程使边远地区公共图书馆能够得到更多地经费支持和对读者提供可读文献的丰富,极大的促进了基层图书馆的硬件建设。
二、共享工程对图书馆工作人员队伍建设的促进。
西部边远地区、特别是少数民族地区的公共图书馆发展长期处于举步维艰的状态,除了地方经济欠发达、基础设施落后、人文环境较差等客观因素以外,还与图书情报工作人员队伍的素质水平有着极大的关系,这些地区普遍存在专业技术人员奇缺,人员素质参差不齐的状况,极大的限制了县级公共图书馆的工作开展,也与共享工程的快速发展不相适应。为改变这种现状、推进共享工程的顺利实施,必将要培养和造就一支掌握现代信息技术、适应网络化建设需求的专业人员队伍。共享工程将给基层图书馆带来两个机遇,一是边远地区公共图书馆在共享工程建设中将有更多的机会获得专门用于人才队伍建设的专项资金,二是直观丰富的信息资源、新颖的网络服务手段将激发工作人员的学用热情。在人员培训方面先进省市已经走到了我们的前面,例如湖南地区各级共享工程工作机构依托当地公共图书馆采取了专业学习、岗位培训、知识竞赛等多种方式广泛开展了大规模的技能演练活动。各基层分中心针对各自工作的实际开展了内容丰富、卓有成效的技能演练活动。还根据活动经验和共享工程工作的特点,建立和完善了长效培训机制,使之更加规范化、科学化。作为边远少数民族地区的公共图书馆,我们也要借鉴先进地区的经验,通过三个方面来完善人才队伍建设:一是举办各类培训班和选派馆员赴先进地区和上级中心参观培训,提高他们的业务水平;二是对馆员的自我学习特别是专业技术的学习给予积极支持,鼓励他们提高自身素质;三是建立能上能下的激励机制,使他们产生学习的意识和激情,加快自我提高。逐步建立一支懂计算机、网络、多媒体技术的高素质专业队伍,保证文化共享工程和图书馆工作的持续发展。
三、共享工程对图书馆服务能力和社会效益的促进。
基层图书馆工作的最终目的就是服务基层、服务群众,而实施文化共享工程的目的就是把优秀的中华文化通过现代网络送到广大基层,缓解基层群众看书难、看戏难、看电影难、获取知识信息难等问题。
共享工程实施后,图书馆的对外服务得到了强化,工作重心向基层特别是农村、社区延伸,公共图书馆可以充分利用资源优势,开展丰富多彩的服务活动。笔者所在的图书馆在安装调试接收了共享工程的卫星节目以及接收了上级匹配的各类资源后,汇同本市党员干部现代远程教育中心积极开展了多种类型的服务活动。一是利用其中的农牧业、就业科技技术,播放适用科技影片、编印下发农牧业科技技术手册,为当地农牧业生产和再就业培训服务;二是深入基层送文化、丰富群众业余生活,在我市社区公共场所播放爱国主义影片和科技教育片,开展了“党员电教流动播放季”、“露天电影进社区”等系列活动;三是在我市党员电化教育播放点和电教科技示范基地播放共享工程节目,使文化共享工程建设与党员干部教育工作紧密结合起来,使广大党员干部受到生动的思想政治教育,提高了他们带领群众致富的能力。也切实让群众知道了共享工程是促进社会精神文明建设的工程,是贴近群众的精神文化需求的文化建设工程,取得了良好的社会效益。
少数民族地区实施共享工程,就是要整合现有文化信息资源以及独具特色的民族文化资源,形成本地区文化信息网络的资源优势,弘扬优秀的民族文化,用先进的文化推动基层文化建设与发展,改变边远少数民族地区作为经济欠发达地区文化资源不足、基础设施薄弱的现状。利用现代科技手段,向广大人民群众提供丰富、健康、快捷的文化信息。实施共享工程,使这些地区基层公共图书馆的建设和服务能力得到了极大加强,必将进一步促进图书情报事业的发展,使公共图书馆在能够真正的在地区经济发展和边远少数民族地区新农村新牧区建设中发挥应有的作用。
参考文献:
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2017)03-0164-02
目前,信息采集的多样化,已严重威胁到了信息存储的安全性。仅用一部手机,就可获取与泄露重要的信息。对文本数据信息安全性的担忧,促使了纸质文本图像信息隐藏与提取方法的提出。这类方法的核心在于将安全标识信息,以特有的方式嵌入到文本图像的文本区域中,这样,如果发生信息泄露或者要找寻到泄露源,就可以通过分析文本区域中包含的安全标识信息,反向追踪,查出泄漏源,或者通过安全标识信息,回收被泄露出去的信息。对于简单的、只包含文本信息的文本图像,目前的处理技术已比较成熟,能够比较准确的将版面信息进行有效的分析,但是对于包含文本、图形和图像区域的复杂版面文本图像,当前的处理技术尚不成熟,需要进一步提高。本文聚焦于复杂文本图像分割方法研究。
版面分割的方法,大体上可以分为两大类:层次式和非层次式的。层次式分割算法,主要有自顶向下和自底向上两种算法。非层次式算法则主要是利用复杂的图形图像处理技术,根据其图像特征,对文本图像进行版面分割[1-4]。层次式方法中,游程平滑RLS(Run-length Smoothing)算法和投影轮廓切分PPC(Projection Profile Cut)算法是两种有代表性且应用较广泛的算法。而基于纹理分析的版面分析算法,则是将版面分析和版面区域类型识别结合实现的一种算法。但上述方法时间消耗较大,为此本文提出了一N简单有效的分割方法。
1 提出的分类算法
首先,读入待分类文本图像,并对其格式转换,确保图像数据完整性,以防止丢失图像数据;然后进行有效区域提取,剔除四周的空白无效区域,得到有效信息区。在此基础上,对有效信息区进行二维坐标下的行投影,确定并统计、提取特征值,再根据统计得来的特征值,进行孤立行分析,并依据判定的孤立行,对文本图像进行区域的粗分割,得到版面分析的粗分割结果。在上述过程中,可根据投影结果以及统计的特征值,完成对纯文本区域、纯图像区域的分割工作。需要指出的是,本文着眼于复杂文本图像,为此还须对区域粗分割得到的各个子区域,进行二维坐标下的列投影,再根据投影结果,判定子区域中是否存在分栏版面。完成以上步骤后,原本复杂的文本图像版面就被分割为了多个简单版面的文本图像区,在此基础上,再进行行、列投影,根据所得特征值分析与分类,区分出文本区、图像区和图形图表区域,完成分割任务。具体流程见图1。
本文采用特征7个特征统计分析文本图像,各特征分别为:(1)行高,记录投影行高度的值。本文对行进行投影,依据投影结果,计算二值化投影平均值发生改变的临界点值,在临界点值作运算,获得行高值。 我们对各行高度值进行平均运算,在分别与各行高度作对比,进而初步确定异常区域;(2)行间距,行与行之间的间隔距离。此间距,由投影结果而得的下标值计算求得。在文本图像中,行间距发生明显变化的部分,往往为段落或者区域块之间的分割标识,此处计算行间距,作为段落区分和区域块区分的一个标识;(3)缩进率,文本与页面边界之间的距离。依据每一行的列投影结果,计算边界至文本的距离占左右边界之间距离的比率,求得缩进率。在文本图像中,标题不同于其它文本行,往往存在较大缩进,或左缩进,或右缩进,或左右都有,为此可结合行高,完成对标题的判定。此外,段落中往往有首行缩进,段尾也常因字符无法填满文本行而存在缩进,因此也可根据缩进率,判定段落区域;(4)行外接矩形填充率,在缩进的行区域块中,有效信息区域占整个区域块的比率。依据每一行的列投影结果值计算填充率。主要用来判断一些特殊的文本行,如页眉的判断;(5)最大跳变位置,对文本行进行列投影时,坐标轴所示下标发生最大变化的区域位置。根据该特征,如果连续多行在相同位置都发生最大跳变,且跳变区内像素点平均值为1,则可以判定在该位置处存在分栏,此外,还可以根据最大跳变,判定是否存在异常区域;(6)行内信号跳变周期(频率),对文本行进行列投影后,坐标轴上投影下标值发生周期性变化的周期或者频率。根据此特征,可用来判定是否存在异常区域;(7)对齐方式,该特征用来衡量文本图像中内容距离左右边界的距离,具体有居中,左对齐和右对齐三种方式,可用来辅助计算缩进率,进而分割区域块。分割结果举例见图2。
2 结语
文本图像版面分析是对文本图像处理的关键环节。针对上述问题,本文以文本图像二维坐标下行列投影结果为基础,提取并分析相关特征,提出了一种新的基于投影轮廓分析的版面有效分类方法。该方法通过对特征的综合运算与分析完成复杂版面文本图像的分析工作。验证了方法的有效性及准确性。
参考文献
[1]Kise K, Sato A, Iwata M. Segmentation of page images using the area Voronoi diagram[J]. Computer Vision Image Understanding,1998,70(3): 370-382.(8-4).
中图分类号:G251 文献标识码:A 文章编号:1009-3044(2016)29-0017-03
随着大数据时代的到来,信息的互联互通成为提高信息服务能力的重要前提,任何一个图书馆都难以同时满足不同学科专业、不同层次用户的信息需求,也不可能实现对所有资源的收集和管理,数字信息资源共享就是为了解决个体图书馆信息资源的有限性和信息需求无限性的矛盾而采取的图书馆间合作建设与发展的策略。现阶段,我国文献信息资源共享的理论研究主要集中在文献资源的布局和配比方面,因此多将信息资源共享效率低下的症结归于管理体制的不完善、技术手段的落后和宏观调控的缺乏。信息资源共享是追求自身效用最大化的过程,是一种分析投入成本和产出收益的博弈过程,通过借鉴博弈论的研究方法,从图书馆个体利益和共享集体利益的关系出发进行研究,可以进一步认识阻碍数字信息资源共享的因素,并找到解决这些问题的方法和措施。
1博弈论概述
1.1博弈论的涵义
博弈论,也称对策论,英文为Game Theory,是根据信息分析及能力判断,研究多个决策主体之间行为的相互影响作用,以取得收益或效用最大化的一种对策理论。其中的“博弈”是指个人、队伍或组织,在一定的环境条件及规则下,同时或先后、一次或多次,根据环境和竞争对手的情况变化,从各自允许的行为或策略中进行选择、加以实施,并从中取得相应结果的过程。中国早在几千年以前就已存在博弈思想,田忌赛马的故事就是较好的博弈论案例。自20世纪80年代,博弈论得到了广泛的应用,尤其对信息经济学的发展做出了重要的贡献。
1.2博弈论“囚徒困境”经典模型分析
博弈论经典模型囚徒困境建立在一个假设之上,即甲、乙两人被怀疑是合伙的偷盗犯,警方虽逮捕了他们但没有掌握充分证明两人犯罪行为的证据,警方将其分开单独审问,双方不能进行信息的交流。警方对这两个嫌疑犯的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人判5年刑。如果两人都不坦白,则警方由Tile据不足,只能对每个人各判刑2年。表格1中的框图体现了这个博弈的分析过程,左方是甲的可选择策略,上方是乙的可选择,双方均可做出坦白和不坦白两种选择。其中包含数字的格对应甲乙的一个策略组合,每格第一个数字代表甲的报酬,第二个数代表乙的报酬。比如第二个数字格是指当甲坦白,乙采取不坦白的策略时,甲的报酬为-1,乙的报酬也是-7。图中的报酬均为负数,以表示判刑的年数。
在警方交待了量刑原则以后,会从自身利益出发进行分析,选择坦白或不坦白的策略,此时双方展开了博弈的过程。首先分析甲的思考过程,当甲进行决策选择的时候一定会先考虑乙的想法。根据图表1的矩阵图可见,当囚犯乙选择了坦白的策略时,囚犯甲坦白则获刑5年,不坦白获刑7年。由此,当乙选择坦白时,甲必然选择坦白(因为5
如果仔细分析囚徒困境报酬矩阵,甲乙双方若都作出不坦白的决定,会得到更好地结果,即各判刑2年。可是因为没办法进行信息沟通,每一方都会担心对方坦白但自己不坦白时会受到重判(即对方坦白获刑1年,自己不坦白则被判7年)。因此,每个囚犯都从个人利益出发考,最终的结果都会选择坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡结果。
囚徒困境的结论折射出的道理发人深省,从个体的视角思考做出的占优策略决定(-5,-5),显然劣于做出合作策略的选择(-2,-2)。换句话说,从单个个体的角度出发得出的占优策略,从整体而言得出的却是最不理想的结局。囚徒困境最终达到的策略均衡,体现出了个人理性和集体理性的矛盾冲突。目前,图书馆在数字信息资源共享问题上也存在着类似的矛盾,我们将“囚徒困境”的博弈分析方法运用到资源共享问题上,也可以解释合作的不稳定性及相关问题。
2图书馆数字信息资源共享的博弈分析
2.1数字信息资源共享的静态博弈
数字信息资源共享一直是图书情报界关注的重大课题,每个图书馆都有资源共享的愿望,图书馆信息资源的共享,可以实现整体效用的最大化。假定参与共享合作博弈的图书馆为A、B两个,分析图2矩阵可以发现,如果A、B馆都选择合作策略,每个参与者均可获得收益为10,总报酬最大为20;如果A、B两者中有一方选择合作,而另一方选择不合作,参与者报酬分另4为6、12,总报酬为18;倘若A、B两馆都做出不合作的选择,那么各馆报酬都是8,总报酬16是最小值。可见(合作,合作)策略是团体利益最大的策略选择(20>16)。
事实上,一些图书馆为了自身的利益,往往从个人理性角度出发,最终与团体利益冲突,陷入“囚徒困境”。类似于囚徒甲、乙的决策过程,A馆会根据B馆的决策选择策略,当B选择合作策略时,A若选择合作可得10,A若选择不合作,既省去了共享资源需付出的成本,又无偿享受了B馆提供的信息资源,报酬是12。因此,A必然不会合作(显然12>10)。同理可推得,B做出了不合作的选择时,A仍然会选择不合作策略(因为8>6)。显而易见,无论B做出合作或者不合作的选择,A都会采取不合作策略。同样的分析结果对B馆也是适用的,最后的博弈结果为(不合作,不合作),这时总报酬16,小于最优策略的总报酬20。
这一博弈矩阵可以看出,大家最初都希望达到(合作,合作)总报酬为20的结果,但是通过报酬矩阵分析可见,即便已经签订合作协议,各自馆也会抱有“搭便车”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自违背共享约定,形成了图书馆资源共享博弈的(不合作,不合作)结果。
上述两种博弈均为一次性博弈,参与博弈者都只能进行一次选择决定,另外博弈参加者在做出自己决定的时候并不清楚对方的决定,大家都是同时决定自己的一次性策略选择。处在这样的前提之下,参与者都做出了自己的策略选择时便已完成了一个完整的博弈过程,并得出了最终结论,这种博弈称为静态博弈。在静态博弈中,出于个人理性的策略选择往往导致了从整体而言的最坏结果。一方面,在达成合作协议以后,参与者都会有投机的心理,并从自身利益出发暗地选择了不合作的做法。另一方面,对于一次性的博弈,只要参与者做出了最终决定便完成了博弈过程,对于违反约定的行为没有补救和惩罚的有效措施,无法通过后续的博弈进行调整和制约。
2.2数字信息资源共享的动态博弈
实际上,博弈通常为一系列重复进行的运动,即相对静态博弈而言的动态博弈,在连续进行的动态博弈中,上面结果会有所不同。
2.2.1数字信息资源共享的无限次重复博弈
无限次重复博弈是指相同结构的博弈可以无限次地重复进行下去。如果设定在数字资源共享的无限次重复博弈中,不管哪一方图书馆在其中的一轮合作博弈中采取了不合作的行动,在以后的博弈中便会遭到其他馆“不合作”的报复策略,而且这一不合作策略会在未来的所有博弈中重复下去,长此以往,首先违约的一方便永远失去了与另一方合作的机会。因为在无限次重复博弈中,存在着对欺骗和违约行为报复的机会,因此参与合作的各方会担心采取不合作策略给自己带来的长期损失,不会主动选择不合作的策略,使得数字信息资源共享合作得以维持。
继续用图2加以说明,对于图书馆A,各馆如果一直处于合作的状态,便可以长期获得报酬10,累积起来10+10+10+…,但如果抱有机会主义的想法,打破约定选择了不合作的策略,他的确获得了一次性的利益,得到报酬为12,但在以后的无限次重复博弈中,均会受到对方不合作的报复行动,收益只能为8。为了一次性的好处,使得日后的收益从原来合作策略时的10+10+10+…下降为不合作策略时的8+8+8+…。显然,任何一个图书馆在数字信息资源的无限重复博弈中,为防止被报复而丧失长期的经济效益,都会遵守协议,采取合作的策略。
2.2.2数字信息资源共享的有限次重复博弈
在有限次重复博弈中,假设事先约定只合作5次,用逆推法进行分析,各方均知道第5轮博弈是最后一轮博弈,因此这一轮博弈便同静态博弈无异。根据前面的分析,这一轮的违约不可能在以后受到惩罚和损失,那么,每个图书馆出于个人理性出发选择的占优策略就是不合作的结果。逆推到第4轮,因为大家都可以推算出第5轮不合作的结果,因此第4轮博弈也会采取不合作的策略。由此类推直到第1轮,都可以得到同样的结果。显然,在有限次重复博弈中,图书馆数字信息资源的共建合作是不稳定的,博弈的最终均衡策略为(不合作,不合作)。
3用博弈论的思想解决数字信息资源共享问题
在现实生活中,参与博弈的各方合伙的机会必然是有期限的,信息组织间的合作共享是否根本无法实现呢?显然在现实生活中是存在着长期合作的共同体。事实上,无限次重复博弈的主要界定标准在于参加者均不清楚哪一轮博弈会是最后一轮,合作各方担心违约会遭到日后的“报复”便会把合作策略坚持下去。在有限次的重复博弈中,如果合作双方不确定哪一轮是最后一轮,参与者会认为日后还要继续打交道、博弈状态会继续维持,这便同无限次重复博弈无异。所以,在不能确定终止期的有限次重复博弈的图书馆数字信息资源共享博弈中,合作解是可以存在的。当然,为了维护合作模型的稳定性,更好的实现团体利益的最大化,必须配合以必要的措施。
3.1建立信任机制
图书馆信息资源共建共享机制的成功建立,取决于成员间的相互信任和对于联盟内部规则的遵守程度,能够取得收益同时实现持续的发展,其中成员馆之间的信任是至关重要的。成员间除了应相互理解对方的行为和立场,尊重对方的观点,还应加强组织内的交流,达成对某些问题的认识。另外,信任评审机制的建立也十分必要,通过建立完备的综合性、长期性评估测试标准系统,对成员的联盟策略及行动影响因素进行持续地跟踪测评,通过完善细致公平的执行制度,形成稳定可靠的运行机制。
3.2建立监督机制
对于合作中的各馆,都希望采取最优于自己的策略,以期得到最好的结果,因此为了达到合作团体利益的最大化,应该对各成员进行有效监督,维护合作协议的顺利执行。要在建立领导协调组织和健全监督机制上下工夫,在明确各成员权利义务的基础上,监督各成员的行为。对于损人利己的倾向和行为,及时采取措施,必要时对违反合作协议的成员进行制裁,甚至终止合作。
3.3建立保障机制
因为各图书馆之间的规模与发展水平不均等,建设规模大、信息丰富的图书馆往往很难与信息量相对较少的图书馆实现资源共建共享,另外数字信息资源共建共享经常发生“搭便车”的问题,这些都需要通过建立保障机制加以制约。在内部评估制度规范的基础上,对贡献大的图书馆要采用奖励的办法进行收益补偿,同时针对慵懒的图书馆,通过采取惩罚的方式实现督促作用。
1.正确引导学生自主构建价值体系
在开展高职院校思想政治概论课教学活动的过程中,教师在教学活动中不仅要对学生的价值观进行引导,还要注重对学生自主构建价值观进行引导。这就需要教师在教学过程中让学生的主体地位得到充分体现,并让学生积极主动地参与到知识的探索中去。在实施问题式教学的过程中,教师必须为学生创造良好的学习环境,让学生之间形成互相帮助的氛围,并且让学生与教师形成良好的协作关系。同时要以学生的主动学习为基础,以师生合作学习的方式开展教学。这样不仅能让学生在学习的过程中与教师产生情感共鸣,还能让教师构建的问题情境得到学生的高度认可,从而推动问题情境的发展,获得更大动力,帮助教师有效提升教学质量。
2.掌握问题设计的基本原则
在开展高职思想政治概论课教学中,教师对问题式教学的应用还必须建立在科学合理的问题设计之上,所以在对问题进行设计时,必须掌握问题设计的原则,并做到灵活运用。
首先,要让设计的问题有明确的层次性,并且问题的难度要合适。相对于一般高校而言,高职院校学生的思想政治理论基础相对薄弱,并且学生的思维不太活跃,所以高职思想政治课教师在设计问题的时候必须要对学生的实际情况进行详细了解,掌握学生的认知特点和水平,科学合理地设计与学生实际能力相符的问题。其次,问题的设计要具有足够的启发性。学生的学习兴趣直接决定其学习成绩,是其主动参与到教学中的决定性因素,所以在进行问题设计的时候,教师还要让学生能够被设计的问题所吸引,从而积极地参与到教学活动
中。这种教学方式能够减轻教师的负担,并且对提升教学质量有很大帮助。最后,教师在设计问题的时要对学生学习过程中的重点、难点进行了解,然后根据实际情况有针对性地设计问题情境,切实帮助学生解决学习中遇到的问题。
3.培养学生的问题意识
很多高职学生的学习基础比较差,其在学习思想政治概论课知识的过程中会存在有问题而不敢问的情况,对理论性较强的问题更是不敢问。所以教师在开展问题式教学的过程中必须引导学生提问,这样才能保证问题式教学的顺利开展。从高职思想政治概论课教学的实际情况来看,很多教师在开展教学活动过程中对知识点的讲解较为简略,这会导致学生出于对自尊心的维护,忽视自己存在的问题。所以教师在教学活动的时候要根据每个知识点的难易程度,设置不同的讲授课时,让学生充分了解知识点的重要性,从而促使学生发现问题、解决问题。另外,在开展教学活动的过程中,教师要多为学生创造提出问题的机会,如在课堂教学中设置提问环节。这样不仅能让学生养成经常提问的习惯,还能让学生与教师的交流变得更加顺畅,从而促进问题式教学的发展。
4.为学生构建和谐的问题环境
在高职思想政治概论课教学过程中,学生经常会因为教师的过于严肃而惧怕在课堂上提出问题,并且会担心自己提出问题后会影响教师的教学进度。出现这种情况的主要原因是教师没有为学生构建和谐的提问环境,导致学生在有问题的时候不能积极主动地向教师提问。所以教师在开展思想政治概论课教学的过程中,要在课堂上强调发现问题并解决问题的重要性,让学生在发现问题的时候及时寻求教师的帮助。同时,
教师还要在教学过程中设置讨论环节,让学生之间形成相互帮助、相互探讨问题的学习气氛。这样不仅能让教师在教学活动中更容易发现学生存在的问题,从而制定有针对性的教学策略,还能让学生在参与教学活动的时候提升其发现并解决问题的能力,能有效提升思想政治概论课的教学质量。
问题式教学注重的是学生在教学活动中对问题的提出,所以高职教师在开展问题式教学的过程中,必须为学生创造良好的提问环境,还要培养学生发现问题和解决问题的能力,这样才能促进高职思想政治概论课的教学开展,让学生的主体地位得到体现,从而提升思想政治概论课的教学质量。
Threshold Citrusimage Segmentation Research and Analysis
WANG Jun, ZHOU Li-juan
(Collegeof Information Science and Technology, Hunan Agricultural University, Changsha 410128, China)
Abstract:Image segmentation is an important and primary problem in the field of computer vision. The thesis puts forward a full set of cit? rus image segmentation algorithm, which adopts improved genetic algorithm combining with improved threshold method. The thesis, through simulation experiment, brings forward threshold scope which is more stable, and makes the image segmentation edges more dedi? cated.
Key words: navel orange; threshold segmentation; classes distance; improved genetic algorithm
图像分割是计算机视觉领域的一个重要而且基本的问题。它在农产品无损检测方面得到了广泛的应用。图像分割算法好坏会直接影响检测系统的准确度。它是从图像处理到图像分析的一个关键步骤。对它的研究一直都是图像技术研究中的热点和焦点之一。但由于图像的特殊性,针对具体图像,针对具体问题,分割算法就不一样,至今还没有找到通用的分割理论,也没有找到对所有图像都适合的通用分割算法。
近几年来,基于遗传算法的图像分割方法得到了很多学者的研究。由于遗传算法在搜索方面具有很强的优势,而图像分割的实质是在众多的参量中去寻找一个最优参量,以此作为分隔的依据。于是如果在图像分割中引入遗传算法去求取最佳阈值,将会大大提高分割效率。
本论文重点对基于传统遗传算法的图像分割算法进行了比较系统的研究。针对传统遗传算法的不足,提出了一些改进措施,并且设计新的阈值确定方法——类类距离法,将两者结合共同运用到脐橙图像分割中,得到了比较好的效果。在最大程度上避免基本遗传算法收敛性差,容易早熟等问题。
1脐橙图像分割
对于脐橙出产大省湖南省,每年脐橙收获完后的分类,分等级进行销售是一项工作量庞大的任务。脐橙表面破损自动检测系统就是基于计算机视觉技术研发而成,其检测的精度较人工挑选有很大提高。该系统中脐橙图像分割算法好坏会直接影响系统检测脐橙表面是否破损的准确度。
通过特定装置获得比较清晰的彩色脐橙图像后,对于表面有破损的脐橙,要进行筛选清理。进行破损部分比对前,要对彩色脐橙图像先进行分割处理。把整幅图像分成脐橙和背景两部分,再提取脐橙部分的图像进行破损分析。这要求将脐橙的边缘和破损部分处理得非常清晰,最大可能的避免将破损区域误分割成图像背景。
2改进的遗传算法
2.1控制参数改进
在遗传算法中,直接影响到算法的收敛性的关键参数是:交叉概率与变异概率,它们的选取会影响到算法行为和性能。在适应度值变换的情况下将交叉概率与变异概率随之调整,以达到保证算法收敛性的目的。于是我们对交叉概率和变异概率按照如下公式进行自动调整:
图5本文提出的算法分割效果图
从表1,图2至图5可以得出以下结论:
1)脐橙图像利用遗传算法来分割,每次运行所得阈值都在变化,但变化的范围不是很大,只是在一定区域做细微波动。这种情况是正常的,也是完全可以接受的,其原因是由于遗传算法随机生产初始种群,这种随机性就带来了阈值的波动性。这也是遗传算法不稳定性的体现。但从表中数据看出采用本文所设计的改进的遗传算法,即交叉概率和变异概率随适应度自动调整,那么分割的图像所得到的阈值,其波动会限制在一个很小的范围以内(稳定在4个像素以内,阈值最大为60,最小为57),这样既保持了群体多样性,又保证了遗传算法的收敛性。同时其稳定性也明显地优于其他算法。
2)利用本文所设计的类类距离遗传算法进行图像分割可以极大减少阈值计算时间,平均运算时间比起其他几个常用方法都缩短了不少,平均仅在2.3s左右。在进化代数相同的条件下,本论文提出的图像分割算法较其他算法更有优势,收敛速度更快。
3)从图2至图5这几个图像分割结果图来看,本文所设计的分割方法中对脐橙图像中的破损部分,边缘轮廓等细节都有非常好的体现,可见结合遗传算法和类类距离法所设计出的图像分割新算法比其他常用算法有很大的优势。
本文通过改变的遗传控制参数结合类类距离法,把改进后的遗传算法应用到脐橙图像分割中去。仿真实验结果表明,此图像分割算法由于所设计的寻找最优阈值的方案比较合理,阈值的计算时间缩短了,使得最终图像分割所用时间明显减少了。同时此方法还做到了将阈值范围稳定在4个像素以内,大大提高了算法全局收敛的稳定性。而且从视觉角度来看,其分割效果更明显,图像边缘处理很细致、清晰。实验证明本论文设计的算法分割图像不仅快速准确,而且还能满足各种图像的实时处理、分析的需求。具有较高的通用性和实用性。
[1]姚敏.数字图像处理[M].北京:机械工业出版社,2006.
[2]孙艳歌,邵罕.基于改进遗传算法的最优阈值图像分割算法[J].信息系统工程,2010,10(6),26-27.
[3]童小念,刘娜.一种基于遗传算法的最优阈值图像分割算法[J].武汉理工大学学报:交通科学与工程版,2008,32(02),301-304.
[4]王强.图像分割中阈值的选取研究及算法实现[J].计算机与现代化.2006(10).54-56.
[5]左奇,史忠科.基于模糊理论的图像分割方法[J].西北工业大学学报,2003,(03):313-316.
[6]劳丽,吴效明,朱学峰.模糊集理论在图像分割中的应用综述[J].中国体视学与图像分析,2006,11(3):200-205.
主管单位:中国科学院
主办单位:中国科学院遥感应用研究所;中国图象图形学学会;北京应用物理与计算数学研究所
出版周期:月刊
出版地址:北京市
语
种:中文
开
本:大16开
国际刊号:1006-8961
国内刊号:11-3758/TB
邮发代号:82-831
发行范围:国内外统一发行
创刊时间:1996
期刊收录:
中国科学引文数据库(CSCD―2008)
核心期刊:
中文核心期刊(2008)
中文核心期刊(2004)
中文核心期刊(2000)
期刊荣誉:
联系方式
期刊简介
中图分类号:TP391.9文献标识码:A文章编号:1009-3044(2009)32-9032-03
Gray-scale Histograms Feature Extraction Using Matlab
LIU Yi-xin1, GUO Yi-zheng2
(1.Department of Computer, Jinshan Vocational Technical College, Yangzhong 212200, China;2.Department of information science and technology, Nanjing Normal University Taizhou College, Taizhou 225300, China)
Abstract: The feature extraction of image is a foundational work for image recognition, image data mining, content-based image retrieval (CBIR), etc. And it is a hot topic in the research of image now. This paper analysised and implemented CT liver image gray-scale histograms feature extraction using Matlab. The experiments proved that these features are different prominently between normal liver and abnormal liver.
Key words: gray-scale histograms; feature extraction; matlab; medical image
图像特征是用于区分图像内容的最基本属性,它们可以是原图中人类视觉可鉴别的自然特征,也可以是通过对图像测量和处理人为定义的某些参数。所谓特征提取是对研究对象固有的、本质的及重要的特征或属性进行量测并将结果数值化,或将对象分解并符号化,形成特征矢量或符号串、关系图的过程[1]。
医学图像内容丰富且结构复杂,提取有效特征来描述这些图像内容是医学图像分析和理解的重要内容。对于医学图像特征提取算法,大体可以分为三大类:颜色(灰度)特征提取[2]、纹理特征提取[3]和形状特征提取[4]。其中颜色特征是医学图像的重要特征之一,且广泛应用于图像处理系统中。在医学图像中,大部分是灰度图像,而不是彩色图像,因此与颜色特征相对应的是灰度特征。医学图像灰度特征,是利用灰度具有一定的稳定性,对大小、方向都不敏感,能表现出相当强的鲁棒性。
基于灰度直方图的特征提取是医学图像颜色特征提取中的一个典型算法。任何一幅图像的灰度直方图都包含了丰富的信息。图像的灰度直方图是表示一幅图像灰度分布情况的统计特性。图像的灰度直方图简称直方图,是图像处理中一种十分重要的分析工具。图像灰度直方图特征是医学图像的基本而重要的特征数据。本文对基于灰度直方图的特征提取进行了Matlab分析与实现。实验结果表明,正常异常肝脏图像的灰度直方图特征有明显差异,为图像分析与理解、图像检索、图像识别和图像挖掘等后继研究奠定了一定的理论基础。
1 灰度直方图的定义
一幅数字图像的灰度直方图就是一个灰度级的离散函数,可以用式(1)来表示图像灰度直方图的定义[5]。
(1)
其中i表示灰度级,L表示灰度级种类数,ni表示图像中具有灰度级i的像素的个数,N表示图像总的像素数。公式描述的是图像中具有该灰度级的像素的个数占图像总像素的百分比,即图像中具有灰度级i的像素出现的频率。其横坐标是灰度级,纵坐标是该灰度出现的频率。
图像的灰度直方图提供了该图像外观的一个全局描述,所提取的特征具有RST不变性,即旋转、比例和位移不变性,缺点是不能有效地表示图像的空间信息,如图1表示的是一幅医学图像的直方图示例。
2 基于直方图的统计特征
一般不是直接将医学图像的直方图作为特征,需要通过用一些统计量来反映图像的直方图,这些统计量通常称为直方图的统计特征。常用下列几种统计量来反映图像的直方图特征:
1) 均值(mean):均值反映的是一幅图像的平均灰度值。
(2)
2) 方差(variance):方差反映的是一幅图像的灰度在数值上的离散分布情况。
(3)
3) 歪斜度(skewness):歪斜度反映的是图像直方图分布的不对称程度,歪斜度越大表示直方图分布越不对称,反之越对称。
(4)
4) 峰态(kurtosis):峰态反映的是图像的灰度分布在接近均值时的大致状态,用以判断图像的灰度分布是否非常集中于平均灰度附近。峰态越小,表示越集中;反之,表示越分散。
(5)
5) 能量(energy):能量反映的是灰度分布的均匀程度,灰度分布较均匀时能量较大,反之,较小。
(6)
6) 熵(entropy):熵也反映了直方图灰度分布的均匀性。
(7)
3 灰度直方图特征提取的Matlab实现
以图2所示的肝脏CT图像为例。众所周知,灰度图像在计算机中的表示是一个M*N的二维矩阵,这里M=N=512。一个像素就对应着矩阵中相应位置的一个灰度值,由于灰度级是256,因此灰度值范围在0~255之间,最小灰度值0代表黑,最大灰度值255代表白。
对于肝脏CT图像,纯黑对应背景区域,纯白对应骨骼组织,这两部分对于图像的特征提取没有意义,因此公式中i的取值为1~254。以提取基于直方图的均值特征为例,程序如下。
tic
filename='1.bmp';
pi=imread(filename);
pix=double(pi);
s=double(zeros(254,1));
for i=1:512
for j=1:512
for k=1:254
switch pix(i,j)
case k
s(k)=s(k)+double(1);
otherwise
end
end
end
end
sum=double(0);
for k=1:254
sum=sum+s(k);
end
h=double(zeros(254,1));
for u=1:254
h(u)=s(u)/sum;
end
junzhi=double(0);
for i=1:254
junzhi=junzhi+i*h(i);
end
filename
junzhi
toc
上述代码运行结果如下,可见,图2所示的肝脏CT图像,其基于直方图的均值特征 ,程序运行时间0.938000秒。
filename = 1.bmp
junzhi =129.0577
Elapsed time is 0.938000 seconds.
现在随机抽取10幅正常肝脏CT图像(如图3所示)和10幅异常肝脏CT图像 (如图4所示)。比较其均值特征,如图5所示,由曲线图清晰可见,正常肝脏CT图像与异常肝脏CT图像在均值特征上差别明显,正常肝脏CT图像均值在129.2879左右,异常图像的均值在115.2091左右。值得注意的是,结果并非表明用这一个特征就可以完全区分正常肝脏与异常肝脏,细看曲线图可知,异常肝脏CT图像中第一幅图就无法使用均值判断其正常异常与否,仅仅使用均值就会误判。现实生活中,肝脏CT图像因拍摄位置、拍摄仪器等多方面原因,要想理想判断其正常还是异常,使用一个或一类特征是远远不够的。
图3 随机抽取的10幅正常肝脏CT图
图4 随机抽取的10幅异常肝脏CT图
4 总结
本文对基于灰度直方图的医学肝脏CT图像特征提取进行了Matlab分析与实现。特征的提取很重要,特征提取的好坏直接影响到图像识别、基于内容的图像检索、图像挖掘、图像分析与理解等后继工作的成败。由于医学图像与普通图像存在很大的不同,医学图像具有灰度分辨率高、所含信息量大、数据的巨量性、异构性、噪声显著性等特点,单一的特征提取方法都还不能很好的表达医学图像的内容,寻找适合医学图像的特征提取方法仍是一个需要深入探索的领域。
参考文献:
[1] 郭依正. 基于多特征融合的医学图像识别研究[D].镇江:江苏大学,2007.
[2] Yong Rui . Image Retrieval: Current Techniques, Promising Directions and Open Issues [J]. Journal of Visual Communication and Image Representation, 1999,10(3):39-62.
一、引言
数字图像拼接技术主要包括三个重要步骤:图像预处理、图像配准和图像融合[1]。其中图像的预处理包括图片去噪,图像投影,图像修正等;图像配准是找出待拼接图像的重叠部分并使其坐标对准;图像融合是使重叠部分自然过度,消除拼痕;其中图像配准是图像配准的关键,它直接决定了拼接的准度和效果。
二、Harris角点检测
1988年C.Harris和J.Stephens利用自相关函数的思想共同研究出了Harris角点检测算法,先定义矩阵M
M=G?茚Ix2IxIyIxIy Iy2= (1)
式中Ix、Iy分别代表图像I在x、y方向的梯度,G为高斯模板;?茚代表卷积:
=G?茚Ix2 ,,=G?茚IxIy (2)
在矩阵M的基础上,角点响应函数CRF定义为:
CRF=det(M)-krace2(M),k=0.04
CRF=det(M)-krace2(M),k=0.04(3)
式中,det是矩阵的行列式;trace是矩阵的迹;k是常数,这里取0.04,CRF的局部最大值即为角点。使用Harris角点检测算法对两幅图像分别提取角点后,接着就要进行图像配准的工作。在两幅图像中以每个特征点为中心取一个(2N+1)×(2N+1)大小的相关窗,然后以参考图像中的每个角点为参考点,在待拼接图像中寻找对应的角点。通过计算特征点相关窗之间的相关系数[2]来实现图像特征配准。
在具体实验步骤中:1、对图像中的每个像素点分别计算其x,y方向的一阶导数和梯度;2、对上步操作中得到的三幅图像进行高斯滤波;3:计算原始图像上的角点响应函数值和相关系数;4:使用透视变换模型计算出待拼接图像到参考图像变换参数。5:使用渐入渐出法进行图像融合[3]。
三、实验结果
四、结论及展望
Harris角点检测算法是一种简洁、高效、提取的点特征均匀且合理的算法,由于Harris算子只涉及到一阶导数,因此对图像旋转、灰度变换、噪声影响和视点变换不敏感,但通过计算相关性特征来进行配准的准确率还有待提高。
参考文献: