时间:2023-06-11 08:13:01
引言:寻求写作上的突破?我们特意为您精选了12篇神经网络基本原理范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
中图分类号:TP183 文献标识码:A 文章编号:1009-3044(2013)14-3362-04
1 概述
数字识别在车辆牌照识别、银行支票识别和邮政储蓄票据识别等领域有着广泛的应用,因而成为研究人员近年来研究的一个焦点[1]。而人脑神经系统模型的建立为人工神经网络的产生提供了理论模型依据, 使其具有模拟人脑部分形象思维的能力[2],因而使其成为人工智能技术的重要组成部分和常用方法。人工神经网络由简单信息处理单元相互连接组成,通过简单处理单元间的相互作用来实现对其所接收信息的处理。而随着人工神经网络技术的快速发展,其为解决模式识别邻域的相关问题提供了新的解决思路和方法,其突出的优点在于它具有对接收信息可进行并行分布式处理能力和自我学习反馈能力,因而吸引了众多研究人员对其进行广泛和深入的研究。而误差反向传播网络(Back-Propagation),即BP神经网络,是一种典型的人工神经网络,它具有人工神经网络的所有优点,因而在众多技术邻域有着广泛的应用[3]。该文首先对BP神经网络的基本原理进行了详细介绍,在分析了其基本原理的基础上,针对数字识别问题,设计了一种利用BP神经网络技术进行数字识别的方法。经实验表明,该方法合理可行,且其识别效果正确有效。
2 相关原理与知识
由于本文针对数字识别问题,利用BP神经网络技术对其进行方法设计和实现,首先必须了解BP神经网络的基本原理,即了解其具体构成形式、模型分类和其功能特点。其次,在了解了BP神经网络基本原理的基础上,进一步了解其所处理数据的特点和组成形式,并根据处理数据的特点和其数据结构设计相应的数字识别方法。下面分别对它们进行详细的介绍。
2.1 BP神经网络基本原理
BP神经网络算法由数据信息流的前向计算,即正向信息流的正向传递,误差信息的反向回馈两个部分组成。当信息流进行正向传递时,其传递方向为从输入层到隐层再到输出层的顺序,器每层神经元所处的状态只会影响下一层神经元的状态。若在最后的输出层没有得到理想的输出信息,则应立即进入误差信息的反向回馈过程[6]。最终经过这两个过程的相互交替运行,同时在权向量空间使用误差函数梯度下降策略,动态迭代搜索得到一组权向量,使得该BP神经网络的误差函数值达到最小,从而完成对信息提取和记忆过程[7]。
2.2 BMP二值图像文件数据结构
由于本文处理的数据源为BMP二值图像,则必须了解其数据结构,才能对其进行进一步的识别方法设计。由数字图像处理基础知识可知,常见BMP二值图像文件的数据结构由以下三部分组成:(1)位图文件头,其包含了BMP二值图像的文件类型、文件大小和位图数据起始位置等信息;(2)位图信息头,它包含了BMP二值图像的位图宽度和高度、像素位数、压缩类型、位图分辨率和颜色定义等信息;(3)位图数据体,其记录了位图数据每一个像素点的像素值,记录顺序在扫描行内是从左到右,扫描行之间是从下到上。因此,根据BMP二值图像数据结构信息,读出所需要的图像数据,并对这些图像数据做进一步的处理。在本文给定的训练图像中,图像数据大小为80个字节,而图像数据体距离其文件头的偏移量为62个字节。但为了减少数据处理数量,该文在进行实验时直接使用位图数据体中的数据,没有通过读出位图文件头来得到位图数据体中的数据。
3 数字识别具体设计方法
由上文可知,该文使用数据源为图像大小为20*20的BMP二值图像,由于是对位图数据体的数据直接进行操作,因此省去了对图像其他数据结构数据的繁杂处理过程,将问题的核心转向BP神经网络的设计方法步骤。
4 实验结果
图4所示为BP神经网络训练及测试结果图。该文选择10个训练样本,通过实验结果可以看出,由这10个训练样本训练出来的BP神经网络对于训练样本中的图像数值识别率达100%,训练时间也比较短,其迭代次数大概为700次左右。对于一些含有噪声的图片,只要噪声系数小于0.85个字符,其数字识别率可达96%。
5 结束语
针对二值图像数字识别问题,该文在对BP神经网络的基础理论进行分析后,设计了一种基于BP神经网络的数字识别方法,并通过实验验证了该BP神经网络用于数字识别的可行性和有效性。而对于BP神经网络存在的收敛速度慢、易陷入局部最优和学习、记忆具有不稳定性等问题,还有待于对其进行一步研究。
参考文献:
[1] 韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.
[2] 吕俊,张兴华.几种快速BP算法的比较研究[J].现代电子技术,2003,24(167):96-99.
[3] 陆琼瑜,童学锋.BP算法改进的研究[J].计算机工程与设计,2007(10):96-97.
[4] Sven Behnke,Marcus Pfister.A Study on the Combination of Classifiers for Handwritten Digit Recognition,2004.
[5] 马耀名,黄敏.基于BP神经网络的数字识别研究[J].信息技术,2007(4):87-88.
[6] Hasan soltanzadeh.Mohammad Rahmati.Recogniton of Persian Handwritten Digits Using Image Profiles of Multiple Orientations[J].Pattern Recognition Leaers,2004(15).
2基于BP神经网络和证据理论的评价方法
2.1BP神经网络的基本原理
BP神经网络,是由Rumelhart和McCelland等人(1986)提出的。其基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层通过隐含层传向输出层。若输出层的实际输出与期望输出不符,则转入误差的反向传播阶段,并将误差分摊给各层的所有单元。正向传播与误差反向传播周而复始,一直到网络输出的误差减少到可接受的程度,或预先设定的次数为止。
2.2证据理论的基本原理
①定义1:设为一个互斥又可穷举的元素的集合,称作识别框架,基本信任分配函数m是一个集合2到[0,1]的映射,A表现识别框架的任一子集,记作A哿,式中:m(A)称为时间A的基本信任分配函数,它表示证据对A的信任程度。②Dempter合成法则:假定识别框架下的两个证据E1和E2,其相应的基本信任函数为m1和m2,焦元分别为Ai和Bj,则m(A)=m1(A)茌m2(A)2.3信用风险评估算法为了保证神经网络的收敛和稳定性,本论文中将15个指标分为四组,建立4个神经网络NN1,NN2,NN3和NN4。神经网络的输出设计为(0.1,0.1,0.9)T、(0.1,0.9,0.1)T、(0.9,0.1,0.1)T,表示的信用风险级别分别为高风险、中度风险、低风险,记为A1,A2,A3。将输出归一化,得到向量(a′i1,a′i2,a′i3)T,记作V′i。令mi(Ai)=a′il,i∈{1,2,3,4},l∈{1,2,3},表示由NNi得到的对信用风险级别Ai的基本信任度,即针对事件Ai的证据。之后,再将4个证据利用DS证据理论融合。就可以对信用风险进行评估,最初最终决策。
3应用实例
本次数据采集共发出问卷200份,收回135份,有效问卷92份。将前91组数据分别训练神经网络。再将余下1个样本输入训练好的神经网络,归一化处理输出结果即得该证据对该命题的基本概率分配,而后利用DS证据理论将其融合得到最终优化结果。
[中图分类号]F270.7[文献标识码]A[文章编号]2095-3283(2013)01-00-02
一、 应用BP神经网络的必要性
随着经济全球化和信息技术的加快发展,我国企业面临着更为严峻的竞争压力。为了适应现代市场需求,企业必须优化配置人力资源,并科学制定人力资源规划。其中,科学的人力资源需求预测是人力资源开发和规划的基础,对人力资源管理活动将产生持续和重要的影响。
企业人力资源需求预测分析方法多种多样。在进行人力资源需求预测时,企业要考虑的因素复杂多变,如企业的目标和经营战略、生产状况的变化、工作设计或组织结构的变化等,而且各种影响因素与预测结果之间的相关性难以用定量的方法表示出来,是非线性相互制约的映射关系。将BP神经网络方法应用于人力资源需求预测领域,弥补和改进了人力资源需求预测分析方法,能较好地实现各指标与需求结果之间非线性关系的映射,对企业人力资源决策具有一定的参考和指导作用。
二、BP神经网络的基本原理
人工神经网络,简称神经网络,是一种包括许多简单的非线性计算单元或联结点的非线性动力系统,是用大量简单的处理单元广泛连接组成的复杂网络。Back-Propagation Network,简称为BP网络,即基于误差反向传播算法的多层前馈网络,是目前应用最成功和广泛的人工神经网络。它由输入层、隐含层和输出层组成。隐含层可以是一层或多层。BP神经网络自身具有的非线性映射、自学习、自适应能力、容易实现并行计算等优点,弥补和改进了供应商选择和评价方法,能较好地实现各指标与评价结果之间非线性关系的映射。
基于BP神经网络,构建供应商的选择评价模型,其基本思想为:假设输入变量为X=(X1,X2,···,Xi)',隐含层输出变量为Y=(Y1,Y2,···,Yj)',输出层变量为Z=(Z1,Z2,···,Zl)',期望输出的目标变量为T=(T1,T2,···,Tl)',Wij、Wjl分别为输入层到隐含层、隐含层到输出层的连接权值(如图1所示)。对于i个输入学习样本X1,X2,···,Xi,已知与其对应的输出样本为Z1,Z2,···,Zl。通过BP算法的学习,沿着负梯度方向不断调整和修正网络连接权值Wij和Wjl,使网络的实际输出Z逐渐逼近目标矢量T,也就是使网络输出层的误差平方和达到最小。
图1三层BP网络结构图三、BP神经网络在企业人力资源需求预测中的应用
根据上述BP神经网络主要思想,以A公司为例,分析如何运用MATLAB工具箱实现基于BP神经网络的企业人力资源需求预测。
1.样本数据处理
选取年份、产值、资产总计、利润4个指标作为输入向量,从业人员作为目标向量(见表1)。在对BP网络进行训练前,应该对数据进行归一化处理,使那些比较大的输入仍落在传递函数梯度大的地方。本例采用MATLAB工具箱中的premnmx()函数把数据归一到[-1,1]之间,如表2所示。
对于BP网络,有一个非常重要的定理。即对于任何在闭区间内的一个连续函数都可以用单隐层的BP网络逼近,因而一个三层BP网络就可以完成任意的n维到m维的映射。本例采用单隐层的BP网络进行从业人员预测。由于输入样本为4维的输入向量,因此,输入层一共有4个神经元,网络只有1个输出数据,则输出层只有1个神经元。隐含层神经元个数根据最佳隐含层神经元数经验公式取15个。因此,网络应该为4×15×1的结构。隐含层神经元的传递函数为S型正切函数tansig(),输出层神经元的传递函数为线性激活函数purelin()。
3.BP网络训练及仿真
建立网络后,对表2中的数据进行训练,训练参数的设定如表3所示,其他参数取默认值。
训练次数12100012目标误差120.00112学习速率120.01训练结果如图1所示,可见经过52次训练后,网络的目标误差达到要求。
图1训练结果网络训练结束后,运用MATLAB工具箱中的sim()函数,将经过归一化后的数据表2进行仿真模拟,获得网络的输出,然后将运算结果通过postmnmx()函数进行反归一化处理,得到BP网络预测值,最后检查BP网络预测值和实际从业人员数之间的误差是否符合要求,如表4所示。
4.预测结果评价
图2反映了该BP网络较好地逼近了输入矢量,即年份、产值(万元)、资产总计(万元)和利润(万元)与目标矢量,即从业人员(人)之间的线性关系。用BP神经网络对现有人力资源状况进行分析拟合,是人力资源需求预测的较理想方法。与传统的人力资源需求预测方法相比,将BP神经网络用于人力资源需求预测,克服了输入矢量和目标矢量非线性、不符合统计规律的问题。BP神经网络模型良好的容错和自学习能力,调用MATLAB工具箱函数,使预测过程更易实现,可以更好地对人力资源进行规划,提高人力资源预测精度。
图2BP神经网络的函数逼近结果将BP神经网络应用于企业人力资源需求预测,能较好地建立起各影响因素与预测结果之间的非线性关系,是企业预测人力资源需求的一种较理想的方法。但BP神经网络也存在着一些不足和问题。主要表现在学习速率太小可能会造成训练时间过长;BP算法可以使权值收敛到某个值,但并不能保证其为误差平面的全局最小值;网络隐含层的层数和单元数的选择一般是根据经验或者通过反复实验确定,网络往往存在很大的冗余性,在一定程度上也增加了网络学习的负担。因此,BP神经网络在企业人力资源需求预测领域的应用仍需根据企业自身实际情况做进一步的改进和完善。
[参考文献]
[1]飞思科技产品研发中心神经网络理论与MATLAB7实现[M]北京:电子工业出版社,2005.
[2](美)海金(Simon Haykin)神经网络原理(原书第2版)[M]叶世伟,史忠植译北京:机械工业出版社,2004.
[3]丛爽面向MATLAB工具箱的神经网络理论与应用[M]中国科学技术大学出版社,1998.
[4]刘跃基于BP神经网络的人力资源估价研究[J]统计与信息论坛,2007(1):96-99.
[5]艳明四种人力资源的定量预测方法及评述[J]统计与决策,2008(7):30-32.
[6]国家统计局固定资产投资统计司,中国行业企业信息中心中国大型房地产与建筑业企业年鉴[M]北京:中国大地出版社,2003-2008.
1.概述
智能小车实际上是一类轮式移动机器人,其运行原理是依据单片机程序来自动实现行使、转向、加速等运动形式。因此对智能小车运动方式的控制属于机器人学的范畴。对智能小车运动轨迹的控制主要依赖于传感器的信息采集技术和智能控制技术。而在智能小车的运动轨迹控制问题中的一个重要问题是如何实现其自动避障。要完成这一任务,需要解决两个方面的问题,一是利用传感器准确的收集小车所在的环境信息,二是将环境信息自动处理后变成控制信息。实践表明,采用的单一的传感器技术已经不能满足收集充足环境信息的需要,而需要多种类型的传感器相配合,从而获得准确的环境信息。对这些通过多种类型传感器获得的环境信息的处理需要实现不同数据的之间的整合,即需要利用多传感器的数据融合技术。常用的数据融合技术如传统的卡尔曼滤波法、D-S证据推理等,但其核心思想是一致的,即通过对多种信息的融合来实现对目标的识别和跟踪。采用基于多传感器的数据融合技术已经成为智能小车避障控制中的重要研究方向。在本文中将以多传感器的数据融合技术为基础,研究智能小车的避障问题。
2.基于多传感器的数据融合
基于多传感器的数据融合技术需要处理来自多个传感器的实时数据,并进行快速的处理。从传感器获得数据的类型来看,这些数据代表不同的物理含义,如速度、距离、角度等,数据类型和特征也不尽相同,分属于不同的层次,因此对来自多个传感器的数据融合实际上要完成对多层次数据的综合评定,这必须依赖于一定的数据融合结构。
2.1 基于多传感器信息的融合结构
从现有的研究成果来看,基于多传感器信息的数据融合结构主要有四种形式:无反馈分布式融合、反馈分布式融合、集中式融合和反馈并行融合,各类融合结构的主要特点分别为:①无反馈分布式融合。无反馈分布式融合模式需要对每个传感器的数据都进行滤波分析,并完成对各传感器的局部信息融合,最后再实现对多个传感器数据的融合。这类数据融合方式的优点是不需要太大的通信开销,融合速度较快,所需的存储空间也较小。②反馈分布式融合。反馈分布式融合的基本原理和无反馈分布式融合类似,但每个传感器多了一个信息反馈通道,可提高预测和状态估计的精度,但需要更大的通信开销。③集中式融合。集中式融合的主要特点是对所有传感器采集的信息进行状态的估计和预测,通过对每个传感器采集信息的检测判定来实现对所有传感器信息的综合判定。由于采用了所有传感器的全部信息,因此这类融合方法的精度较高,但也需要更高的硬件配置。④反馈并行融合。这类数据融合结构综合了以上三类融合结构的优点,对局部、整体的数据处理效率和精度都很高,但对硬件和数据关联技术等要求也较高,是一类重要的研究方向。
2.2 基于多传感器信息的数据融合方法
基于多传感器信息的数据融合方法主要分为两类,一是基于概率统计的方法,如统计决策法、贝叶斯法等,二是人工智能方法,如模糊控制法、人工神经网络、D-S证据推理等。每种方法可参考有关文献,此处不再一一详述。
3.模糊神经网络基本原理
模糊神经网络是模糊控制理论和人工神经网络理论的耦合技术,能够有效的处理对经验性依赖较高的问题,并能广泛的适用于无法精确建模的系统。而人工神经网络则能够具备自学习能力和快速求解能力。通过模糊控制和人工神经网络的结合,能够形成函数估计器,有效的处理模糊信息和完成模糊推理,其性能比单一采用模糊控制或人工神经网络控制效果更优。模糊神经网络的基本原理为:①定义若干各模糊集合,并形成对应的控制规则。定义神经网络的层次(一般分为三层)和节点数量。②定义输入层。将输入层中的节点与输入向量分量之间实现连接。③定义隶属函数层。以语言变量值构成隶属函数层的节点,与输入层的连接权值固定为1,节点阈值为0。④定义规则层。每一条模糊控制规则定义为一个节点,节点的输出为隶属函数的输出。
4.实例应用
4.1 硬件
在本例中,智能小车所采用硬件平台为STC89C52型单片机,动力系统为AUSRO马达130,驱动芯片型号为TA7267,驱动芯片与单片机相连,其输出端和马达直流电机连接,从而实现对小车的方向控制,小车通过两轮驱动。
小车采用的传感器有两种类型:超声波测距系统和红外传感器系统。超声波测距系统的型号为TCT40-10T/R,红外传感器的型号为索尼CX20106。
4.2 传感器数据融合规则
在采用了5路超声波测距系统后,基本上可以对小车周围的障碍状况有比较可靠的了解,红外传感器的作用是为了弥补超声波测距系统的盲区。对这两类传感器所采集数据的处理方式为:①超声波测距系统和红外传感器同时工作;②若红外传感器的有效探测距离内发现障碍,以红外传感器的数据为准;③其他情况以超声波测距系统的探测值为准。
对5个方向的超声波测距的数据所采用的数据融合流程为:开始选择通道发射超声波盲区延时接收信号计算小车与障碍之间的距离数据融合选择小车动作。数据的融合技术采用模糊神经网络法。
4.3 模糊神经网络的构建
结合智能小车避障控制的需要,在小车车身配置5个超声波系统和一个红外系统,分别完成对前、左、左前、右、右前5个方向的测量,因此模糊神经网络共需要建立起5个输入和2个输出的网络结构。各个输入量的物理含义为小车在上述5个方向的与障碍的距离,神经网络的输出量为小车的前进和停止。以红外传感器采集的数据作为小车运动控制的开关量。隶属函数层的函数形式采用高斯型,模糊语言变量分别为{“远”、“近”},因此结合第一层的5个输入,共构成10个神经元。结合输入层和隶属函数层的情况,输出层的神经元数量为2的5次方,共32个神经元。
4.4 模糊控制规则和样本训练
(1)模糊控制规则
模糊控制规则体现的是人为控制经验的总结,分别对5个方向的超声波探测到的距离信息为基础来控制小车的转向。其基本原则为,若距离障碍较近,则小车停止前进,若距离障碍较远,则小车继续前进。分别以F表示前进、TF表示左转、TR表示右转、在实际控制规则中,共有9条,这里仅举一条来进行说明:若前方障碍较近,且左、左前、右、右前距离障碍较远,则小车左转。将上述规则转换为模糊语言后,即可获得具体的控制规则。具体转换方式可参照有关文献。
(2)模糊神经网络的训练样本
依据上述模糊神经网络的基本组成方式,其模糊输入范围的论域为[0,5],以高斯型隶属度函数来划分距离远近的模糊集合。训练样本的数据量较大,因此这里不便一一列出,神经网络的训练方法可参照有关文献。
4.5 运行效果
在上述的步骤完成后,对小车的避障能力进行了实际验证。实验表明,利用超声波测距系统结合红外传感器后,以模糊神经网络融合上述两类传感器采集的数据可有效的实现智能小车的避障运动。
中图分类号:TP183 文献标识码:A文章编号:1007-9599 (2011) 19-0000-02
Digital Identification Study Based on Neural Network
Wang Qinghai
(Qinghai Normal University,Xining810008,China)
Abstract:At first,this paper introduced the priciple of NN and a BP net,secondly,according to the principle of noised digital number recognition,it designed to the BP network model for applying to identify.At last,the BP network had been effectively carried out by using Visual C++ 6.0 software.Practice shows that the network to identify digital character has a high recognition-rate.The author think that the realization of the network has wide application prospects.
keywords:Artificial nerve network;BP network;Digital recognition
人工神经网络是人工智能领域发展最快的信息处理技术之一,是由研究大脑和神经系统获得的启示而建立的一种计算模型。由于其具有鲜明的分类能力、并行处理能力和自学习能力。通过对有代表性的样本的学习可以掌握学习对象的内在规律,从而可以在一定程度上克服信息量大的问题,解决传统方法的不足。采用神经网络的识别方式对字符识别研究提供了一种新的手段,其应用具有重要的意义。本文论述了利用神经网络理论进行图像识别的原理并用Visual C++6.0实现了在提取图像特征后,利用BP神经网络进行图形识别图像的主要技术。
一、BP网络简介
BP神经网络通常采用输入层、隐层和输出层的结构形式,层与层之间的神经元进行全加权连接。相关文献表明,含有一个隐层的3层BP神经网络可拟合任意的非线性函数。
图1中 和 为连接权系数矩阵, 和 为偏差矩阵, 为输入矩阵, 为输入参数,隐层含有 个神经元,输出层含有 个神经元, 和 为各层传递函数。激励函数决定了神经模型的学习和计算能力,也决定了模型的构造方法与性能的优劣。本工作网络隐层和输出层都采用 函数作为激励函数。
在实际训练时,首先要提供一组训练样本,其中的每个训练样本由输入样本和理想输出对组成。当网络的所有实际输出与其理想输出一致时,训练结束。否则,通过误差逆传播的方法来修正权值使网络的理想输出与实际输出一致。反复学习直至样本集总误差(公式1)达到某个精度要求,即E
(公式1)
其中 为网络之实际输出, 为网络期望输出。
二、数字字符识别的基本原理
数字识别系统在实现的过程当中,先分解成两个大块,就是图像预处理模块和数字识别模块。其中图像预处理块在对图像进行了一系列变换后把最后提到的数字字符提交给数字识别模块,然后进行识别并给出结果。
数字识别系统中图像预处理环节用到了许多图像处理中的相关技术:比如灰度化、二值化、图像内容自动调整、去离散点、图像的缩放、细化、曲线平滑、曲线去枝桠操作及神经网络对提取到的数字信息进行分析判断[1]。
三、神经网络的设计与实现
(一)数字的编码方式
本文采用BP网络的思想来设计并训练一个可行、高效的BP网络,以实现对0到9共10个加噪声后的数字识别。
这里采用8×8个加64点阵的形式,使用美观的数码管字体。
(二)神经网络模型的建立
由于本文中所介绍的系统采用8×8个加64点阵的形式表示数字字符,所以容易确定BP神经网络的输入层为64维。在输出层,将0~9数字用8421码进行编码,这样10个数字就需要4位二进制的编码。因此就可确定输出层有4个神经元。隐层的神经元数目的选择,是BP算法设计的关键。编程证明,当隐层神经元数目超过55的时候,网络的训练时间将无法忍受,同时抗噪声能力大大降低[3];当神经元数目低于7的时候,系统误差无法收敛到满意的值,又造成识别率过低[4]。经过多次的比较分析、测试,本文最终选定了隐层为49个神经元。
(三)数字识别的基本步骤
Step1:初始化样本,这里采用两组样本训练网络,第一组是纯净的不含噪声的样本数据0-9,第二组是含10%噪声的样本数据0-9。
Step2:初始化神经网络。
Step3:利用第一步中的样本训练神经网络。
Step4:利用训练好的网络进行数字识别。
(四)程序的实现
本文采用Visual C++6.0加以实现。
setSamples()的功能:装载的网络学习样本集和目标输出,并传递给inputsamples和targetsamples。
Train()的功能:根据setSamples()装载的网络学习样本集和目标输出,训练网络权值和阀值参数[6]。
程序的实际运行表明对数字字符采用如上的BP网络可以达到很高的识别率。
四、结论
实践证明,该网络对数字字符识别具有很高的识别率,由神经网络具有自学习、联想、记忆、行处理复杂模式的功能,在多过程、非线性系统方面的模式识别中发挥着较大的作用[7]。此网络的实现具有广阔的应用前景。
参考文献:
[1]方彩婷.基于BP神经网络的图像识别与跟踪研究[D].西安:西安电子科技大学,2006
[2]熊国清,于起峰.用于实时跟踪的快速匹配算法[J].计算机辅助设计与图形学,2002,7(2):46-48
[3]桑农,张天序.旋转与比例不变点特征松弛匹配算法的Hopfield神经网络实现[J].宇航学报,1999,20(3):106-108
[4]杨小冈,曹菲,缪栋等.系统工程与电子技术[M].北京:高教出版社,2005
[5]张宏林.Visual C++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003
[6]万里青,赵荣椿,孙隆和.不变性目标识别方法研究[J].信号处理,1996,12(2):124-128
引言
遗传算法GA(GeneticAlgorithms)模拟了达尔文的“适者生存,优胜劣汰”的自然进化论与孟德尔的遗传变异理论是由Michigan大学Holland教授1975年在他的专著AdaptationinNaturalandArtificial首次提出。其基本流程如图1。遗传算法(GA)与传统算法有很多不同之处,主要体现在GA适应性强,其使用的算子是随机的,如交叉、变异和繁殖等算子不受确定性规则的控制。但这种搜索也不是盲目的,而是向全局最优解方向前进。直接使用适值函数进行适值计算,而不需要求优化函数的导数,使一些不可求导的优化函数也可用GA优化;GA具有较强的鲁棒性,它能同时搜索解空间的多个点,从而使之收敛于全局最优解,而不至于陷入局部最优解;另外它还具有智能性和并行性,利用遗传算法的方法,可以解决那些结构尚无人能理解的复杂问题。它已广泛应用于函数优化、组合优化、模式识别和信号处理等领域,在处理复杂优化问题时遗传算法显示了巨大潜力,在实际工程应用中取得了巨大成功。由于上述特点,建立合理的模型,可以将GA用于设备的状态监测和故障诊断之中。本文把近年来的有关GA用于故障诊断的文献进行分析、归纳,总结出GA在故障诊断中的具体应用。
GA用于故障诊断从目前来看,有直接应用于故障诊断之中,主要用于提取特征向量,为诊断的后续处理作准备。有和其他的诊断方法相结合,研究得较多。
一、利用遗传算法提取、优化特征参数
机械故障诊断是一个典型的模式分类问题。在诊断实践中,由于诊断对象的复杂性,故障特征和故障类别的对应关系不甚明了,人们提出了大量的原始特征以进行故障识别。但由于特征向量之间存在一定的关联性,且特征向量对不同故障的敏感程度不同,这对设备诊断的效率和准确率有重要的影响。要对这些特征向量进行优化,使它们能够适应实际需要。
史东锋等对回转机械故障诊断中3类由同步振动引起的故障来分析,应用遗传算法,染色体采用二进制编码方式,以样本类内、类间的距离判据为适应值函数,进行特征选择,高效地剔除原始特征集的冗余特性,提高故障的识别精度。而用常规方法对得到的23个特征量进行分类,由于起高度的冗余性,很难取得理想的分类效果。
二、遗传算法与人工神经网络(ANN)的结合应用
人工神经网络以其强有力的学习和并行处理能力为故障诊断提供了全新的理论方法和实现手段。神经网络通过对经验样本的学习,将知识以权值和阈值的形式存储在网络中。网络的输入是被诊断对象的征兆即特征值,输出则表示发生故障的可能性。神经网络是以神经元为信息处理的基本单元,以神经元间的连接弧为信息通道,多个神经元联结而成的网络结构。神经网络以其独特的联想、记忆和学习功能在机械设备故障诊断领域受到广泛关注,其中研究较多的是BP神经网络及其改进算法。
三、遗传算法与模糊集理论的结合应用
模糊集理论是一种新的数据分析和处理方法,使用模糊集理论可以对决策表进行简化,去除冗余属性。故障模糊诊断的基本原理是利用模糊变换的原理、最大隶属度和阈值原则,根据各故障的原因与征兆之间不同程度的因果关系,在综合考虑所有征兆基础上来诊断旋转机械振动故障的可能原因。将模糊集理论应用到解决旋转机械故障诊断问题时,要计算旋转机械振动故障数据库中的频域征兆,使用模糊集理论对其进行约简,根据约简的结果生成规则。利用得到的规则对故障样例进行诊断。
四、遗传算法与小波理论的结合应用
对BP神经网络模拟模型建立的基础,人们是这样认为的,因为影响工程造价的因素,大多数人们都是没办法确定的,所以我们不需要把这个值具体是多少确定下来,而是从另一个方面考虑,根据这个项目的基本情况,估计实际的造价落在某个范围的机会会大一些,这个思想就是计算机模拟技术建立模拟模型的理论基础。
1.2人工智能模型
工程造价估算专家系统,是通过人工智能,加上知识库技术而建立起来的,可是这种人工智能模型主要靠专家的知识,来对工程造价进行估计计算的,但是估算的结果是被估算人员的主观意识所影响的,不同专家的性格,知识面的宽窄,经验丰富与否、都是不确定因素,几乎可以会所不一样的估算专家所得出的结果都不会一样。这种方法很容易带有个人偏见和片面性。受专家的主观偏见性较强。
2BP神经网络模型构造与算法
2.1人工神经网络的基本原理
1985,D•E•Rumelhart等人组成的PDP小组提出的一种神经网络模型,这就是我们今天所说的BP神经网络,BP神经网络结构是利用误差反向传播来消除误差的,它有三个层次,有一个输入层,第二个是隐层,最后一个当然就是输出层。在训练估算中,我们可以通过计算输出值和我们预期的期望值,他们之间所产生的误差,逆向思维,去求解输出层单元的一般化误差,然后再把误差进行反向传播,把隐含层单元的一般化误差求解出来,并最终调整输出层和隐含层,包括输入层之间的连接权,还有连接权与隐含层和输出层的阈值,最终目的就是让系统误差达到我们可以接受为止。当先前的系统误差达到我们所需求的时候,权值和阈值就变成了固定不变的了,这样我们再通过反向逆推,就可以测出我们这个项目的未知信息。这就是人工神经网络的基本原理。
2.2BP神经网络模型建立的步骤
(1)我们首先确定模型输入层,隐含层还有输出层的神经元个数。并且以此为依据,确定BP神经网络模型的结构参数;(2)神经网络只能处理-l~l之间的数据,所以在输入网络时,我们不仅需要对原始数据进行规范化处理,还要对隐含单元和各个单元输入信息进行求和;通过反向逆推之后得到本单元的输入信息。所以对原始数据,隐含单元输入模块规范化细致化是非常重要的;(3)隐含单元的输出值可以根据神经网络操作模型得出,只要我们把net信号经过一次激发函数的处理,可以得到这个隐含单元的输出值;(4)对于输出单元节点,我们只要对前一层的隐含层单元输入信息,并且加权求和后,就能得到该单元的输入信息。操作起来非常方便快捷;(5)对权矩阵的调整,因为人工神经网络可以近似实现任意空间的数学映射。所以我们假设,如果神经网络输入单元数为M,输出单元为N,则在m维欧式空间尺中会有一个有界子集A,存在着一个到n维欧式空间,那么R中一个有界子集F(A)的映射。
3基于BP神经网络的工程造价估算模型
3.1定量化描述工程特征的因素
什么是工程特征,在BP神经网络中所说工程特征,就是指不但能表示工程特点,而且还能反映工程的主要成本构成的重要因素。,我们可以通过参照历史工程资料的统计和分析,进行工程特征的选取工作。选取完成之后,再根据专家的经验来确定,这样就可以万无一失了。首先我们可以通过典型住宅工程的造价组成进行分析,然后对建筑结构参数的变化和别的工程做一下对比,通过以上两点得出的结果,分析这些因素对造价的影响,依照以上的理论方法,我们进行了实践性的研究,最终把础类型,结构形式,建筑层数,门窗类型,外墙装饰还有墙体材料以及平面组合等,这7种因素作为工程的主要特征。不同的建筑工程有着不同的类型,比如说结构,可以是砖混结构和框架结构等;砖条基和钢筋砼条基础等都可以作为基础特征,对于这样的特征选取的多样性我们称之为特征类目,通过工程特征不同类目的列举,再跟据定额水平,工程特征对造价影响的相关性,这些对平方米造价的改变,对工程定量化的描述可以主观的给出对应的量化数据。
3.2建立估价模型
工程造价估算的指标体系到该项目的单位造价的非线性映射,就可以统称为是建设项目工程造价的估算问题。BP网络可以根据人们的需求以任意的精度去逼近任意映射关系,究其原因就是上文说的BP网络采用的是三层BP神经网络结构,不同于其他的电脑估算网络。不仅是因为该模型的输入单元为7个,还有他们的项目样本特征也不尽相同。神经网络可以根据已经经过我们优选的模型特征,做为参考估算要素,然后再通过项目工程造价估算中,我们所提供的一定数量的已知样本,采取对样本的神经网络训练,最后根据以往的大的数据库,提取类似的项目估算值,然后才能对其它特征的项目进行估算。这样我们只需要输入指标体系的各指标值,BP神经网络就可以在该项目的单位造价的非线性映射中给出该项目的单位造价。
3.3检测结果的分析
上面我们通过大量的实际实验得知了这两个固定不变的数字,然后我们可以用程序值被收敛后的网络,对现在要进行求解的数据进行检测,在测试后,如果发现总体误差比率较小,那么就满足我们初步设计的概算需求了,同时对工程可行性研究的投资估算需求也已经基本符合了,这些结果能有好的保证,全是依赖我们所选择的模型的宽度够用,模型在所有的因素中具有广泛的代表性。所以估价模型的计算才较为成功。几个工程估算的好坏也不能代表所有的项目都是完美的,也有个别工程造价估算误差大,因为电脑毕竟是人在给其输入程序,电脑的经验,还有就是对一些特征的学习不够用,本身的知识储备还是有局限性的。因为对样本数量的学习始终是有限,不可能面面俱到,而且挑选的样本也不可能针对这个工程而言都是符合这个项目的特性。虽然说BP神经网络模型有这样无法控制的缺点,但是和其他的造价估算模型相比,BP神经网络模型的优点还是可圈可点的,其优点和其他的造价模型相比较优点还是非常明显的。在以后的估算中,随着样本的不断充实,数据的不断积累,经验的不但丰富,其估算的误差也将不断缩小,这些方面的补充,在以后的估算中,必定会取得非常完美的成绩。
中图分类号:TE328 文献标识码:A 文章编号:1009-914X(2016)03-0025-01
1.人工神经网络的基本原理
目前人工神经网络有四十种左右,结构、性能各不相同,但无论差异如何,它们都是由大量简单的基本处理单元广泛连接而成的。这种基本处理单元称为神经元,也称为节点,它是生物神经元的模拟物。最简单的节点是所有输入的加权和,并通过一个非线性函数输出结果
决定一个神经网络性质的要素有三个,即神经元特性、网络结构、训练方法(或叫学习方法)。所谓训练方法是指网络作什么方法适应或学习自动地形成网络中各个节点之间相互连接的权系数及各个节点的阀值。由于这三个要素的不同形成了丰富多彩的各种网络。在该项目的研究中,使用的神经网络是多层感知器(Multilayer Perceptron)。
2.多层感知器
多层感知器是一种层状结构有前馈神经网络,它由输入层,输出层,一个或多个隐蔽层(hidden layer)组成,隐蔽层也称为中间层,每个节点只与邻层节点相连接,同一层间的节点不相连。一个三层感知器可产生任意复杂的判定区,多层感知器使用的激活函数是S型函数。按训练方法多层感知器属于监督学习型,训练方法多采用误差反传播算法,简称BP算法。
3.误差反传播算法
函数(costfunction)最小化,估价函数等于期望输出与网络实际输出差的平方和。只有对应当前输出所属类的那个输出节点的期望输出是1.0,其余所有输出节点期望输出是0.0。网络训练时,开始取一些小的随机数(计算机自动生成),以这些随机数作为网络内部各个节点之间连接的权系数和各个节点上的阈值的初始值,然后,输入所有训练样本数据,根据网络求得输出结果,计算实际输出与期望输出的差值,并按照一定的规则,不断地修改节点间的连接权系数和节点内部的阈值,反复这一过程,直至权值收敛,并使估价函数降至可接收值。研究指出,真正的梯度下降法要求采取无穷小步长,权值改变的比例常数是学习率,学习率越大,权值改变量越大,网络收敛速度越快,但学习率大会产生震荡。为了增大学习率而不导致振荡,可增加一个冲量项(momentum term)。
4.神经网络油气预测
本次研究对三维地震资料进行了层位标定和构造解释,在构造解释的基础上分别提取地震属性,按其XY坐标重新进行网格化,将所提地震属性合并为一个整体。
该工区面积为1272平方千米,测线号1977-4639,共2664线,样点数为1905242点。预测层位为孔二段(EK2)。根据所选样本射孔井段深度及其试油结论,落实该段的含油气井和干井。统计结果表明:
在EK2内选择45口 (g107x1、g108、g143、g146x1、g2209、g61、g63、g68、g87、g89、g95、g996、g998、g999、n18、n20、n21、n22x1、n24、n59、n63、n69、n70、n73、n89、n91、wu7、y23、z19、z23、z25、z28、z31、z32、z34、z45、z46、z48、z49、z50、z52、z87、z88、z89、zx58)含油气井;
应用神经网络进行油气预测,首先应用Landmark软件提取地震层位属性,其后的实现步骤为:
①将每个地震属性在工区范围内作归一化处理,在此基础上可获得每一个地震道对应的地震属性样本。
②根据试油结论、地质分层数据表、射孔井段、井口坐标和井斜数据制作各砂层组和各井在该砂层组内的含油气性数据表,以便生成供神经网络学习用的训练样本集。上述数据及地震解释层位数据的可靠性都将影响预测结果准确性。
③训练样本集构成的参考原则:选取部分井旁样本组成训练样本集,留一部分井作为检验井,考核预测结果的可靠性。具体做法是:以射孔井段处的井下坐标在地面上的投影为原点,在指定的搜索半径范围内和指定产油气井旁抽取若干个样本作为含油气样本子集;在产油气井周边选择部分无油气井、并在无油气井旁抽取若干个样本作为无油气样本子集;将这两个样本子集合并在一起,便生成了训练样本集。
④将训练样本集提交给神经网络,让神经网络学会有油气和无油气的分类方法,即计算神经网络节点间的权系数。
⑤对工区内逐个样本进行分类,从而得到油气预测平面分布图。
EK2训练样本集是由含油气样本和干样本两个子集构成,从45口产油气井旁各抽取1-2个样本(其中g998、n20、n70抽取了两个样本),组成48个含油气样本,又从c14、g129、z37等22口干井旁各抽取1-4个样本(其中c14、g136、g137、g139、g157、g158、g194、jia6、x6、x7、y11抽取了2个样本,g128、g9、g990、wu15、z37抽取了3个样本,wucan1抽取了4个样本)组成48个干井样本,该层训练样本集的样本总数为含油气样本和干样本之和(96)。生成的训练样本集供神经网学习,“学习成绩”可以用不在训练样本集中井的含油气性来评判,即EK2的训练样本集共用67口井,用余下123口井(其中35口井为含油气井,其余88口井为干井)的含油气性来评价预测结果的可靠性。得到了EK2的油气预测图及顶面构造(等值线)与该层的油气预测叠合图。训练样本集选用了45口含油气井和22口干井,其余123口井作为验证井,EK2油气预测成果图(图7-9)显示,除了少数油气井(如g120、w38)在油气预测含油气边界处外,其余33口井均得到很好的验证,表明预测结果具有较高的符合程度(即符合度为33/35*100%=94%)。
5.结论
本次研究对三维地震资料进行了层位标定和构造解释,神经网络对工区内逐个样本进行分类,从而得到油气预测平面分布图。从分析结果看出,EK2含油气的地方,其预测值大部分都落在0.5至1的范围内,油气预测成果图展示了含油气区域的有利范围。从此次研究上看来利用神经网络预测油气是可行的。
参考文献
中图分类号:TP393.06 文献标识码:A 文章编号:1007-9599 (2012) 15-0000-02
网络故障检测所指的是检测对象一旦有某种故障出现,就立即对其实行检测,从而找出引发网络异常的因素。网络故障检测主要分成三个阶段,分别是采集信息、提取故障征兆以及识别状态,可以说,故障的检测,最根本之处就在于对故障征兆集至故障状态集之间所存在的非线性映射进行求解,在各种各样的神经网络模型中,得到最广泛应用的就应该是BP模型了,针对此通过BP算法来进行计算机网络故障的检测。
1 BP神经网络故障检测原理及算法
1.1 BP神经网络实行故障检测的基本原理
所谓的BP神经网络模型,它主要依靠一个输入和与之相对应的输出来和外界产生联系,神经网络模型训练主要是通过对样本数据的充分采集与 BP算法的有机结合来实行的,通过这一措施,来使得神经网络越来越和组合导航系统中最原始的算法模型所具有的非线性的这一特征几乎一致。具体来说,通过BP神经网络来实行故障检测的基本原理主要包括两个部分,第一个部分是要保证具有足够的样本数量来和神经网络训练之所需相满足,并在此基础上来得出所期望的诊断网络。第二个部分,就是通过诊断输入,来对神经网络进行充分的利用,从而有效实施故障检测。需要注意的是,在对其实行故障检测之前,所需要做的就是对原始的数据,对训练样本的数据等等做出相关的处理,所谓的处理,主要包含了两步,第一是预处理,第二是特征的提取,只有通过这两个步骤,才能够为网络诊断提供更加适合的诊断输入和更加有效的训练样本。
其中,需要引起注意的有三部分的内容,第一,对网络结构确定的一个关键所在就是要对网络结构的规模进行合理且科学的确定,特别是对其中的网络中间层神经元来讲,其个数的选择尤为重要。第二,要注意对训练的样本以及测试的样本进行确定。所谓的训练样本,其所具有的最主要的作用是对网络进行训练;所谓的测试样本,其所具有的主要作用就是要在前者的基础之上,来进行效果的监测。第三,需要做的就是要结合上述训练样本的结果和测试样本的结果,来将两者有机的结合起来,从而最大限度的实现和神经网络的一致性,进而有效进行故障的检测。
1.2 BP神经网络的检测算法
对于神经网络的检测来讲,和其他检测不同的是,它并不需要事先把相关的模式经验知识以及相关的函数判别等等罗列出来,因为它是一种具有自适应性的模式,能够对自身的学习机制进行充分的利用,来形成一个决策区域。网络在进行某一种映射关系的获得的时候,需要通过状态信息来对各种状态的信息进行训练,这一映射关系,会随着环境的不断改变而自行进行调整,从而和瞬息万变的环境相适应。它的具体算法是:
输入:net=
输出:y=
输出的导数为 =y(1-y)
BP神经网络的形成,主要是通过多种神经元之间实现相互的连接而实现的,它所具有的最主要特点就是单向传播,是一种多层前向的网络,它主要分成三个层次,也就是输入层、中间层以及输出层,其中,中间层还可以分成若干个层次,并且对于其中每一层的神经元来讲,它只对前一层的神经元输出予以接受。不仅如此,BP神经网络当中并没有反馈的存在,在同一层中的不同节点来讲,它们之间是不会形成相关的耦合作用的,它所能够影响的也只是下一层节点的输入。
2 基于神经网络的计算机网络故障检测措施
2.1 通过神经网络来实行故障检测的措施
(1)模式识别神经网络。所谓的故障检测,实际上需要做的是进行模式分类和模式的识别,在传统意义上的模式识别技术,它在进行模式的分类的时候,基本上采用的方式都是通过对函数的识别进行充分的利用,来对每一个类别实行划分。那么,在这样的划分模式下,我们假设模式样本的特征空间为N维欧氏空间,同时假设模式的分类为M类,这样,我们就可以从数学模式上来对其进行分类,具体分类方式就是:通过对朱超平面方程的定义,来对N维欧氏空间尽可能地实现最佳分割,并且这一分割的决策区域是M这样的问题。但是,在具体的实践中,如果要对复杂的决策区域进行分割,那必定是十分困难的。所以,必须要准确的选出最适合的函数判别式,来在识别中对函数相关的参数进行识别,从而进行相关的修正措施。
(2)故障预测神经网络。对于故障预测神经网络来讲,它的实现,主要是通过两种方式来完成的,第一种方式是,把神经网络作为主要的函数逼近器,饼子啊次基础上莱迪机组工况的某一些参数实行拟合预测看,这一种方式,最常见的就是本文所研究的BP网络就。第二中方式是充分对输入和输出这两者之间的关系进行考虑,之后,采用带反馈连接的动态神经网络来针对具体的过程或者具体的工作情况参数,来吧动态的模型建立起来,从而实行故障预测。但是从目前其应用程度来看,得到最广泛的应用的应该就是基于多层的前馈网络。
现在,我们站在系统辨别的角度之上,来看前馈网络,它所代表的仅仅只是那些能够通过代数的方程,就能够进行静态映射的扫描,从而实行静态预测的描述,如果把它用在设备的动态建模和动态预测当中,毫无疑问会受到很大的限制。所以,我们可以说,动他的神经网络预测,也就是一个动态时序建模的过程。
(3)专家诊断神经网络。所谓的专家诊断神经网络,也就是把神经网络和专家系统两者之间进行有机的结合,这一有机结合的费那个是主要有两个,第一个是,把专家系统来组合成为神经网络,详细来讲,也就是要针对传统的专家系统,来把其中的建立在符号上的推理直接转变成为建立在数值运算上的推理,这样做的最根本目的就是要把专家系统所具有的执行效率大大提升,并在此基础上来对其学习能力进行充分的利用,从而把专家系统中的学习问题彻底解决好。第二个是,把神经网络看成是一种知识源的具体表达以及具体处理的模型,通过把这一模型和其他的相关知识表达模型的有机结合,来把领域专家的知识充分的表达出来。总的来讲,建立在神经网络基础上的故障检测专家系统,是一种新的知识表达系统,它是通过对大量的节点的一些简单处理,是通过单元与单元之间的相互作用来实现信息处理的。
这一方式,通过对网络信息的保持性的充分利用,来把其中的那些不是很精确的诊断推理实现,是一种简单且有效的方式。
2.2 神经网络故障检测的具体应用
在一般情况下,导致网络故障的因素不外乎是在设置上出现了问题,对于这类原因引起的故障,我们可以把着手点放在软件上面,通过这一入手点,来实行故障的检测,对于把网络的设置改正确了,对本地机主的测试也通过了,但是,他和与之相邻的主机却是不同的,并且,在这一时候,和交换机相连接的端口没有出现网线的松动情况,那么,需要做的就是进行TCP/IP 的重新安装。将具体一点,也就是如果系统处于正常运行的状态的话,实际上,这一时候的残差是和高斯白噪声序列最为接近的时候,这是,期均值就近乎为零,这时,我们把协方差上界用以下的式子来表示:
U(k)=
其中U(k)所表示的是协议方差,它是会随着k的变化而出现不同的统计特性,如果我们定义一些随机变量,采用的方式是:
需要指出的是, 我们可以认为其就是服从于 的分布的,所以,上述的式子又可以表示成为:
从上述的式子中,我们可以用字母N来表示数据床的长度,那么,如果系统是处于正常运行的状态的话,d(k)的数值就会很小;反过来讲,如果系统正处于突发性故障的状态的话, 就不能够和白噪声的特性相满足,所以, ,其中所标示的是阈值,H0所表示的是正常模态,通过实践,如果有故障发生,那么只需要进行一步时延,d(k)就会发生明显的变化,由此来对网络故障进行检测。
3 结束语
总之,到目前为止,网络故障诊断的一个最主要发展趋势就是采用智能化的检测技术来记性,而神经网络有着极佳的非线性映射,有着极强的自适应能力,从而日益被广泛的应用到网络故障的检测当中,也可以说,这是一种值得深入推广的技术。
参考文献:
期货市场是一个不稳定的、非线性动态变化的复杂系统。市场上期货合约价格的变动受金融、经济、政治及投资者心理等众多因素的影响,其过程具有非线性、混沌性、长期记忆性等特点。传统的经济模型大部分是线性模型,具有一定的局限性.而人工神经网络则能很好地解决这个问题。
一、BP神经网络原理与过程
BP神经网络(反向传播网络Back Propagation)是一种多层前馈型神经网络,其神经元的激活函数是sigmoid函数,一般为log sigmoid 函数和tan sigoid 函数,函数的图形是S 型的,其值域是为0到1的连续区间。它是严格递增函数,在线性和非线之间有着较好的平衡性。
1.数据归一化处理
数据归一化方法是神经网络预测前对数据常做的一种处理方法。数据归一化处理把所有数据都使其落在[0,1]或[-1,1]之间,其目的是取消各维数据间数量级差别。避免因为输入输出数据数量级差别较大而造成网络预测误差较大。数据归一化的方法主要有以下两种。
(1)平均数方差法,其公式如下:
2.BP神经网络的学习过程
BP网络的学习过程由信号的正向传播和误差的反向传播两个过程组成。其基本原理是:网络先根据输出层的误差来调整输出层和隐含层的权值和阈值,再将部分误差分配置隐含层,然后根据误差来调整隐含层和输入层之间的权值和阈值,并不断地重复上述过程,直到网络的输出与目标之间的误差趋于最小,达到规定的要求。
一般地,BP网络的学习算法描述为如下步骤。
(1)初始化网络及学习参数,如设置网络初始权矩阵,给出学习速率和神经元激活函数等。
(2)提供训练模式,训练网络,直到满足学习要求。
(3)前向传播过程:对给定训练模式输入,计算网络的输出模式,并与期望模式比较,若有误差,若执行步骤(4),否则,返回步骤(2)。
(4)反向传播过程:计算同一层单元的误差,修正权值和阈值,返回步骤(2)。
二、玉米期货价格预测分析
美国是世界上玉米生产大国和消费大国,良好的现货基础为美国玉米期货市场的发展提供了优越条件。其中,以CBOT为代表的美国玉米期货市场同现货市场有效接轨,不仅在美国内玉米生产流通领域发挥了重要作用,而且在世界玉米市场上也影响巨大。
发现价格作为期货市场的基本功能之一,CBOT作为全球最大的玉米期货交易市场,其玉米期货价格的国际影响力是非常巨大的。目前,在国际玉米市场上,玉米贸易价格的形成和交易活动是以CBOT的玉米期货价格为中心展开的,该价格是国际玉米贸易中签约双方需要考虑的最重要的依据之一。美国已经通过芝加哥玉米期货市场取得国际玉米贸易的定价权,在国际玉米市场中发挥着主导作用,并且能够对本国和其他国家玉米产业的发展产生深刻影响。
本文研究所采取的样本来自WIND资讯金融终端,以2008年07月-2015年10月的CBOT的玉米期货为研究对象。共计100组样本数据,将其中92组数据作为训练数据。8组作为分析样本。本文从影响全球玉米的供需平衡的角度出发,从期初库存、产量、进口、饲料消费、国内消费总计、出口、期末库存、总供给、贸易量共九个因素进行分析研究,对玉米期货的价格进行预测。利用MATLAB软件训练生成BP神经网络并进行预测,将隐含层神经元设为20个,训练次数为100次,训练精度为0.00005。最后得到结果见表1。
从表1中可以看出,通过BP神经网络计算得出的预测值与实际值绝对误差相对较小,这说明通过BP神经网络预测模型产生的预测结果的精确度较高。具有较强的实用性。但是由于玉米期货除了受到供需因素的影响外,同时还受金融、经济、政治及投资者心理等众多因素的影响。所以本文的结果还带有一定的局限性。若把上述因素考虑进去,其精确度可能进一步提高。
三、结语
本文采用BP神经网络对美国玉米期货的价格进行了研究。使用了多因素BP神经网络预测模型,对玉米期货的价格进行预测,得到了拟合度在较高的预测值。这说明BP神经网络方法可以对玉米期货价格走势进行有效预测。通过预测,可以对投资者的投资行为进行指导,从而达到规避风险而获取较好的经济利益。
引言
PID控制因为算法简单,鲁棒性能好,可靠性高被广泛应用于工业过程控制中,通常需要整定3个参数:比例系数、微分时间、积分时间。但由于传统PID控制在实际工业控制系统中会出现类似控制过程非线性,时变性等不确定的问题,会使原来的参数难以建立精确的数学模型,从而无法保证系统达到理想的控制效果[1]。
而在传统PID控制过程中由于部分因素影响会使得控制过程出现某些问题,如非线性问题,另外还可能会造成时变性不确定。这对于相关模型构建则会带来一定的影响,使模型精确度降低,无法满足控制要求。因此,需要一种改进型的PID控制器对系统进行控制。神经网络具有自适应和自学习的能力[2],通过相关手段对PID控制器进行完善,可对其系统结构等进行优化从而得到更好的控制效果,保证系统的稳定性,相对于传统的PID控制算法来说具有更好的适应性。
1 BP神经网络PID控制
1.1 BP算法的基本原理
利用梯度最速下降法作为BP算法可对整个控制体系进行有效优化,一方面采取该方法可对权系数进行修正,从而使传播误差得到控制。在上述条件下可让网络实际输出值与目标输出值偏差控制在最小范围内,使得控制过程得到优化。而在正向传播阶段,需要对输入层权值进行控制,通过利用隐含层节点可对相关函数激活并对输出层节点产生作用,最后获取输出值。若输出值与目标输出无法匹配再对误差变化进行分析,通过有效反向传播进行反馈,同时对各个层级的神经元权值进行转变,最终得到期望值[3]。
1.2 基于BP网络的PID控制算法归纳
基于BP网络的PID控制器控制算法归纳如下:
①先对BP网络结构进行有效确定,确定输入层节点数M及隐藏层节点Q,同时对各层的加权系数初值w■■(0)和w■■(0)进行把握,另外还要确定学习速率?浊和惯性系数?琢;②采样rin(k)和yout(k),获取误差error(k)=rin(k)-yout(k);③对PID控制器可调参数进行计算(神经元输入值、输出值、输出层值);④根据相关公式对PID控制器的输出u(k)进行计算;⑤利用神经网络自学习对w■■(0)和w■■(0)进行调整,从而使PID控制参数可自行调整;⑥置k=k+1,返回至第①步。
2 实例说明
设被控对象的近似数学模型为:y(k)=■+u(k-1),a0(k)是慢时变的,a0(k)=1+0.15sin(k?仔/25)。输入信号为正弦信号r(k)=sin(2k?仔/100),将学习速率设置为0.28,惯性系数设置为0.04,神经网络结构设置为4-5-3型。
仿真曲线图如图1至图4所示。
从上述曲线可知基于神经网络所得到的PID控制器可保持稳定的工作状态,误差较小,这使得超调及抖动等问题均得到了有效控制。另一方面上述PID控制器具备了理想的精度,可同步跟踪控制信号,无论是在适应性上还是速率上较传统PID控制均表现了明显的优势。
3 参数设定
3.1 网络的层数
一般情况下会以三层网络进行构建,其中存在一个隐藏层。利用多层结构可在一定程度上提升精度,当然也会造成结构趋于复杂化,而在隐含层当中适当增加神经元数目也可有效控制误差并提升进度,从操作性来看更为简便。
3.2 加权系数的初值
加权系数的初值最好设置为随机数。因为系统是非线性的,初始值与学习是否达到局部最小、是否能够收敛以及训练时间的长短的关系很大。如果在学习开始时将所有初值设置一致,那么各个隐含层将会得到一致的加权系数调整量,并保持加权系数一致。在matlab中,分别用语句wi=0.50*rands(H,IN);wo=0.50*rands(Out,H);对输入层到隐层,以及隐层到输出层随机取值。
3.3 学习速率
学习速率的选取范围在0.01-0.8之间,本研究中将学习速率设定为0.01至0.8区间内,以此促使系统可维持稳定的运行态。学习速率决定着每次循环训练中引起的突触权值变化量。选择的太大,可能会导致系统不稳定;选择的太小,虽然能保证网络的误差值趋于最小误差值,但学习时间过长,收敛速度较慢。
3.4 隐层节点数
在满足精度要求的前提下取尽可能少的隐层节点数。隐层节点数与输入层和输出层的节点数以及网络的复杂程度有关。当隐含层节点数取输入层和输出层节点数之间且靠近输入层节点数的值时,收敛速度较快;隐层节点数太少时,学习过程不收敛;隐层节点数太多时,网络映射能力增强,容易收敛到最小点,但是会使学习时间变长,网络容错性降低。
4 结束语
基于BP神经网络PID控制器必须通过试探法先确定理想的学习速率以及合适的初始权值,让系统在运行过程中保持稳定态。神经网络PID控制方法简单,无需建立被控系统的数学模型,避免了人工整定PID参数的繁琐工作。文章只是对基于BP神经网络的PID控制进行简单的研究,并没有应用到现实中的实际问题,如果将此类研究和现实中的例子结合,将会很有意义。
参考文献
中图分类号:U472 文献标识码:A
在现代生产过程中,柴油机作为常见的机械设备之一,广泛应用于动力发电、工程机械等各种领域,其动力性和可靠性的好坏直接影响着整个系统的工作状况。因此,对柴油机进行故障诊断和状态监测,及时发现并排除故障,对增加柴油机工作状态下的安全性与可靠性,减少经济损失,避免事故发生具有重大的意义。传统的柴油机故障诊断与处理方法包括油法、振动噪声法等,但都是以定期保养和事后维修为主,这些方法缺乏事故预见能力、成本高、效率低[1]。随着计算机技术、信号分析处理技术、人工智能的迅猛发展,柴油机故障诊断技术的水平也在不断地提高。以非线性并行分布处理为主的神经网络为柴油机故障诊断技术的研究开辟了新的途径[2]。经过对柴油机的故障资料进行分析,柴油机的涡轮增压系统发生的故障较多,本文只研究柴油机涡轮增压系统故障的诊断,利用MATLAB神经网络工具箱,分别基于BP、RBF和Elman网络进行柴油机的故障诊断,并对三种网络方法诊断结果的可靠性和适用性进行比较和分析。
1 涡轮增压系统的故障分析
根据对柴油机工作过程的分析和实际运行经验,可以确定涡轮增压系统的出现的工作故障的原因和部位主要有:增压器效率下降、空冷器传热恶化、透平保护格栅阻塞、透平通流部分、空气滤清器阻塞、空冷器空气测流阻塞增大和废热锅炉流阻增大。其中后三项故障可以直接由部件特性参数诊断得出,系统的工作状况和前四项故障原因作为网络输出变量由建立的神经网络进行故障诊断,确定柴油机涡轮增压系统是否处于安全运行中。柴油机涡轮增压系统工作状况下可以得到的征兆变量包括排气总管温度、扫气箱压力、平均燃烧最大爆发压力、扫排气道压损系数、增压器转速、压气机出口温度、扫气箱温度、空冷器压损系数、滤网压损系数、废气锅炉压损系数和柴油机工作负荷参数,共11项可以作为网络的输入变量。
根据某型号柴油机技术规范要求,可以得到柴油机无故障时的数据,如下所示[3,4]。
气缸排气温度: 30K
扫气箱压力: 0.06MPa
最大爆发压力: 1MPa
滤网压损系数: 0.1
增压器转速: 1500r/min
空冷器压损系数: 0.1
废气锅炉压损系数: 0.1
扫排气道压损系数: 0.06
压气机出口温度: 30K
扫气箱温度: 40K
其中,由于滤网压损系数、空冷器压损系数和废气锅炉压损系数可以作为部件特性系数,直接进行诊断,所以,排气总管温度、扫气箱压力、最大爆发压力、增压器转速、扫排气道压损系数、压气机出口温度、扫气箱温度和柴油机负荷作为网络的输入变量。由神经网络诊断出的数据参数上下偏差超过以上数据时,则认为柴油机有故障。
2 神经网络模型
2.1 BP神经网络
BP学习算法的基本原理是梯度最快速下降法,通过梯度搜索使网络的实际输出值和期望输出值的误差均方值为最小。BP神经网络是误差反向传播算法的学习过程,如图1所示,输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求;传递到输出层各神经元的信息,完成学习的正向传播处理过程,由输出层向外界输出信息处理[5,6]。
图1 BP神经网络结构
2.2 RBF神经网络
RBF神经网络属于前向神经网络类型,如图2所示。第一层为输入层,由信号源结点组成;第二层是隐含层,隐含层中神经元的变换函数是非线性函数,传递函数为radbas;第三层为输出层,传递函数为线性函数purelin,对输入模式作出响应[7]。
RBF神经网络的基本原理是前馈式神经网络,它具有最佳逼近性能和全局最优特性,并且结构简单,训练速度快,在模式识别、非线性函数逼近等领域的神经网络模型方面应用广泛[8]。
2.3 Elman神经网络
Elman神经网络是一个具有局部记忆单元和反馈连接的局部前向回归网络,主要结构是前馈连接,包括输入层、隐含层、承接层和输出层,其中承接层从隐含层接收反馈信号,用来记忆隐含层神经元的输出值,经过延迟和存储,在输入到隐含层中,这样对历史数据具有敏感性,增强了网络的动态信息处理能力[9]。
图2 RBF网络结构
3 网络设计
3.1 样本数据选取与处理
确定正确的训练样本集是神经网络能够准确故障诊断的一个关键环节,柴油机涡轮增压系统的每一种故障都对应着一个样本,样本的目标值取0,0.5和1来表示诊断出故障的严重程度。确定训练样本,分别取满负荷运行、90%负荷运行、70%负荷运行和半负荷运行四种状况下的数据集,现抽取其中的9组数据作为训练样本,3组数据作为测试样本。由于原始数据幅值不同,甚至相差很大,直接在网络中使用学习速率会变得很慢,无法反应出小的测量值变化,所以要先将训练样本进行归一化处理,处理后的数据对于网络更容易训练和学习[10]。归一化函数如下所示:
Xi =(xi-A)/B
式中:Xi表示归一化后的测试数据,xi表示原始的测试数据,A表示相应的无故障情况下的基准值,B表示最大偏差值的绝对值。
3.2 建立网络并故障诊断
3.2.1 BP神经网络
根据试凑法,选取隐含层节点数为12,第一层传递函数使用tansig函数,第二层传递函数使用logsig函数,训练函数为trainlm函数,训练次数3000,训练目标0.01,学习速率为0.1。
net=newff(minmax(P),[12,5],{'tansig','logsig'},'trainlm');
net.trainParam.epochs=1000;
net.trainParam.goal=0.01;
LP.lr=0.1;
net=train(net,P,T);
如图3所示, 经过32次训练后,网络的性能达到了要求。
图3 BP网络训练结果
利用训练好的BP网络对测试样本进行测试,测试代码为yi=sim(net,pi) i=0,1,2测试结果为:y1=0.0000 0.9999 0.0000 0.0036 0.0000;y2=0.21050.0000 0.5245 0.0000 0.0059y3=0.0000 0.0014 0.0000 1.0000 0.0000测试结果表明,经过训练后,网络可以满足柴油机涡轮系统故障诊断的要求。
3.2.2 RBF神经网络
由于样本数目比较小,将径向基分布常数设定为1.2,由此,利用MATLAB创建一个RBF神经网络如下:spread=1.2;net=newrbe(P,T,spread);经过训练后,对策是样本进行测试,测试结果如下:y1 = 0.0000 1.0550 -0.189 -0.0758 0.0147;y2 =0.0000 -0.0018 0.5196 0.0055 -0.0087;y3 = 0.0000 0.0202 -0.0111 0.9804 0.0028测试结果表明,网络成功诊断出了所有故障。
3.2.3 Elman神经网络
创建单隐层的Elman神经网络,最影响函数性能的是隐含层节点数,通过考虑网络的速度与性能,将隐含层节点数定为15,创建网络如下所示:net=newelm(minmax(P),[15,5],{'tansig','logsig'})net.trainParam.epochs=500;net.trainParam.goal=0.01;net=train(net,P,T);
如图4所示,经过训练和对数据测试后,结果如下所示:y1 = 0.0232 0.8539 0.0050 0.2311 0.0021;y2 = 0.0112 0.0291 0.4829 0.0468 0.0447;y3 = 0.0129 0.2031 0.0146 0.7644 0.0204
图4 Elman神经网络训练结果
测试结果虽然误差较大,但可以测试样本的故障诊断结果。
4 结语
(1)采用神经网络建立故障诊断模型,能够客观的反映柴油机是否故障及严重情况,三种网络均能够满足故障诊断的要求;(2) BP网络具有很强的非线性映射能力,在柴油机故障诊断中应用很成功,但由于BP网络是前向的神经网络,所以收敛速度比较慢,而且有可能收敛到局部极小点;RBF神经网络收敛速度快,当函数的扩展速度spread越大,函数拟合就越平滑,如果数值过大,会使传递函数的作用扩大到全局,丧失了局部收敛的优势,所以在网络设计中需要尝试确定最优解;Elman网络的训练误差曲线比BP网络要平滑,收敛速度很快,能准确的识别所有故障类型,但相对于BP网络和RBF网络,Elman网络的识别误差更大,但并没有影响所建立模型的应用。(3) 由于样本量比较小,对于和训练数据相差很大的数据,所建立的网络可能无法正确诊断。在实际应用中要采用大容量的训练样本,并对样本数据进行分析和检查,如利用小波方法处理非正常的高峰值波动数值等[11]。
参考文献
[1]张蕾. 融合技术在柴油机故障诊断中的应用[J]. 小型内燃机与摩托车,2002,31(3):33-36.
[2]汪云,张幽彤.神经网络在电控柴油机实时的故障诊断[J].汽车工艺与材料,2001,(1):38-40.
[3]马旭凯,谷立臣,李世龙. 基于SOM神经网络的柴油机故障诊断[J]. 机械制造与研究,726-731.81-83.
[4]丁艳君,吴占松.锅炉烟气排放检测软件传感器[N]. 清华大学学报(自然科学版),2002,42(12):1636-1638.
[5]李玉峰,刘玫.基于动量BP网络的柴油机故障诊断[J].控制工程,2007.
[6]傅荟璇,赵红等.MATLAB神经网络应用设计 [M].北京:机械工业出版社,2010.
[7]朱大奇,史慧.人工神经网络原理及应用[M]. 北京:科学出版社,2006.