统计学的分类方法范文

时间:2023-08-04 09:20:13

引言:寻求写作上的突破?我们特意为您精选了4篇统计学的分类方法范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。

统计学的分类方法

篇1

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2009)33-9515-03

The Design of Medical Image Classification Based on Ensemble Leaning

LIN Xiao-jia

(Faculty of Logistic and Information Management, Fujian Ineternational Business and Economics College,Fujzhou 350006,China)

Abstract: The paper proposes a medical image classification based on ensemble leaning.The system we proposing consists of a pre-processing phase, a feature extraction phase and a building the classifier phase. On the basis research of single feature, one new method is proposed one kind of medicine image classification new method that synthesized the multi-characteristic merge and the data mining technology. This method is through the introduction of data mining in the concept of Ensemble Learning,utilizing the Ensemble learning method to classify to the single characteristic the weak sorter to carry on the iterative training.

Key words: ensemble learning;the characteristic extraction;adaboost M1;medical image classification

随着计算机医学成像技术的发展,医学影像越来越多样化,医学影像的应用也越来越广泛,与此同时大量的医学设备的应用使得医学影像的数量也越来越多,大量的影像资料使医院迷失在信息的海洋。利用数据挖掘技术可以有效的对医学图像进行组织和管理,合理有效的对其进行分类,从而使其更好的辅助日常的医学诊断和医学研究。

该文提出的方法是使用SVM分类器将整个特征空间分成诸多子空间;采用集成学习方法Adaboost方法对样本进行多次抽样,将Adaboost算法中的分类精度作为特征选择的依据,选取出少量有利于分类的特征,同时将单特征训练得到的弱分类器通过集成学习增强为强分类器。

1 系统的构成

整个系统的构成如图1所示。

该系统主要包括训练和分类两个阶段。在医学图像训练阶段,通过数据库建立训练集,对医学图像进行预处理,提取图像颜色和纹理特征,创建训练的弱分类器。对图像特征进行选择。分类阶段进行的是待分类图像的选择特征的提取,利用训练得到的强分类器进行分类,输出分类结果。

2 图像预处理

由于实际的医学图像数据因为操作的原因,存在不完整性、噪声和不一致性性,不能直接在原始数据上进行数据提取,因此必须对医学图像进行预处理。数据清洗和数据的变换[1-2]都是经常用于图像数据预处理技术上的。

图像预处理的第一步就是图像去噪。大部分的医学图像一般包含了大量有噪声的背景:有的医学图像太暗,有的医学图案太亮,还有来自影像设备中电子元器件的随即扰动。通过去噪处理后,可以去掉图像中的大多数的背景信息和噪声,增强图像的特征,提高图像的信噪比。针对医学图像来说,图像本身有边缘模糊的特性,通过去噪对医学图像进行复原,使之与原图像逼近是存在比较大的困难的。因此本系统主要采取的去噪方法为滤波技术,该技术可以在最大限度保持信号不受损失的基础上,尽可能过滤噪声,提高图像的可读性,将医学图像中感兴趣的特征(图像的轮廓和边缘等重要信息)有选择的突出。

图像预处理的第二步是图像归一化,基于图像特征分类主要是对图像特征进行匹配和区分的过程,但是通常情况下待检图像的图库中,图像的大小尺寸并不完全相同,用户所提供的分类例图大小也不完全一样的。在提取图像特征(特别是空间分布特征)时,就有可能存在本身同类的图像所计算出来的特征差别却很大,而不属于同一类的图像由于尺度不同却计算出了相似的特征,进而影响到分类的结果。为了防止这类情况的发生,本分类系统必须首先对图像的尺度进行归一化,即通过对图像的缩放使得图像具有同一尺度256×256,在同一尺度上提取图像特征,从而消除尺度影响,又能够保证图像的整体灰度不变性。通过对大尺度的图像进行尺度归一化之后,按比例进行了缩小,降低了图像特征提取时的计算量,提高了分类速度。

3 基于集成学习方法的特征选择和分类

3.1 集成学习方法

集成学习(Ensemble Learning)是一种新的用来组合的学习器的方法。其主要思想[3]是:通过某种组合方法把一些学习器组合起来,使得集成后的学习器能够表现出比单个学习器更好的性能。狭义的说,集成学习是指利用多个同质的学习器对同一个问题进行学习,这里的“同质”是指所使用的学习器属于同一种类型,例如所有的学习器都是决策树、都是神经网络等等。广义的来说,只要是使用多个学习器来解决问题,就是集成学习[4]。

集成学习从萌芽阶段发展到现在,很多研究者提出了不同的算法。其中研究最深入,最具影响力,应用最广泛的就要算Boosting算法了。在众多Boosting算法中,AdaBoost是Boosting家族中的基础算法,也是Boosting家族最具代表性的算法,之后出现的Boosting家族中的扩展算法都是在AdaBoost算法的基础上发展而来的,对AdaBoost的分析也适用于其它的Boosting方法。因此下面我们以AdaBoost M1算法为例,进行描述。

AdaBoost M1算法用于解决多类单标签问题。每个待分类样本只能属于多个类别中的单个类。AdaBoost M1的基本思想是:首先给定任意一个弱学习算法和训练集(x1,y1),(x2,y2),…,(xm,ym),yi在分类问题中是一个带类别标志的集合,yi∈Y={1,…,K}。初始化的时候,对每个训练例赋予的权重都相同为1/m。接着,调用弱学习算法对训练集进行T次的迭代训练,每次训练后,按照训练结果更新训练集上的分布,对于训练失败的训练示例赋予教大的权重,也就是在下一次迭代训练的时候,更加关注集中对这些失败的训练例进行训练。通过这样的T次迭代训练,得到一个预测函数序列h1,h2,…,ht,其中ht也有一个权重,预测效果好的预测函数的权重较大,预测效果差的预测函数的权重较小。经过T次迭带后的最终预测函数H采用有权重的投票方式产生。

3.2 特征选择和分类

本系统利用训练样本的分类属性,采用Adaboost M1算法同时,对算法进行改进,使算法同时具有进行特征分类性能的评价(特征选择)和SVM分类器的增强的功能:对样本进行多次抽样,将分类精度作为特征对分类性能的判定依据,进行有效特征选择,选取出少量对分类作用较大的特征,同时将单特征训练得到的弱分类器增强为强分类器,使分类器具有较好的分类精度和泛化能力。具体算法思想如下:

1) 在Adaboost M1算法每次迭带训练时候,赋予每个训练例的分配权重 Dt(i)(t表示迭代次数,i表示训练例标号),同时也表明它被分类器选入新训练子集的概率。如果某个样本已经被准确的分类,那么在构造下一个训练集中,它所占的比重概率就会被降低;反之,如果某个样本没有被正确分类,那么它所占的比重就会得到提高。通过这样的方式,Adaboost M1算法就能更加重视那些较困难、更富信息的样本上。

2) 针对Adaboost M1这个特点,我们在选入的训练集上,选择SVM作为弱学习机,针对每个特征维向量进行训练,产生弱分类器,并且计算分类精度,用来衡量该弱分类器对分类的作用程度,精度大的弱分类器表明该特征维向量的分类性能较好,有利于作为有效的分类特征,被选入作为分类特征,经过多次迭代可以得到大部分对分类作用较高的特征,最终增强得到一个强分类器。

改进的Adaboost M1进行特征选择以及SVM分类器增强的算法步骤如下:

输入:训练集 (x1,y1),(x2,y2), …,(xm,ym) ,其中标签yi ∈Y={1, …,k}

特征维向量集{S}

弱学习算法SVM

迭带训练的次数T

初始化:对于i=1,2,…,D1(i)=1/m, Do For t=1,2,…,T //其中T为迭代训练的次数,m为训练样本数。

步骤1 弱分类器学习

根据选择权重Dt(i)进行采样,获得第t次迭代样本集,选取特征子集,学习重采样后的样本集得到弱分类器集合Hrt ,其中Srt是特征子集集合,表示第t次迭代的每个特征维度;Srt是弱分类器集合,是根据Hrt单特征训练出的弱分类规则,r表示特征维度标签号,t表示迭代次数。

步骤2 计算分类精度,选择特征

计算弱分类器在样本集上的误差 在此作为特征子集Srt 有效性的判据,误差越小则此特征子集作用越大,选取误差最小(εt=min{εrt})的对应的分类器为Ht与有效特征向量Srt计算本次迭代得到的分类器贡献权值βt=εt/(1-εt)。

步骤3 更新权重

其中,βt为每次迭代的分类器贡献权值,值由βt=εt/(1-εt)来确定;Dt(i)为每个训练例的分配权重,Zt为标准化常量。

输出:有效特征子集Sr

增强分类器

通过改进的Adaboost M1算法可以得到所选择的特征子集Sr以及增强的分类器Hx。

分类时,只要将待分类医学图像根据有效特征子集Sr进行特征提取,输入增强的分类器集 Hx中,就可得到分类的结果。

4 实验结果及结论

本实验所采用的是医学图像中的CT、MRI和DDR图像,根据医学图像的功能和用途,我们将这些医学图像分为头部(包括中枢神经和头颈五官)、胸部(包括呼吸系统、循环系统)、腹部(包括消化系统)、骨盆(包括泌尿系统)和其他等五大类标签,每类标签60幅(由于CT应用比较广泛,所以选用CT图像40幅,MRI和DDR各20幅),共计300幅图像构成图像库。在测试集和训练集的选择上,采用10折交叉验证的方法。通过训练集最终选取了36维特征向量中的分类性能较高的12维(详细如表1所示)。

分类性能采用敏感度(sensitivity)、特异度(specificity)以及分类精度(precision)三个指标率来衡量:敏感度也称真正识别率,即正确识别该类元组的百分比;特异度是真负率,即正确拒绝不属于该类元组的百分比;而精度就来标记实际属于该类的元组在已分配到该类的元组总数的百分比,表2是本实验的分类结果。

从表2中可以看出,本实验医学图像分类器算法的敏感度、特异性和分类精度都较高,分类识别率和精度平均在83%左右。

分类系统的速度主要取决于特征的提取以及进行分类的运算量。如果将所有特征都运用于分类的话,由于有些特征向量维度对分类贡献不高,对分类效率没有明显的提高,并且也大大增加了特征提取阶段的时间负担。在本系统中仅仅选择了不到1/3的特征,去除了部分对分类效率贡献不高的特征,因此在特征提取阶段速度大大提高了,而且在分类阶段也因为只在有效特征中进行提取分类,速度也有较大提高,表3列出了在 Inter Core Duo processor T2450 2.0GHz、1G DDR内存、VC++6.0环境下本分类系统与其他分类平均分类精度的比较。

本方法比最常见的综合特征分类法在特征提取分类阶段速度上有所提高,但是比起单个特征提取,速度还是比较慢的。但是从表3正确率相比,准确率还是蛮高的,相对的牺牲时间还是值得的。

参考文献:

[1] Maria-Luiza Antonie,Osmar R.Z aiane and Alexandru Coman,Application of Data Mining Techniques for Medical Image[C],Proceedings of the second international workshop on Multimedia Data Mining(MDM/KDD’2001),in conjunction with ACM SIGKDD conference.

[2] Osmar R.Z aiane,Maria-Luiza Antonie and Alexandru Coman,Mammography Classification by Association Rule-based Clasifier[C], MDM/KDD2002:International Workshop on Multimedia Data Mining(with ACM SIGKDD 2002).

[3] Zhou Z-H,Wu J-X,Tang W,Chen bining regression estimators:GA-based selective neural network ensemble.International Joural of Computational Intelligence and Applications,2001,1(4):341-356.

[4] Zhou Z-H,Wu J-X,Tang W.Ensembling neural networks:many could be better than all.Artificial Intelligence,2002,137(1-2):239-263

篇2

一、国内外统计学科分类的现状

 

一些作者认为,统计学在学科分类中将由原来的二级学科升为一级学科;①我国存在着两门统计学,国际上存在着一门统计学。②其实这些说法并不确切,对学科分类的理解也不够全面。

 

所谓学科分类,指在一定条件下运用某些原则划分各门学科的对象和领域,确定各门学:科在整个科学知识体系中的位置,阐明各学科之间的相互关系。③国内外都很重视学科分类何题研究,结合各国情况提出适合需要的分类模式,制定各种分类表。从各国情况看,有以下四种不同用途的学科分类。一是以科研统计和科研管理为目的的学科分类。例如:《联合国教.科文科学技术统计工作手册》、《中国科学院科研项目与档案分类》等。二是以教育管理学科和专业划分为目的的分类。例如:《日本大学学科分类目录》,中国《普通高等学校专业目录》等。三是以文献图书分类为目的分类。如:《美国国会图书馆分类法》、《中国人民大学图书馆图书分类法》等。四是以各种百科全书辞目分类所反映的学科分类情况。④如:《国际社会科学百科全书》分类目录、《大不列颠百科全书》辞目等。

 

很显然,根据现在科学在理论和应用两个方面的进展,根据不同的目的,学科分类是多种多样的。下面我们来看国内外把统计学作为一级学科的分类情况。

 

国内外统计学分类的门类属于社会科学。国内反映学科分类的文献较多,其中参考价值较大的有以下8种⑤:《国家科学技术委员会统计学学科分类与代码》(I989年)、《中国科学院封算机管理用代码手册》(1985年)、国务院学泣委员会办公室和国家教委研究生司《授予博士、硕士学位和培养研究生的学科、专业目录》(1988年)、国家教委高教一司《普通高等学校社会科学本科专业目录与专业简介》(1987年)®、国家教委科技司《国家教委学科分类目录代码〉》〇987年)、中国图书馆图书分类法编辑委员会《中国图书馆图书分类法(第三版)》(1"0年)、《中国人民大学图书馆图书分类法(五版)》(1989年)、《中国大百科全书(全套)》〇982—1991年)。据对这8种文献中社会科学一级学科频率的统计,可以发现:(1)国内8种学科分类文献列出的45门一级学科,其中频率4次以上的有经济学等9门;出现次数多说明公认程度和成熟度较高。(2)统计学作为一级学科出现的频率为2次,说明统计学作为一级学科早在1992年以前就已存在,只是公认程度还不算很高。

 

对国内这8种学科分类文献进一步研究还可以看出,所谓“两门统计学”之一的数理统计学,从来没有作为一级学科存在过,它只是一级学科数学下面的一个二级学科。

 

因此,应该澄清统计学科体系研究中的一些含混说法。第一,统计学“上升为一级学科”的提法不准确,只是说应该在更多学科分类中争取它的一级学科地位,特别是在国家有关部门的官方文献中。第二,两门统计学的提法很不确切。如果两门指的是二级学科(数理统计学,社会经济统计学),那一级学科应该就是统计学。如果一门指的是一级学科社会经济统计学或一级学科经济学下的二级学科,一门指的是一级学科数理统计学或一级学科数学下的二级学科,前者显然不仅不符合学科分类原则,也违背逻辑,不可能数学同时存在两个一级学科。后者也违背提出两门统计学的初衷,既然是二级学科,就独立不起来。

 

国外统计学作为一级学科存在,在门类(大类)里归属于人文、社会科学。数理统计学无论在那种分类文献中都不是一级学科。据对联合国教科文组织于70年代初期出版的3卷本专著《社会科学和人文科学研究中的主要趋势》、《国际高等教育百科全书》、《大不列颠百科全书》、《日本大学学科分类目录》、《美国国会图书馆分类法》等15种参考价值较大的学科分类文献统计,统计学作为一级学科出现的频率为6次,说明国外统计学作为一级学科存在,已经是比较成熟和公认的了。

 

二、建立适合中国国情的统计学学科体系

 

统计学在形成和发展中,经历了一个漫长、曲折的过程。如果说以前对统计学的地位、对象争议还比较多的话(这种争论自然还会持续下去),随着国家标准关于统计学学科分类与代码在我国的与实施,统计学科分类应用研究就显得十分重要。'

 

(一)继续加强统计学学科体系理论研究

 

长期以来,我国统计学学科分类及其应用研究十分沉闷,思维狭窄,阻碍了统计学的发展。(I)1979年以前,把统计学学科体系研究同政治形势挂钩,忽视了统计自身发展的规律。(2)强调数理统计学和经济统计学是两门统计学,两门之间相互隔绝、相互排斥。(3)将数理统计归属于自然科学的数学,经济统计归属于社会科学的经济学,认为二者之间鸿沟不可逾越,看不到社会科学与自然科学的结合、渗透、交叉。统计学学科体系研究,首先要有新的视野,新的思维。把握现代科学发展特征。人类文明发展到今天,现代科学同时在微观和宏观两个方向获得重大威果,在理论和应用方面取得卓越进展,在高度分化的同时又在高度综_合相互统一协调,由单线联系走向多维的联系。现代科学结构是一个全新的多层次的综合性的庞大网络体系,我们要把握现代科学发展的这些特点,构筑统计学的新体系。

 

1.统计学一级学科的设置。统计学是一门搜集、整理、分析数据并进行统计推断和预测的方法论科学。方法论包括两个层次的含义:其一是方法论研究,包括调查方法、整理方'法、分析方法、推断方法和预测方法。其二是运用统计方法帮助人们认识、解决自然现象、社会现象、经济现象以及医学、工程、环境等领域的具体实际问题。从统计方法的应用说,统计是人们认识世M认识社会的一种手段和工具,指导人们认识、探索、分析事物的规律,所以,统计学的研究对象包括自然现象、社会现象,经济现象,它的研究内容十分广泛,无所不包,包括人们科学实验,社会生产和生活中认识的领域或待开发的领域,只要有人类活动,就有统计方法的应用。

 

一门科学是一个历史的私动的[本系。统计学的理论体系,除继续巩固、发展比较成熟时数理统计、经济统计、人口统计外,还应该广为吸收、融合现代其他科学营养,开拓新的生存、发展空间。比如,吸收数学、信息科学与系统科学、计算机科学技术、哲学、法学、经济学等科学理论和方法,_进行移植、综合、交叉,形成新的研究方法和研究领域,加深统计学理论基础,扩大统计认识范围。统计学传统理论中,数据搜集、推断方法比较完善和精涞(可以归结为提供统计数据功能),统计学在发展中,完全有可能也有必要向统计规律、统计控制,统计信息技术方面发展;这些领域将会涉及许多理论和方法问题。统计学成为一级学科,将更有利于统计理论的深化和应用的发展,促进统计学的成熟程度。

 

2.统计学二级学学科设置。二级学科的设置应考虑:(1)划分标志选择统计一般方法和研究领域两个标志。(2)根据学科特点考虑到在有限的三级学科分类体系中能反映该学科的全貌。(3)留有余地,以便扩延。在分类体系相对稳定的情况下,为萌芽中的新兴学科留有余地,以得到必要的补充和延续。二级学科设置10个:①理论统计学,②数理统计学,③经济统计学,④社会统计学,⑤自然科技术统计学,⑥环境生态统计学,⑦统计法学,⑧国际统计学,⑨统计学史,⑩统计学其他学科。

 

一部分统计二级学科具有交叉性和双重属性(例如经济统计,是统计与经济交叉的突出例子之一。一个时期以来有人对经济统计颇有微词,认为它不是科学,这是不公正的。有人认为经济统计能否从经济学中分离出来才是统计学成熟的标志。恰恰相反,从科学发展趋势看,二者的交叉,结合,既是经济学发展的需要也是统计学发展的必然)。建议在两处列类,两处编码。例如数理统计,既作为统计学的二级学科,又作为数学的二级学科;经济统计,既作为统计学的二级学科,又作为经济学的二级学科。

 

3.统计学三级学科的设置。统计学三级学科的设置以研究内容和应用为主要划分标志。考虑到学科发展的不平衡和分类习惯,有的二级学科下可暂不列出三级学科。本文提出部分统计学二级学科的三级学科如下:(1)理论统计学,包括:统计调查理论,统计分组理论,统计分析理论,统计指标理论,统计指数理论,统计信息理论,统计控制理论,统计预测理论,计算统计学,统计逻辑学,统计系统与管理等。(2)数理统计学,包括:抽样方法,假设检验,非参数统计,相关回归分析,统计推断,贝叶斯统计,多元分析,时间序列分析等。U)经济统计学,包括:国民经济统计,企业统计,运输统计,流通统计,财政统计,金融统计,价格统计等。(4)社会统计学,包括.人口统计,教育统计,卫生统计,生活统计等。(5)自然科技统计学,包括:科技管理统计,生物统计,遗传统计,心理统计,气象统计,农业统计等。

 

(二)强化统计学一级学科地位

 

如前所述,我国现有学科分类文献中把统计学列为一级学科的还不多。尽管国家了学科分类标准,我们仍不能仅仅满足于此,而是要让更多的学科分类文献贯彻体现国家分类标准,反映统计学成熟程度,体现现代科学发展趋势,将统计学列为一级学科。

 

当前要做的,一是要面向社会大力宣传国家学科分类标准。统计学科建设,不仅仅是统计理论工作者的事,它关系到统计的前途和发展,也关系到我国现代科学的发展。二是继续加深对按一级学科建设统计学的重要性的认识。统计学成为一级学科,是统计学自身内在发展的需要,是统计学研究对象共同特征和研究方法的通用性所决定的,完全具有必要和可能。不存在硬争统计学一级学科地位问题。三是经济统计、应用统计、理论统计工作者加强联系,携手共进,研究统计学的发展特点,内在规律,建立大统计,大统计学科。四是有步骤地向有关部门、权威机构宣传、反映、介绍统计学的发展和现状,以便将来修改、制订学科分类表时将统计学列为一级学科。五是国家统计局要广泛调查研究,制定贯彻实施国家学科分类标准的具体措施,使统计学一级学科地位真正确立起来。

 

(三)在高等学校系科专业设置中体现统计学一级学科地位

 

国内目前学科分类文献中,国务院学位委员会、国家教委联合颁布的《技卞傅工、硕士-学位和培养研究生的学科、专业目录》和国家教委的《普通高等学校本科专业目录》是两个很重要的具有实际意义的分类文献。分类的基本原则是专业设置一般以学科为主。按照这种划分就出现了令人困惑的结果:统计学一方面是经济学(一级学科)的二级学科,一方面又是数学(一级学科)的二级学科。于是在大学里就出现了一个在经济学下的统计学,一个在数学下的统计学。在研究生专业目录中还有卫生统计、生物统计、农业统计、工程统计等专业。这种状况,很不利于统计学的发展,也不利于统计学的国际交流和比较。

 

鉴于高校系科专业设置影响十分巨大,建议国务院学位委员会、国家教委尽快对这两个文献加以修订,将统计学列为与哲学、经济学、数学等并列的一级学科。

 

篇3

在当今高科技高信息时代社会里人们生存面临着很大的挑战,生存问题刻不容缓,因此、我们学知识储备知识就是为了将它用到社会上,也是为了在这社会上生存。通过知识的积累,说大了就是为社会和公民造福做贡献说小了就是为了谋生之道。我们知道知识是渊博的,人一生活到老学到老就是说这个道理。通过各种各样的科学学科储备知识,而这些学科之间紧密相连的。例如:统计学和新闻专业也有本质的联系,也许有的同学可能问我们为什么要学统计学?统计学和新闻学的最大特点就是实践性很强的学科。作为一名新闻工作者搜集信息是他的职责范围,那么他用什么方法搜集数据信息呢?这当然用统计的方法搜集。统计学对于写论文具有很重要作用,比如:动态数列分析方法在各经济类学科中的运用很频繁。

资料来源:《内蒙古统计年鉴》2011[2]

表1的数据表明,随着人均收人的增加,奶制品的消费也在逐渐增加,所以,收入水平是影响和决定乳品消费需求的重要因素。

二、统计学是实践性很强而且应用性很广的学科

(一)统计学是应用性很强的学科

国家各大要害部门,像国家统计局、省、自治区、市、人民政府统计局及地区、乡、镇各部门都设有统计部门,还有非统计行业各企事业单位都设有专门统计部门和所需的专门统计专业人员。例如:医院需要统计人员,对病人、职工人数的统计,还有各种病情性质不同方面分为神经科、外科、内科、耳科、眼科、少儿科妇科等等都是用统计方法进行分类的。法院也需要统计人员,如对死刑犯的统计,各类死刑案件的统计。学校里对各院(系)的分类,每院系里各专业分类,学生人数和学生宿舍的统计等等都用了统计方法。还有人口普查是利用统计学的各种统计方法进行统计的:

还有古代也很早就用了统计方法,如:十三世纪成吉思汗统治世界时,他把军队分为十户、百户、千户、万户等,十户有十户长、百户有百户长、千户有千户长、万户有万户长这样有利于作战,有利于管理军队。

1.统计学是一门不可忽视的学科

同学们将来就业的时候,都想以后找个好工作,有个好前途,发挥所学的知识在社会上有用。大家想过吗?就是拿统计学这门课来说,学好统计学我们就有机会到各个统计部门上班。统计学对于写论文具有很重要作用,比如:动态数列分析方法在各经济类学科中的运用很频繁。

2.统计学与我们工作生活紧密相连

对于学校来说,学校是很多院系组成的,系里有很多老师和员工组成的而这些老师当中的班主任是有很多学生,学生公寓来说,公寓有长,而公寓长管理着各个楼,楼里分为宿舍,这些都是用统计方法统计的。

(二)统计学是实践性很强的学科

统计学家不像数学家、物理学家和化学家一样在家里就可能推断谋中公式。统计学家(人员)必须进行实地调查。因为、统计学中所涉及的各种统计数据、资料都是来源于仔细的调查和整理。

篇4

统计学历经300多年的发展,事实上已成为横跨社会科学和自然科学领域,并与数学紧密结合的多科性的科学。为了便于讨论,我们首先给出一个目前国内统计学界大多数人能够接受的关于统计学的定义:“统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学”®这一定义实际上是按所谓“大统计学”的观点给出的。从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学参见图1

由此可见,统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般收集数据分析数据方法的理论统计学另一类是以各个不同领域的具体数量为研究对象的应用统计学前一类统计学具有通用方法论的理学性质,其特点是计量不计质。后一类统计学则与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论,因而具有复合性学科和边缘学科的性质所谓应用既包括一般统计方法的应用,更包括各自领域实质性科学理论的应用。传统的“数理统计学派”只承认前一类统计学,否认后一类统计学的存在,是不妥当的传统的“社会统计学派”否认理论统计学具有通用方法论的性质,将统计学全部划归社会科学也是不合适的。

经济统计学是以经济数量为对象的方法论科学。要在经济领域应用统计方法,必须解决如何科学地测定经济现象即如何科学地设置指标的问题,这就离不开对有关经济现象的质的研究要对经济问题进行统计分析,也必须以有关经济理论为指导。因此,经济统计学的特点是在质与量的紧密联系中,研究事物的数量特征和数量表现不仅如此,由于社会经济现象所具有的复杂性和特殊性,经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如估算的方法、核算的方法'综合评价的方法等等。所以'从总体上看,我们认为经济统计学属于社会科学它既是统计学的一个分支,又是经济学下的二级学科经济统计学与其他统计学的区别在于:研究的具体对象不同,其所结合的实质性学科也有较大差别经济统计学与其他经济学的二级学科的区别在于:它并不直接研究经济规律,而是为其他经济学科提供专门的方法和工具。

应当指出,将经济统计学作为经济学下的二级学科,并不会影响该学科所具有的方法论性质举个例子来说,经济计量学中应用了大量数学和统计学方法,它也是方法论性质相当强的学科。经济计量学属于经济学,对此,人们并无异议那么为什么一定要把经济统计学从经济学中分离开来呢?事实上,经济学的进步离不开经济统计学,已经有多位学者由于其在国民经济核算投入产出核算、经济计量分析和将统计方法应用于投资分析等方面的贡献而获得诺贝尔经济学奖经济统计学的发展,也不仅有赖于通用的统计方法的发明和完善,而且更有赖于经济学提供研究的背景和新的研究课题全融合,形成统一的学科?—对经济统计学发展方向的认识。

如前所述,现实中存在着两类不同性质的统计学目前国内统计学界有一种比较流行的说法,认为:两类统计学最终将完全融合,形成统一的学科因此,将统计学划为理学“是与国际接轨的”,“可使统计学真正成为以概率论和数理统计为基础、多领域应用、多学科交叉的横向学科”。对于这种观点笔者不敢苟同。

首先,这一观点只是与国际上的“数理统计学派”接轨,而不是真正的与国际接轨从国际统计学会新修订的章程看,国际统计学会的宗旨是:“在广泛意义上发展和完善统计方法,并在全世界推广应甩”所谓“广泛意义上”的统计方法不仅包括以概率论为基础的数理统计方法,而且包括与概率论并无多大联系的其他统计方法。尽管过去较长一段时期内国际统计学界,数理统计学派占据主流地位但是,社会统计学派仍然存在和发展,并且在一些国家有较大的影响。例如,1997年笔者曾赴日本进行访问和学习据了解,当时,日本文部省资助的有关社会经济统计研究的重点课题有两项:一项是“微观统计信息的开发与应用”,另一项是“亚洲长期经济统计”。其资助金额分别为5亿日元和4亿5千万日元(按当时的汇率,大约相当于人民币4000万元到3500万元)在这两项研究中,数理统计方法的应用只占一小部分,所应用的方法大量是非概率的统计方法顺便提一下,同一时期的日本文部省资助的数理统计方面的课题只有两项,资助强度每项只有300万日元事实上,从80年代以来,国际统计学界已出现了一些新的动向不少原来从事数理统计理论方法研究的学者开始越来越关心实际的应用问题正如一份参加国际学术会议的总结报告所指出的那样,国际上应用统计学的发展趋势是“统计学与数学的关系越来越远,与计算机科学的关系越来越近,与经济学及其他实质性学科的结合越来越密切。一些国际知名的数理统计出身的统计学家甚至提出“统计学与数学离得越远越好”的观点。台湾辅仁大学统计系系主任谢邦昌教授提出:“一个重要的问题是应该淡化统计的理学院色彩,现在统计这个领域愈来愈偏向管理学院和商学院目的就是希望统计在这些领域中和其他学科互相结合。

    国际统计学会下的专业分会,70年代以前只有“国际自然科学统计协会”,后改为“贝努里数理统计和概率学会”。进入70年代,“国际调查统计协会”、“国际统计计算协会”雛成立1985年/‘国际官方统计协会”成立1990年,笔者作为中方的正式代表参加了官方统计协会在北京举行第二届会议,这届会议所提交的相当一部分论文,如关于通货膨胀率的测算总供需的平衡测算等与概率统计都没有紧密的联系,而是官方统计中迫切需要解决的重大问题1987年,原中国统计学会会长、经济学家和社会经济统计学家李成瑞还被选为国际统计学会的副主席(任期1987-1989)从国外一些主要学科分类目录看,如联合国教科文组织制定的国际文献联合会分类体系、美国科研基金会科学和工程研究资助大纲、日本大学学科分类目录、日本文部省学术国际局研究课题分类等,都将社会经济领域的应用统计列为社会科学,而不是理子所有这些都说明,“只有数理统计才是统计”已经不再是国际学术界的主流观点因此,不能认为将统计学划归理学就是“与国际接轨”。

其次,两类统计学都是统计科学大家族的成员,可以相互借鉴、相互促进、相互渗透、共同发展,但两类统计学特别是其中的社会经济统计学与数理统计学的研究对象不同,理论基础不同,知识体系也有相当大的差异,不能互相取代,不可能也没有必要归并成统一的学科。

过去,我国照搬前苏联的理论,认为只有社会经济统计学才是唯一的统计学,而将数理统计学排斥在外,严重妨碍了整个统计科学的发展,经济统计学自身也停留在“初等的统计学方法加简单的指标解释”的水平改革开放以来,不少同志感到:为了推进经济统计学的发展和进步,使之适应社会主义市场经济发展的需要,有必要大力引进和吸收数理统计学的成果所谓“大统计学”的提法,就是在这样一种背景下产生的并且得到了相当部分统计学家的赞成①”笔者认为,“大统计学”的提法,对于促进理论统计学与各种应用统计学的相互借鉴、相互渗遂共同繁荣、共同发展是有益的。但是,如果认为“大统计学”就是要将各类不同性质的统计学完全结合起来,建立一门统一的学科,则很可能从一个极端走到另一个极端。因为,作为统一的学科必然要强调其共性,由于各种统计学横跨社会科学和自然科学领域,与其密切结合的各种实质性学科性质差异很大,其共性只能是它们所利用的具有通用性质的统计方法和作为这些统计方法理论基础的概率论。因此,从某种意义上讲,将所有的统计学都划为理学,是上述“建立统一的统计学科”符合逻辑的结果。而如果统计学是理学,则社会经济统计学的大部分内容如国民经济核算等将很难被包括在“理学”的统计学内。事实上,已经有一些学者提出:国民经济核算等不是统计学而是经济学如果这一观点可以成立,则连国家统计局都要改名。因为官方统计工作的大部分内容,与“理学的”统计学并无太大的关系。在这样一种误导下,进行统计学的学科建设,其结果很可能是名义上的“大统计”,实质上的小统计,即最终异化成“只有数理统计才是统计”。

笔者认为,我国统计学科建设的正确方向是:理论统计学与各类应用统计学继续并存,相互促进、共同发展一方面,理论统计学要结合应用统计研究中提出的需要解决的通用方法论问题,丰富和完善其方法论内容另一方面,应用统计学不仅要吸收和利用理论统计学研究的成果,而且还要与本领域的实质性科学更加紧密结合,着重研究适合本领域的特有的统计方法各类统计学都按其自身的规律发展,最终形成较为松散的“统计学”学科群体,而不是强求一致的统一的一级学科。

就经济统计学而言,今后一段时期需要重点研究的课题有:国民经济核算体系的进步充实和完善;有关地下经济的测算的研究;关于如何准确把握我国失业状况的研究;适合我国国情的统计调查方法体系的研究;可持续发展的统计测定;知识经济的统计测定;统计如何为企业经营决策服务;统计在投资和决策中的应用研究;统计在保险精算中的应用等等。进行这些课题的研究,需要应用通用的统计方法,但更重要的是要密切结合有关经济理论,建立和完善以有关经济现象为对象的特定的统计方法上述课题的相当一部分,都不是“以概率论和数理统计为基础的”、“理学的”统计学所能涵盖、所能指导的。

总之,搞经济统计的同志不要妄自菲薄,不要“东施笑颦”,更不要“邯郸学步”,而应该理直气壮地坚守自己的阵地,要密切结合社会主义市场经济发展需要,将研究适合经济领域特有的统计方法作为自己研究的重点努力促进经济统计学的现代化,并为整个统计科学的发展和进步作出自己应有的贡献。

三、“大统计”还是“大经济”?—对经济统计学专业办学模式的认识

随着我国社会主义市场经济的逐步发展,我国高校原有的专业设置面过窄、专业划分过细、所培养的人才适应面不广等弊端曰益显现。针对这些弊端,不少专家提出了要淡化专业,培养“宽口径”人才。这种提法无疑是正确的。对于统计学专业来说,问题在于要培养什么样的宽口径人才。

对于统计专业的办学方向有两种模式:一是强调各类统计学所具有的共性由于统计学是横跨不同领域具有交叉学科性质的方法论体系任何人毕其一身精力也难以成为精通统计学各领域的人才。因此,这种模式实际上将主要培养学生掌握通用的统计方法和理论它肯定统计学的“理学性质”,按照理学类学科的特点设置课程,概率论和数理统计方法等通用的统计方法论在课程中占有较大份量其培养目标是有良好的数学基础熟练掌握统计学基本理论与各种方法,同时有一定的专门领域的知识,能够适应各个不同领域的统计工作和统计研究的统计人才。二是强调各类统计学的个性,对于经济统计学来说,就是强调其与经济学其他学科的密切联系,按照经济类学科的特点设置课程,除统计学本身的专业课外,经济学类的课程占相当大的份量其培养目标是所谓的“复合型人才”,即具有坚实的经济理论基础、既懂数理统计方法>又懂经济统计方法,并能熟练掌握现代计算手段的经济统计人才。这种人才既是统计人才又是经济管理人才,不仅能胜任基层企业和政府部门的日常统计业务,而且能从事市场调查经济预测、信息分析和其他经济管理工作。前一种办学模式可称为“大统计”模式,后一种办学模式可称为“大经济”模式。从国际上看,总的来说,美国的统计教育比较接近于“大统计”模式,而日本的统计教育比较接近于“大经济”模式。

友情链接