统计学分析数据范文

时间:2023-08-10 09:21:59

引言:寻求写作上的突破?我们特意为您精选了12篇统计学分析数据范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。

统计学分析数据

篇1

关键词:

大数据;统计学;研究方法

中图分类号:

F27

文献标识码:A

文章编号:16723198(2015)11005201

随着信息技术的日益发展与普及,信息以及数据在社会经济发展过程中发挥的作用越来越重要。现如今,“大数据”时代已经来临,于是如何更有效地利用数据快速做出科学决策也已成为众多企业甚至是国家所共同关注的焦点问题。在数据处理和分析方法方面,《统计学》以及在其基础上发展而来的实证统计方法是当前的主流,这些方法可以帮助数据持有者从大量的数据中挖掘有价值的信息,并为其相关决策提供理论支撑和方法支持。然而,传统的实证统计方法在最新出现的大数据情境下,却呈现出了诸多缺陷,例如传统数据收集方法无法实现大规模(甚至是总体)数据的收集,传统统计方法和分析软件无法处理大规模数据,等等。于是,在将传统统计学方法应用于最新的大数据情境和问题之前,需要首先明确大数据所要求的处理方法与传统的统计学处理方法存在哪些关联和区别,然后才能够决定是否可以应用既有统计学理论和方法来处理某些大数据问题。

1大数据的界定

根据一位美国学者的研究,大数据可以被定义为:it means data that’s too big, too fast, or too hard for existing tools to process。也就是说,该学者认为:在关于大数据的所有定义中,他倾向于将之定义为那类“太大”、“太快”,或现存工具“太难”处理的数据。一般而言,大数据的特征可以概括为四个V:一是量大(Volume);二是流动性大(Velocity),典型的如微博;三是种类多(Variety),多样性,有结构化数据,也有半结构化和非结构化数据;四是价值大(Value),这些大规模数据可以为持有企业或者组织创造出巨大的商业或社会价值。

Victor在其最新著作《大数据时代――生活、工作与思维的大变革》中指出,大数据时代,思维方式要发生3个变革:第一,要分析与事物相关的所有数据,而不是依靠分析少量数据样本;要总体,不要样本。第二,要乐于接受数据的纷繁复杂,而不再追求精确性。第三,不再探求难以捉摸的因果关系,应该更加注重相关关系。这些变革反映出了大数据处理方式与传统统计学分析方法的很多关联以及主要不同。因此,下面我们分别针对两者的联系和区别进行讨论。

2大数据与统计学分析方法的联系

从18世纪中叶至今,统计学已经经历了两百多年的发展历程,不论是基础理论还是社会应用都极其坚实而丰富。大数据作为一种新兴的事物规律认知和挖掘思维,也将会对人类的价值体系、知识体系和生活方式产生重要影响,甚至引发重大改变。作为两种认知世界和事物规律的基本方法,它们在以下两个方面存在紧密关联。

(1)挖掘事物规律的基本思想一致。统计学(statistics)探索事物规律的基本方法是:通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析和总结,做出推断和预测,为相关决策提供依据和参考。对于大数据,维克托指出,大数据思维的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识。通过这两个定义可以看出,不论是传统的统计学方法还是新兴的大数据分析方法,都是以数据为基础来揭示事物特征以及发展趋势的。

(2)均采用量化分析方式。大数据分析的基础是数据化,也就是一种把各种各样现象转变为可制表分析的量化形式的过程。不论是传统统计学中所应用的数据(定性和定量数据),还是大数据时代即将被转化和采用其他形式数据(如文字、图像等),最终都是通过量化分析方法来揭示数据中所蕴含的事物特征与发展趋势。

3大数据与统计学分析方法的区别

(1)基础数据不同。在大数据时代,我们可以获得和分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机抽样。这意味着,与传统统计学数据相比,大数据不仅规模大,变化速度快,而且数据来源、类型、收集方法都有根本性变化。

①在数据来源方面,在大数据背景下,我们需要的纷繁多样的数据可以分布于全球多个服务器上,因此我们可以获得体量巨大的数据,甚至是关于总体的所有数据。而统计学中的数据多是经由抽样调查而获得的局部数据,因此我们能够掌握的事“小数据量”。这种情况下,因为需要分析的数据很少,所以必须尽可能精确的量化我们的数据。综上,大数据情况下,分析人员可以拥有大量数据,因而不需要对一个现象刨根问底,只需要掌握事物大体的发展方向即可;然而传统的小数据情况下则需要十分注意所获得数据的精确度。

②在数据类型与收集方面,在既往模式下,数据的收集是耗时且耗力的,大数据时代所提出的“数据化”方式,将使得对所需数据的收集变得更加容易和高效。除了传统的数字化数据,就连图像、方位、文本的字、词、句、段落等等,世间万物都可以成为大数据范畴下的数据。届时,一切自然或者社会现象的事件都可以被转化为数据,我们会意识到本质上整个世界都是由信息构成的。

(2)分析范式不同。在小数据时代,我们往往是假想世界是如何运行的,然后通过收集和分析数据来验证这种假想。也就是说,传统统计实证分析的基本范式为:(基于文献)提出理论假设-收集相关数据并进行统计分析-验证理论假设的真伪。然而,在不久的将来,我们将会在大数据背景下探索世界,不再受限制于传统的思维模式和特定领域里隐含的固有偏见,我们对事物的研究始于数据,并可以发现以前不曾发现的联系。换言之,大数据背景下,探索事物规律的范式可以概括为:数据观察与收集――数据分析――描述事物特征/关系。

(3)数据分析方法不同。传统统计学主要是基于样本的“推断分析”,而大数据情境下则是基于总体数据的“实际分析”,即直接得出总体特征,并可以分析出这些特征出现的概率。

(4)分析视角不同。传统的实证统计意在弄清事物之间的内在联系和作用机制,但大数据思维模式认为因果关系是没有办法验证的,因此需要关注的是事物之间的相关关系。大数据并没有改变因果关系,但使因果关系变得意义不大,因而大数据的思维是告诉我们“是什么”而不是“为什么”。换言之,大数据思维认为相关关系尽管不能准确地告知我们某事件为何会发生,但是它会提醒我们这件事情正在发生,因此相关关系的发现就可以产生经济和社会价值了。

4结语

综上,相对于传统而言,大数据思维主要包括三个重大转变。首先,要分析与某事物相关的所有数据,而不是依靠分析捎来能够的数据样本;其次,研究人员应乐于接受数据的纷繁复杂,而不再追求精确性;最后,认知世界的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。以上三个转变构成了大数据思维的核心。在统计学的进一步应用和发展完善过程中,需要结合以上转变所产生的挑战,思考有效的统计学发展对策。

参考文献

篇2

一、SPSS统计软件特性分析

(一)SPSS统计软件应用范围

SPSS(Statistical Product and Service Solutions),是一种“统计产品与服务解决方案”软件。开始时它的全称为“社会科学统计软件包”,但最后被命名为“统计产品与服务解决方案”。它最初用于统计学分析运算、数据挖掘、预测分析和决策支持任务,有Windows和Mac OS X等版本。后来随着SPSS公司对这款软件的更新与改进,它的应用范围也逐渐扩大起来,它在自然科学、技术科学和社会科学等方面都有涉及,并且都收到使用者的好评。世界上许多著名的杂志报刊都对SPSS统计软件的各方面功能做出了很高的评价。

(二)运用SPSS统计软件的实例分析

某高校要对大学生党员素质进行评价,以便于对发展和培养当代大学生的工作实践。他们首先选取了“道德品行”“政治素养”“学习能力”“工作能力”“心理素养”这五个方面对大学生党员素质进行评价,然后要求被调查者根据自己对党员的要求来判断学生党员是否能做到其中一点。其中1表示“非常不同意”、2表示“不同意”、3表示“不能确定”、4表示“同意”、5表示“非常同意”。从发出的300份卷中筛选出有效的188份,然后用SPPS统计软件对分卷信度用克隆巴赫系数测量,该系数表示的是问卷调查结果总变异中由不同被调查者导致的比例占多少,整个问卷和各个子问卷的克隆巴赫系数如下表所示:

为了验证所获得数据的有效性,该试验还进行了Bartlett’s Test和KMO指标验证。Bartlett’s Test检验的sig为0.000说明参与分析的数据来自正态分布的总整体,而KMO的取值在0到1之间,所得到的值越接近1,表明这些变量对因子分析的效果越好,这些因素很好的解释了大学生优秀党员应当从什么地方开始培养,而SPSS统计软件则是验证了这些因素的有效性和可信度,为大学生党员的培养工作提供科学依据。

二、大学生职业素质评价模型构建

(一)大学生素质评价模型研究背景

随着时代的前进和科学技术的发展,现代年轻人的思维也追上了时代的最前端。步入大学殿堂的“90后”一代年轻人,他们追求自我和个性的特点越来越显著,教育工作者对大学生职业素质的培养与分析也遇到了挑战。如何根据大学生的特点来构建素质评价模型是新一代教育工作者需要考虑的问题。

(二)SPSS统计软件对大学生职业素质评价模型构建的作用

对大学生职业素质评价要从学习能力、工作能力、政治思想、心理素质四个因素考虑,这四个因素涵盖了大学生的外在处事能力和内部思想,是对一个人的综合职业素质比较全面的评价。大学生的职业素质评价模型由这四个因素构成。运用SPSS统计软件对这几个因素进行分析,可以看出这些因素对职业素质评价所占比重的大小,然后根据各个因素所占的比重构建大学生职业素质评价模型,得出科学的评价方法和评价重点。

(三)SPSS软件对大学生职业素质评价情况分析

运用SPSS统计软件对大学生职业素质进行数据统计分析,可以了解到我国当代大学生需要培养的职业素质,也可以看出在校大学生对自身优秀职业素质的期盼和要求。大学生的职业素质涵盖了学习、工作、政治、心理等四大方面,以大学的具体生活为基础,由校园小范围扩大到社会这个大范围,具有很强的现实指导意义。运用SPSS统计软件,可以得出大学生职业素质评价的重点,让大学生充分了解到自己达标和不达标的地方,加以改正。

三、结论

对大学生的职业素质进行评价是大学生发展阶段中的必要条件。大学教育的目的在于让大学生成长和发展,让他们掌握更多的知识技能,认清自己与社会外界的关系,有助于自己以后的工作和生活。而在SPSS统计软件的分析下,可以看到大学生的职业道德素质由多种原因共同决定,因此我们可以知道,只有多方面的对大学生进行教育,才能使大学生形成良好的职业道德素质,做一个对社会、对国家有用的人。

篇3

1.定量资源

对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因索方差分析;

2.定性资源

对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用X-检验;

3.回归分析

对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资料,不应简单化处理;

篇4

统计意识的培养是小学学习最重要的目标之一. 统计意识的首要方面是能有意识地从统计的角度思考有关问题,当遇到有关问题时能想到去整理分析数据,即发展学生的统计意识. 发展学生的统计意识最主要的方式就是让学生体会到统计是有用的. 基于以上目标,在学生根据原始数据提出自己的问题后,教师引导学生体会解决问题必须对这些数据进行整理,就产生了整理统计的需要,有了需要学生就会考虑选用方法进行整理统计,然后通过教师的点拨,学生在小组内自主完成数据的整理统计,学生参与度和统计结果正确率都比较高. 根据统计结果,同学自己提出的问题迎刃而解. 这样的设计,让学生带着解决问题的需要,投入到数据的整理统计中,在经历统计的过程中培养了学生的统计意识. 如以下设计:

(一)呈现情境,提出问题

师:同学们,2008年北京奥运会中国以51枚金牌数居金牌榜榜首. 大家看,这是第二奥运中国体育代表团金牌榜. 根据金牌榜提供的信息,你能提出什么问题?

生1:中国游泳项目获多少枚金牌?

……

(二)分类统计,解决问题

师:老师发现同学们提到的问题都与中国各种项目获金牌数情况有关,所以我们先来解决这个问题“中国各种项目获金牌数的情况是怎样的”. 解决这个问题需要用到哪方面的知识啊?(统计知识)对,我们需要对原始数据进行整理、统计. 你打算怎样统计?

生:用统计表,根据体育项目进行分类统计. (板贴:统计表)

师:这名同学想到了根据体育项目进行分类统计,你们同意吗?除了用统计表表示统计结果,还可以用什么来表示?(条形统计图)

师:大家看,在金牌榜上出现的体育项目既多又分散,比如说水上项目就有游泳、跳水、划艇等,我们可以把某些项目进行归类,请看大屏幕(课件出示分类标准).

师:下面小组内进行分类统计,可以选用统计表,也可以选取统计图来表示统计结果.

生:(分小组活动).

……

二、关注扇形统计图的产生,让学生通过数据分析体会学习扇形统计图的必要性

让学生体会引入扇形统计图的必要性是认识扇形统计图的开始,有利于激发学生对新知的求知欲. 因此,在教学中我有意识地将切入点回归到学生要解决的问题上,在引导对条形统计图进行分析后,教师抓住学生前面提到的“举重项目获金牌数占金牌总数的百分之几”这一问题让学生来解决,随即出现一组含有百分数的统计表,然后教师提出“要清楚地表示出这些信息,我们还可以用这样的统计图”,大屏幕出示做好的扇形统计图. 这样一来,扇形统计图的引入水道渠成,既加强了与数据整理统计的联系,又为扇形统计图特征和作用的理解做了有力的铺垫. 如下面的设计:

……

师:刚才我们用统计表和条形统计图表示出了各种项目获金牌数的情况(课件出示统计表和条形统计图),之前有名同学还提到这样一个问题(课件出示单式统计表):举重项目获金牌数占金牌总数的百分之几,这个问题怎么解决啊?(课件出示复式统计表空栏)

生:用举重项目金牌数除以总金牌数.

师:怎样列算式?

生:8 ÷ 51.

师:非常好!体操项目呢?它获的金牌数占金牌总数的百分之几?

师:像这样,用每种项目获得的金牌数除以金牌总数就能得到这样一组百分数. (课件出示复式统计表加百分数)

师:同学们,对于中国各种项目获金牌情况,我们还可以用这样的统计图来表示(课件出示扇形统计图)

三、关注扇形统计图的直观优势,让学生读懂数据

当前是一个信息时代,读图时代. 让学生从统计图中获取信息,根据统计图中的数据进行分析、预测和推断,是发展学生数据意识具体的教学策略. 统计图的特点是形象直观,便于比较观察,那么在指导学生读图的时候,应当突出图的直观优势. 教学前我首先思考了“扇形统计图的直观优势在哪里”这样一个问题. 通过研读教材我发现,扇形统计图的特征应该从百分数的意义和扇形大小两方面去理解,在读图过程中也应侧重这两方面,且要将数与形两方面进行有机结合. 课堂上在教学扇形统计图特征时有意识地引导学生读懂数据,注重了对百分数意义的理解和它所在的扇形的大小,特别在比较大小时,我们既可以通过百分数大小来比较,又可以通过扇形大小这一直观优势进行比较. 另外,注意让学生结合生活情境,根据统计图中的数据进行推断、预测,体验数学的价值所在. 通过读图,学生切实体会到了扇形统计图的作用. 如下设计:

师:见过这种统计图吗?(没见过)那知不知道它叫什么统计图?(扇形统计图). 大家可真聪明,它就叫扇形统计图. (板贴课题:扇形统计图)

师:知道它为什么叫扇形统计图吗?

生:圆内有大大小小的扇形.

师:大家都发现了,扇形统计图中有扇形. 谁能到前面来指一指图中哪儿有扇形?(生指扇形统计图中的扇形)

师:正像这名同学所指的,圆内确实有大大小小不同的扇形. 你能看出哪个扇形最大吗?(生指水上项目所在扇形)

师:为什么表示水上项目的这个扇形画得最大?

生:因为水上项目获得金牌数占金牌总数的百分比最大. 师:最小的呢?为什么呢?

师:在这个扇形统计图中有两个大小一样的扇形,你发现了吗?

师:为什么这两个扇形可以画得一样大呢?

……

四、关注素材的决策功能,体现统计中数据分析的价值所在

统计教学中,学生不仅要读懂简单的数据,更重要的是要根据统计图和实际情况,分析统计图中数据的合理性,作出某些判断和决策,并从中得到某些启示. 针对初教时研课提出的问题,我们设计了部分开放性的练习,如:我从媒体中找到一些数据,鼓励学生读懂媒体中的统计图,并引导学生体会这些数据带给我们的启示,等等. 这样一来,使得统计教学更具价值性.

……

师:下面让我们来关注学校的红领巾广播站. 学校广播站每周播音2小时. 下图表示各个节目的播音时间情况.

师:哪个节目的播音时间最长?你是怎么知道的?

师: “学法交流”的播音时间是24分钟,占每周播音时间的百分之几?

生:24除以120等于20%.

师:这是求一个数是另一个数的百分之几.

师:如果老师请你做我们学校广播站的策划者,你对栏目内容和时间有什么好建议?

篇5

【关键词】大数据 高中统计 数据分析 内容数据链

大数据的价值性,快速性,大量性,多样性,和预测功为教育提供了一种可能目前教育的形式多种多样,慕课、微课、网络公开课等等。大数据时代下的教育是怎样的呢?是基于个性化学习,是量化的,自我组织学习内容的教育,不仅要了解学生“心声”,认知水平和学习兴趣,而且要师生互动、合作探讨学习内容,将传统课程、教学、教材的内容数据化,利用可视化技术,提高学习兴趣。提升内容吸引力。高中统计内容必须系统化、过程方法直观化,这对高中的统计内容提出了挑战。使专题块和课程案例集以数据知识链为核心,使教育在大数据时代下的“量化”。

一、高中统计内容的新契机是大数据

使教育由数字支撑变化到数据支撑。高中统计教学场景布置,统计内容设计,学习场景的变革等等过去靠“敲脑袋”或者“理念灵感加经验”的东西,在背景为物联网、云计算、大数据下,变成一种由数据支撑的“行为科学”.用数据分析的方法对高中统计内容进行分析、挖掘,利用大数据更改高中统计内容,建立主线为“统计知识链”、目标为培养“数据分析能力”首尾呼应内容数据链,使高中统计内容的系统更加优化。

由于各种原因使高中统计内容,没有得到较好的发展.直到国家教育部颁布了各种政策,统计才得以发展.然而各种问题的存在仍然困扰着我国统计教学发展。大数据关注每一位学生的个性化需求与发展,关注学生的自我意识,分析群体心理,让教师关注学生的兴趣爱好,选择适合学生的方法,让学生自主的、创新的学习。

正如教育家张韫所说:“大数据时代的到来,让社会科学领域的发展和研究从宏观群体逐渐走向微观个体,让追踪每一个人的数据成为可能,从而让研究每一个个体成为可能.对于教育研究者来说,我们将比任何时候都更接近发现真正的学生。”大数据在充分了解学生各种需求,目前处于的状态的情况下合理运用各种统计内容,各种现代化的教学方式,不拘泥于传统化教学方式,利用各种资源形成螺旋式上升的统计内容数据链。使每一位学生都乐于学习,其个性化学习需求成为可能。

二、高中统计内容数据链在大数据视域下的内涵

数据高中统计内容的核心研究对象,数据分析是重点,统计学习是在初中的基础上,进一步学习数据统计方面的各种方法;用各种操作培养学生的归纳推断能力、统计思维、数据分析素养,提升学生在数据分析方面的能力,统计内容数据链为学生统计能力的提升提供了研究平台。把课程目标,学生需求、与大数据算法,数据链式结构有机结合起来是大数据视域下的统计内容数据链核心思想,利用大数据,将统计内容数据化,增强内容的可读性,衔接性、合理性、连贯性,织成统计知识,形成统计内容数据链。例如:具体环节为:链宿是“样本估计总体、”等数据分析方法,链源是“系统抽样,等距抽样、分层抽样”,链节是的数据描述、统计图形.通过统计知识的实际应用使“统计知识链”为统计内容数据链的内化,“统计能力链”为其外化,“统计能力链”,“统计素养链”为其发展,成为对学生产生重大影响的“统计思想链”所以,利用大数据的科学方法可使统计内容体系最终形成的统计思想体系;数据结构的链式模型,将促进学生创新思维,增强学生的参与积极性,使高中统计集“知识链、能力链、素养链、思想链”于一体。

三、高中统计内容大数据视域下下的数据链设计

(一)高中数学统计内容知识结构

各种版本的高中数学统计内容都介绍了基本的获取样本数据的获取,提取方法,就是我们常说的用样本推断总体,部分推断整体.统计知识注重培B学生数据分析的能力,利用实例讲解数据的各种思想,方法结合在一起,提高学生的综合能力。例如:结合具体问题情境,学习如何进行数据收集,分析,如何思维理解其含义。

(二)高中数学统计内容的教学要求

课标充分重视高中数学统计内容,并采取了有效的改进和创新措施。教学过程中,注重学生自我特长的发展,创新教学方式,不拘泥于传统的书本知识,强调以人为本,面向未来,让学生有数据意识,学会用数据说话,将统计知识运用于实践。

(三)高中统计内容在大数据视域下数据链设计

量化教育是大数据时代的可行教育,通过数据了解学生的个性化需求,促进学生的个性发展,注重创新式培养。结合教材利用现代化信息技术设计出学生乐于接受的教学方式。从“数据读心”,到“抓心入心”,再到“知心交心”,最终形成“数据育心”的培养链是统计内容数据链的设计原则。例如:分层抽样内容数据链的设计.首先,将分层抽样知识系统化。其次,将分层抽样的过程方法直观化。最后,依据统计内容数据链的设计原则和学生个性化学习需求,动态生成分层抽样内容数据链。把具体问题数据化。使分层抽样内容数据链成为满足自我发展需要的“知识链、方法链、素材链”。

四、结语

综上所述,对统计内容数据我们应该就地取材,因地制宜,开创多种方式的教学方式,注重学生的个性化需求,不要拘泥于传统的教材,注重培养学生的创新思维和自主参与能力,要让学生发挥主观能动性,积极主动的自己去思索,发展自己的特长,学会将具体的事情数据化不用数据的思想去思考问题,去看世界,老师也要探索更好的教学方法。将现代化的科学技术与传统枯燥的教材相结合创造出一种能够发挥学生潜能,特长的教学方式,要循循善诱,引导学生。总之,统计内容数据链能更好地使学生不断提升自己的数据分析“能力链”使学生学会用统计思想、统计方法、统计思维、统计观念、统计意识来认识世界,改造世界。

参考文献:

篇6

中图分类号:G643 文献标志码:A 文章编号:1673-291X(2012)18-0245-03

信息素养是指人们在解决问题时利用信息的技术和技能。这个概念是1974年由美国信息产业协会主席保罗·泽尔斯基首次提出后又经该协会定义的。随着计算机等现代技术的发展,信息量以几何级数的方式递增。一方面,准确完整的信息是做好决策的基础,另一方面,如何进行有效的检索,是利用信息从而解决问题的关键,这两者均取决于人的信息素养。

研究生教育担负着为国家建设发展培养高素养、创造型人才的重任。现代管理学之父德鲁克曾经说过:“知识工作者的生产率是21世纪管理的最大挑战。”

在北京交通大学,早在2004年,便把信息素养的教育列入了研究生学期教育的内容,为了全面掌握研究生信息素养情况,使信息素养教育更具有针对性,我们于2011年9月对北京交通大学的博士研究生和学术型硕士研究生进行了抽样调查,并结合访谈的形式对于相关重点问题进行了确认。

一、样本与调查维度说明

调查根据各院系学术型研究生数量的相对比例,共随机抽取360位研究生进行调查。经检查核对,最后共获得有效问卷343份,有效问卷回收率为95.27%,样本总量占6 847名学术型研究生总量的5.3%。有效样本在各学院的分布情况为:电子信息工程学院50人,计算机学院29人,经济管理学院97人,交通运输学院29人,土木建筑工程学院39人,机械与电子控制工程学院20人,电气工程学院20人,理学院21人,人文社会科学学院11人,软件学院17人,建筑艺术系5人,语言与传播学院5人。在全部被调查者中,硕士研究生为主体,占84.54%,其余为博士研究生;从年级分布看,一年级占45.18%,二年级研究生占43.73,三年级研究生只占11.07%;从性别构成看,男性占57.73%,女性占42.27%,与我校男女生总体比例58.4∶41.6持平。

调查的维度包括研究生信息素养教育基础、获取并利用专业信息的途径、对提高自身信息素养的途径选择与期望三个大的方面,共包含22个问题。

二、调查结果

1.研究生信息素养教育基本情况。调查表明:近四成研究生在本科阶段没有受过正规的信息素养教育。有34.74%的被访者在本科阶段没有学习过科技信息检索或类似的课程;有40.12%的被访者没有学过学术论文和学位论文写作的课程或听过相关讲座。

2.获取并利用专业信息的途径。在使用各种信息资源方面,以图书馆资源配合网络搜索引擎为主;将近1/3的学生经常使用纸本书和期刊,并通过专业相关论坛学习;还有一小部分学生利用免费的(见表1)。

在对既有资源的深入使用方面,对我校图书馆的使用情况的调查表明:有80.62%的学生使用过借还书服务;61.67%的学生做过电子数据库检索;44.49%的学生进行过书刊阅览;只有36.12%的学生使用过学术资源门户;26.43%的学生做过信息咨询;17.62%的学生使用过馆际互借;甚至有20%未使用过借还书服务(见表2)。

计算机技术发展到今天,涌现出很多面向公众的免费软件,这些开源软件除了在社交网络方面,在各专业领域里也层出不穷,熟练运用这些免费软件将是对我们当前有限资源的一个有效补充。但使用情况并不普遍。有15.42%的学生没有用过任何一款开源软件(见表3)。

研究生对本专业领域内优秀文献及前沿信息的掌握情况在一定程度上决定其创新力。研究生对其专业核心期刊及网站信息的掌握途径如下:60.79%的学生请教导师或同学,46.26%的学生利用期刊导航系统,28.63%的学生利用CSSCI或CSCD获知,11.45%的同学咨询图书馆员,其他途径为4.41%(见表4)。

从外文数据库的使用情况来看,有3.08%的学生从不使用本专业外文数据库;有43.17%的学生不熟悉外文数据库但常用Google找英文文献阅读;只有29.52%的学生经常使用本专业的外文数据库。由此可见,我校的专业外语和外文数据库的培训亟须加强(见表5)。

学术数据库的便捷和及时已成为研究生学习、研究过程中不可或缺的工具。随之而来的大量电子文档如果得不到系统的管理,会浪费掉很多时间和精力。与国外学校情况相比,我校研究生对参考文献管理工具的认识和使用情况令人担忧。以三种最广泛使用的管理工具为调查对象,使用过endnote、noteexpress或 refwork这三种管理软件的学生分别占16.74%、12.33%和8.81%,竟有近63.88%的学生没有使用过任何参考文献管理软件(见下页表6)。

3.提高研究生信息素养的方向与途径选择。调查显示:31.42%的被访者不太能对所浏览的网站的权威性作出判断,2.65%的被访者完全不能判断出所浏览网站的权威性;有40.27%的被访者回答能够判断网站的权威性,但根据的是模糊的经验;只有25.66%的被访者因为听过有关讲座,从而能够准确判断所浏览网站的权威性。

信息搜索能力提高途径方面,43%的同学希望采取听主题讲座的方式;22%的同学选择上选修课;20%的同学选择自学;15%的同学愿意请教导师和同学。

三、分析与建议

1.需强调信息技术教育与信息素养教育的结合。近四成研究生在入学之前没受过正规的信息素养教育,这样的数据映射了中国对于信息素养教育的认识严重不足。国外对信息素养问题的研究可谓由来已久。20世纪60年代至今,相关的研究已相当深入。通过Elsevier、Infotrieve等检索系统都可以检索到众多的研究文献。而通过“google”进行网络检索则返回了1 180 000条记录。这些记录中包含大量的信息素养研究组织、论坛、专门研究网站和资源网站,可以找到数量丰富的研究报告、论文、会议文献及有关的项目和计划等资料。资料还反映出信息素养概念的内涵逐渐由最初单纯的信息技能掌握到人的整体素养层面的演进以及信息素养重要性被广泛认可的过程。

相对而言,国内信息素养理论研究比发达国家滞后得多。1984年,教育部《关于在高等学校开设〈文献检索与利用课〉的意见》,奠定了《文献检索与利用课》作为中国高校大学生用户教育主要形式的地位。此后,受国外影响,中国图书情报界对用户教育活动的理论思考逐渐演变上升为信息素养层面的研究。就发文量而言,中国对信息素养问题的真正研究始于20世纪中期。1995年首次在研究文献中出现了“信息素质”和“信息素养”的概念,但之后发文数量一直非常有限,到2011年一共682篇。反映出中国对信息素养问题的研究多年来一直徘徊在较低的水平。

在对被调查者的访谈中,他们接受的信息教育要么就是计算机教育(简称为“计算机课”、“电脑课”)和在此基础上有所发展的信息技术教育,并以掌握计算机、网络等信息技术的知识和技能为最终目的;要么就是信息化教育,即将计算机、投影仪等设备用于辅助教育。从2000年开始,信息素养概念已进入一部分信息技术教育研究人士的视野,在国家信息技术教育相关政策中也出现了“信息素养”的提法,但基本上是将信息素养的培养局限于信息技术教育之中。而图书情报界则主要是从原有的用户教育、尤其是文献检索课的视角来看待信息素养。

因而,针对于研究生的信息素养教育,应该强调信息技术与人的学习、生活和工作的联系,强调信息和信息技术在各个层次上的学习与应用,特别强调信息素养在终身学习与自主学习中的作用,强调信息素养与个人发展的关系。

2.有待建立统一的信息素养标准,涵盖教育的全过程。信息素养标准是信息素养评估的依据,也是信息素养教育的课程目标。因此,各国积极建立适合本国国情的信息素养标准。在这一方面,美国、英国、澳大利亚制定的信息素养标准都对其他国家产生了一定的影响。美国最具有影响力的信息素养标准分别制定于1998年和2000年。1998年美国学校图书馆协会与教育交流技术协会制定了《学生学习的九大信息素养标准》,并且涵盖了教育的全过程,是从中小学基础教育到高等教育的一个重要主题。

中国的信息素养教育研究起步比较晚,目前还没有制定出一套全国通用的信息素养评估体系。《北京地区高校信息素养能力指标体系》是中国第一个正式的并且比较有权威的信息素养评价标准体系。该指标体系参照了美国、英国和澳大利亚高校的信息素养评价标准,共分为7个一级指标、19个二级指标、61个三级指标。

信息素养教育和其他任何一种教育领域一样,素养的提高是多个相互联系的因素持续作用、形成合力的结果,局部的强化难以实现。且研究生中的绝大多数毕业后便要走向职场,与其他层次的教育相比,除了传统意义上的学习的压力,还有面临从学生到职场人的转变的压力。如果单纯从研究生阶段加强信息素养教育,即使体系完备,也难以避免学生现学现用,不成系统的弊端。

篇7

引言

每次全国普通高校非计算机专业计算机联合考试(一级)考试阅卷结束后,由自治区将成绩以Excel电子表格形式下发到各学校(以下简称成绩表)。成绩表的表头各字段名如下:

教师需对成绩表进行汇总统计与分析,了解全校各系、各年级、各专业的平均分、及格人数和及格率等情况,便于修订教学计划。

针对学生成绩表的多条件统计分析需求给出公式或函数法和数据透视表法两种解决方案。

1.公式或函数法

1.1 SUMPRODUCT函数

SUMPRODUCT函数是在给定的几组数组中,将数组间对应的元素相乘,并返回乘积之和。

语法SUMPRODUCT(array1,[array2], [array3], ...)

其中,数组参数Array1必需,Array2,array3,……可选,其相应元素需要进行相乘并求和。

SUMPRODUCT函数的基本功能是返回相应的区域或数组乘积的和。但也可利用SUMPRODUCT函数进行多条件计数和多条件求和。

若要统计同时满足条件1、条件2到条件n的数据个数,则可使用

SUMPRODUCT((条件1)*(条件2)*…*(条件n))

若要统计同时满足条件1、条件2到条件n的数据的和,则可使用

SUMPRODUCT((条件1)*(条件2)*…*(条件n)*求和区域)

1.2定义名称

为了在公式计算中方便输入和减少输入量,给需使用的单元格区域定义简单易记的名称,它们分别为年级、院系名称、理论成绩和操作成绩。

操作步骤:选择菜单“插入”“名称”“定义”命令,在定义名称对话框中输入名称和引用位置,确定即可。定义名称对话框如图1所示。

图1定义名称对话框

名称引用位置中使用了一个动态的公式“=OFFSET(成绩表!$F$2,,,COUNTA(成绩表!$A:$A)-1,1)”定义数据源,这样就不用管共有多少条记录了,COUNTA(成绩表!$A:$A)-1会自动计算记录数,并且如当一条新的纪录添加或删除时,数据源会自动扩展。

1.3创建统计表

添加一个新的工作表,用于存放统计数据,命名为“统计表”,表头设计如下:

在A和B列分别输入年级和院系名称。

在C3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(理论成绩>=0))”;

在D3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(理论成绩>=60))”;

在E3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(操作成绩>=60))”;

在F3单元格输入“=D3/C3”;在G3单元格输入“=E3/C3”;

在H3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*理论成绩)/C3”;

在I3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*操作成绩)/C3”。

填充数据,并将小数位设置为两位,部分统计结果显示如下:

2.数据透视表法

2.1创建空白的数据透视表

选定数据清单中的任意单元格,选择菜单“数据”“数据透视表和数据透视图”命令,在弹出的对话框中单击“完成”按钮。Excel将产生一个含有空白的数据透视表的工作表,其中显示字段列表和数据透视表工具栏。

2.2对数据透视表进行布局

若需统计各年级、各院系的理论成绩的平均分、及格人数和及格率等,则可从字段列表中将“年级”字段拖到页字段区,将“院系名称”拖到行字段区,将“理论成绩”字段拖到列字段区,将“理论成绩”、“学号”和“学号”字段依次拖到数据区。将数据透视表中的“数据”拖到右边的单元格。

若要改变数据透视表的布局,就将欲删除的字段拖出数据透视表,然后将新的字段从字段列表中拖到数据透视表相应区域即可。

2.3设置字段的显示方式和汇总方式

将“理论成绩”分为

Excel对“理论成绩”字段默认的汇总方式为“求和”。若要更改汇总方式为“平均值”,可右击“求和项:理论成绩”,选择“字段设置”,或先单击“求和项:理论成绩”,再单击数据透视表工具栏上的“字段设置”按钮,均可调出“数据透视表字段”对话框;在“数据透视表字段”对话框中,单击“汇总方式”列表框中的“平均值”,然后单击“确定”按钮。这就将“理论成绩”的汇总方式改成了“平均值”。

将“学号2”字段的显示方式更改为“占同行数据总和的百分比”。操作方法:右击“计数项:学号2”,选择“字段设置”,在调出“数据透视表字段”的对话框中,单击“选项”,在“数据显示方式”列表框中选择“占同行数据总和的百分比”,然后单击“确定”按钮。

2.4重命名字段

当向数据区域添加字段后,它们都将被重命名,例如“理论成绩”变成了“平均值项:理论成绩”,这样加大了字段所在列的宽度,表格显得不紧凑。如需重命名字段,只要单击数据透视表中需要修改的标题单元格,在编辑栏中输入新标题即可。我们将“平均值项:理论成绩”改为“理论平均分”,“计数项:学号”改为“人数”,“计数项:学号2”改为“人数占比”,将“0~59”改为“不及格”,将“60~119”改为“及格”。

稍作修饰,将小数位数设置为两位小数,隐藏“人数汇总”和“人数占比汇总”。至此,可得到如图2所示的数据透视表。

图2数据透视表

数据透视表创建好后,任何时候都可根据需要,对数据透视表重新进行布局,即只需拖动字段按钮就可,并可非常方便地调整显示方式和汇总方式,以便从不同的角度查看分析数据,从中寻找有价值的信息,满足新的数据分析的要求。

结语

Excel具有强大的数据分析和数据处理功能,包含了9大类、400多个内置函数和大量的分析工具。公式或函数法和数据透视表法都是Excel分析和处理数据的重要手段,合理选取,巧妙应用,能使数据处理方便且高效。

参考文献:

篇8

    1   Excel中加载“数据分析”工具

    首先,启动Excel,点击工具菜单中的“加载宏”选项,在出现的对话框中选中“分析工具库”,确定安装后,在菜单栏的“工具”下会出现“数据分析”选项。

    2   使用Excel进行数据统计描述

    用Excel可进行数据的统计描述,包括:(1)集中趋势(集中指标),它包括算术平均数,中位数,几何平均数,众数等。Excel提供有现成的公式及内置函数可进行这几个指标的计算。如首先输入一组数字,然后建入公式=AVERAGE(常数),=MEDIAN(常数),和=MODE(常数),按回车健可得到算术平均数,中位数和众数;(2)离散趋势(变异指标),它包括全距,百分位数,四分位数间距,方差,标准差,标准误,偏度系数和峰度系数等。而其中以方差,标准差,百分位数和标准误较为常用。同样在电子表格中建入公式=VARP(常数)和=VAR(常数)两函数可计算总体方差和样本方差。建入公式=STDEVP(常数)和=STDEV(常数)便可得到总体标准差和样本标准差。

    3   t检验

    t检验是医学统计分析中最常用的统计分析方法,用来检验标准试样测定结果的平均值与标准值之间是否有统计学意义。Excel“数据分析”中提供了多种不同条件的t检验工具,如“平均值的成对二样本分析”,“双样本等方差假设”,“双样本异方差假设”及其他统计分析工具,当样本中的观察值存在配对关系时,可以使用“平均值的成对二样本分析”t检验。例如对一个样本组在实验前后进行了两次检测,为确定实验前后样本均值是否相等,应使用成对t检验,此t检验并不假设两个总体的方差是相等的。例如,用某药物治疗高血压患者10名,治疗前后舒张压变化如下:

    在工作表中输入上面的数据,比如数据区为A1至J2。分析时,在“工具”菜单中,单击“数据分析”命令。在数据分析对话框中,选择t检验:平均值的成对二样本分析,拉出平均值的成对二样本分析对话框,其中有如下输入项:变量1的区域:输入需要分析的第1个数据区域的单元格引用。该区域必须由单列或单行数据组成。可单击输入框右面的按钮,回到电子表格上自数据开始的单元格向结尾的单元格拖动。此时变量1的区域(A1~J1)自动进入输入域中。然后单击输入域右面的按钮,回到原对话框。变量2的区域:输入需要分析的第2个数据区域的单元格引用。该区域必须由单列或单行的数据组成。输入方法同前。变量2的区域为(A2~J2)。假设平均差:在此输入期望中的样本均值的差值。缺省为0值,即假设样本均值相同。标志:如果输入区域的第1行或第1列中包含有标志项,应选中此项:如果输入区域没有标志项,Excel将在输出表中生成适宜的数据标志。这里选中此项。α在此输入检验的统计意义水平。该值范围为0~1之间。缺省为0.05。

    输出区域信息可选择如下单选项:输出区域和新工作簿。我们选择新工作表,结果为平均95.88889,方差80.86111,观测值9,泊松相关系数0.881366,假设平均差0,df 8,tstat 5.230769,P(T≤t)单尾0.000396,t单尾临界1.859548,P(T≤t)双尾0.000792,t双尾临界2.306004。两组比较差异有统计学意义(P<0.05)。

4   方差分析(analysis of variance,ANOVA)和卡方检验

篇9

1.要让学生感受需要用数据来说话。

统计教学与其他数学内容一样,首先要激发学习的需求:为什么要统计?与其他数学内容所不同的是,统计是用“数据来说话”。

在《复式折线统计图》教学中,结合生活实际以及折线统计图的特点,我们创设了“常州气温是否变暖”问题。通过师生谈话聊出“气候变暖”话题,提出问题:怎样说明常州气温是在变暖?在现实且有意义的问题驱动下,让学生充分感受“数据”是说明问题有力的“证据”,以此认识到数据分析的重要性。

情境只是载体,想到需用“数据”说明问题是活动目的。随着一次次经验的积累,学生也就逐渐体会到“数据”能说明问题,说明问题需要统计数据,统计能帮助人们了解事情并做出判断,也就逐渐建立了统计意识。

2.要让学生明白用怎样的数据来说话。

在《复式折线统计图》教学中,为使学生感受怎样的数据才能科学地说明常州气温变暖问题,师生间进行了如下对话:

师:你们觉得要收集怎样的数据呢?

生:收集今天的气温。

师:单单收集现在的气温能说明这个问题吗?

生:不能,要现在的和以前的,这样才可以对比。

师:对比,是一种好方法!只是,气温有最高气温,有最低气温,还有平均气温,你们觉得这里用哪个气温比较合适?为什么?

生:平均气温。因为平均气温在中间,既不是最高的也不是最低的,比较公平。

师:是啊,在新闻中经常会出现在哪一年或哪一个月出现极端气温。为了避免这种极端数据影响我们的判断,所以要用“平均气温”来比更合适。但气温的变化很微妙,如果用今年和去年气温比,很接近,很难发现问题。怎么办?

生:相隔时间久一些。

生:调查年份多一些。

师:其实,气象工作者和你们的想法一样,一般用现在月平均气温与前几十年的月平均气温作比较。(出示在常州气象局查阅的常州1949年-2000年的50年月平均气温和常州2010年各月平均气温)

……

《课程标准》(修订稿)对统计教学明确提出:要会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)收集数据。很显然,如何收集数据、搜集怎样的数据是要求学生达成的能力要求,那么,数据的科学性教育也就显得尤为重要了。

二、“数据”是分析问题的“依据”

1.要让学生读懂数据表达的信息。

在《复式折线统计图》教学中我们设计了这么一道练习:下面两幅统计图,只有一副是真的,请同学们猜一猜那副是真的。

这道题是根据苏教版小学数学教材中的练习改编而成。改编后的练习不仅丰富了统计内涵,更重要的是通过游戏的形式使学生产生对数据的亲近感,让学生感觉数据并不枯燥乏味,数据分析也不仅仅是计算,数据是蕴含信息的,数据是能表达生活实际,每幅统计图其实就是告诉我们一个生活故事。

2.要让学生体悟数据有助于分析问题。

发展统计意识、培养学生的数据分析观最有效的途径就是让学生体会统计的价值。数据是能表达信息的,数据所表达的信息是能够帮助人们做出决策的。

在《复式折线统计图》教学中,为使学生认识到统计对决策的作用,设计这样的题目:完成某地区7-15岁男女生平均身高统计图。

(1)给出7、8、9岁男女生平均身高的相关数据,要求学生独立描点、连线完成部分统计图,并交流绘制的过程。

(2)进行分析和推测。

看着7-9岁的身高图,先猜一猜9-15岁男女生的两条折线会有怎样的发展趋势。然后出示9-15岁的折线统计图,说一说男女生7-15岁身高有怎样的变化。再想一想,如果接着画下去,男女生的两条折线还会怎么样?

篇10

【中图分类号】 G642.0 【文献标识码】 B 【文章编号】 1009—458x(2013)08—0062—05

一、引言

辍学率居高不下已成为国际远程教育领域的共性问题之一。世界各国开放大学的招生规模不断扩大,但极高的辍学率给学生、院校和社会带来了较大影响,也困扰着远程教育的发展。

英国开放大学作为世界远程教育的翘楚,目前的毕业率仅为22%,是英国全日制普通高等教育毕业率(82%)的1/4左右,是业余高等教育毕业率(39%)的一半左右;其他远程开放教育院校的毕业率则更低,如印度安姆贝德卡大学为14%、南非大学为6%、加拿大阿萨巴斯卡大学为5.3%、美国的凤凰城大学为5%。[1]

在我国,开展网络高等学历教育的试点高校先后开设了300余种专业、1500多个专业点,设立了9000多个校外学习中心,累计招收网络远程教育本、专科学生1000多万人[2],学生人数位居各类教育形式之首,但也受到高辍学率的困扰。目前,远程教育学生的辍学问题还没有在我国引起充分重视,对辍学者的行为研究和理论模型十分缺乏,甚至很多远程教育院校没有完整的辍学统计数据,更谈不上对辍学问题的分析、研究和干预。

西南交通大学网络教育学院自2001年起作为全国首批网络教育试点高校之一开始招生,截止2012年12月31日,先后共开设了47个专业,设立了59个校外学习中心,累计招收网络本、专科学生十万余人,总体辍学率为8.30%。西南交通大学网络教育学院(以下简称“学院”)的学生分布广泛,影响其辍学的因素复杂多样。在日常学籍管理工作中,学院对所有辍学学生均严格要求办理相关辍学手续,并详细记录了所有辍学者的辍学时间、辍学原因等相关数据。

本研究以学院2008~2012年(共5年)的所有学籍数据为研究对象,对之进行多视角的挖掘分析,以期为远程教育辍学研究提供一个完整的实证案例,为各远程教育院校、学习中心降低辍学率提供相关参考和借鉴。

二、数据样本及研究方法

1. 研究对象及数据来源

本研究利用学院“教务管理数据库”平台,选择2008年春季~2012年秋季(共10个学期)全部学生的学籍数据,共计135670条,建立“2008-2012年学籍状态数据库”,并关联毕业生学历数据表、辍学学生数据表、学习中心数据表、各专业数据表等相关数据,全面分析、挖掘2008~2012年间辍学情况。

2. 数据指标定义

本文中,辍学率=辍学人数/招生注册数。其中,“招生注册数”指已经完成了学籍注册、获得学号、具有学籍的学生总数,包括在读、已毕业和辍学流失三类学生;“辍学人数”包括辍学、开除、已达最长学习年限但未完成学业而被清退的三类学生数。

3. 数据预处理

(1)将所有辍学学生按照入学时间、学习层次、专业、性别、年龄、学习状态等进行分类、整合,从多视角计算、分析其辍学情况;

(2)对学院先后开设的47个本、专科专业进行归一处理,分为文法类、理工类、经济类三个大类,分别统计其辍学等相关数据;

(3)将所有辍学学生按学习中心所在的行政区划进行分类,共得到27个省(市)/自治区的有效数据,将其再按照地域方位划分为东北、西北、西南、东南、中部共五个区域进行统计;

(4)计算所有已辍学学生“参加过考试的学期数”,得到其有效在读的时间,即“修业时长”,并将该数据进行归类统计;

(5)对专升本辍学学生的统考通过情况进行分类统计。

4. 统计分析方法及研究工具

本研究采用SQL、FOXPRO、EXCEL等数据库软件,对所有数据进行采集、统计,并对数据进行关联、求和、百分比、标准差等计算处理。

三、辍学总体情况

根据统计数据(表1),2008~2012年学院共计招收本、专科学生135670人,目前在读或已毕业人数125768人,辍学人数共9902人,总体辍学率为7.30%。其中,高升专辍学人数6154人、平均辍学率7.28%,专升本辍学人数3748人、平均辍学率7.33%。

我国网络教育学制为2.5年,目前2008~2010年入学的学生已到毕业时间,2011、2012年入学的学生仍处于正常在读年限内。根据2008~2012级各层次辍学率逐年分布图(图1),2008~2012级总体辍学率呈现下降趋势,且各年级专升本辍学率普遍高于高升专辍学率。2008级专升本辍学率达到最高值(11.95%),高于平均辍学率4.65个百分点。

四、辍学率变化趋势及差异比较

学生辍学涉及很多因素,如学习基础和能力、经济状况、环境变化、工作调换、出国、生病、怀孕,等等。但学生在填写“辍学原因”时,往往只简单地填写“自动辍学”或“工作原因”等,由此难以得到学生真实的辍学原因。因此有必要对所有辍学数据进行不同视角的观察和分析。

1. 辍学时间的情况统计

从表2和图2可以看到,辍学时间主要集中在每年的4月和10月,其辍学率分别为15.26%和21.63%。平均月辍学比例的标准差值为0.0579。在每年春、秋季学期,新生入学注册的时间大约是3月和9月,4月和10月为新生入学后的第一个月。

结合已辍学学生参加考试的学期数(图3),可以看出辍学学生的“修业时长”主要集中在前两个学期,其中没有参加任何学习就辍学的学生占辍学总人数的21.94%,为最大值。此后逐渐下降,在第5个学期出现一个小高峰(14%)。已辍学学生参加考试学期数比例的标准差值为0.0806。由此可见,辍学学生主要集中在学习的早期阶段,较有代表性的时间段为新生入学一个月左右的时候及学习时间到达学制2.5年的时候(第5个学期)。

2. 各专业学生的辍学情况

从表3和图4可以看出,专升本学生的辍学率略高于高升专学生;文法类和经济类学生辍学率相对较高,理工类学生辍学率较低。但总体来说,各大类专业学生间的辍学率区别不大,标准差为0.01150。

3. 不同性别、年龄学生的辍学情况

从表4和图5可以看出,女生辍学率的标准差为0.0126,大于男生0.0073的标准差,总体标准差为0.0087。20~46岁的辍学率变化幅度虽然不大,但呈现明显的规律:26岁以前男女生辍学率整体高于26岁以后;21~25岁学生辍学率最高,31~35岁学生辍学率最低;20岁左右的学生,男女生辍学率无明显差别;21~30岁的学生中,女生辍学率高于男生,其中21~25岁的女生辍学率达到9.65%,为所有年龄段学生中最高;26~30岁学生中,男女生辍学率基本一致;30岁以上学生中,男生辍学率高于女生,其中31~35岁学生中,女生辍学率为6%,为所有年龄段学生中最低;46岁以上的学生中,男女生辍学率趋于一致。

4. 不同地区学生的辍学情况

通过对不同学习中心所在行政区域的辍学情况进行统计,共得到27个省(市)/自治区的有效数据。将该数据按照地域方位划分为东北、东南、西北、西南、中部共五个区域,进行进一步归类统计,得到以下数据(表5)。

通过不同学习中心所在地区总体辍学率分布图(图6)可以看出,地处西北地区的学习中心其学生辍学率最高,达到9.25%;其次是东南、中部和西南地区,分别为8.00%、7.25%和6.54%;东北地区辍学率最低,为4.15%。不同地区辍学比例标准差为0.0318。

5. 专升本已辍学学生的统考通过情况

根据教育部和网考委的相关规定,网络教育专升本学生必须通过公共基础课全国统一考试(以下简称“统考”),因此对统考通过情况的统计是分析学生辍学原因的重要依据。从专升本辍学学生统考通过情况的统计(表6、图7)可以看出,专升本学生辍学总人数为3748人,其中仅通过英语统考的人数为170人,占专升本总辍学人数的4.54%;仅通过计算机统考的人数为169人,占专升本总辍学人数的4.51%;两门统考均未通过的人数为3408人,占专升本总辍学人数的90.93%;两门统考均通过却辍学的学生仅1人,占专升本总辍学人数的0.03%。该生为女性,年龄25岁,于2010年秋季入学,机械设计制造及自动化专业,辍学时间为2012年6月,参加过3个学期的期末考试,在读期间共选修16门课程,其中9门课程通过,7门课程均因“缺考”而未通过。经调查了解,该生因工作地点频繁变动而无法继续学习。

五、辍学原因分析及讨论

通过以上对各项辍学数据的统计和分析,以及各类数据的标准差值,可以看到,对辍学情况影响最大的因素为专升本统考的通过情况。网络教育对学生的入学水平没有严格的要求,入学后各门课程的教学、考试标准也由各院校自行把握。然而面对“统考”这一国家统一考试,学生的通过情况则与其入学水平呈正向关联。如何有效提高学生的学习能力和真实水平,是网络教育解决专升本辍学问题的重要因素。

统计结果显示,辍学往往发生在学习的早期阶段,具体时间是入学后第一个学期的一个月内。此外,第一次考试后也是辍学的高发时间段。数据无法体现出其具体原因是什么。但根据日常教务管理经验,笔者推测可能是学生入学后发现学习的难度超过了预期,也可能是第一次考试的通过情况让学生丧失了继续学习的动力。不管何种原因,在此期间于学习支持服务中提供积极指导和早期干预是非常重要的。

不同性别和年龄对学生保持率的影响也不容忽视。在数据统计中,相对年轻的学生更容易辍学。网络教育的学生往往是在职学习的成人学生,工学矛盾十分突出。学生需要有很强的时间管理能力,能合理规划生活、工作和学习的时间,能按部就班地完成每一阶段的学习。网络教育现有的学习支持服务主要是解答问题和满足需求,这类服务的对象是那些已经具有良好“活跃度”的学生,此类学生往往具有较高的保持率。而那些相对“安静”或“冬眠”的学生则需要更多的主动帮助、按时提醒和及时干预。

在我国,地区经济发展水平不均衡,东部经济发展较快,西部经济则相对落后。在日常教务管理工作中,我们经常遇到西部或偏远地区学生因为经济原因而辍学的情况,比如付不起学费、买不起电脑等;另一方面,在东部等经济发达地区,人员流动性较大,很多学生因为工作变动频繁或工作地点不能提供良好的远程学习条件而放弃学习。网络教育可以通过多样化的学习和考试方式,甚至是便携式移动终端来解决学生在时间和空间上的不便;通过贷款等资助方式解决学生的学费问题。

不同专业对学生辍学的影响主要体现在专业间难度不同以及学生入学水平的差异上。部分学生因为选错了专业但又不符合转专业的条件而选择辍学。因此,在入学时学习支持服务人员帮助学生选择适合的专业是降低辍学率的积极做法。另外,帮助基础较差的学生提高学习水平、激发学习兴趣至关重要。网络教育通过提供灵活的课程结构、适中的课业负担、多样的学习方式,能有效提升学生保持率。

当然,无论采取何种措施来降低学生的辍学率,都需要花费院校、学习中心、学习支持服务人员的时间、精力和成本。目前,我国远程教育院校的收入主要来源于学生缴纳的学费。有研究表明,招收一个新生的费用远高于挽回一个辍学者的费用[4]。因此,挽救一个学生的成本会换来数倍的回报,对院校、学习中心甚至学生本人,带来良好的成本-效益。

目前我国远程教育对辍学学生的关注度并不高,降低辍学率的工作任重而道远。各远程教育院校需要不断提升服务水平、完善辍学数据统计;学生则需要保持学习动力、提高学习水平,获得更好的远程学习体验。

[参考文献]

[1] 刘永权,李莹. 破解远程开放教育高辍学率的难题——访英国开放大学奥蒙德·辛普森教授[J]. 开放教育研究,2012,(10).

[2] 孙崇正,安哲峰. 基于网络远程教育的高校创新性人才培养模式改革研究[J]. 现代远距离教育,2011,(2):43-46.

[3] 刘永权,牛健,李莹. 透视国外远程教育降低辍学率的窗口——对英国开放大学扩大参与中心2010年报告的解读[J]. 现代远程教育研究,2011,(6).

篇11

1 Excel中加载“数据分析”工具

首先,启动Excel,点击工具菜单中的“加载宏”选项,在出现的对话框中选中“分析工具库”,确定安装后,在菜单栏的“工具”下会出现“数据分析”选项。

2 使用Excel进行数据统计描述

用Excel可进行数据的统计描述,包括:(1)集中趋势(集中指标),它包括算术平均数,中位数,几何平均数,众数等。Excel提供有现成的公式及内置函数可进行这几个指标的计算。如首先输入一组数字,然后建入公式=AVERAGE(常数),=MEDIAN(常数),和=MODE(常数),按回车健可得到算术平均数,中位数和众数;(2)离散趋势(变异指标),它包括全距,百分位数,四分位数间距,方差,标准差,标准误,偏度系数和峰度系数等。而其中以方差,标准差,百分位数和标准误较为常用。同样在电子表格中建入公式=VARP(常数)和=VAR(常数)两函数可计算总体方差和样本方差。建入公式=STDEVP(常数)和=STDEV(常数)便可得到总体标准差和样本标准差。

3 t检验

t检验是医学统计分析中最常用的统计分析方法,用来检验标准试样测定结果的平均值与标准值之间是否有统计学意义。Excel“数据分析”中提供了多种不同条件的t检验工具,如“平均值的成对二样本分析”,“双样本等方差假设”,“双样本异方差假设”及其他统计分析工具,当样本中的观察值存在配对关系时,可以使用“平均值的成对二样本分析”t检验。例如对一个样本组在实验前后进行了两次检测,为确定实验前后样本均值是否相等,应使用成对t检验,此t检验并不假设两个总体的方差是相等的。例如,用某药物治疗高血压患者10名,治疗前后舒张压变化如下:

在工作表中输入上面的数据,比如数据区为A1至J2。分析时,在“工具”菜单中,单击“数据分析”命令。在数据分析对话框中,选择t检验:平均值的成对二样本分析,拉出平均值的成对二样本分析对话框,其中有如下输入项:变量1的区域:输入需要分析的第1个数据区域的单元格引用。该区域必须由单列或单行数据组成。可单击输入框右面的按钮,回到电子表格上自数据开始的单元格向结尾的单元格拖动。此时变量1的区域(A1~J1)自动进入输入域中。然后单击输入域右面的按钮,回到原对话框。变量2的区域:输入需要分析的第2个数据区域的单元格引用。该区域必须由单列或单行的数据组成。输入方法同前。变量2的区域为(A2~J2)。假设平均差:在此输入期望中的样本均值的差值。缺省为0值,即假设样本均值相同。标志:如果输入区域的第1行或第1列中包含有标志项,应选中此项:如果输入区域没有标志项,Excel将在输出表中生成适宜的数据标志。这里选中此项。α在此输入检验的统计意义水平。该值范围为0~1之间。缺省为0.05。

输出区域信息可选择如下单选项:输出区域和新工作簿。我们选择新工作表,结果为平均95.88889,方差80.86111,观测值9,泊松相关系数0.881366,假设平均差0,df 8,tstat 5.230769,P(T≤t)单尾0.000396,t单尾临界1.859548,P(T≤t)双尾0.000792,t双尾临界2.306004。两组比较差异有统计学意义(P

4 方差分析(analysis of variance,ANOVA)和卡方检验

在数据分析工具库中提供了3种基本类型的方差分析:单因素方差分析、可重复双因素分析和无重复双因素分析,现简单介绍方差分析的应用。

单因素方差分析:在进行单因素方差分析之前,须先将试验所得的数据按一定的格式输入到工作表中,其中每种水平的试验数据可以放在一行或一列内,具体的格式如表,表中每个水平的试验数据结果放在同一行内。数据输入完成以后,操作“工具-数据分析”,选择数据分析工具对话框内的“单因素方差分析”,出现一个对话框,对话框的内容如下:(1)输入区域:选择分析数据所在区域,可以选择水平标志,针对表中数据进行分析时选取;(2)分组方式:提供列与行的选择,当同一水平的数据位于同一行时选择行,位于同一列时选择列,本例选择行;(3)如果在选取数据时包含了水平标志,则选择标志位于第一行,本例选取;(4)α:显著性水平,一般输入0.05,即95%的置信度;(5)输出选项:按需求选择适当的分析结果存储位置。 双因素无重复试验方差分析 与单因素方差分析类似,在分析前需将试验数据按一定的格式输入工作表中。 数据输入完成以后,操作“工具-数据分析”,选择数据分析工具库中的“双因素无重复方差分析”,出现一个对话框,对话框的内容如下:(1)输入区域:选择数据所在区域,可以包含因素水平标志;(2)如果数据输入时选择了因素水平标志,请选择标志按钮;(3)显著性水平α:根据实际情况输入,一般选择0.05;(4)输出选项:按需要选择分析结果存储的位置。

可重复双因素分析:双因素可重复方差分析与双因素无重复方差分析数据输入的区别在于对重复试验数据的处理,就是将重复试验的数据叠加起来。 数据输入完成以后,操作“工具-数据分析”,选择数据分析工具库中的“双因素可重复方差分析”,出现一个对话框,对话框的内容基本与双因素无重复方差分析相同,区别在于每一样本的行数选项,在此输入重复试验的次数即可。若须对数据进行方差分析时,在输入区域选择数据所在区域及因素水平标志,在每一样本的行数处输入3,即每种组合重复3次试验,显著性水平选择0.05。在输出选项中可以按照需求选择分析结果储存的位置。选择确定以后分析结果。在工具菜单中均有现成的这3种分析工具。

5 非参数检验

Excel也没有提供非参数检验的分析工具,但可利用其提供的函数和公式可进行分析。如利用IF(指定要执行的逻辑检验函数)和COUNTIF( 条件函数 )进行编秩。利用=SUMIF(条件单元格求和函数 )计算正负秩和。=COUNT(个数函数)利用=ABS和=SQRT计算绝对值和z值。

6 相关回归

为了反映两个或多个变量之间的关系,描述相关关系的方向与密切程度,需采用相关分析;为了反映两个或多个变量之间的依存关系,建立回归方程,采用回归分析。先将数据输入工作表中,然后用Excel提供的函数可进行线性回归(linear regression)又称简单回归的分析和Spearman等级相关分析,用菜单中的“工具数据分析相关糸数可进行相关分析。用“工具数据分析协方差工具可进行协方差分析。用Excel的XY散点图工具可以进行散点图的绘制。

Excel是一种使用极方便的电子表格软件,它有强大的数据管理功能,不仅能够根据需要分类管理数据信息,能进行数据统计、筛选、排序、汇总、汇制图表等,还能利用其强大的函数功能以及分析工具库为建立复杂的统计或计量分析工作带来极大的方便。

篇12

中图分类号:TP311文献标识码:A文章编号:1009-3044(2010)08-1921-02

Analysis and Design of School Education and Teaching Evaluation System Database

PAN Guo-rong

(Changzhou Liu Guo-jun Higher Vocational and Technical School, Changzhou 213004, China)

Abstract: An evaluation database was designed based on the requriment analysis of the schooleducation and teaching evaluation system. It can realize themaintenance of the essential information, and the query and statistics of evaluation data. The needs analysis,conceptual design ,logical design etc. was disscussed in the entire design.

Key words: evaluation system; needs analysis; logical design; E-R diagram; relational model

学校教育教学情况测评是指学生对班主任教育情况及任课教师教学情况的评价,我校一直以来都非常重视学生对教师的评价。从1998学年开始,学校教务处会在每一学期的期中考试前或考试后,统一组织学生进行测评。最早采用的测评方式就是给每个学生发一张评价表格,测完后以班级为单位装订成册,供领导和教师查询,这种方式的主要缺点是查询不方便且无法统计分析;从2005学年开始,改为学生按评分规则填涂卡,教务处用读卡机读卡并统计,最后将所有测评情况汇总成册,供主要领导查阅,采用这种方式虽然能作一些统计,但统计方式单一、查询不方便,也耗费资源,班主任和众多任课教师很难及时、方便看到测评结果,尤其是学生对学校的意见、建议及评价信息。在学校加强信息化管理的大趋势下,学校于2008年初提出要开发一个基于计算机网络平台的学校教育教学情况测评系统(简称测评系统),以提高测评工作的效率,提升教学管理水平。

1 需求分析

需求分析是整个系统设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规范化和分析,这是最费时、最复杂的一步,但也是最重要的一步,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。

测评工作在我校已开展多年,本人对测评过程也比较了解,该项工作的主要负责部门是教务处。教务室工作人员提供了原先使用的测评评价表(见图1)及测评情况汇总表,明确提出了对测评系统的要求,通过分析,主要有以下几方面的要求:

1)学生能在校园网上登录系统,并且每个学生登录的用户名及密码是不同的;

2)学生测评时是不记名的,并且只能对本班班主任及任课教师进行测评;

3)测评的项目见图1测评评价表所示,这些项目和分值是相对固定的,即项目数不变,项目内容和分值在不同的测评中会有所调整;

4)学校领导及教师能在校园网上登录系统并查询测评数据;

5)测评数据可以用多种不同的方式汇总并查询。

2 业务流程分析

根据对测评的需求进行分析,可以得出测评系统主要的业务流程如图1所示。

由以上业务流程,可以清晰地划分出三大处理部分,首先,教务部门人员在测评前要对本次测评所需的基本数据进行准备,即要维护好参与测评的班级、班级的班主任、班级的科目及任课教师等相关信息;其次,组织学生对班主任及任课教师进行测评;最后,领导和教师对测评情况进行查询。

3 数据库的分析与设计

3.1 概念结构分析与设计

概念结构设计是整个数据库设计的关键,通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。测评系统数据库概念设计的表达工具采用E-R模型,基本过程如下:

1) 按照业务流程分析中划分出的三大处理部分,可以确定主要模块。

教师情况数据维护:对教师(包括班主任及任课教师)的基本信息进行维护;

课程情况数据维护:对课程的基本信息进行维护;

班级情况数据维护:对参与测评班级的基本信息进行维护;

班级科目数据维护:对参与测评班级的所授科目情况进行维护;

系统用户维护:对系统用户的基本信息进行维护;

学生对班主任的测评:学生对本班班主任的教育情况进行测评;

学生对任课教师的测评:学生对本班任课教师的教学情况进行测评。

2) 确定实体集。

在教师情况数据维护中实体集合有:教师;

在课程情况数据维护中实体集合有:课程;

在班级情况数据维护中实体集合有:班级,教师信息;

在班级科目数据维护中实体集合有:班级信息,课程信息,教师信息;

在用户情况数据维护中实体集合有:用户;

在学生对班主任的测评中实体集合有:学生信息,班级信息,教师信息,班主任测评信息;

在学生对任课教师的测评中实体集合有:学生信息,班级信息,课程信息,教师信息,任课教师测评信息。

3) 确定实体集之间的联系。

学生是属于班级的,教师与班级之间可能有两种不同的联系,一是教师担任班级的班主任,二是担任任课教师,一个班级开设有多门课程,每门课程可以有1位或几位任课教师,通过分析不同实体之间的联系,便于设计数据库完整性约束。

4) 确定实体和联系的属性。

按前面分析及系统要实现的功能,可以设计出各个实体及联系的属性。学生是一个比较特殊的实体,从理论分析看,学生是参与测评的主体,系统中应该有这个实体,而从测评系统具体实际出发,测评时只需记录一个学号,不需要学生姓名等其他信息,因此,系统中不设计这个实体。

5) 画出局部E-R图。

分别画出班级选择科目及测评的E-R图,如图2、图3所示。

6) 集成局部E-R模型。

形成全局E-R模型,如图4所示,其中系统用户实体未画出。

3.2 逻辑结构设计

逻辑结构设计的任务就是把概念结构设计阶段设计好的基本E-R图转换为与选用的具体机器上的DBMS产品所支持的数据模型相符合的逻辑结构,并对其进行优化。

1) 将实体与联系转化为表。

在概念结构设计阶段已画出全局E-R模型,现在只要利用范式理论,将实体和联系转化为关系型数据库管理系统中的表,将实体中的属性转化为表中的属性。测评系统所选用的DBMS为Microsoft SQL Server2000,一般可以利用SQL语言来实现数据库、表、属性等的创建,并完成所有表及表之间的实体完整性、参照完整性约束和用户自定义完整性约束。

2) 数据模型的调整与完善。

数据库逻辑设计的结果不是唯一的,可以根据应用需要对设计结构进行适当的修改和调整,以期进一步完善设计,提高应用系统的性能。本测评系统中,学生测评完毕后,领导和教师要频繁统计查询测评结果,因此在表中增加适当的冗余是必要的。

4 结束语

数据库设计是管理信息系统开发过程中非常重要的一个环节,在进行数据库设计时,应该准确了解用户需求,以便设计出符合实际需要的数据库。本人开发的基于Struts框架结构的测评系统已经在学校成功进行了4次测评,在最近的一次测评中,有90个班级近4300名学生参与了测评,同时在线参测学生达400人,查询统计非常及时方便,大大提高了教学管理的效率和水平。系统的实际运行证明,测评系统中数据库的设计是规范的,运行是稳定的、可靠的,完全满足系统的要求。

友情链接