时间:2024-02-27 14:40:12
引言:寻求写作上的突破?我们特意为您精选了12篇经济学数据分析范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
烟草使用的经济费用具有破坏陛,因烟草使用而引起的疾病和死亡曾一度是高经济收入国家中的主要问题,现在也已成为发展中国家日益增长的疾病负担,烟草使用已严重影响了人类健康和经济发展。烟草是世界上第二大死因,世界上每年与吸烟有关的疾病引起的死亡人数达490万人,尤其在低、中经济收入国家,生活着12亿烟民,如果不采取积极有效的控烟措施,未来50年人类将面临着巨大的健康危害。
我国政府于2003年11月10日签署了全球性的《烟草控制框架公约》,表明了中国对控烟工作的重视。戒烟竞赛是一个旨在通过奖励形式来促使大众戒烟的控烟活动,是中央补助地方烟草流行监测与控制干预项目内容之一。2008年由我国独立举办的中国戒烟大赛在全国31个省、市、自治区开展。广西壮族自治区爱卫办于2008年5-6月在南宁、柳州、桂林等地组织群众(大众)和医务人员报名参赛。群众涌跃参加,总人数达到10190人。为了顺利开展大赛取得理想的效果,按大赛要求于2008年12月进行了报名者戒烟半年的随访调查,并对半年随访数据进行分析与相关经济学特征探讨。
一、随访调查对象与方法
按照中国疾病预防控制中心控烟办公室的有关要求,半年随访表是按大赛要求采用简单随机抽样的方法进行,即用excel数据库中产生随机数字的函数"=rand()”抽取10%的登记报名者;如果被抽到的报名者联系不到,不得不更换时,则从未抽取的报名者中采用同法抽取新的报名者作为换样;对抽中报名者进行电话调查,并填写"2008年中国戒烟大赛半年随访表”。具体方法是,先将表格进行整理、剔除无效表,确保资料的真实、准确性;再采用Epi Data3.1统计软件进行数据录入和逻辑核查并建立数据库,然后利用SPSS13.0统计软件进行数据分析。
二、随访调查表数据分析
(一)大众参赛者随访调查基本情况
据参赛者“报名登记表”统计知:大众参赛者8830人中,平均年龄42.5+10.6岁,文化程度高中以上者占71.48%,每日吸烟量在半包(即10支)以上者占55 16%,超过10年以上烟龄者占54.18%,有52.10%的人尝试过戒烟;医务人员参赛者1360人中,每日吸烟量在10支以上者占35.59%,超过10年以上烟龄者占30.52%,有58.31%的人尝试过戒烟。
本次进行的参赛者戒烟半年的“随访调查表”中包含14项基本内容,通过统计,本次随访共访问大众参赛者944人,其中男性889人,女性55人;戒烟大赛前,随访人员平均吸烟15年:随访人员平均每天吸卷烟16.11支,雪茄0.038支,烟斗0,0625支;其他相关数据分析如下。
1 大众参赛者获得戒烟大赛信息来源
465人从广播或电视获得信息,553人从报纸或杂志获得信息,618人从宣传海报获得信息,371人从家庭成员获得信息,414人从朋友或同事获得信息,153人从医务人员获得信息,179人从疾控机构获得信息,110人从网站获得信息,119人从其他途径(社区、单位等)获得信息,由此表明大部分参赛人员都是从多种渠道获得了信息。对“在大赛期间你的家人、朋友、同事等是否打算戒烟但没在大赛中登记”这一调查选项回答“是”的有624人,回答“否”的有319人。说明本次戒烟大赛有一定的吸引力,以及广泛宣传控烟的意义及其有效性。
2 大众参赛者参加戒烟大赛的原因分类
344人希望通过大赛可能获奖,398人希望治疗疾病,779人希望预防疾病,15人是因为怀孕,138人是因为经济原因,335人是为了孩子,342人是因为吸烟不清洁,291人是因为其他人劝阻或施压,59人是因为其他原因。由此看出,大部分人参加戒烟大赛的原因是多方面的,但是因为经济原因的仅占14.62%,值得对此进行经济学探讨。
3 大众参赛者得到过的支持及采取过的措施
在大赛期间,864人得到家人的支持,667人得到朋友或同事的支持,263人得到医务人员的支持,104人得到戒烟热线咨询的支持,259人得到其他人的支持。戒烟时,330人通过戒烟药物,347人找医务人员咨询,121人找戒烟热线咨询,175人采取其他措施(自己控制、吃零食等)戒烟。由此表明戒烟方法的多样性,值得管理者对此进行思考。提出更有效的控烟措施。
4 大众随访者职业分布、学历构成和婚姻状况分析
(二)参赛人员半年随访结果综合分析
医务人员随访共访问137人,其中男性133人,女性4人。两类参赛人员主要情况分别描述于表4至表6。
三、戒烟效果评估与探析
本次调查方法严谨。项目全面,调查结果客观真实。能够基本反映被调查者在参赛半年后的戒烟情况,并且为下一步采取吸烟干预措施提供了有效的依据。
由表4可见,被抽中接受随访调查的944名大众参赛者认为戒烟大赛对戒烟“非常有帮助”和“有点帮助”两选项合计占95.23%;137名医务人员参赛者选此两项的占95.62%。由表5可见,大众参赛者在戒烟半年后“完全戒烟”和“仍旧吸,吸烟量比以前少”两项合计占91.73%:医务人员参赛者则为93.43%。这些实证研究表明,戒烟大赛(及其采取的相关干预措施)对戒烟有一定的效果,但仍需进一步跟踪调查和探讨。而由表6可见,所列的8项戒烟失败原因中,两类参赛者均认为排在前四位的是“周围有人吸烟”、“缺乏支持”、“紧张时吸烟”和“喝酒时吸烟”,应引起相关部门重视。
影响戒烟效果的因素是多方面的。首先是职业。文化层次较低的职业人群,其戒烟意识不强,而某些职业人群虽然文化层次较高,但由于工作紧张,或环境的影响(周围有人吸烟)等,戒烟信心不足,难以坚持,使戒烟成为泡影。其次通过本次随访调查,我们发现戒烟过程中有无得到他人帮助、得到谁的帮助、是否采用了特殊有效的戒烟方法,也同样影响着戒烟效果。因此,戒烟既需要自觉与自控,还需要全民动员与相关支持。
控烟是一项长期而艰巨的社会系统工程。戒烟竞赛活动只是控烟的一种形式,通过控烟教育虽然能使吸烟率有所下降,但离控烟目标仍差距甚远。因此,我们必须加大控烟健康教育的力度,提高吸烟者的认识和信心,从“不许吸”变为“我不吸”;另一方面要采取行政干预措施,联合社会群体组织,实行广泛的社会监督,健全控烟网络,建立高素质
的控烟监理队伍,严格执行《烟草专卖法》、《广告法》、《公共场所管理条例》等法规条例,争创无烟单位,强化控烟干预,将控烟措施落到实处,并持之以恒,方可收到实效。
四、与控烟相关的经济学特征探析
经济学基本原理认为:随着一种商品价格的上升,对该商品的需求数量将出现下降。香烟作为一种非必需品,如果涨价,对于经济收入较高者来说,可能影响不大;但对于低收入者,则促使其戒烟或减少烟草消费量。特别对青少年吸烟者影响更明显,可以减少对香烟的需求,有助于青少年远离香烟。由本次随访结果看出,大部分人是因为多种原因来参加戒烟大赛的,但是因为经济原因的仅占14.62%。这说明提高烟草价格来激励戒烟,也许是一种有效手段之一。值得进一步探讨。
提高烟价和烟税是控烟的有效措施且具有极高的成本效益。有的决策者简单地根据供给理论的“成本理论”认为:减少香烟销售会减少就业机会,提高香烟价格会增加香烟走私;这种观点忽略了“机会成本”的意义。例如,学者朱秀敏等提出,采取减少烟草供应的政策将不会在大多数国家造成就业机会的长期丧失,烟草供应量的减少并不意味着国家整体就业水平的降低。因为吸烟者曾用于香烟的钱将转而用于其他商品和服务,从而产生其他就业机会以弥补烟草行业的损失。即使少数几个依赖烟草经济的国家。其市场也大得足以确保在未来很多年内的就业机会。因此,提高香烟的价格、增加烟草税率,不影响政府财政收入,有利于经济发展,是减少烟草需求的有效措施且具有极高的成本效益。
在公共场所或工作场所实行禁烟,也符合成本效益原则,收益明显超过成本。有可能节省成本的方面包括有可能因吸烟造成的火灾危险及对公共财产和设施的破坏、清洁费用等。美国环境保护署的分析得出结论,该全国性的工作场所内禁止吸烟的法规是一个高度符合成本效益原则的社会投资,每年会有超过39-72个亿的收益。在有助于进行财政评估的资料中可看出,控烟在经济上的收益明显要超过成本。
烟草作为特殊经济作物。具有双重特征:烟草是特殊商品,烟草产业对于国家而言,不仅是一个生产部门,还是国家实现再分配的重要手段;同时,作为一种有害品和嗜好品,国家必须从国民健康的角度,通过财政和行政手段控烟。概括历史上各种控烟政策对不同群体的影响有所不同:税收政策通过提高烟草价格,减少需求;采取行政手段如不当则有可能导致税收收入减少;限制有害物含量,引导烟草产业绿色化才是我国应采取的长远策略。
国外研究发现(Colfins,1995),吸烟与社会经济地位(教育程度、职业、收入等)有一定的关系,指出吸烟越来越集中在社会经济地位低下的人群中,他们更易于吸烟且更难戒烟。我国的相关研究发现(本次随访调查也证实),目前吸烟现象较为严重且主要集中在社会经济地位低下的人群中,提示国家控烟战略与措施应有针对性的在这部分人群中开展。
一、引言
随着信息技术的发展,在经济管理中会出现越来越多的数据,如何挖掘这些庞大的数据,发现有用的信息已成为管理中迫切需要解决的问题。如在网上营销中,我们急需知道哪一类人需求某一种商品,从而使营销能够有的放矢,最大限度地扩大销售量。而《数据统计分析》正是讲述如何收集数据,整理数据,分析与解释数据,研究如何在浩瀚的数据中发现信息并指导我们的经营管理。因此《数据统计分析》成为财经学院的学科基础课,成为该类学校各专业的必修课。希望该门课程的讲授能够让学生掌握基本的统计分析方法,并能够运用这些统计方法解决实际问题。
笔者通过这几年对这门课的讲授与学生的交流,发现学生在学习这门课的过程中普遍存在如下几个问题。
第一,该门课程涉及深奥的概率知识与统计理论以及复杂的推导,学生普遍感觉该门课程的理论很难以掌握。
第二,虽然通过统计软件操作出结果,但对结果的解读不一定正确。
第三,学生普遍对这门课很有兴趣,但在学习过程中总感觉内容太多,学过易忘。
对于这些问题,作为教师该如何调整教学,使学生能够克服以上问题?本文从以下几个方面进行了教学改革,提高了教学质量,激发了学生兴趣。
二、《数据统计分析》教学内容调整
对于财经学院的学生来说,学习这门课以前,普遍学习了《高等数学》《线性代数与概率统计》,但学得不一定深,学生对于统计分析所要求的各种分布性质、矩阵与向量的计算等理论推导很头疼。因此,教师应该以“学以致用”为原则,坚持理论与实践相结合,理论适可而止,重点在于应用与实践。根据这些原则构建“基础理论-统计软件-实践教学”授课体系,首先浅显地讲述理论,然后在统计软件中进行操作,对得出的结果进行详细的分析,结合实际案例进一步加深对理论的理解以及结果的解读。因此教师在本课程教学中应以实践为主,可以开设为全实验课程。
授课内容的选取与教材有关。本课程选取了薛薇主编的《SPSS统计分析方法及应用》,该书是北京市高等教育精品教材。重点教授内容为与经济管理相关的数据文件建立、数据预处理、数据的描述统计、参数检验、非参数检验、回归分析、聚类分析、因子分析、信度分析和时间序列分析。与统计分析相关的统计软件有Matlab、SAS、SPSS、R、Eviews、STATISTICA等,而SPSS全部是界面式操作,对于不是计算机与统计相关专业的学生来说是最容易上手的。而且SPSS软件包含了统计分析方法的所有功能和强大的图形输出功能,可以输出简洁漂亮的y计分析图表。运用SPSS 软件,可以使理论概念变得直观、准确、具体、形象,将理论知识融入实践中来,增强学生对概念的理解和对数据处理方法的运用[1]。而在该教材中,对于SPSS操作讲解非常详尽,每种统计方法结合具体案例都有详细的讲解。
三、《数据统计分析》教学方法与手段革新
从以上分析可知,该门课程应用实践性很强。在教学中如何避免复杂的理论记忆而掌握各种统计方法,并能学以致用呢?本文从以下几个方面进行阐述。
(一)运用以“统计思想”为中心的“黑箱”教学方法
什么是统计思想?统计思想是关于“为何统计,统计什么,如何统计”的思想,就是关于统计的世界观和方法论[2]。《数据统计分析》有很多统计方法,每种统计方法都有复杂的统计理论及推导。对于经济管理类学生来说,掌握所有的理论推导有一定的难度,但可以理解相应的统计思想。在统计教育中,掌握了统计思想,就慢慢培养了看问题的统计思维方式和思维习惯,统计思想教育应重于统计方法教育[3]。因此,教师在教学中应使每种统计方法的理论讲解浅显易懂,重点讲清楚统计思想。所谓“黑箱”教学方法就是从综合的角度提供了一条人们认识事物的重要途径,尤其对某些内部结构比较复杂的系统,它是从系统的观点出发,强调在整体与部分之间、整体与周围环境的相互联系中认识事物,而不去深究其内部结构和局部细节[4]。所以教师在统计理论的讲解中,应把学生从复杂的统计理论与推导中解脱出来,把这些当作“黑箱”,只需在学生头脑中建立起某种统计方法的统计思想,然后随着授课进度的深入,结合具体的案例再讲解这些理论与方法。例如对于非参数统计,可以借助已学过的参数检验,讲解非参数统计的统计思想也是“提出假设-建立统计量-计算概率-是否拒绝原假设”,只是参数检验是在数据符合正态分布的条件下,推断检验数据的均值与标准差是否相等,而非参数检验是小样本统计推断下,判断各数据是否来自同一分布。学生理解非参数统计思想后,再打开“黑箱子”,阐明非参数检验各种情况下统计量的来源及计算方法。
(二)以“案例”为导向讲述统计的理论与方法
《数据统计分析》这门课理论复杂,只有与实践相结合,统计的理论与方法才能被学生充分理解和接受。案例教学是一种通过模拟或者重现现实生活中的一些场景,让学生把自己纳入案例场景中,通过讨论或者研讨的方式来进行学习的教学方法[5]。学生在教师的指导下,对案例进行思考,分析与讨论,从而在案例中掌握所授课的内容。例如讲述“因子分析时”,可以先阐述因子分析的统计思想就是降维以及相关的适用条件、因子的抽取、因子的命名解释等,然后以某一行业上市公司的盈利能力指标为例让学生进行因子分析。在案例讨论分析时,教师首先引导学生分析数据是否适用于因子分析,然后让学生考虑应该抽取几个因子,每一个因子包含哪些盈利指标,每一个公司在新因子的得分情况如何,最后让学生分析如何对所有公司的盈利能力进行综合排名。在这样一个案例讨论中,通过教师循序渐进的引导,学生不断加深对该方法的理解,而且对一些晦涩的概念如方差贡献率、载荷矩阵、因子得分等有了感性认识,增强了学习兴趣。
(三)加强学生上机实验的体验式教学模式
所谓体验式教学模式,主要是组织体验和引导反思,让学生在经历和实践中实现自我领悟,在反思中重构自己的经验,形成自己的行动策略和方式,从而习得相关知识[6]。为了使学生掌握相关的统计知识,可以让学生亲身运用SPSS体验某种统计分析方法。这样教授每部分内容时,必须准备好相应的实验指导书与实验报告。在实验指导书中简单阐述相P的理论、实验内容以及相关的SPSS操作步骤与结果。学生根据实验指导书完成实验报告中的新内容,并撰写实验分析报告,实验报告主要是实验结果以及对结果用规范的统计语言进行描述,分析与解释。学生做完实验报告后,教师根据实验情况进行讲解与分析,验证实验结果。每部分授课内容通过这样的体验式教学,学生就会懂得相关的统计分析方法、操作与结果分析,达到教学目的。
(四)充分利用信息技术,构筑立体化教学模式
对于该门课程,教师在课堂教学中可以充分利用多媒体技术制作一些动画与视频,吸引学生的兴趣。课堂教学以外,可以构建该课程的网络教学平台,提供上课视频、课件、实验指导书、实验报告等,让学生可以对课堂内容进行复习和自主学习。对于该课程的拓展及补充内容,制作一些微课,进一步拓宽学生的知识视野,提高学生的自主学习能力;还可以开设网上答疑和学习讨论空间,对学生提供在线答疑。
四、《数据统计分析》考核方式改革
在每门课程中,学生最关心的是考试,但一次理论考试根本不足以评价学生的学习情况。该门课程又是一门实践性较强的课程,因此应改革考核方式,变为如下图的综合考核体系。
在该门课程考核中,根据课堂表现和实验报告考核学生上课情况。在教学中把教学内容分为两部分进行阶段化理论考核:第一部分包括数据预处理、基本描述性统计、统计推断;第二部分包括相关分析、线性回归分析、聚类分析、因子分析、时间序列分析等。对于期末大作业,让学生收集感兴趣的三套数据,运用学过的方法进行分析与评价,这样可以充分考核学生对已学知识的实践应用能力。在这样一个综合考核体系中,学生在每部分阶段考核中,为了通过考核,必然会对这部分内容进行复习,而不是累积到期末再复习,这样就不会感觉要学的内容繁杂,学了后面忘前面。该评价体系不仅考核了学生是否掌握理论知识,而且进一步考核了学生应用知识的能力,从而提高了学生的分析能力。
五、结束语
综上所述,《数据统计分析》是一门应用性很强的课程,随着信息技术的发展,它在经济管理中的应用越来越广泛,这门课会在更多专业开设。作为这门课的教师,应该根据时代的要求,不断调整教学内容,创新教学方法与手段,改革考核方式,提高教学质量,增强学生的学习兴趣。
【参考文献】
[1]刘凤艳.SPSS 软件在多元统计分析课程教学中的应用杂谈[J].赤峰学院学报(自然科学版), 2016(03):255-256.
[2]李金昌.关于统计思想若干问题的探讨[J], 统计研究,2006(03): 31-38.
[3]马艳梅,汪冬华.经济管理类专业多元统计分析教学探讨[J].教学研究, 2013 (05):79-82.
中图分类号:TP3 文献标志码:A
大数据,作为当今最热门的关键词,已在各行各业中掀起变革的巨浪。在教育领域中,同样蕴藏着具有应用价值的海量数据。荷兰著名的行为观察软件商NOLDUS公司的研究表明,在一节40分钟的普通中学课堂里,一个学生所产生的全息数据约有5-6GB,而其中可归类、标签、并且进行分析的量化数据约有50-60MB,这相当于在传统数据领域中积累5万年的数据量总和。[1]那么,如何有效挖掘、分析和利用这些数据来更好地改进教学?学习分析技术给出了很好的答案。美国新媒体联盟(NMC)与美国高校教育信息化协会(EDUCAUSE)的《2013年地平线报告(高教版)》预测:学习分析技术将在未来的两到三年内成为主流技术,并得到广泛的应用。[2]
一、学习分析技术的内涵
学习分析技术是一个新兴的研究领域,旨在应用数据分析为教育系统的各级决策提供参考,关键内容就是应用于教育领域的大数据分析。这一研究方法原先来自于商业领域,商家通过对消费者的活动进行数据发掘分析来把握消费趋势。比如淘宝网会根据用户购买和浏览过的产品,来推断用户对某类产品的偏好。又如在社交网站中,新浪微博会根据个人的关注对象推荐该用户可能感兴趣的其他对象。这类技术的实质,就是通过对数据的提取、归类、分析与总结,进行统计性的预测和判断。
基于学生相关数据的分析则是以学生群体为主体,以设计出更完善的教学方法为目标,致力于为学生提供高质量、个性化的学习体验,并评估制定的学习计划是否能有效帮助学生加强学习,这些分析结果对于教学双方来说都具有重要的意义。对教育工作者和研究人员而言,学习分析在剖析学生与在线文本、课件之间的互动中发挥着至关重要的作用。对学生而言,通过开发用于分析学生具体数据的移动软件和在线平台,能够为学生提供符合他们学习需求的支持服务系统,使他们受益于学习分析,提高学习成绩和学习效率。
二、学习分析技术的分析方法
学习分析技术除了传统的数据分析方法外,充分吸收了大数据时代下各个领域的新技术,包括社会网络分析法、话语分析法和内容分析法。这些新技术的引入,使得学习分析逐渐科学化、现代化和智能化。
社会网络分析法(Social Network Analysis)原先是一种社会学研究方法,它是对社会网络的关系结构及其属性加以分析的一套规范和方法,现已广泛运用于教育领域。如果将学习者个体作为研究对象,通过社会网络分析法,我们不难判断学习者个体向哪些同伴寻求了学习帮助,在哪些方面产生了学习认知上的困难,又有哪些具体的情境因素影响了学习者个体的学习过程等。如果将整个网络作为研究对象,社会网络分析法主要关注的是网络学习过程中信息的分布和个体学习的进展情况。
话语分析法(Discourse Analysis)原先是一种语言学研究方法,是在课堂对话基础上建立的口语分析方法,经过不断发展引入到教育领域,在课堂教学实践中得到了广泛应用。在大数据时代下,话语分析的对象不仅仅只是教学过程中面对面的对话内容,还涉及网络课程与会议中产生的文本内容,以及网络背景下的异步交流内容等。通过话语分析技术,我们可以对网上学习交流过程中话语的文本性含义有更深入的了解,从而探究知识建构的本质,对整个学习发生的过程获得更加清晰的认识。
内容分析法(Content Analysis)是一种对传播内容进行客观、系统和定量描述的研究方法。内容分析的过程是一个层层推理的过程,其实质是对传播内容所含信息量及其变化的分析,即由表征的有意义的词句推断出准确意义的过程。[3]在教育领域中运用内容分析法,不仅可以对学习者的学习过程数据进行定量分析,探寻学习者的行为模式;还可对其进行定性分析,运用积累的大量经验来预测当前的学习者行为,为学习者提供个性化的学习资源服务。
三、学习分析技术的模型
笔者根据学习分析技术的决策流程,构建了一个基本的模型(如图1所示)。
1.数据的收集
学习分析技术需要大量数据作为支撑,仅仅依靠结构化数据是远远不够的,必须同时收集不同系统中的非结构化数据,保障分析结果的正确性、一致性和完整性。
目前,教育系统中已经积累了大量的学生信息。信息系统中的学生信息、课程信息和教师信息这些档案类信息都可以作为学习分析的数据来源之一;课程管理系统(CMS)和学习管理系统(LMS)中也蕴藏着大量可以挖掘的信息,包括课程中的交互信息(与老师或学生的交流等)、学习表现信息(作业完成情况等)以及行为信息等;同时,基于教师经验、教师观察以及教师直觉的课程指导方针也是形成决策树分析的必不可少的部分。
2.数据的处理
结构化数据的考量很难反映一个学生在一堂课中吸收了多少知识,但是通过其在系统中的行为反应可以转化为可量化的数据来对其学习过程进行分析。比如在在线课程中,可通过多个方面检测学生的表现:比如与同班同学相比,在网站上花费的时间;登录网站的频率;犯了同样错误后重复犯错的概率;在某一科目停留的时间等等。通过综合分析这些数据,可以对学生的学习行为有更深入的了解,从而更加微观地了解学生。
3.软件分析
学习分析软件按照专业程度来分,可分为专用工具和通用工具两种。“专用工具”一般是学习分析项目中的核心分析工具,它专门针对某一项目的具体要求进行设计和开发,在项目实施过程中运用该工具搜集和分析学习者数据,从而指导教学。典型的专用工具有Socrato、SNAPP和 LOCO-Analyst等。而“通用工具”则是原来应用于互联网、可用性设计等其他领域的工具,后来被转用于教育情境下,用来分析学习者如何使用教学系统,主要有Mixpanel Analytics、Userfly、Gephi 等几种。[4]
4.行为干预
学习分析结果可用来评估学生表现,并及时提供反馈意见,同时还可根据学生的学习效果,有针对性地调整学习内容和方法,为学生提供指导和帮助,提高学生的学习能力。
四、学习分析技术所带来的教学变革
1.个性化教学的变革
学习分析技术的运用可以为每个学生提供一个个性化的学习环境。例如,如果一个学生解决一个问题所花费的时间远少于其他同学,系统分析结果就会自动给予提示与线索,试图促进该学生加强学习。这种即时性的提示在过去是不可能完成的任务,学生至少要等待多天,直到他们的作业被批改完。同时,在使用学习分析技术一段时间后,教师能够通过信息追踪和分析,判断自己的教学方法是否有效,从而进行相应的调整。因此,每个学生都能各自拥有一套为他们量身定制的个性化学习课程。
国内外大学中,较早应用学习分析的案例之一是美国普渡大学的“信号项目”。该项目于2007年启动,将数据从学生信息系统、课程管理系统和课程成绩单中提取出来,按照学习表现分类,从而对那些极有可能不及格或辍学的学生有针对性地提供服务。美国奥兰治县的马鞍峰社区学院通过它的“高等教育个性化服务助理”或叫SHERPA(Service-Oriented Higher Education Recommendation Personalization Assistant)系统,运用学生数据成功实施了个性化教育。该软件为每个学生建立详细档案,记录了其完整的在校期间的日程信息、跟随导师学习的经历以及其它个人信息;接着对这些信息进行分析,提出对时间管理、课程选择的建议,以及分析其它有助于学生在学业上获得成功的要素。
2.教师角色的变革
学习分析技术的运用将使教师不再仅仅是一个“教师”,同时承担了分析师的角色。传统意义上的教学主要是经验式的,教师凭借自己的主观判断来选择教授课程的内容和方式,然后通过一次次的反复实践来进行验证。而大数据时代下的学习分析技术有助于教师从这种传统的教学模式中解放出来,教师所做的决策将不再是纯粹的经验式判断,而是建立在数据分析的基础上。
美国教育发展中心(Education Development Center)和学生与技术中心(Center for Children and Technology)对如何利用数据帮助美国纽约市公立学校的教师进行教学决策开展了研究实践。他们与一家公司合作,对学生在数学学习过程中的数据进行了记录与分析,最后生成了可供教师分析的书面报告和网络报告。书面报告为教师提供了标准的全班学生学习情况的报告,为教师根据学生的需求分组、关注学生的个体特点等提供了依据。网络报告则为学校不同层次的员工提供不同层次的信息和重点。
五、结束语
大数据时代的来临,强有力地推动着教育信息化发展的浪潮。通过学习分析技术,使教学实践从关注宏观群体走向关注微观个体,并使教育个性化服务成为可能。但是,学习分析技术作为一种新兴技术,也面临着诸多挑战,距离其大规模运用可能还有较长的路要走,需要广大研究者深入研究,进一步开拓该技术的服务对象和应用场景,真正发挥大数据背景下学习分析技术的作用。
参考文献:
[1]张韫.大数据改变教育――写在大数据元年来临之际[J].上海教育, 2013(10).
数学模型以及数序建模,是在以数据为主导的领域中应用最为广泛的数学内容,也是其发挥效果最好的领域。其中,为了能够更好的进行数据预算以及数学计算,在很大程度上需要针对应用领域进行模型的搭建,从而设计符合其领域内的数学计量模型。在经济领域中,应用数学计量数据模型的概率是非常高的,而且也需要不同形式以及不同功能的数据模型纪念性经济数据的计量。在不同的经济领域中,由于需要进行产出比以及数据的未来预测。因此,针对经济领域的数学计量数据模型的应用就更加广泛。本文以不同经济领域的数据模式进行举例分析,以此来分析如何更好的运用数据计量数据模型。
一、经济领域进行数据模型的应用需求分析
经济领域中,由于其覆盖的方向比较广泛,因此对于不同的经济领域而言,其设计的经济数据也会存在一定的差异性。那么,对于经济领域而言,数据在一定程度上能够反映该领域的发展状况以及产出比等重要数据。数据是经济的命脉,也是经济的方向。通过数据的呈现和分析,能够非常清晰的了解目前经济领域的发展状况以及未来的发展方向。也就是说,通常情况下,通过分析经济领域的数据,不仅仅能够掌握目前该领域的经济状况,更能够对未来的经济发展状况进行预测。因此,采用数据模型就现代非常重要。那么,对于经济领域而言,其进行数据模型的应用有哪些需求呢?
首先,针对不用经济领域进行分类,从而匹配与之对应的数学模型。由于经济领域是复杂并且多变的,而且经济形式也非常繁多。因此,对于经济领域一定要进行分类和划分,例如可以针对经济领域按照生产型以及虚拟型经济领域进行划分,那么针对生产型经济领域,就需要有针对性的进行数据统计以及数学模型的应用,而虚拟经济领域则更加依托虚拟数据的估算以及预测等。
其次,针对性的进行数据模型的设计;数据模型的设计需要从数学建模的思想中进行提取,从而根据实际的经济领域进行模型的建立。数据模型中,需要设置数据输入的端口,并且需要有输出的预算和测算。这在很多生产型经济领域中有着非常广泛的应用。此外,对于数据的预测是非常重要的,在经济领域中,一般都需要针对该领域进行产出比以及经济效益的预测,从而确保未来经济发展的稳定性。
最后,经济计量数据模型的需求更为广泛也更加实际;在数据估测过程中,需要针对经济数据进行模型评估,从而进行模型设计。对于计量数据的模型搭建,具备数据的基础需求分析,并且根据高等数学的概率论内容进行概率估算,从而针对经济领域的实际情况,进行经济计量数据模型的设计。
二、经济领域中数学计量数据模型的应用分析
样本分析,数据统计,数据评估是经济领域中非常重要的三个内容。那么,对于针对经济领域进行的数学计量数据模型的应用,也需要这三部分的内容进行搭建,从而设计针对不同经济领域的数学计量数据模型。因此,在应用方面,数学计量数据模型的作用也将从以上三个方面进行体现。根据不同的经济领域,数学计量数据模型的模型设计会有所不同,但是其设计理念与设计思想是可以并轨的。
第一,基于样本分析的数学计量数据模型应用;样本分析是根据经济领域中的以往数据或者是估算数据进行数据分析,针对经验数据的一种预测和估算方式。搭建数学计量数据模型的同时,主要依赖经验数据进行现有数据的预测。因此,基于样本分析的数学计量数据模型重点研究的内容是市场预测。也即是说,在未投身某一行业之中的时候,如何根据经验数据来预测行业风险以及经济效益。
第二,基于数据统计的数学计量数据模型应用;数据统计是某行业的经济发展已经达到一定的规模,但是每年或者每季度都需要进行经济评估,通过评估数据来确定该行业发展状况是否正常,是否有潜在的危机和现有的漏洞问题。基于数据统计的数学计量数据模型的应用重点在于分析当前的经济发展状况,是为了保证现有经济环境的健康和稳定性发展而进行的一种数学计量数据模型的应用。
第三,基于数据评估的数学计量数据模型应用;数据评估是对未来走向的一种经济预测。其中,对于经济领域的未来发展,通过建立数据评估的数学计量数据模型,可以根据经验数据和现有数据,进行未来经济数据的估算,通过这些估算数据可以充分的展现未来该经济领域的发展情况,是否有必要进行扩大化的发展。因此,这些数据的形成,都是在一定程度上反应该经济领域的发展状况以及未来的发展潜力。
总之,数学计量数据模型实际上可以针对经济领域的现有情况,以及未来的经济数据估算,来对某经济领域进行全方面的数据分析,从而通过数据的科学性来理性的进行经营和发展,从而实现经济的稳步发展。但是,重点在于如何能够将这些数据进行科学化的统计和估算,从而保证预测的准确性。
三、结语
通过对数学计量数据模型的分析,针对某一经济领域的数据测算等,这些数据的呈现,是通过长期的统计和计算得到的。而利用数学计量数据模型的作用,则是为了能够更加科学的进行预测和测算,从而对现有经济情况以及未来的发展等关键性因素进行分析和实践,从而保证在经济领域内的长远发展问题。总之,数学计量数据模型的应用,可以提高经济领域内的科学标准与价值,在稳步发展以及科学发展的进程中,起到至关重要的作用。
参考文献
[1]顾慰文,蔡福春,吴定华.宏观计量经济模型中变系数问题探讨[J].数量经济技术经济研究,1986(02):29-35.
在线学习系统中包含了大量与学习者学习行为相关的数据,例如,学习日志、学习途径、学习成果数据、课程数据、学习管理数据等。充分集中整合这些大数据,再对学习过程和学习效果进行评价分析,更有效地支持学习,优化教学服务,为教学管理与决策提供依据已成为远程教育工作者面临的重大课题。
一、目前远程教育存在的问题
远程教育中学生可以随时随地利用网络进行课程学习,不受时间和空间的限制,但同时也存在一些问题,例如:
1.评价数据单一化。
教师通常采用总结性评价对学习者的学习过程进行评价,如利用课后作业、论文、测验、出勤情况等评价数据。
2.评价方法静态化
目前评价方法采集的数据是静态的,缺乏对学习过程进行实时监测,不能实现动态的反馈,不能准确反映学习者的参与程度。
3.评价的真实性难以把握
对于一些视频课程的学习,很难判断出学习者是认真参与学习还是开着视频人却离开,而对于课后测验与作业是否独立完成也很难保证。
利用上述方法考核、分析和评估远程教育,教师既不能实时把握学习者真实的学习情况,也无法确定学生个体的学习方式、认知习惯和学习兴趣。学生也无法对自身学习效果有一个客观而明晰的认识,不能较好地制订下一步的学习计划。
二、学习分析的特征
学习分析技术是运用数据挖掘、信息可视化等智能技术来分析学习系统产生的数据,并利用分析结果提供恰当的干预、评估,其主要目的是优化学习过程,促进学习。学习分析技术具有以下特征:
1.复合化的数据采集
多样化的数据为自动化的学习支持和针对性的学习服务提供了可能性。学习分析技术采集的数据来源:一是由学习管理系统、移动终端、社会性软件中所记录的学生的学习行为数据;二是内容管理系统中的学习记录数据;三是学生学习成果数据,如作业、作品。这些不同来源的多样性数据通过第三方分析软件整合并导入到同一个分析框架中,就可得出学生学习情况的分析结果。
2.多角度的分析技术
要进行有效的分析,必须使用多种研究方法、技术与工具。学习分析技术应从网络交互、交流内容、交互内容等多个角度展开,并对数据进行挖掘、聚合、分析,结合定量研究与定性研究的数据为学习提供支持。
3.可视化的分析结果
通过可视化分析结果,使学生对学习状况、教师对教学情况有直观地了解,并作出有效的判断和分析。
4.多层次的服务对象
学习分析技术从教师、学生以及管理者的角度对学生的学习过程进行客观的预测,方便教师优化教学,改进过程评价手段,帮助学生进行自我评价、自我诊断,给教育机构和管理者提供决策依据。
三、基于学习分析技术的远程学习系统模型
学习分析技术利用数据分析探究学习过程的发生机制,改进学习,这一过程包含了数据的选择、获取、综合与报告、预测、使用、完善和分享等活动。因此需要基于学习分析技术初步规划学习系统运行的步骤。第一步,学习者结合自身兴趣和系统推荐,选取学习内容;第二步,系统记录下学生者产生的学习数据,结构先定义好再存入数据库;第三步,对预测模块进行分析,在采集学习者行为数据的基础上,与学习者的特征信息相结合,利用分析工具及模型对预测模块进行分析;第四步,在参照上一步预测模块预测结果的基础上,利用数据挖掘技术为学生推荐适合学生学习特征的学习策略及指导方法;第五步,可以利用可视化的形式将上述数据挖掘结果、分析结果传递给学生、教师和教学管理者。
该学习系统包含六大模块:(1)学习的内容。管理、维护、传递个性化的学习内容与评价给学习者,以支持学习者的学习行为。(2)学习行为数据。记录学习者在学习系统中的学习行为(比如学习时间、学习次数、学习路径、学习进度等)。(3)分析预测模块。这是整个模型的核心,整合学习者信息系统中的数据和学习者学习行为数据,通过多种技术(语义分析、社会网络分析)对数据处理和分析,对学习者未来的学习行为和结果进行预测。(4)可视化面板。根据用户角色的不同,将预测模块中的结果以可视化、图形化的方式呈现。(5)推荐模块。根据分析预测模块的运行结果,再根据学习者的学习水平和兴趣,对学习内容等进行个性化的定制和推送。(6)干预模块。允许教师、教学管理者和系统开发人员根据预测模块的运行结果,对系统实施人工干预、自动化干预。
基于学习分析的远程学习系统模型能够及时量化跟踪学习过程,提出较好的学习建议,并以可视化的形式呈现给学生和老师,帮助他们更加清楚地了解自己学习的变化过程,帮助学生更好地认知自己的学习状态,激发学习者的学习兴趣和学习激情。
模型利用采集到的学生学习兴趣发展的数据,了解学习者状态,包括学习者已掌握的相关知识、学习习惯等;建立合理的学习者分析模式与数据分析框架,从简单的资源推送逐步完善为提供基于大数据分析的适时、贴切的个性化指导,帮助学生完善知识结构,挖掘自身兴趣爱好和特长。整个学习过程既实现了学习者的自制学习和自我学习,以及教师个性化干预指导,又实现了系统根据用户特征适应性推送资源辅助学习者学习的目的。
中图分类号:G250.76
1 数据库资源评估概述
1.1 商业数据库是数字资源的重要组成部分。经管学科商业数据库资源是高校图书馆重要的数字馆藏。其评估包括买前质量比较评价和用户进行买后服务绩效评估两部分,一方面是对数据库资源质量的评价,注重其自身的学术性和权威性价值,另一方面是对数据库资源服务绩效的评估,其重点在于数据库的利用率、服务质量和管理成本等使用效果。
1.2 数字馆藏绩效评估的相关国际和国家标准。有关数字资源馆藏使用及评估的标准主要有ISO11620信息与文献-图书馆绩效指标、ISO2789信息与文献-国际图书馆统计数据和NISO Z39.7图书馆统计标准。这三个指标是国内外相关研究的主要体系依据。
1.3 国内外数据库资源评估指标体系分析。建立数字资源评估指标体系是数字资源评估工作的核心。目前国外比较有代表性的数据库资源评估研究项目主要包括美国ARLE-Metrics、英国项目COUNTER、欧洲项目EQUINOX、美国项目CALILEO、英国项目MIEI 2以及北大图书馆肖珑的评估指标。比较而言,ARL E-Metrics、MIEI 2、肖珑侧重于资源质量的评估;EQUINOX注重数据库服务绩效指标的评估;而COUNTER项目的研究重点在于数据在线传递交流的使用和获取统计。对于数据库的学术性、数据来源的权威性、学科性和学科覆盖率等指标很少明确涉及。
1.4 评估方式和测度方法
国内图书馆界对数据库资源的评价大体上有两种方式:一种是个案式比较研究,另一种提出更具一般意义的评价方法和指标。具体的评估方法包括以下类型:(1)定性方法、定量方法,(2)第三方评估、用户评估,(3)用户满意度调查法。
2 建立经济管理学科商业数据库评估指标体系
2.1 必要性:(1)符合高校图书馆馆藏结构学科性和发展政策的需要,有利于优化资源体系,为管理决策提供依据。(2)解决海量商业数据库规模与有限图书馆经费之间的矛盾,实现馆藏资源建设效益最大化。(3)网络化环境下用户研究、文献需求研究的新课题使图书馆研究领域进一步深化和拓展。
2.2 明确评估目标。高校图书馆学科数据库资源具有专业性较强、二次资源比例较高、学科细分程度高等特点。其建设以高校经济管理学专业设置和重点学科发展为主要体系框架,并在此基础上建立起图书馆专业数据库资源体系。
2.3 评估指标的选取原则:(1)学科针对性和代表性原则;(2)指标可获取性与通用可比性原则;(3)保证评估的客观性原则;(4)指标的规范性和标准性原则;(5)运用科学方法体现理论与实践相结合的科学性原则;(6)评价指标和体系的全面性与系统优化原则。
2.4 确定商业数据库评估方式。将商业数据库评价指标体系的研究和同类数据库的比较分析研究作为我们的测度内容,在吸收和筛选国际常规估评标准和指标的基础上,增加符合本馆学科资源属性的新指标,采用定性分析或定量评价相结合的研究方法,将图书馆评估、第三方评估、数据库公司评估和用户评估相结合。用户满意度调查部分以读者试卷调查、智力竞赛和读者意见邮件电话反馈为主要方式。
2.5 经济管理学科数字资源综合评估指标及其体系:
图1
框架指标――图书馆评估指标:数据库质量评估
――用户评估指标:数据库服务绩效评估
具体评估指标:(1)学校专业设置和学科建设需求;(2)数据库资源和数据来源的准确性、权威性;(3)数据库信息量和经济数据的绝对数量值、内容涵盖的全面性;(4)数据提供和传递方式与系统平台的访问方式;(5)数据库信息和数据检索的多维性和计量工具的应用;(6)数据库信息和数据的不可替代性和内容的重复性;(7)售后和升级服务质量;(8)数据库定价的合理性和产品性价比;(9)开放的数据信息定制和自定义统计功能;(10)用户满意度。
3 案例:中山大学图书馆经济与管理学科分馆商业数据库评估
3.1 经济预测、分析报告数据库比较分析:中经专网、国研网数据库和锐思数据库。经济预测、分析报告数据库最重要的评估指标是:数据量的全面性、数据来源和升级服务。
3.2 经济统计数据库比较分析:中经网统计数据库、国研网统计数据库、锐思数据库。经济统计数据库最重要的评估指标是:数据来源的权威性准确性、数据传递方式、数据量和全面性、售后升级服务。
3.3 金融分析专业数据库比较分析:WIND、CSMAR和CCER。金融分析专业数据库最重要的评估指标是:数据检索的多维和计量工具、数据来源的准确权威性、数据传递和获取方式与访问平台、用户点满意度、数据量和全面性。尤其是数据库内容本身的可定制性和灵活获取方式,在泛在环境下尤其重要。
3.4 世界经济统计指标数据库(外文)比较分析:BVD系列数据库和IMF数据库。世界经济统计指标数据库(外文)最重要的评估指标是:数据检索的多维和计量工具、数据来源的准确权威性、数据传递和获取方式与访问平台、用户点满意度、数据量和全面性、不可替代和内容重复率。
4 结束语
(1)“数据库的高校重点学科专业设置和学科建设需求”、“数据库资源和数据来源的准确性、权威性”、“数据库信息和数据的不可替代性和内容的重复性”等指标是重要的个性化评估指标。(2)由于经济学和管理科学所具有的数理和计量功能,“数据库信息和数据检索的多维性和计量工具的应用(回归分析、表图自动生成工具等)”、“数据库信息量和经济数据的绝对数量值”、“内容涵盖的全面性(包括大量的宏微观、行业和区域经济数据)”、“数据提供和传递方式与系统平台的访问方式(同步EXCEL表单文件获取)”等指标是不可或缺的学科专业性评估指标。(3)“售后和升级服务质量”、“数据库定价的合理性和产品性价比”、“开放的自定义统计功能”、“用户满意度”是经济管理学科数据库必须的基础质量和绩效评估指标。
参考文献:
[1]张咏.网络信息资源评价方法[J].图书情报工作,2002(10):41-47+61.
[2]肖珑,张宇红.电子资源评价指标体系的建立初探[J].大学图书馆学报,2002(03):35-37.
教学资源与管理人员短缺,使得学院管理落后,阻碍了高职院校发展。高职院校学生管理面临着巨大的工作压力,生源质量逐年下降,传统的学生管理模式和当前高职院校的实际需要不相符。在这种情况下,高职院校学生管理面临着大数据带来的新形式与新技术,不断推进高职院校学生管理的信息化构建,这是学生管理工作者不容忽视的一个方面。
一、高职院校学生管理工作信息化存在的问题
1.1大数据管理体系缺少完整性、统一性与有效性
高职院校没有对应的大数据职能管理部门,其数据管理体系缺少完整性,使得传统的数据管理模式与高职院校现阶段的大数据管理工作不相符。此外,分散的信息处理使得学生管理者低效劳动,导致学生的大量混乱,部门间具有较差的数据一致性,对高职院校信息的准确性构成较大影响,不利大数据的管理工作的开展,要构建大数据管理体系并不容易。
1.2学生管理工作者信息化意识弱,无法发挥大数据技术作用
管理者不愿将更多的时间用在学习信息化功能上,使得信息化管理效率不高。高职院校现有的技术仅能处理部分相似的信息数据,无法现代化地收集及分析大数据,数据分析技术未切实应用,无法支持高职院校管理决策,缺少大数据挖掘、分析的专业人才,大数据的开发利用有助于学生管理工作,由于缺少分析人才,所以无法体现数据价值。这是现阶段许多高职院校存在的问题。
1.3信息化程度低,数据挖掘与处理难度大且效率不高
尽管高职院校有一部分工作流程实现了办公自动化,但缺少系统的顶层设计,系统间的信息交互差。很多高职院校在管理方式上还是使用一般文件夹存放文档数据,使得文件夹较多地存储在电脑设备上,存放路径无一定规律,使用效率不高。学生管理产生了许多学生的数据,半结构化数据的挖掘与处理还不成熟,使得高职院校学生管理系统化程度低与决策支撑力度低。
二、基于大数据背景的高职院校学生管理信息化构建的策略
2.1转变思维,重视大数据体系构建
构建专员管理制度,依照各职能部门把全院所有数据分配至个人,安排专员统一录入数据,编制有关数据管理规范,合理规范信息的收集与使用,确保数据及时、有效。数据整合是一项艰巨的任务,高职院校寻求变革,转化大数据结论,于同类院校中突出优势。高职院校部门的决策者革新思维,高度重视大数据。
2.2提升学生管理工作者队伍的信息化素养与技能水平
学院需要着力提升学生管理工作者的信息化意识,让他们熟练地操作管理信息化系统,搞好学生思想教育工作,有效管理学生常规事物,实时了解学生思想,基于信息化工作经验,探究信息化工作模式。以各种形式强化学生管理者间的沟通,把学生管理系统的工作经验分享给大家,提升信息分析能力与处理能力,逐步提升管理者队伍的信息素养。着重通过大数据技术引导学生管理工作理念的开展,利用各种形式于无形中让学生熟悉并使用大数据管理平台。在大数据背景下,高职院校学生管理者实际践行,转变思维,结合具体工作,不断进步,提高学生管理水平,大数据人才需要熟练掌握大数据所有技术,分析大数据结论,深入探究院校各部门间关联性[1]。按照大数据结论,确保操作操作与评价可行。要求学院统一培养大数据专业人才,组织构建大数据管理团队。
2.3利用大数据研究成果,致力于搭建大数据交换共享平台
建立大数据共享平台,涵盖全院各数业务信息系统数据与各数据记录,使各系统间信息数据共享成为可能,保持系统间信息顺畅,便于大数据分析与使用。信息化建设时,要求学生管理者高度敏感数据信息,常汇集并整理相关数据信息,经过认真仔细地分析,获得可靠的结论。学生在校参加各类活动,得到积分,找寻学生对某些活动的关注度,便于后续相似活动的开展,强化学生活动的影响力。分析学生校园一卡通的消费记录状况,相应地找到隐性贫困学生,提供帮扶资助,将人文关怀提升到一个较高的高度,健全学生社团主题网站,让学生更好地展示自己风采,培养他们各项技能,使学生形成正确的人生观与价值观。
三、结束语
大数据给高职院校的学生管理带来了机遇与挑战。物联网更多地应用在高校中,利用无线通信技术实现了信息化管理,不断收集数据,发给客户。实现了人性化与开放化的学生管理,还要强化学生精细化管理,较好地服务学生职业规划[2]。可以想象未来高职院校学生管理工作将逐步完善大数据平台的应用,更好地投入实践工作中。
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程[1]。数据挖掘在很多领域都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售等商业领域。但是,数据挖掘在教育领域的应用尚处于理论探索阶段,其他研究中已经证明,数据挖掘在高校家庭经济困难学生精准识别的过程中具有理论上的可行性,本文通过建立基于家庭经济困难学生数据库的数据挖掘模型对困难生精准识别进行实证角度的探索,以期能够解决家庭经济困难学生认定过程中存在的主观性、片面性等问题。
本研究通过运用数据挖掘技术,对家庭经济困难学生的数据进行量化分析、建模评价、以及结果分析。本文的主要设计思路为:针对学生的一系列评价家庭经济困难程度的指标划分学生困难等级,有利于简化家庭经济困难学生的认定程序,降低错误率。一个完整的数据挖掘过程主要包括数据准备、建立模型进行挖掘、模型的评价与修正三个阶段。借助数据库中已有学生信息,使用数据挖掘方法开发出困难等级评分模型从已有数据中分析归纳出困难生识别的规则和标准。然后,将这些规则或标准应用于困难生认定过程。本文所采用的数据挖掘软件为SPSS Clementine 12.0。该软件操作简单、无需编程、界面人性化,是一款十分适用的数据挖掘软件。图1展示了基于数据挖掘的困难生精准识别所构建的模型。
一、数据预处理
数据预处理主要包括原始数据整理与数据分割两部分。
本研究采用原始数据来自2015年度某高校某学院家庭经济困难学生数据库,该数据库共有数据496条。从学生《家庭情况调查表》以及家庭经济困难申请表中原因陈述结果可以看到,涉及到学生的特征指标包括户籍性质(HJ)(农村、城镇),户口所在地(HK)(东部、西部、中部),家庭人口数(RK),是否孤残(GC),是否单亲(DQ),家庭人均年收入(SR),家庭健康情况(JK),家庭负债情况(FJ)等一系列指标。数据经整理后能够满足Clementine对数据挖掘的要求。
数据分割的目的主要是为了验证数据挖掘模型,根据一般原则,数据分割的比例配比为训练集(40%),测试集(30%),验证集(30%)。分割方法为简单随机抽样,利用Clementine 12.0的Partition节点完成。分割后的三个数据集用新增变量Partition的取值标识,但仍合并在同一个数据文件里。
二、建立模型
家庭经济困难的等级与困难学生本身的特性是紧密相关的,经由这些特性能够细分学生困难等级,常用的特征识别方法是分类树。分类树着眼于从一组无次序、无规则的事例中推理出分类树表示的分类规则。现在比较常见的算法是基于信息论的方法的决策树。本文选取决策树模型来分析处于不同困难等级的学生所共有的一些个人信息,并对困难生认定提出相应的一些建议。
符合以下几条规则之一的,可以认定为家庭经济条件特殊困难:(1)人均年收入少于2250元,家庭人口少于3.5;(2)家庭人口多于3.5,人均年收入少于950元;(3)人均年收入高于2250元,家中有负债,人口数少于5人,家庭存在不健康因素。
符合以下几条规则之一的,可以认定为家庭经济条件困难:(1)人均年收入大于1250元,家中有负债,农村户口;(2)人均年收入大于1250元,户籍所在地为中西部地区;(3)人均年收入大于1250,家中人口多于5人,且有负债;(4)收入多于2250,人口数多于6人且家中不健康因素的。
符合以下几条规则之一的,可以认定为家庭经济条件一般困难:(1)收入多于1250,家住农村,无负债;(2)收入在2250到2450之间,家住中东部,人口少于6人;(3)收入大于2450元。
三、模型评估
完成模型的制定以后,下一步就是对模型进行评估,检验其预测能力的强弱。一般来说,模型的检验有两种方式:样本内检验和样本外检验。在Clementine中,模型评估主要采用图形展示,例如Gain图、Lift图等。另外,也常用分类矩阵来比较预测结果与实际结果的吻合程度,分析结果如图2。
首先,从收益图可以明显的看出,利用决策树得到预测模型准确率非常高,几乎与理想模型重合,而基于客户特征的细分变量的准确率也比较高。
为了更好的评判预测效果,利用Clementine 12.0中的Analysis节点,可以得到如下关于决策树模型在三个部分的数据集中的预测准确率。在大小为40%的训练数据集中,模型的预测准确率达到86.03%;在大小为30%的检验数据集中预测准确率为86.1%;在大小为30%的验证数据集中,其预测准确率达到86.18%。可见,利用决策树模型已经达到了相当好的估计效果。
四、结论
数据挖掘模型的运行结果在理论与实践层面都得出了有益的结论。
首先,数据挖掘的运行结果给出了困难生认定的一些普遍规则,这些规则基于困难生认定的原始数据所表现出来的困难生的特性,反映学生的方方面面。这些规则在困难生认定过程中将会是非常好的参考条件,甚至对困难生认定的准确度起决定作用。
其次,数据挖掘应用于家庭经济困难学生精准识别,对于数据挖掘在教育领域尤其是在学生管理与服务工作中的应用提供了有益的借鉴,这种借鉴也不应止步于此,应当进行更加深入的研究与应用,一遍提高高等学校学生工作的科学化水平。(作者单位:1.济南大学外国语学院;2.济南大学党委学生工作部)
2019年12月,农业农村部、中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知,部署了用数字化引领驱动农业农村现代化,加快农业农村生产经营、管理服务的数字化改造的发展战略,将全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平作为农业农村发展的目标[1]。农业农村的数字化建设离不开专业人才的培养。农林经济管理专业毕业生的就业方向主要有农业经营单位、面向农业农村的政府管理部门、事业单位、科研院所等。随着农业农村数字化发展战略的推进,给传统的农经人才培养带来了一系列的挑战[2]。在数字经济和智慧农业的时展背景下,数据分析能力是农经专业学生重要的核心竞争力。如何提升农经专业学生数据分析能力,是农经专业人才培养中面临的重要课题[3]。
1农业农村数字化发展战略给农经人才培养带来的挑战
1.1对农经人才的数据思维的更高要求
在大数据时代,无论是农业生产经营活动,还是农村的行政管理中都有大量的数据资源。农业企业、农业合作经营组织、农产品产销数据、农产品溯源数据为农业经营者提供了生产、物流、销售环节大量的数据资源。经营者需要认识到数据是一种新的生产要素,要调动数据作为生产要素的属性,让数据分析为管理决策服务[4]。在数字中国的建设进程中,各级政府部门工作人员通过各级各部门的行政管理智能,收集了大量省、市、区、县级的区域经济社会发展数据。社区网格化管理下收集了微观层面的农业经营单位数据、农村常住人口数据、医保数据、扶贫数据、农村小额信贷数据。这些数据资源是政府提高行政效率、提高政务服务质量的宝贵资源。
1.2对农经人才的数据分析能力的更高要求
在大数据时代,每天都有海量数据生成,如何能更好地利用这些数据,让数据能发挥其为管理决策服务的功能,与数据使用者的数据分析能力是密切相关的。例如,农业经营单位在农业生产环节的农业投入数据、农产品销售数据、电商平台的客户反馈评论、农产品库存的动态数据,如何整合分析这些数据,要求农业经营者系统掌握数据分析、数据挖掘、文本分析等多元化的数据分析方法。政府管理部门掌握的农业人口的迁移数据、农村常住人口网格管理数据、农村居民医保数据、扶贫数据等,数据类型丰富,数据量庞杂,如何实现数据库的整合,要求政府部门工作人员掌握数据库管理、大数据分析技术。
2农经专业数据分析课程群建设中存在的问题
2.1课程之间连贯性不足
以笔者所在的高校为例,为农经专业本科生开设的数据分析类课程,见表1。数据分析课程群包括了通识教育、专业教育和实践教育。从目前的课程设置来看,涵盖了数据库、统计学、经济计量学、多元统计、大数据分析等领域,内容丰富。数据库应用由计算机学院开设,是一门通识教育课程,在授课时教师往往将其视为一门计算机类的入门课程,在教学中没有针对农经专业学生的特质,将数据库的教学与其在农经领域的应用结合起来。学生在学习中往往会觉得该课程与专业联系不够紧密,教学内容枯燥,缺乏学习兴趣。
2.2学生学习的软件种类繁多,但不够深入
在统计学和多元统计课程中,学生将学习EXCEL、SPSS或者R语言的应用,在经济计量学课程中学生将学习Eviews或STATA的应用,在数据挖掘与大数据分析课程中学生将学习Python语言的应用。在每一门课程中学习的软件都不同,对于软件的学习缺乏连贯性和延续性,虽然学生接触的软件种类多,但是由于学时所限,每一种软件都只是入门级的介绍,无法进入到深度学习。
2.3与专业课学习联系不够紧密,缺乏应用机会
学生缺乏在专业课学习中运用数据分析类课程所学知识的机会。数据分析类课程主要介绍数据分析方法和软件的应用,但大部分都安排在第5学期和第6学期。学生在学习了数据分析方法后,缺少在专业学习领域里运用这些方法的机会。例如学生若要完成产业经济学、农业技术经济学、农产品国际贸易学的专题研究、课程论文,需要用到统计学、经济计量学、大数据分析的方法,但在第2-4学期开设大量专业课的学期,数据分析类课程还没有开设。若能将数据分析类课程尽量靠前安排,学生可以在后续的专业学习、课题研究中运用所学的方法,一方面夯实数据分析技能,另一方面也可以增加学生对专业课的学习兴趣。
2.4排课不够科学
在大三阶段,学生可以选修多元统计、数据挖掘与大数据分析、Python语言三门选修课。但到了大三,学生专业课的学习任务重,选修课种类考虑繁多,学生选课可能出于兴趣、学分安排或者准备考研保研考虑,并不是每一位同学都会选修上述课程。尤其是计算机能力不太强、对数学类课程感到困难的同学,会倾向于选择难度小的课程。
3基于项目驱动式教学理念的数据分析课程群改革
3.1开展项目驱动式教学的意义
项目驱动教学法是基于行动导向的探究式教学方法,是将真实的或模拟的项目转化为教学项目,结合课程内容将项目分解为若干工作任务,创设工作情境,引导学生完成任务,进而实现项目教学目标的教学活动[4-5]。项目驱动式教学法最显著的特点是“以项目为主线、教师为主导、学生为主体”,改变了以往“教师讲,学生听”被动的教学模式,完善了学生主动参与、自主协作、探索创新的新型教学模式。与传统教学方法相比,教学实施过程中,学生的目标更清晰明确,可避免传统课堂教学的被动性,进而提高学生学习知识的兴趣和主动性[6]。在数据分析课程群中引入项目驱动教学,一方面能让学生运用所学的数据分析方法分析现实问题,创设数据分析情境,加深对所学方法的理解和运用,激发学习兴趣,培养自主学习能力;另一方面也可以有针对性地创设围绕“三农”问题的数据分析项目,让学生从数据分析中加深对“三农”问题的感性认识,培养对农经专业学习的兴趣,提升对农经专业的认同度。具体来讲,可以从以下方面开展对数据分析课程群的改革[7]。
3.2统筹规划教学内容,加强课程间的连贯和递进
农经专业数据分析课程群目前主要包括必修课数据库应用、统计学和经济计量学,选修课多元统计、数据挖掘与大数据分析,以及实践课R语言与统计应用、Python语言。统计学教学的重点在于对基础性的统计方法的运用,经济计量学教学的重点在于让学生掌握经济计量分析的范式,如何利用经济计量模型开展实证分析。多元统计强调对复杂多维数据信息的提炼。数据挖掘与大数据分析教学的重点在于大数据时代数据挖掘方法的应用。此外,针对于目前学生所学的软件门类过多,软件操作不够熟练,建议在统计学、多元统计、数据挖掘大数据分析中统一采用R语言进行教学,让学生通过几门课程的学习,能够熟练掌握一种统计分析软件。
3.3基于项目驱动对教学内容进行整合及优化,调动学生主动参与
例如统计学课程介绍了基础性的统计分析方法,在后续课程经济计量学、多元统计、数据挖掘与大数据分析中引导学生运用基础性统计分析方法,对数据进行初步的统计分析和整理,为经济计量分析、多元统计、数据挖掘做好数据处理上的准备,让学生体会到关联课程中所学知识的联结。鼓励学生积极参与“三下乡”活动,开展田野调查实践,围绕“三农”开展调研,运用统计和计量方法对调研数据进行分析,鼓励学生参与到教学中来,培养学生的学习兴趣,学以致用。
3.4建设“项目驱动”实践教学模块
结合农经专业课程体系,建设数据分析课程群“项目驱动”实践教学模块。在农经专业的课程体系中开设的农业经济学、农产品贸易、农村社会学等专业性课程对大量的“三农”问题进行了探讨,这类课程中涉及的城乡差异问题、收入和消费问题、农产品价格波动、农产品贸易等现实问题的研究,都离不开基于现实数据的定量分析。因此,在农经专业的数据分析课程群中可以结合教学内容引导学生对专业课学习中热点问题的研究,围绕课程教学大纲,建设“项目驱动”实践教学模块,理论联系实际,让学生在研究项目中运用所学的数据分析方法,加深对专业知识的理解。
4农经专业数据分析课程群优化方案
在大数据时代,数据分析能力是学生的核心竞争力之一。数据分析类课程在建设中要强调理论与实践的结合,不能只是将教学停留在课堂上,引入体现专业特色的实践教学环节。可以从以下几方面开展数据分析课程群的优化:第一,数据分析基础类必修课安排在大一学年。在第1学期,可以安排R入门、Python入门、数据可视化课程,让学生尽早接触当前主流的数据分析软件,激发学生对R或Python的学习兴趣,让学生自我拓展学习空间。R入门、Python入门、或者数据可视化课程都属于数据分析的基础课程,无需其他先修课程。在这一时期,让学生开始接触数据分析软件,学习数据可视化的分析工具,有利于培养学生的数据思维、数据意识和软件实操能力。第二,将与农经专业课有关的专业必修课统计学、经济计量学安排在第3-4学期学习。统计学课程需要学生先行修读高等数学和概率论课程,经济计量学需要学生先行修读微观经济学、宏观经济学,因此可安排在第3-4学期。让学生在掌握了一定经济管理专业知识后,可以更好地体会统计学、经济计量学方法论学科的应用价值。第三,将数据分析进阶类选修课多元统计、大数据分析、数据挖掘、机器学习等课程安排在第5-6学期。为高年学生提供丰富的数据分析类选修课,让学生结合自己的兴趣、未来的发展规划学习更加多元化的数据分析技术。鼓励学生能在专业论文习作、学科竞赛中有更多的机会运用自己所学的数据分析方法,增加学生的收获感和成就感,挖掘学生的学习潜力。第四,改革课程考核评价体系,采用项目式管理和评估的思路,由学生自主开展一个数据分析项目,从收集数据、提出问题、分析数据到提炼研究结论,开展小组团队成员互评。教师跟踪学生的项目开展过程,从学生的学习态度、投入程度、数据分析质量等综合评价学生的学习效果。
5结束语
将项目驱动教学引入到农经专业数据分析课程群的建设,让学生参与到教学中去,突破传统教学中“教师教学生学”的局面,让学生通过参与项目,运用数据分析方法解决项目中的实际问题,激发学生的学习兴趣和潜能,让学生体会到所学知识的应用价值,让学生不再对数据分析类课程望而生畏。本文的研究对于农经专业学生数据分析能力的培养有重要的意义,强调理论与实践的结合,提高学生数据分析的高阶能力,也能为同类课程开展项目驱动教学提供借鉴。
参考文献:
[1]农业农村部中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].
[2]李虹贤.农业经济管理专业人才培养模式创新研究与实践[J].智慧农业导刊,2022,2(7):110-112.
[3]冯开文,陶冶.农业经济管理专业实践教学改革———以中国农业大学经济管理学院为例[J].教育现代化,2017,4(23):54-56+63.
[4]杜洪燕,陈俊红.乡村振兴背景下中国数字农业高质量发展路径研究[J].南方农业,2021,15(21):213-214.
[5]金娥.基于项目式学习的《现代教育技术应用》课程学习框架的设计与实践研究[D].武汉:华中师范大学,2021.
中图分类号:F276.1
文献标识码:A
文章编号:1002―2848―2007(01)-0108―06
一、前 言
在经济数据的传统定量分析中,所分析的数据对象具有这样的特征,即数据要么是时间序列数据,要么是横截面数据。而实际中获得的许多经济数据,往往是在时间序列上取多个截面,再在这些截面上同时选取样本观测值所构成的样本数据。计量经济学中称这样的数据为“平行数据”(Panel Da―ta),也被翻译成“面板数据”,或“纵向数据”(longitudinal data)。20多年来,许多学者研究分析了面板数据。事实上,关于面板数据的研究是计量经济学理论方法的重要发展之一,它在解决数据样本容量不足、估计难以度量的因素对经济指标的影响,以及区分经济变量的作用等方面,具有突出优点。但是,研究面板数据的计量模型,以线性结构描述变量之间的因果关系,且模型太过于依赖诸多的假设条件,使得方法的应用具有一定的局限性。为了弥补面板数据的计量模型分析方法及其它统计分析方法的缺陷,本文基于经济数据的函数性特征,介绍一种从函数视角对经济数据进行分析的全新方法一函数性数据分析(Functional Data Analysis,FDA)。
函数性数据分析的概念,始见于加拿大统计学家J.O.Ramsay和C.J.Dalzell于1991年发表的论文《函数性数据分析的一些工具》。6年后,J.O.Ramsay和B.w.Silverman(1997)将对函数性数据进行统计分析的已有理论和方法,总结在《函数性数据分析》一书中。但这本书偏重方法的理论介绍和数学推导,不利于统计基础薄弱者使用。经过5年的努力,J.O.Ramsay和B.w.Silverman研究了一些函数性数据案例,并将其具体的分析过程编入他们于2002年出版的专著中。虽然国外在这方面已经做了许多研究,也取得了许多有价值的结果,但是有关函数性数据的研究依然处于起步阶段,还有很多问题需要研究或进一步完善。另外,从方法应用的具体领域来看,很少涉及对经济函数性数据的分析。就目前研究文献来看,我国在此方面的研究尚是一片空白。
为填补我国在这方面研究的空白,本文从思想、方法等方面,对函数性数据分析进行系统介绍,并通过编写计算机程序,率先利用该方法分析实际的经济函数性数据。本文共分六部分,以下内容的安排为:数据的函数性特征及经济函数性数据实例、从数据的函数性视角研究数据的意义、函数性数据分析的目标和步骤、函数性数据分析方法的经济应用,最后一部分是本文的结论。
二、数据的函数性特征及经济函数性数据实例
一般地说,多元数据分析(Multivariate Data A-nalysis,MDA)处理的对象,是刻画所研究问题的多个统计指标(变量)在多次观察中呈现出的数据,样本数据具有离散且有限的特征。但是,现代的数据收集技术所收集的信息,不但包括传统统计方法所处理的数据,还包括具有函数形式的过程所产生的数据,例如,数据自动收集系统等,称具有这种特征的数据为函数性数据。
函数性数据的表现形式多种多样,但就其本质来说,它们由函数构成。这些函数的几何图形可能是光滑的曲线(如人体在成年前的身体高度变化等),也可能是不光滑的曲线(如股票综合指数等)。许多研究领域的样本资料往往表现为函数形式,如考古学家挖掘的骨块的形状、按时间记录的经济数据、手写时笔尖的运动轨迹、温度的变化等。函数性数据分析(Functional Data Analysis,FDA)的基本原理是把观测到的数据函数看作一个整体,而不仅仅是一串数字。函数指的是数据的内在结构,而不是它们直观的外在表现形式。
实际中,之所以要从函数的视角对数据进行分析,是因为:(1)实际中,获得数据的方式和技术日新月异、多种多样,例如,越来越多的研究者可以通过数据的自动收集系统获得大量的数据信息。更重要的是,原本用于工程技术分析的修匀(smoothing)和插值(interpolation)技术,可以由有限组的观测数据产生出相应的函数表示。(2)尽管只有有限次的观测数据可供利用,但有一些建模问题,将其纳入到函数版本下进行考虑,会使分析更加全面、深刻。(3)在有些情况下,如果想利用有限组的数据估计函数或其导数,则分析从本质上来看就具有函数性的特征。(4)将平滑性引入到一个函数过程所产生的多元数据的处理中,对分析具有重要的意义。
在经济分析中,融合时间序列和横截面两者的数据很常见,例如,多个国家、地区、行业或企业的多年的年度经济总量、多家商业银行历年的资本结构、能源(如电力、煤炭、石油等)多年按月的消耗量、不同时间上多个省市的失业数据等。这些经济数据往往呈现函数性特征,即每个个体对应着一个函数或曲线。在对经济函数性数据进行分析时,将观测到的数据(函数)看作一个整体,而不是个体观测值的顺序排列,这是函数性数据分析不同于传统统计分析之根本所在。例如,表1是工商银行、农业银行、中国银行、建设银行1995年到2004年期间的资产收益率(ROA)数据。
利用基于MATLAB编写的程序,对数据进行平滑处理(smoothing),并绘出四家国有银行的资产收益率(ROA)的修匀曲线(见图1)。由曲线图可以看出,每个个体(银行)对应着一条曲线(其数学表达式为函数),这是将多家银行的历年ROA数据记录看作函数的根本理由,也是函数性数据分析的出发点。
三、从数据的函数性视角研究数据的意义
从函数的视角,对具有函数特征的经济数据进行研究,会挖掘出更多的信息。例如,对函数性数据的平滑曲线展示,不但能够诊断出拟合数据的可能数学模型,还能够通过对光滑曲线求一阶、或更高阶的导数,来进一步探索数据的个体(横截面)差异和动态变化规律。
图2是四家银行资产收益率的速度(一阶导数)曲线,观察发现:在1995年至2004年期间,农业
银行、中国银行及建设银行的资产收益率的变化率,呈现出较强的周期性,其中尤以建设银行的表现最为突出。加速度曲线图显示,四家银行资产收益率的变化率的波动状况不相同,转折变化的时间差异也较大。这些情况一定程度表明,各家银行的内部管理与经营机制,对市场信息的反应快慢程度各不相同。
四、函数性数据分析的目标和步骤
函数性数据分析的目标与传统统计学分析的目标基本一样,具体情况如下:
(一)以对进一步分析有利的方法来描述数据;
(二)为突出不同特征而对数据进行展示;
(三)研究数据类型的重要来源和数据之间的变化;
(四)利用输入(自变量信息)来解释输出(因变量)的变化情况;
(五)对两组或更多的某种类型的变量数据进行比较分析。
典型的FDA主要包括以下步骤:
第一步,原始数据的收集、整理和组织。假设我们考虑的自变量是一维的,记为t,一个的函数仅在离散抽样值 处被观测,而且这些ti可能等间隔分布,也可能不是。在函数性数据分析中,将这些离散的观测值看作一个整体。
第二步,将离散数据转换为函数形式。这是利用各次观察的原始数据定义出一个函数x(t),它在某一区间上所有t处的值都被估算了出来。解决这个问题的基本方法是选定一组基函数 (t),k=O,…,K,并用基函数的线性组合给出函数x(t)的估计
第三步,多种形式的初步展示与概括统计量。概括统计量包括均值和方差函数、协方差与相关函数、交叉协方差(cross―covafiance)与交叉相关(cross―correlation)函数等。
第四步,为了使每一条曲线的显著特征都在大体相同的自变量处(如月份、年份等)显现出来,可能需要对函数进行排齐(regigtration),其目的是能够区别对待垂直方向的振幅变化与水平方向的相变化。
第五步,对排齐后的函数数据进行探索性分析,如函数性主成份分析(FPCA)、函数性典型相关份析(FCCA)等。
第六步,建立模型。建立的模型可能是函数性线性模型,也可能是微分方程。
第七步,模型估计。
五、函数性数据分析方法的经济应用
为了说明函数性数据分析方法的具体应用,同时出于使所绘图形简单明了,本文再次利用四家国有银行的数据,对资产收益率进行更深入的分析。虽然此实例中个体数少,但并不妨碍对方法应用的系统描述与理解。
在对实际问题的经济数据进行分析时,通常需要依照研究的目标编写计算机程序。就目前的研究现状来看,基于MATLAB或SPLUS等编写的程序,如绘图或综合计算函数等,完全可以满足分析的需要。本文首先基于MATLAB编写程序,然后对四家国有银行的资产收益率数据进行分析。
关于四家银行资产收益率数据的函数(曲线)展示与初步分析,本文在前面已进行了描述,具体结果见图1和图2。概括资产收益率特征的统计量(均值函数和标准差函数)的曲线见图3。
为了进一步探讨典型函数所呈现的特征,本文利用函数性主成份分析,对四家银行的资产收益率数据进行分析。一般来说,在函数性数据分析中,与多元统计中的某个主成份的权向量相对应的是主成份权函数(principal component weight function),记为 ,其中t在一个区间 中变化。第i个样品(个体) 的主成份得分值为 ,第一主成份就是在 的约束条件下,寻求使主成份得分 的方差达到最大的权函数 ,即它是下面数学模型的最优解: 类似地,可以求得第j个主成份,其权函数毛(t)是下面数学模型的解:
为了得到光滑的主成份,一种方法是对由上述方法求出的主成份进行修匀,另一种方法是将修匀处理过程,融入到主成份的求解过程中。具体作法是将描述主成份曲线波动程度的粗糙因子纳入到约柬条件中,形成带惩罚的约束条件。利用粗糙惩罚法求第j个主成份的数学模型是其中 称为修匀参数,用它可对粗糙惩罚项进行调整。
利用上述方法和基于MATLAB编写的程序,对四家银行进行函数性主成份分析(FPCA)。具体结果见图4。第一个主成份(PCI)的解释能力为85.5%,第二个主成份(Pc2)的解释能力为13.1%,前两个主成份的综合解释能力为98.6%。
为了清晰地显示主成份,并进行有意义的解释,在同一图中绘出三条曲线,一条是整体均值曲线,另两条是对均值曲线分别加上和减去主成份的一个适当倍数而形成的曲线,具体结果见图5(本文所选的倍数是0.12)。以上所述的三条曲线分别对应着图5中的实心曲线、‘+’曲线和‘*’曲线。第一个主成份反映了资产收益率(ROA)的一般变化,尤其反映了资产收益率的“两头”变化情况(1999年以前和2003年以后)。第二个主成份反映了资产收益率(ROA)的中段变化。
六、结论
在经济实践中,越来越多的领域所得到的样本观察资料是曲线或图像,即函数性数据。因此,对这种类型的经济数据进行统计分析和描述,具有重要的现实意义。因篇幅所限,还有一些函数性数据的分析方法未予以介绍,如函数性方差分析、函数线性模型、函数性典型相关分析以及描述动态性的微分方程等。由于本文的主要目的,是通过对函数性数据分析方法和具体应用的介绍,传述对数据进行分析的新思想,而不只是方法技术本身。因此,缺少的方法并不影响对思想的阐述。
当前经济类学生的培养体系中,统计学、计量经济学等以数量研究为特征的学科成为了核心课程。经济类本科生不仅需具备良好的经济学专业知识,还需具备一定的量化研究能力。而在量化研究能力的培养过程中,确实地使用当前经济运行的实际数据进行分析是必要的。为了更好地为学生提供学习环境,建立为经济类专业的数据动脚平台就成为必然之选。
一、数据支持平台概念
所谓的数据支持平台是指为学生提供可获得教学和研究的相关经济数据的软件和硬件的集合,具体可设计包括:数据采集实验室;数据分析实验室;数据库(数据建设实验室)等。数据支持平台是一个集成平台,可作为整个经济类专业开设学院的基础平台。
二、数据支持平台建设的重要性
数据是教学和科研工作的重要支撑,这一点对经济学科尤其重要。
首先,由于科研基础的薄弱和信息获得的滞后性,公开的二手数据目前科研工作价值逐渐降低。收集获得第一手数据值得重视,基于自身一手数据的论文有绝对的竞争力。数据支持平台可以提升整个经济类院校教师的科研水平。
其次,学生参与数据收集、数据整理,并在此基础上分析问题、解决问题,无疑提升了学生的科研能力和动手能力;学生对自身感兴趣的经济、社会问题,以及发生在身边的现象收集数据,加深对社会问题的理解。同时在问卷中,与受访者联系,有助于学生提高自己的社交沟通能力,不但使重要的社会实践,而且增强学生就业和就业后的社会适应能力。
再次,可作为经济学院的对外合作的一个窗口。
三、数据支持平台内容设计
1、定位
数据支持平台应当作为经济类相关专业通用的数据平台,成为特色实践和特色教学的重要内容。它应当为教师提供教学和研究所需的数据,同时也为学生提供学习和研究的数据支持。
2、服务对象
数据支持平台的对象包括了服务主体的服务内容。其中服务主体主要是为校内外教师和学生提供服务,服务内容包括了校内外教师和学生的问卷调查、学生的科研以及社会实践、与统计和计量经济学等相关课程相衔接的实验和实践、此外还可以考虑对校内开放,有偿接受其他文科学院学生科研,为其他学院教师科研有偿服务;接受学校委托进行师德学风、学校建设、大学生生活、就业等等调查;向社会开放,接受企事业、地方政府、咨询机构、社会公益组织等等委托为其调查。
3、调查功能
数据支持平台的调查功能可以包括多个方面,具体而言:
(1)市场调查:主要针对产品品牌知名度、市场渗透率和市场占有率,居民消费观念、消费习惯和生活形态,媒体覆盖率接触率和广告到达率等。主要委托对象是工商企业、媒体单位和研究机构。
(2)社情民意调查:主要包括居民对市政建设、环境治理、治安情况以及就业、教育、住房现状的评价。此类调查主要由各级政府和相关部门委托。
(3)行业行风调查:包括政策透明度、办事程序和办事效率以及办事人员工作态度等。主要服务对象为党政纠风部门、行业主管部门和大型企业集团,如工商、税务、公安、银行、电信等。
(4)社会热点问题、分配问题、公共服务评价调查等
(5)网络调查。这是这个数据支持平台发展的方向之一。从前瞻性角度来说,随因特网发展和电脑普及,网络是人们生活的一部分。网络是最大的受众媒体,网络调查将是统计调查未来发展方向。私密性、敏感的、设计人文生活的热点话题、包括政治统计都会在网络进行。因此个数据支持平台必须能开展网络调查。
四、数据支持平台技术模块设想
数据支持平台可包括:数据采集实验室;数据分析实验室;数据库(数据建设实验室)三个方面的内容。其中:
1、数据采集实验室
数据采集方式可包括包括传统的问卷调查和电脑辅助调查两种。具体而言,传统的问卷调查的问题设计是电脑辅助调查的基础,因此应与保留,作为辅助调查手段。电脑辅助调查模块要集成计算机辅助电话调查系统CATI和计算机辅助人员访问CAPI(Computer Assisted Personal Interviewing)。具有高智能的问卷评价体系,以及可以与通行数据库对接。CATI系统通常的工作形式是:访员坐在计算机前,面对屏幕上的问卷,向通话另一端的被访者读出问题,并将被访者回答的结果通过鼠标或键盘记录到计算机中去;督导在另一台计算机前借助局域网和电话交换机的辅助对整个访问工作进行现场监控。CAPI系统通常的工作形式是:问卷由计算机管理与呈现,被访者回答的结果被访问员(或被访者)通过鼠标、键盘、手写笔或触摸屏等直接记录入计算机内。访问结束,数据通过互联网、邮寄或无线网等方式传送到中央服务器。汇总后的数据无需做太多整理便可直接用于统计分析。
CATI和CAPI都有现成的技术和成套软件。CAPI是发展趋势,因此我们这个模块选择集成CATI功能的CAPI系统,因此需要新购置电脑中有一部分是移动电脑,承载面访功能。
2、数据库(数据建设实验室)
对于一些收据如就业、教育、住房等需要定期、长期、连续调查收集,这样经过很多届学生、多年的积累,可以汇集成自有数据库。这个数据库可以支持教师的科研创新团队,同时可以对外出售、租用、转让,因此必须加强数据库的建设。
3、数据分析实验室
数据分析实验室主要包括了建立可考虑有已有的计量分析平台、由学院前期购进SPSS完成。
综上所述,为提高经济类本科教学的质量,提升相关专业教师的教学和研究水平,特别是培养经济类本科生的量化研究能力,构建数据支持平台是具有必要性的。通过数据采集实验室、数据分析实验室和数据库三方面的建设,为教师和学生全面提供了教学和研究所需的数据支撑,并且还可为学校内外的其他教学和研究单位提供服务。因此建立数据支持平台具有现实的意义。
参考文献:
[1]黄秉成,孙宗进.统计调查数据质量的甄别与控制[J].中国统计,2010,(1).
一、应用统计学的主要步骤和要点
1.1样本的选择
样本是应用统计学方法实践的首要要素。所有的统计归纳和对比分析都是建立在样本群的调查之上的。所以样本的选择至关重要,既需要具有随机性,又要有代表性,不能过于偏向某一领域又不能不顾及权重的配比。
1.2统计方法的确定
应用统计学科中有很多统计学的方法,可以对样本量进行多种处理与计算,既可以简单分析样本的分布特征,又能够从时间序列上获取其趋势。而一些复杂的统计学模型则提供了更加精确和量化的对比模拟方案。
1.3统计结果的分析
对统计结果的分析也是统计学应用的重要环节,在分析时不仅要考虑结果直接体现出来的表面特征,还要学会从表面特征挖掘出其背后可能存在的因素与条件,进而得到一个比较合理科学的解释。
二、应用统计学在生产实际中的应用表现
2.1应用统计学在经济学领域的应用
经济一直是我国发展过程中重点关注的对象,经济基础决定上层建筑,所以有效的把控经济走势,快速精准的判断经济拐点,果断坚决的进行经济指导和干预才是推动和保障我国经济稳步发展的关键。应用统计学作为一门需要使用统计学理论进行现状分析的学科,恰好可以满足经济学发展的需要。越来越多的经济分析实例需要建立在完善和科学的统计结果之上,而经济学专业的学生也不断加强自身的统计学相关知识。例如对于金融行业来说,无论是风险投资还是项目推广,都需要提前对市场进行预判,对受众和用户进行一个大概的了解。应用统计学就能够在进行样本选定和调查后,根据长期经验得到的指数建立模型,分析客户心理和消费能力等要素,进而为后续的发展指明方向。
2.2应用统计学在医学领域的应用
2020年一场突发的公共卫生事件牵动着全球人民的心,一种新型的病毒在人群中大肆传播,造成身体健康的严重损害甚至夺去生命,对医学领域带来了巨大的挑战。这时,应用统计学的知识和理论就为防疫战疫提供了重要的理论依据。通过前人对类似传染病的统计结果,建立一个传染病扩散速率和死亡率等的数量关系,各个参数都由经验给出,从而就可以针对不同的病毒传播特征得到一个模型,既可以比较早的对未来情况有一个把握,又能够为公众提供一个科普的窗口,提醒人们注意保护和预防。
三、统计学理论在大数据时代的应用
3.1数据分析、统计学理论之间的结合
应用传统统计抽样方式,无法对庞杂数据来进行分析、处理,也难以展现出大数据的知识密度,获取的分析结果自然不够精确,这无疑会影响数据的挖掘、使用成效。将数据分析、统计学理论之间结合,能够打破传统数据分析模式的限制,充分发挥出大数据的价值。大数据内容多元、混乱,对数据形式准确性要求不高,可以利用统计学分析方式来对比数据变化,同时,大数据对数据精度的要求并不是很高,而是“以量取胜”,更加侧重于整体研究,通过数据分析、统计学理论之间的结合融合了两者优势。
3.2创新数据分析理念
大数据具有价值、多样、高速、大量4个方面的特点。基于大数据分析的特点,既往相关专家总结出了如下公式,即:大数据=高频海量数据+复杂类型的数据。在大数据时代下,数据分析工作便是对海量数据的分析、归纳、统计、总结,挖掘出其中具有价值的信息和内容,进行对比,以得出具有价值的信息。在数据收集、处理环节中,需要进一步创新数据分析渠道,扩充数据来源,对于相关人员而言,要具备数据积累、处理的意识。大数据具有一定的流动性,在时间的流逝下,数据信息数量会继续增加,因此,相关人员要具备创新化的数据分析理念,让数据真正实现增值,以帮助人们更好地解决问题。
四、加强校企深度合作,构建统计专业学生的培养体系策略
4.1完善校企合作政策法规保障
首先,政府应以立法的形式完善专业教育校企合作相关法律法规,通过法律对院校与企业在开展合作中的责任、义务与权利加以确认,为校企双方在人才培养方面的深层合作提供制度保障。其次,保证政策“落地”,一方面可通过教育宣讲的方式,强化院校、相关企业以及社会组织等对有关政策的深入了解,从而获得合作各方的配合与支持;另一方面,在政策实施过程中还要及时收集反馈信息,并针对合作受阻原因,继续完善相关政策,保证政策真正“落地”。
4.2开创多元化的合作模式
第一,可通过“产教结合”的方式,这也是当前校企合作的主流模式,主要包括短期性实习、参观考察、专业技能竞赛等形式。第二,实行“订单式培养”模式,为企业定制输送专业人才,此模式只能应用于特定合作项目。第三,实行“校企共建”模式,校企双方通过整合资源,在合作中充分发挥各自优势,实现校企双方的良性互动。
4.3打造“双师”高校教师队伍