时间:2022-12-05 23:03:55
引言:寻求写作上的突破?我们特意为您精选了12篇excel数据分析范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
中图分类号:TP391 文章编号:1009-2374(2017)07-0056-02 DOI:10.13535/ki.11-4406/n.2017.07.027
1 概述
在水电站的维护管理中,对水库大坝的监测是极其重要的一项内容,保障了水库大坝日常的运行安全。通过监测技术得到了许多大坝的数据信息,我们对这些数据信息进行系统的分析,可以及时地获取大坝工作运行的实际状态,为水电站的调度与日常维护提供可靠的数据信息。但是在实际的安全检测工作中,监测点是非常多的,每个监测点的数据信息非常多,在许多时候我们需要得到某个事件说明的时候,就需要在这些数据信息中寻找想要的信息,一般需要人工来进行,其效率就会非常慢,并且使用人工就非常容易出错,其结果也会出错。然而excel有着数据信息统计的能力,只需要使用一些常用的函倒δ埽就能够很容易处理需要检测的数据信息,进而提高数据信息的分析能力。
2 函数工具
在Excel软件里面函数工具极其多,在大坝监测工作中所用到的函数工具主要有以下三种:
2.1 运算符号
在函数公式中,需要用到很多运算符号,主要有算术运算符号、逻辑运算符号、文本运算符号、引用运算符号等,这些运算符号和数学计算法则比较一致的,其运算逻辑也相同。
2.2 查找与引用
Excel系统的查找与引用,主要是把符合有些条件的字符串与数值按照要求查找并引用到指定的单元格内或者放在公式中。我们在对大坝进行监测中会获取许多的数据信息,这些数据信息在分析处理的时候,经常会用到LOOKUP函数与VLOOKUP函数。
LOOKUP函数主要的功能是一个数值和一行数据或者一列数据逐一进行比较,在找到匹配数值之后,把另外一组数据信息中所对应的数值提取出来,但是这种函数公式只能够进行模糊查找。
VLOOKUP函数主要是一个数据与整个表对比,并非像LOOKUP函数那样和某一列数据或者某一行数据进行对比,并且使用VLOOKUP函数公式可选择的范围比较广,精确查询与模糊查询都可以。
2.3 IF函数
IF函数通常用在真假值的判断之后,按照逻辑判断真假值的返回找出不同结果。在大坝监测的数据分析中,在查找函数没有办法在所选表格区域当中找到匹配值,系统会出现“#N/A”的错误值,在“#N/A”错误的时候,可能分析内容起就很容易出错,有时候还要结合其他函数一起使用才行。
3 大坝监测数据分析Excel的应用
3.1 数据的收集
在水库大坝监测工作中,要对监测出来的数据进行分析研究,我们要先明确想要的结果,并且根据实际需求来收集整理监测数据信息,通过Excel函数工具把这些数据信息整理成想要的结果。
3.2 成图
在大坝监测数据分析工作中,Excel函数工具中有插入图表的功能,可以对数据信息进行研究分析整理成想要的图表,一般情况下都是采用散点图来分析趋势的。
4 实例
以某水电站为例,使用Excel函数工具来分析监测数据信息。该水电站工程是大型水电工程,水电站工程的主要任务是发电。水库蓄水位正常的是1300米左右,洪水位约为1300米,死水位大约为1285米,水库的总容量为1.59亿立方米,总装机100兆瓦,保证出力约10兆瓦,装机利用小时数3500小时,今年来平均年发电量约4亿千瓦小时。这个水电站挡水的建筑物是碾压式沥青混凝土墙坝,大坝顶的高程大约为1300米,防浪墙顶的高程大约为1300米,大坝顶的宽度大约为10米,坝高最高为大约为90米,大坝的长度约为439米。在大坝的上游设置半米左右厚混凝土的护坡,在大坝的下游设置预制的网格梁,可以种植草皮来护坡。心墙顶厚度大约为0.5米,心墙两侧摆放过渡料,水平的宽度一般为3米,在大坝的两岸设置4个测压孔,测压孔的参数见(表1)。
4.1 数据的统计与图表
从数据库中导出测压计的历史数据(表2),从测压计的历史数据来看每个测压点的数据信息相互交错,如果要从这些复杂庞大数据库里面找到想要的数据信息,就会用到Excel函数工具数据库里面的每项数据,复制粘贴到各种工作表中:
在使用Excel函数工具把数据进行汇总之后,会发现在数据列里面出现了许多“#N/A”错误,使得过程线无法连续,因此用Excel函数工具来判断数据是否是“#N/A”错误,Excel函数工具的使用可以得到连续的过程
线图。
4.2 数据分析
对上述数据表格进行研究分析,能够发现UP1测压管的历史过程线和库水位的历史过程线的关联非常密切,其相关性非常强,我们结合其他数据信息得知,左岸UP1测压管钻孔和水库内是通着的。
5 结语
总而言之,在以上的实例分析中仅仅使用了Excel数据分析工具中很少的一部分功能,即已经达到了大幅减少大坝安全数据分析工作量的目的,Excel数据分析工具还有很多,通过其强大的分析功能,能够进行各种数据处理并辅助监测人员进行决策,通过更加直观的表达方式大大地提高数据分析工作效率。
参考文献
[1] 赵小莉,李芙蓉,王立志.浅析水库大坝变形监测分析与预报[J].水利大坝监测,2015,23(25).
以“格式”选项卡为例,这里提供了数据条、色阶、图标集、大于、文本包含、清除格式等功能按钮,鼠标移到“图标集”上,我们会看到不同的图标风格(如图1),预览满意之后即可应用。“图表”选项卡则可以预览不同风格的图表效果,从而帮助你快速创建相应的图表,例如使用散点图(如图2)。如果需要查看更多的图表,可以点击最右侧的“更多图表”按钮。最常用的操作当然是“汇总”下的求和、平均值、计数、汇总百分比、汇总,相信这也是绝大多数朋友接触最多的操作。在选择相应的功能之后,Excel 2013会在相应的位置上添加一行列出所得出的结果,比如平均值(如图3),点击“>”按钮还可以选择更多的汇总功能。“表”选项卡提供了表、数据透视表、其他等功能选项,可以快速创建非常美观的图表。“迷你图”的效果就不用多介绍了吧?
简而言之,借助Excel 2013的快速分析工具,我们可以在最短时间内快速实现相应的操作,而且是提供充分预览,从而提高操作效率。
午后的三点一刻是下午茶的时间,忙碌了一天,现在放下手中的工作,稍稍休息一会儿吧。
首先,我们来听一首歌,一首很适合在午后时分听的歌:《Down at the coffee shop》,这是一首甜腻腻的歌,就好像草莓味的水果糖。尾音和间隙处衔接非常紧密,她粘粘的唱,那大家就粘粘的听吧。再来一杯有着玫瑰香的泡泡水,清淡、回味。就让一个小清新的午后由此开始吧……
引言
每次全国普通高校非计算机专业计算机联合考试(一级)考试阅卷结束后,由自治区将成绩以Excel电子表格形式下发到各学校(以下简称成绩表)。成绩表的表头各字段名如下:
教师需对成绩表进行汇总统计与分析,了解全校各系、各年级、各专业的平均分、及格人数和及格率等情况,便于修订教学计划。
针对学生成绩表的多条件统计分析需求给出公式或函数法和数据透视表法两种解决方案。
1.公式或函数法
1.1 SUMPRODUCT函数
SUMPRODUCT函数是在给定的几组数组中,将数组间对应的元素相乘,并返回乘积之和。
语法SUMPRODUCT(array1,[array2], [array3], ...)
其中,数组参数Array1必需,Array2,array3,……可选,其相应元素需要进行相乘并求和。
SUMPRODUCT函数的基本功能是返回相应的区域或数组乘积的和。但也可利用SUMPRODUCT函数进行多条件计数和多条件求和。
若要统计同时满足条件1、条件2到条件n的数据个数,则可使用
SUMPRODUCT((条件1)*(条件2)*…*(条件n))
若要统计同时满足条件1、条件2到条件n的数据的和,则可使用
SUMPRODUCT((条件1)*(条件2)*…*(条件n)*求和区域)
1.2定义名称
为了在公式计算中方便输入和减少输入量,给需使用的单元格区域定义简单易记的名称,它们分别为年级、院系名称、理论成绩和操作成绩。
操作步骤:选择菜单“插入”“名称”“定义”命令,在定义名称对话框中输入名称和引用位置,确定即可。定义名称对话框如图1所示。
图1定义名称对话框
名称引用位置中使用了一个动态的公式“=OFFSET(成绩表!$F$2,,,COUNTA(成绩表!$A:$A)-1,1)”定义数据源,这样就不用管共有多少条记录了,COUNTA(成绩表!$A:$A)-1会自动计算记录数,并且如当一条新的纪录添加或删除时,数据源会自动扩展。
1.3创建统计表
添加一个新的工作表,用于存放统计数据,命名为“统计表”,表头设计如下:
在A和B列分别输入年级和院系名称。
在C3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(理论成绩>=0))”;
在D3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(理论成绩>=60))”;
在E3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(操作成绩>=60))”;
在F3单元格输入“=D3/C3”;在G3单元格输入“=E3/C3”;
在H3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*理论成绩)/C3”;
在I3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*操作成绩)/C3”。
填充数据,并将小数位设置为两位,部分统计结果显示如下:
2.数据透视表法
2.1创建空白的数据透视表
选定数据清单中的任意单元格,选择菜单“数据”“数据透视表和数据透视图”命令,在弹出的对话框中单击“完成”按钮。Excel将产生一个含有空白的数据透视表的工作表,其中显示字段列表和数据透视表工具栏。
2.2对数据透视表进行布局
若需统计各年级、各院系的理论成绩的平均分、及格人数和及格率等,则可从字段列表中将“年级”字段拖到页字段区,将“院系名称”拖到行字段区,将“理论成绩”字段拖到列字段区,将“理论成绩”、“学号”和“学号”字段依次拖到数据区。将数据透视表中的“数据”拖到右边的单元格。
若要改变数据透视表的布局,就将欲删除的字段拖出数据透视表,然后将新的字段从字段列表中拖到数据透视表相应区域即可。
2.3设置字段的显示方式和汇总方式
将“理论成绩”分为
Excel对“理论成绩”字段默认的汇总方式为“求和”。若要更改汇总方式为“平均值”,可右击“求和项:理论成绩”,选择“字段设置”,或先单击“求和项:理论成绩”,再单击数据透视表工具栏上的“字段设置”按钮,均可调出“数据透视表字段”对话框;在“数据透视表字段”对话框中,单击“汇总方式”列表框中的“平均值”,然后单击“确定”按钮。这就将“理论成绩”的汇总方式改成了“平均值”。
将“学号2”字段的显示方式更改为“占同行数据总和的百分比”。操作方法:右击“计数项:学号2”,选择“字段设置”,在调出“数据透视表字段”的对话框中,单击“选项”,在“数据显示方式”列表框中选择“占同行数据总和的百分比”,然后单击“确定”按钮。
2.4重命名字段
当向数据区域添加字段后,它们都将被重命名,例如“理论成绩”变成了“平均值项:理论成绩”,这样加大了字段所在列的宽度,表格显得不紧凑。如需重命名字段,只要单击数据透视表中需要修改的标题单元格,在编辑栏中输入新标题即可。我们将“平均值项:理论成绩”改为“理论平均分”,“计数项:学号”改为“人数”,“计数项:学号2”改为“人数占比”,将“0~59”改为“不及格”,将“60~119”改为“及格”。
稍作修饰,将小数位数设置为两位小数,隐藏“人数汇总”和“人数占比汇总”。至此,可得到如图2所示的数据透视表。
图2数据透视表
数据透视表创建好后,任何时候都可根据需要,对数据透视表重新进行布局,即只需拖动字段按钮就可,并可非常方便地调整显示方式和汇总方式,以便从不同的角度查看分析数据,从中寻找有价值的信息,满足新的数据分析的要求。
结语
Excel具有强大的数据分析和数据处理功能,包含了9大类、400多个内置函数和大量的分析工具。公式或函数法和数据透视表法都是Excel分析和处理数据的重要手段,合理选取,巧妙应用,能使数据处理方便且高效。
参考文献:
Excel是Microsoft公司推出的电子表格软件,它不仅具有数据的统计分析、图形和图表处理等功能,而且具有智能化的计算和数据管理功能。这些简单易行的功能正适合应用于大量处理、分析和管理数据的会计专业,使其工作更加快速、准确、安全。
一 利用Excel进行数据分析
数据分析是Excel比较重要的一个功能,而人们在利用Excel进行数据分析时,通常会使用熟悉的排序、筛选、分类汇总等命令。其实,Excel中还包含一些比较适合会计方面数据分析的命令,如记录单命令、模拟运算表命令。
(一)利用记录单进行数据分析
记录单是Excel中用来查询和添加记录的工具。利用记录单,可以轻松的设定查询条件,快速的追加记录,以及对查询到的记录进行编辑。其使用方法很简单。
1.将鼠标光标置于如表1的数据清单中,Excel会自动识别数据清单(此处要注意数据分析,设计数据表时请在标题行与数据清单间插入一行空白行,否则“记录单”会将数据清单中的字段行视为数据清单的记录区)。然后选择“数据”菜单中的“记录单”命令。在弹出的对话框中单击“条件”按钮,进入条件设定界面。
2.在如图1的“品种”文本框中输入“苹果”,然后单击“表单”按钮进入查询状态。
3.在查询状态可以通过单击“上一条”按钮与“下一条”按钮进行查询。在此状态下可对查询到的记录进行编辑,编辑后必须按Enter键确认;也可单击“删除”按钮对查询到的记录进行删除操作。如果想追加记录,可以单击“新建”按钮,即可在数据清单的末尾追加新建的记录。
表1 水果销售表
图1 条件设定对话框
(二)利用模拟运算表进行数据分析
在很多情况下,我们利用公式或函数计算数据时,常常想知道如果其中一个或两个数据发生变化,其结果将会怎样变化,我们想要对比这些情况,此时我们就可以利用“模拟运算表”来解决这个问题论文格式模板。
模拟运算表可以根据假设条件和公式计算出结果。模拟运算表分为单变量模拟运算表和双变量模拟运算表。使用单变量模拟运算表可模拟公式中一个数值发生变化对结果产生的影响;使用双变量模拟运算表可模拟公式中两个数值发生变化对结果产生的影响。
1.使用单变量模拟运算表求解
单变量模拟运算表根据变量分布在行或列中,进一步划分为行引用模拟运算表和列引用模拟运算表。下面对一张银行存款情况表(银行存款情况表是利用FV函数计算出存款人十年后可从银行提取的金额数。)分别使用行引用模拟运算表和列引用模拟运算表进行求解。
(1)行引用模拟运算表
将假设值分布在某行中,如图2所示,即应使用行引用模拟运算表来求解。
图2 行引用模拟运算表分析图
现想通过假设每年底存入的金额分别为2500、3000和3500,得出存款人十年后可从银行提取的金额数。
首先在(B9:D9)区域中输入替换“以后每年底存入的金额”的假设值。然后在假设值左下方的单元格里输入公式(此处的公式必须在假设值的左下方输入,否则结果会出错)“=FV(B4,B5,B3,B2)”。输入完成后,选中包含假设值、公式和结果区三个部分的区域(此处选中的区域必须保证包含假设值、公式和结果区三个部分,否则不会得出正确的结果),再选择“数据菜单”中的“模拟运算表”命令。在弹出的对话框中输入引用的单元格,由于这里的假设值分布在行中,所以为单变量行引用模拟运算表,即在“输入引用行的单元格”后的文本框中输入假设值要替换的原公式中的引用“B3”(以后每年底存入的金额),然后单击“确定”按钮数据分析,回到工作表中即可看到根据假设值和公式计算出的结果。
(2)列引用模拟运算表
将假设值分布在某列中,如图3所示,即应使用行引用模拟运算表来求解。
图3 列引用模拟运算表分析图
现想通过假设总存款期分别为12年、15年和18年,得出存款人十年后可从银行提取的金额数。
首先在(A10:A12)区域中输入替换“总存款期(年)”的假设值。然后在假设值右上方的单元格里输入公式(此处的公式必须在假设值的右上方输入,否则结果会出错)“=FV(B4,B5,B3,B2)”。输入完成后,选中包含假设值、公式和结果区三个部分的区域(此处选中的区域必须保证包含假设值、公式和结果区三个部分,否则不会得出正确的结果),再选择“数据菜单”中的“模拟运算表”命令。在弹出的对话框中输入引用的单元格,由于这里的假设值分布在列中,所以为单变量列引用模拟运算表,即在“输入引用列的单元格”后的文本框中输入假设值要替换的原公式中的引用“B5”(总存款期(年)),然后单击“确定”按钮,回到工作表中即可看到根据假设值和公式计算出的结果。
2.使用双变量模拟运算表求解
双变量模拟运算表可以同时根据公式中两个变量的假设值得出计算结果。在使用双变量模拟运算表时,必须保证其两个假设值分布于行和列中,且公式位于它们的交汇处,如图4所示。
图4 双变量模拟运算表分析图
现想同时通过假设每年底存入的金额分别为2500、3000和3500及总存款期分别为12年、15年和18年,得出存款人十年后可从银行提取的金额数。
首先分别在(A10:A12)区域和(B9:D9)中输入替换“总存款期(年)”和“以后每年底存入的金额”的假设值。然后在行和列的假设值的交汇处单元格里输入公式“=FV(B4,B5,B3,B2)”。输入完成后,选中包含假设值、公式和结果区三个部分的区域(此处选中的区域必须保证包含假设值、公式和结果区三个部分,否则不会得出正确的结果),再选择“数据菜单”中的“模拟运算表”命令。在弹出的对话框中输入引用的单元格,由于这里的假设值分别分布在行和列中,分别在“输入引用行的单元格”和“输入引用列的单元格”后的文本框中输入假设值要替换的原公式中的引用“B3” (以后每年底存入的金额)和“B5”(总存款期(年)),然后单击“确定”按钮,回到工作表中即可看到根据假设值和公式计算出的结果。
二 利用Excel函数进行数据计算
Excel函数共有11类数据分析,下面介绍财务函数中几个常用的函数。
1.年金函数PMT
在很多情况下我们需要贷款解决资金问题,同时我们也想知道每期的还款金额,这就可以利用Excel中的PMT函数计算得出。
PMT函数是计算在固定利率下,贷款的等额分期偿还额,也就是平时所说的“分期付款”。在表2(贷款情况表)中计算每年的还款额只要将光标定位到B5单元格中,输入或插入函数:= PMT(B2,B3,B4),此处要注意的是这里我们只对PMT函数的前三个参数(固定利率、总贷款期、本金)进行了赋值,对于后两个参数fv、type没有赋值(视为省略),是由于fv参数为未来值,一笔贷款的未来值即为零,所以这里不为fv参数赋值。而type参数的值若为0或省略代表各期付款的时间在期末,为1则为在期初,这里如没特别说明,我们则认为其付款时间在期末,即可省略论文格式模板。
表2 贷款情况表
2.投资净现值函数NPV
对于财务人员和项目人员经常要了解投资中未来各期支出和收入的当前值的总和,那就可以利用Excel中的NPV函数计算得出。
NPV函数是基于一系列将来的收(正值)支(负值)现金流和一贴现率,返回一项投资的净现值。现值是指未来各期收益折算成现在的价值总和。在表3(投资收益表)中要计算投资的净收益只要在将光标定位在B8单元格中,输入或设置函数NPV。但此处需要注意的是NPV函数根据初期投资的时间是在期初还是在期末分为两种情况。
情况一:初期投资的时间在期初,即在第一年的年初投资50000(投资均用负数表示),第一年的年末收益12000,其余年份的收益也是在年末,则在B8单元格中输入:=NPV(B2, B4:B7)+B3,注意这里要在最后除去初期的投资额。
情况二:初期投资的时间在期末,即初期投资发生在第一年的年末。在B8单元格中输入:=NPV(B2,B3:B7)即可。
表3 投资收益表
三 利用Excel进行数据保护
我们利用Excel进行数据处理后数据分析,可能会对工作表进行保护,但这样只能保证其他人不能修改数据,而所使用的公式或函数还是可以暴露给别人,如果不想其他人查看所用公式的内容,就要使用Excel中的公式隐藏功能实现。
关键词: 药动学; 数据分析; Excel; PKSolver 1.0
目前在药动学数据处理方面有很多专业软件可供选择,如使用最为广泛的WinNonlin和3P87/97程序等,使用这些功能强大的专业软件,即使是常规的药动学数据处理,也要进行复杂的操作,而大部分新药研究部门的科研人员往往畏惧于学习专业软件的操作和设置。Excel是使用最为广泛的统计软件,具有界面明晰、操作方便的优点,本研究在充分挖掘Excel的VBA编程语言的基础上,完全以Excel为平台,编制了药动学数据分析程序――PKSolver 1.0。同时,参照国内外权威药动学数据处理程序的结果,对本程序的药动学数据计算能力进行了评价,程序操作极其简单。程序的编制扩展了Excel在药动学数据处理中的应用,对于扩大药动学基础理论的实际应用,提高基层药动学研究水平具有一定的参考意义。PKSolver 1.0程序目前共包括10个模块,分别为静注1室、静注2室、静注3室、非脉管1室、非脉管1室(有时滞)、非脉管2室、非脉管2室(有时滞)、非房室模型分析、生物等效性分析(双交叉)以及缓控释制剂体内外相关分析。限于篇幅,本研究以静注2房室模块为例,简要介绍本程序的设计思想及编写过程。
1 材料
11 软件 Microsoft Excel 2002(Microsoft Corporation); 3P87(The Chinese Society of Mathematical Pharmacology); WinNonlin 4.1(Pharsight Corporation).
12 数据选自文献[1]中某药物静脉推注给药后在不同时间点测得的血药浓度时间数据。
2 方法
21 程序的编制
211 操作运行界面的设计 本程序运行界面主要包括4个部分,分别为数据输入区、结果输出区、操作设置区以及图表输出区。以静注2房室模块为例,程序运行界面如图1所示。其中数据输入区、结果输出区以及图表输出区的设置较简单,分别利用Excel程序的内置函数和图表向导即可完成,不再赘述;操作设置区是控制程序的主要部位,通过在Excel中添加按钮、按钮选项、组合框、文本框等控件,利用这些控件可以方便的进行药动学参数的选择和设置,并调用后台程序进行数据处理和结果输出。
212 前台数据的计算 利用Excel的内置函数和单元格引用,可以在操作界面上直接计算出很多中间参数,如“ln(实测浓度)”、“预测浓度”、“ln(预测浓度)”、“残差”以及“权重”等,程序可以在后台直接调用这些中间参数,运用VBA程序进行模型的拟合和优化,大大提高程序的运行效率,这种“前后结合”的数据处理方式可部分提高程序的运行效率。
213 优化过程的VBA程序编写 利用VBA语言编写大部分优化计算过程是本程序的一个特点,尽管各个模块的数据处理过程各不相同,但总的来说,每个模块的后台数据处理都大概分为以下几部分内容:①输入数据的基本合法性验证。主要包括有输入时间点的顺序是否合法、药物浓度时间点的个数是否足够用于相应房室模型分析、药物浓度时间数据是否配对、是否出现不符合实际情况的数值(如负值或者非数字型字符)等等;②待拟合参数的初始值计算及初始值的合理性验证。参数拟合结果除与优化方法有关,更重要的是拟合参数初始值的选取,选取恰当的初始值不仅仅能够加快拟合速度,还能够避免拟合过程中的溢出现象。为获得相对准确的初始值,本程序的编制过程中进行了大量的尝试和改进,除运用最为经典的残数法估算初始值外,在非脉管给药房室模型分析模块中还采用了一些经验设置,能够较快地获得非脉管给药模型参数的初始值。同时,本程序还对计算得到的初试值进行合理性验证,并根据验证结果进行参数拟合或者针对数据特征向使用者提出建议,进一步提高模型拟合的成功率;③参数拟合优化。该部分是程序参数求解的核心部分,以计算的初始值为基础,Excel自带的SOLVER加载宏为主要工具,基于GaussNewton迭代的寻优法为核心算法,进行参数的优化求解,为避免出现拟合结果数学上最优,但实际药动学上不合理的情况(如负值参数的出现)。在拟合过程中,对所有参数的结果以及参数间的相应关系进行了相应的规范和限制,从而保证拟合出符合实际情况且数学上最优的结果,最后对优化结果进行合理性验证;④二级参数及模型判据的求解。根据输入的药动学参数、设置的参数单位以及拟合得到的一级参数,求算出15个二级参数,其单位设置和计算公式参见文献[2],9个模型判据按文献[3]公式计算,分别为r、SS、WSS、R2、WR2、Rsq、S、AIC、SC,所有二级参数和模型判据均在程序后台调用Excel内置函数计算。
图1 PKsolver 1.0药动学数据分析程序运行界面 略
214 输出报告的程序编制 好的程序应具有友好的操作界面和简单的使用方法,利用本程序求得所有参数后,只要在运行界面上点击“报告输出”按钮,即可通过后台启动Microsoft Word应用程序,新建Word文件,并自动生成完整的数据分析报告,报告生成速度快且操作简便。
215 其他模块的编制 本程序中7个药动学房室模型分析模块的编制思路基本一致,非房室模型分析、生物等效性分析以及缓释制剂体内外相关性分析模块则根据相应内容进行编制,限于篇幅不再详细介绍。
22 程序的验证由于程序的模块较多,仅选取其中的代表模块,列出其计算结果进行评价,选取文献[1]中某药物静脉推注496mg给药后在不同时间点测得的血药浓度时间数据,分别用3P87、WinNonlin和本程序采用2室模型以1、1/C、1/C^2为权重进行模型拟合,所得结果用于评价本程序计算的二级参数。另外,用三种软件对此数据分别进行静注1室、2室、3室模型3种权重进行模型拟合,计算AIC值,用于评价本程序计算所得房室模型判据。用PKSolver程序进行模型拟合和参数求解时,仅需输入“时间血药浓度”原始数据,在操作设置区中设置好相应参数,点击“参数求解”按钮即可完成所有参数的自动求算,再点击“报告输出”按钮即可以生成完整的报告文件。
3 结果
对文献[1]数据分别采用3P87、WinNonlin和本程序进行房室模型分析的所有结果见表1和表2,三种程序对数据的拟合结果显示该程序在房室模型参数求算和模型判别上均和权威药动学软件非常接近,所求参数基本一致,应用本程序进行简单的药动学数据分析具有一定的可靠性,分析结果基本准确。利用VBA语言编程能够省去大量的繁琐操作,用计算机代替手工操作,将VBA语言编程应用到药学数据处理方面的报道甚少[4],本研究尝试将VBA语言编程应用于药动学数据处理,取得了预期的效果。
表1 3P87、 WinNonlin、 PKSolver对文献[1]数据按静注二室模型拟合结果的全面比较 略
表2 3P87、 WinNonlin、 PKSolver对文献[1]数据按不同模型拟合AIC判据的全面比较 略
4 讨论
41 程序的核心原理和优点利用本程序进行药动学数据分析的核心是首先通过前台界面输入数据并进行自动初步计算,然后在后台对数据进行一系列合理性验证、参数优化求解、计算二级参数、输出最终结果并自动生成报告文件,所有操作仅需点击两个按钮即可完成,操作非常简便。本程序完全基于Excel程序内置的VBA语言编制,利用Excel强大的数据处理能力和自动作图功能,将Excel应用于药动学数据分析,取得了较好的结果。如表3所示,与国内外常用的药动学数据处理程序相比,本程序具有界面友好、体积小巧、操作简单、结果输出直观方便等特点。特别是本程序充分挖掘了Excel编制宏程序的自动操作潜力,代替手工操作分析数据,将一系列药动学数据处理步骤全部集中在一个按钮上由计算机一步完成,不仅极大的提高了使用方便性,还能避免由于手工处理数据可能带来的错误,这在生物等效性分析和缓释制剂体内外相关性分析模块中表现尤为突出,这也是本程序优于一般药动学处理程序之处。
表3 国内外主要药动学数据处理软件部分功能特点的比较 略
42 程序的改进本程序在模型参数的优化时仅能使用GaussNewton迭代寻优法和共轭法两种方法,运用直观简洁的Simplex法或者Marquardt法[5]进行参数优化的VBA程序正在开发之中。另外,PKSolver 1.0目前的版本仅包括最常用的10个模块,更多的药动学数据分析模块正在开发之中,相信通过进一步优化算法、增加模块有望使本程序的数据分析能力不断完善,从而为药学工作者提供一个操作简单的智能化药动学数据处理程序。致谢: 感谢美国Pharsight Corporation提供药动学软件WinNonlin 4.1试用版!本论文在软件试用期内完成,我们正考虑通过申请PAL (Pharsight Academic License)计划获得软件注册。
参 考 文 献
1 Gabrielsson J, Weiner D. Pharmacokinetic and pharmacodynamic data analysis:concepts and applications. Stockholm, Sweden: Swedish Pharmaceutical Press, 1994,129.
2 Gibaldi M, Perrier D. Pharmacokinetics, 2nd edn. New York: Marcel Dekker, 1982,2~108.
中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2014)09-2051-03
1 数据处理中excel发展概述
Excel软件是经微软公司研发而创造出的一种实用型办公软件,由于其具有数据处理,表格制作以及图表绘制等更为全面的出具处理功能,所以在数据处理领域中迅速得到了应用和普及。作为数据工程人员学术交流和科研的主要内容,数据统计,表格绘制以及数据图形描述等数据处理过程都需要利用数据软件才能完成。Excel的研发与使用,使得数据处理过程实现了从手工计算向计算机数据处理的飞跃,并且具有更快的数据处理速度和更高的处理精度。Excel软件应用简洁,并且具有更为全面的处理功能,这也使得excel软件工具在发展中始终受到数据处理领域的高度关注。Excel软件的发展始于1987年,并且在之后的数年中,不断推出新版本,这使得excel软件的性能和功能得到了进一步的提升,加护界面的优化,图形功能的融入以及编辑环境的简捷等都使得excel软件在数据处理过程中得以迅速普及,并与当下确立了其在数据处理领域中的主导作用。
2 Excel数据处理功能总结
Excel作为微软办公软件的重要构成部分,具有数据效率高和功能丰富的特点,数据处理过程中应用到excel功能主要包括图标集、数据条的使用,数据筛选、分类与统计,数据透视表构建及其他形式图标的建立等。在excel数据处理的色阶、图标集使用中,用户能够根据自己的使用习惯建立可视化的数据分析图表,并通过向数据区域单元格中分配不同的颜色,不同长度的阴影数据条或图标等,使得数据处理界面得以进一步丰富。在excel提供的通用规则中,软件还为用户提供了更为广阔的识别项目,如对数字制定项的最大或最小百分数制定,单元格数据大于或小于平均值等。此外,在excel数据处理功能中,表格的功能使用也为用户提供了创建,扩展表的权限,如用户能够利用标题单元格中的快速筛选按钮对数据进行快速排序与筛选,在公式中使用指定项目和标题名称代替单元格的引用等。数据分类统计作为数据处理功能的重要组成,囊括了数据排序,数据筛选和分类汇总等一系列功能,在数值排序中,excel通过不断完善功能使得数据筛选范围得以进一步拓宽,如用户可以按照单元格图表,字体颜色等多种标准实现数据排序。数据透视图表绘制是对excel数据处理结果的直观展现。在excel的数据透视图表构建中,图像构建效果得到进一步完善,如边缘柔化,倾斜效果以及3D效果的应用等,用户能够通过更换图表类型使得数据在处理后能够更为直观的呈现出来。
3 Excel在数据处理中的应用分析
3.1 excel数据处理应用技巧探讨
3.1.1回车符的移动控制
Excel在数据处理过程中,通常会有对数据自左至右,自上向下的顺序输入过程,输入要求如表1:
而在excel的数据录入过程中,回车键的默认功能是光标的下移,如要通过回车键实现光标右移,则要通过对“工具”菜单中的“选项”子菜单进行编辑,并在弹出的对话框中进行光标移动方向的设置。设置方式如图:
3.1.2自定义数据快速排序
Excel数据排序种类主要分为笔画排序,字母排序等,而在数据处理过程中通常需要按照特定的顺序进行排序,如在学校职称的排序中,职称的升序排列内容是:副教授,讲师,教授和助教,降序排列的顺序则相反,但在实际排序要求中,职称排列顺序应为:教授,副教授,讲师,助教,这就要求用户要对数据排序方式进行设定。Excel为用户提供了数据自定义序列设置选项,用户可以在“工具”菜单中的“选项”子菜单对话框进行设置。设置方式如图:
在完成该操作后,还应在排序过程中通过选择“工具”菜单中的“排序”按钮,并在排序对话框中对“选项”进行自定义编辑,编辑方式如下:
在完成编辑后,点击“确定”按钮,以将设置应用到表格数据处理中。
3.1.3表格横向与竖向间的转换
Excel表格中虽然设置了表格转置功能,当在处理一系列数据向多横行转化的问题时,却无法有效实现。Excel软件中表格转换功能的设立则为行列转换提供了有效途径。在转换过程中,要首先将转换的类数据复制到Word文档中并保存,后通过单击“表格”中的“转换”按钮,将“文字转换为表格”,依据转换要求填入对应的表格列数,便能够有效实现数据的行列转换。
3.2 excel在原始数据处理中的应用
原始数据的录入在excel表格的数据处理中十分方便快捷,数据的输入过程只需用鼠标点击单元格,之后便可以直接进行数据录入。在原始数据输入过程中,为有效避免数据失效问题对数据处理产生影响,应在数据输入之前右击鼠标,选择“数字”选项,再通过点击数值选项,设定数据输入中对应的小数位数。在数据处理过程中,excel表格中的工具选项还为用户通了更为便捷的数据统计途径,如在对列数据进行平均值,标准偏差和相对偏差处理时,应在选取列数据后单击工具栏,选中粘贴函数的下拉式三角箭头,并选择“平均值”选项,进而实现对数据的平均值计算。原始数据录入与处理功能最为常用的领域是数据库处理,如医用射线诊断得出的患者数据内容,供电厂数据库数据统计与管理等。
3.3 用数据分类汇总和图表对数据进行处理的应用实例分析
Excel软件在实际数据处理中被广泛应用于数据汇总和图表数据处理中。就企业运营过程中的产品销售状况数据处理的实例进行分析。Excel软件能够以企业产品的实际销售额,不同产品种类以及产品在多市场环境中的营销状况等为数据基础,对产品销售额及其利润的月变化或年变化趋势进行总结和数据呈现,以此更为直接向企业管理者提供其运营的状况及发展趋势。根据市场调查的数据分析,某企业不同产品类别及市场销售额能够在Excel环境下实现数据汇总和不同数据透视表的构建。企业产品实际销售额的数据分类汇总图标如下:
如图所示,在工作表数据的分类汇总中,第一字段分类由于简单汇总表本身的数据列表形式,已经得到了初步分类,其中的第一字段是原数据列表中作为汇总参考的“ABC数据”字段,第二字段则是作为汇总字段的“类别”和“渠道”,这也是各个数据的分类汇总数值。在第三字段的数据列表分类中,企业则将“净销售额”作为了汇总字段,并以此为依据实现对产品实际销售数据的调用。在完成企业产品销售数据的分类统计后,为进一步实现对数据变化趋势的呈现,还要利用Excel的数据透视表功能建立起数据变化的柱状图或饼状图。企业不同产品的净销售额柱状图和饼状图如下:
柱状图更为生动的呈现出了企业不同产品的销售情况,而饼状图则更为注重对企业销售产品构成比例的呈现。Excel软件的数据透视表建设功能,不仅为实际数据处理提供了更为多样性的表达方式,也使得数据统计结果能够更为直观的得以呈现,为使用者的数据统计与处理提供了较大便利。
4 结束语
计算机和网络技术的飞速进步,为数据处理技术提供了巨大的发展动力,计算机应用技术中excel软件的应用,为当下社会发展中的各领域提供了更为科学有效的数据处理技术。Excel软件立足于当下数据处理在实际应用中的需求,为实际应用领域中的
数据处理提供了更为全面的处理途径,这不仅极大的简化了数据分析,计算和录入等过程,也保证了实际数据处理的质量和效率。随着excel软件在数据处理中应用的普及与发展,我国的数据处理技术水平将会得到巨大提升,这也为我国各领域数据库建立与发展提供了良好开端。
参考文献:
[1] 李奘.DELPHI 入门与提高[M].中国铁道出版社,2004.
Excel这种软件是以表格的形式对数据进行统计、管理以及分析的,使用者需要对表格进行操作才能得到自己想要得到的数据,而这张表格也被称为“工作表”。想要在办公时将Excel表格的优势与功能充分发挥出来,提高对数据计算、处理的准确性和效率,就需要对其使用的技巧进行全面的了解。本文将对Excel表格中的五项数据处理技巧分别展开论述,以供各位使用者进行参考。
一、处理试验数据函数的技巧
在Excel表格中函数基本分为十一种,有五种经常在试验数据处理时使用,第一种就是统计函数,在统计和分析数据区域时经常使用这种函数;第二种是三角和数学函数,使用者只需通过一些简单的编程操作就能完成基本计算;第三种是逻辑函数,主要用于数据真假的判定;第四种是引用与查找函数,通常对数据清单或者表格中的数值或单元格进行查找和引用时会使用这一种;最后一种是信息函数,使用这种函数能够准确得知固定单元格中数据值的种类,便于使用者进行分类和操作。
二、处理平均指标的技巧
使用Excel计算平均指标的情况一般分为两种,一种是求较为简单的平均数值,像想要得到全公司员工的平均年龄,首先就要将实地收集的所有数值都输入到表格中的一列内,并使用鼠标选中全列。之后点选该软件中的公式选项,进而得到年龄的平均数值;另一种是求加权平均数值,这种计算相对较为复杂,在计算时要先选择一个单元格并输入公式,然后再划定待算数值的表格区域,并对每一组的总数进行计算,得出结果。此时,只需对这些结果所在的单元格进行点选,再输入公式进行计算即可得到需要的数值。
三、处理多数据删除的技巧
由于数据的输入基本都是以人工为主,难免会发生数据出现信息输入重复、错误以及遗漏的问题,这时需要对数据进行删除或者修改的操作。这里笔者将介绍信息删除的方式。在Excel中,删除操作主要有直接删除以及批量删除两种方式,只有少量数据需要处理时只需通过人工对单元格进行直接删除的操作;当遇到需要操作处理的信息量过大时,则要使用批量删除的方式进行处理。首先,操作者要选择一个号码,并选择“升序”选项对数据进行排列;其次,要在数据的下一列单元格内输入=IF(A2=A3,1,0)这一公式,这样输入的数据中一旦出现重复的情况就会在数据的后列单元格内出现1这个数字,没有重复的数据则会显示0这个数字,这时使用者就能够很轻松地将重复的数据进行删除了。
四、处理数据对比分析技巧
(一)描述数据对比分析方式
在使用描述数据对比分析的方法时,操作者要对Excel表格中的一个单元格利用鼠标左键单击进行选中,再选择工具栏中的数据分析选项。同时,鼠标右键双击选中需要进行对比分析的描述数据,这时会自动弹出描述数据对比分析这一对话框。其中包括数据输入以及数据分组两项,操作者需要在数据输入处添加将要进行分析的数据单元格,而当输入的单元格需要以行或列的方式来进行区分时,操作者则要使用鼠标单击行或者列,在数据分组中会形成相应的数据标识。当建立新Excel表时,单击鼠标左键,就能在表格中建立新的Excel表。同时,会在新表中的左数第一单元格中将数据的最终结果显现出来。出于工作需要或者是避免表格混淆,操作者可以为新表格设定名字,只需要在表格右侧编辑框内加入自己设计的名字即可。
(二)频数表和直方图的处理
为了提高数据对比的效率,简便操作流程,操作者可以对数据分布的区域进行自定义,并使用频数表以及直方图对数据进行整理,具体操作程序为:频数表。要将原始数据表格复制到一个新表格内,并在新表格中的第二列第一行的单元格中添加组距进行标注。同时,将最小值填入第二列第二行的单元格内,将最大值填入第二列第三行的单元格之中,并单击这两行将其移动到自己选定的区间中右下角一直到第二列最后有数值的单元格之内。这样的操作方式能够有效简化单元格计算的操作程序,提高对数据的计算效率。直方图。在进行这项操作时,首先,操作者要点击工具栏里数据分析中的选项,在弹出的工具栏中选择直方图这一选项,并在弹出的直方图对话框内将需要分析、整理的数据范围添加到其中。再将标志性的数据挑选出来,之后将数据范围导出。同时,在这种样式之下进行表格下拉导出自己选中的图表,点击“确定”按钮就能够在Excel表格中自动显示出最终的计算结果。除此之外,也可以双击图表按照自己的需要对其进行修改,从而使图表更加清晰、易于理解。
五、在PPT中运用Excel的技巧
在自动化操作软件中,PPT与Excel的使用频率都相对较高,而且如果PPT有需要图表以及数据表才能表达的内容时,制作者就会将Excel添加到其中,便于观看者进行理解。但添加的方式需要一定的技巧,如果直接复制就会使表格中的数据不能正常显示。制作者需要进行反复的调整才能使其恢复正常数值,整个操作过程较为烦琐,耗费时间。因此,不可直接将Excel表格复制到PPT之中,而应在菜单栏中点击插入选项,并选择子菜单中插队对象这一操作指令,将Excel表格加入到幻灯片之中,并根据自己的演讲需求修改表格中的数据或者图像,而系统将自动进行调整,效率极高。
六、结语
Excel的功能极为强大,只要操作得当,该软件就能自动分析和统计表格中的数值,极大地提升了人们的工作效率。因此,人们想要对数据进行高效的统计和整理,就需要全面地掌握Excel的操作技巧,并要对每一技巧进行反复的练习,直至熟练掌握,这样才能在使用时将Excel的优势充分发挥出来,对数据进行准确的分析。希望本文对Excel表格五项数据处理技巧的介绍和分析,能够为使用者带来一定的帮助。
(作者单位为衡阳技师学院)
参考文献
[1] 王志梅. EXCEL表格中数据处理技巧[J].计算机时代,2001(05):15-16.
[2] 郭淑红. EXCEL表格中数据处理技巧[J].信阳农业高等专科学校学报,2001(04):96.
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 16. 083
[中图分类号] G64 [文献标识码] A [文章编号] 1673 - 0194(2014)16- 0140- 06
教学管理中,经常要对大量的数据进行分析、汇总,由此也产生了大量的管理软件,但是,软件再多,毕竟无法解决层出不穷的新问题。因此,管理人员掌握常用的数据库软件的使用,可以及时、较好地解决实际工作中的各种问题,提升工作效率。在众多的数据库软件中,Excel作为普及度最高的软件,拥有着强大的数据管理分析功能,而且随着软件的升级,加入了更多、更强大的功能,掌握好Excel的使用、充分运用其功能,将成为解决实际问题的“利刃”。本文以多次考试成绩的汇总、分析为例,提出应用Excel解决类似问题的思路,并详细讲解实际操作方法。还要指出,本问题的解决,还可应用于公司销售业绩、进出货物管理等多种情形,因此具有相当的普适性。
1 提出问题
大量来自不同地区的人员参加考试,每次组织综合科目和不同的专业科目考试,同时通过综合科目和某一专业科目才能取得该专业执业证书,没通过相关科目的人员可能再参加后面批次的考试,要求汇总分析每一次考试和几次考试的人员通过情况和地区通过情况,整理出几次考试后可取得执业注册证书的人员名单,分析每一考试科目的总体通过情况。
2 思路分析
解决该问题的难点在于整理执业证书人员名单时,必须通过综合和专业考试科目,而这两个科目不一定是在一次考试通过,而且考试的专业比较多。
在分析问题时,也应当看到,结果并不要求对每次考试的具体成绩进行层次分析,这样即可简化我们解题思路,即将通过、不通过定义为1、0即可,而不需要分析具体的考试分数(当然也可通过其他办法来进行考试成绩的定量分析)。
基于以上两个主要方面的分析,我们可以得出,利用Excel的数据透视表来解决这一问题是一个比较适当的方法。因为数据透视表是用来从Excel数据列表、关系数据库文件或OLAP多维数据集等数据源的特定字段中总比信息的分析工具。它是一种交互性报表,可以快速分类汇总比较大量的数据,并可以随时选择其中页、行和列中的不同元素,以达到快速查看数据源的不同统计结果,同时还可以随意显示和打印出用户感兴趣的区域和明细数据。数据透视表有机地综合了数据排序、筛选和分类汇总等数据分析方法的优点,可以方便地调整分类汇总的方式,灵活地以多种不同方式展示数据的特征。
3 实际操作
在本节中,以分析解决问题为主线,穿插了Excel数据处理中的常用方法。考虑到Excel 2010在数据透视表方面显著的功能升级和强化,本文以Excel 2010版本为平台进行操作。
3.1 整理数据源
问卷调查是项目研究过程中使用的一种重要手段,对问卷调查结果的统计和分析是调查研究的关键,现在网上出现了许多调查问卷网站,能够进行复杂的结果分析,但有时没有网络环境,只好用纸质问卷或电子表格问卷,这样就得进行大量的人工录入及统计。我们使用的Excel软件就可以进行调查问卷的统计和分析,Excel提供了大量的统计函数,还有进行数据处理的排序、筛选、分类汇总、数据透视表等功能。下面以Excel2003为平台,以“油田员工培训需求的调查问卷”为例,介绍如何使用Excel数据透视表对调查问卷的结果进行统计分析。
1、问卷表格格式
从“油田员工培训需求的调查问卷”中提取几个问题及选项如下表进行分析,为了统计方便我们把各选项分别给予编号O、1、2、3、4,共5个选项。问卷答题结果也使用该编号,如下图,每列第一行为问题字段,下面是答题时选择的答案的前5行,共90人答卷。
在该问卷中,要统计出不同技术职务、不同年龄段的员工对培训需求的程度,愿意接受的培训频率以及接受的每次培训时间等情况。这是多个条件的交叉统计分析问题。可以利用公式进行统计,但在不同的条件下要选择不同的数据源区域来计算,操作起来麻烦,容易出错,我们现在利用数据透视表来进行统计分析。
2、利用数据透视表进行统计分析
在答题结果工作表窗口中,单击“数据”菜单,选择“数据透视表和数据透视图”命令,弹出“数据透视表和数据透视图向导-3步骤之1”对话框,在“请指定待分析数据的数据源类型:”里,选择第一项“Microsoft Office Excel数据列表或数据库”,在“所需创建的数据表类型:”里,选择“数据透视表”,单击“下一步”,在“步骤2”中选择数据透视表的数据源区域,选中全部数据后返回,按“下一步”,在“步骤3”中,让选择透视表的显示位置,在这里选择了“新建数据表”,单击“完成”,在当前工作表前新插入了一个带有透视数据表的工作表。
现在进入了我们操作的关键,根据统计该问卷的要求,要统计出按不同技术职务、不同年龄段的员工对培训需求的程度,例如:要统计不同年龄段的具有高级工职务的员工对培训需求的程度的情况,我们可以这样操作:在“数据透视表的字段列表”中拖动“技术职务”到数据透视表的“页面区域”的位置,将“年龄”拖到“行区域”,将“培训需求程度”拖到“列区域”,再将“培训需求程度”拖到“数据区域”。然后双击“求和项:培训需求程度”,弹出“数据透视表字段”对话框,在“汇总方式”中选择“计数”,“确定”之后,就出现了数据透视表,如下图。也可以进入“表格选项”对透视表的数据选项进行一些设置,是否要总计或者空白处是否显示数字“0”等。
中图分类号:TP311
SQL Server数据库查询速度快,查询能力丰富,对数据集合的解决方法相当多,特别是数据多的时候,优势特明显。由于杭州市拱墅区招商局平时在Excel中有多个台帐,每个台帐上千条记录,十几个分部要汇总,而且每月都在增长,速度明显在下降。另外,Excel速度慢,且查询分组计算功能相对SQL Server来说相对薄弱。用SQL Server解决数据录入、汇总、存储和函数计算分析处理更方便。
1 项目需求分析
杭州市拱墅区招商局要将税收绩效数据和固定资产实际数据录入杭州市招商统计系统中。从图1可以看到,需要录入到系统的数据有外地投资方股权比重、税收总额和税务登记证号,其中税务登记证号表中直接就有记录,但是外地投资方股权比重和税收总额需要对多个台账进行统计计算才能得到。
图1 杭州市招商统计系统中需录入的数据
杭州市拱墅区招商局目前主要是这三张excel表格,内容见表1、表2、表3。每张表内容都有6000多条,内容较多而杂。
表1 2014年1-11月份的企业收入情况
表2 2013年12月份企业收入情况
表3 各个企业已投资额情况
2 项目实现过程
首先将表1、表2、表3导入SQL Server数据库中,作为数据库中的三张表,表名分别为表1、表2、表3。接下去就通过SQL代码来实现对外地股权占比及税收总额的计算和分析。
2.1 对表1和表2中的税收总额求和
现要对表1和表2中税号相同的企业收入(企业税收总额)求和。表1中是2014年1-11月的税收总额,表2中是2013年12月份的税收总额。先对表1和表2中的税收相加,但是难点是表1和表2中的税号和企业名称部分相同,部分不相同,且不对应。所以如果直接在Excel中很难实现。由于要保留两张表中不能相互匹配的企业,所以采用全外连接来实现。
实现代码如下:
图2
2.2 求出表3中外地股权占比
见表3,已投资额分为杭州方和外地方,现在要求出外地方与总投资额的比值。公式为:
外地股权占比=工商注册代码相同的企业的(D项+E项)/(C+D+E)*100。
但是表3中可见,每个相同工商注册代码都有三条或多条记录,所以在求出比值之前,需要先对工商注册代码进行分组,求出每个工商注册代码的杭州方及外地方的总投资额。
实现代码如下:
图3
2.3 求每个企业的税收总额和外地股权占比
求出每个企业的税收总额和外地股权占比,由于税收总额和外地股权占比在两张不同的表中,因此,通过连接查询将税收总额和外地股权占比查出来,将企业名称作为关键字进行匹配。
实现代码如下:
图4
得到了我们想要的税收总额和外地股权占比,将最后需要的表从SQL Server导出到Excel中[1],最后将Excel中的数据导入到杭州市招商统计系统中,就完成了整个数据的录入工作。
3 结束语
实现SQL Server数据库Excel数据表的数据导入导出功能。数据导入导出功能简化了数据录入的工作,降低了建立数据库的工作量,同时也很好的实现了报表输出功能。而且SQL Server中强大的查询分析数据的功能,轻松快速的实现了对于Excel中多个Sheet中的数据的统计归纳和计算。
参考文献:
工欲善其事必先利其器,说起数据分析工具,大家都会感觉很迷茫,有这么多数据分析工具,我应该学习哪个工具,它们之间的区别到底是什么?今天我们从 “工具” 层面带大家盘点一下,作为一名数据分析师,应该学习哪些工具呢?
一、Excel工具
说起用什么做数据分析,很多人的脑海中都会不约而同地想到Python、R、SQL、Hive等看似很难掌握的数据分析工具,它们就像数据分析路上的拦路虎一样,让人踟蹰不前。
其实,在众多的数据分析工具中,Excel属于最常用、最基础、最易上手的一款数据分析工具。Excel的功能十分强大,它不仅提供了众多的数据处理功能,像Excel函数能够帮助我们做数据整理,数据透视表帮助我们快速、高效的做各种维度分析,形形的图表能帮我们形象地展示出数据背后隐藏的规律,同时Excel还有很专业的数据分析工具库,包括描述性统计分析、相关系数分析等。
Excel对于转行数据分析的小白来说,应该是最友好的。大家都知道“转行”其实是一件很困难的事儿,但是你学会了Excel,是完全可以找到一份“数据”相关的工作的,只有踏进数据领域,你才有可能从事其它更多的数据岗位。
二、BI工具
BI工具是专门按照数据分析的流程进行设计的,也是专门用于数据分析的工具。仔细观察这些工具后,它们的基本流程是:【数据处理】-【数据清洗】-【数据建模】-【数据可视化】。
关于BI工具,其实有很多你估计已经用到过,比如说Tableau、Power BI,还有帆软FineBI等。今天我们就分别带着大家来盘点一下,这三款工具。
1、Tableau
Tableau是一款交互式数据可视化软件,它的本质其实也是Excel的数据透视表和数据透视图。
Tableau也是很好的延续了Excel,只需要简单地拖拽,就能很快地实现数据的分类汇总,然后拖拽实现各种图形的绘制,并且可以实现不同图表之间的联合。
Tableau同时支持数百种数据连接器,包括在线分析处理(OLAP)和大数据(例如NoSQL,Hadoop)以及云数据,至少现在你能学到的数据库软件,Tableau基本都能够实现与其数据之间的互动。
2、Power BI
Power-BI是一款(BI)商业智能软件,于2014年,旨在为用户提供交互式的可视化和商业智能,简单的数据共享,数据评估和可扩展的仪表板等功能。。
大家可能都知道,Power BI以前是一款Excel插件,依附于Excel,比如Power Query,PowerPrivot, Power View和Power Map等,这些插件让Excel如同装上了翅膀,瞬间高大上,慢慢地就发展成为现在的Power BI数据可视化工具。
Power BI 简单且快速,能够从 Excel电子表格或本地数据库创建图表。同时Power BI也是可靠的、企业级的,可进行丰富的建模和实时分析,及自定义开发。因此它既是你的个人报表和可视化工具,还可用项目、部门或整个企业背后的分析和决策引擎。
同时,无论你的数据是简单的 Excel电子表格,还是基于云和本地混合数据仓库的集合, Power BI都可以让你轻松地连接到数据源,直观看到或发现数据的价值,与任何所希望的人进行共享。
3、FineReport
帆软是业内做报表比较久的一家公司,使用类excel风格的界面,可添加图表和数据源,也可实现大屏效果。
其实它的类Excel风格界面,应该是它区别于Tableau工具的一个很重要的点。FineReport 通过直接连接到各种数据库,就能方便快捷地自定义各种样式,从而制作周报、月报和季报、年报。
用过FineReport 的朋友,还会有另外一种体会,它的图形效果比Tableau要酷炫的多,操作起来同样也是那样的方便。另外,FineReport 的个人版本是完全免费的,并且所有功能都是开放的,大家赶紧下去试试吧。
4、FineBI
关于FineBI,这是目前市面上应用最为广泛的自助式BI工具之一,类似于国外的Tableau等BI分析工具,但FineBI在协同配合,数据权限上,能更好的解决国内企业的情况。
但严格定义来讲,它其实是一款自助式BI。支持Hadoop、GreenPlumn、Kylin、星环等大数据平台,支持SAP HANA、SAP BW、SSAS、EssBase等多维数据库,支持MongoDB、SQLite、Cassandra等NOSQL数据库,也支持传统的关系型数据库、程序数据源等。
5、Python & R
1.简化理论,保证“够用”。统计学的原理抽象、公式的推导难懂、计算过程复杂容易出错,这些都是学生学习统计学的共同难点。大多数高职院校学生高等数学基础差,甚至根本就没有高等数学的基础。而且,统计学课程的周课时少(一般周课时只有2节),教学进度快,学生理解消化的时间不够。对高职学生来说就更是难上加难了。所以,在保证“够用”的前提下,简化理论就成了统计学教学中的一个重要任务。笔者在实际教学中,按照“必须”和“够用”的原则,根据人才培养方案和教学大纲的要求对上课的内容进行重组。强调课程体系的针对性,课程设置不是从学科体系出发,而是从职业岗位群的需要出发,体现国际劳工组织的MES职业培训体系经常采用的模式――模块式课程模式(把专业学科的系统理论知识进行简化、分解成职业岗位群所需要的模块知识)。具体课堂教学操作是:
在简化理论方面,首先,在教材体系中,简化教材中抽象基本原理的讲述、复杂公式的推导,省略繁杂的书面统计计算过程的章节。把重点放在假设检验、方差分析、χ2检验和直线回归等实际应用性的章节;其次,在教学内容上,简化抽象基本原理的讲述、复杂公式的推导,省略繁杂的统计计算过程。重点讲授基本原理适应解决的对象,统计公式应用的条件,解题的基本步骤、基本方法和应注意的事项,新增引用Excel计算统计量、统计分析和常见统计软件的初步应用等内容。
所谓“够用”,首先是保证学生将来从事的岗位群所需要的统计方法及其原理,包括基本统计方法和原理的含义、应用对象、适用条件等基本知识;其次要保证具有分析和解决实际问题的实操能力,能做到学以致用。主要包括基本统计原理在实际工作中的应用、分析和解决问题的灵活运用能力和基本统计工具(Excel和SPSS,EVIEWS,SAS统计软件)的使用能力等,其中重点是MicrosoftOfficeExcel一些自带工具在统计学上的应用。
2.优化手段,讲求“实用”。在课堂教学中,我们还应遵循教育教学过程和培养目标的另一个特点,即注重岗位能力的培养,根据“按需施教、学以致用”的原则,组织课程教学、试验和实训。笔者根据以上原则,突出统计专业课程是定量分析的内容较多,应用性和实践性十分明显的特点,把优化教学手段和“实用”结合起来,一并体现在课堂教学之中,主要是改变传统讲授统计学的“三个一”模式,对教学手段进行优化,采用多媒体自做课件教学和计算机实操教学。首先,利用多媒体教学信息容量大、视觉直观、效果好的优点,既能简化教材中抽象基本原理的讲述、复杂公式的推导,省略繁杂书面统计计算的过程,又不影响学生对教材的学习和理解,在保证基本理论够用的前提下,还有足够的时间把重点放在讲授基本原理应用性的实用内容上。其次,增加计算机实操(实验实训)课,把教材中的手工、半手工统计计算转化成计算机计算。主要做法是增加SPSS、EVIEWS和SAS统计软件的简介,重点放在引用Excel自带的函数公式“fx”计算标准误、方差等统计量、利用Excel自带的“数据分析”工具分析双样本均数假设检验和方差分析、利用Excel的“图表向导”求回归方程、相关系数和制作图表等内容,其主要目的就是利用计算机这个现代化工具去解决实际生产中的统计问题,使复杂的统计计算简单化,以增强学生的解决实际生产问题的实操运用能力。第三,根据教学对象将来的就业方向,并结合实际工作中的实际案例和学生学习中其它学科出现的统计问题自编练习题,让学生反复练习并要求他们能举一反三、熟练应用。
3.注重方法,力求“会用”。本文所讲的方法是指注重统计学的实际运用方法,强调统计学基础知识和基本原理在实际工作中的运用。重点内容应放在Excel自带的函数公式、数据分析库和统计软件的基本应用上,而不是理论和繁杂的书面计算过程。核心问题是教会学生能够灵活应用统计学这个统计工具,去解决生产实践中的实际问题。在实际生产中,最为简单、方便、实用的统计工具就是Excel。所以笔者在教学过程中就是以Excel的应用为中心,结合实际生产中的问题开展教学工作。
在工作中要始终坚持“会用”这个原则,“会用”包括两层含义:第一,会用统计的原理解决实际问题,即知道解决什么问题时使用什么统计方法;第二,会利用Excel自带的函数公式“fx”、“数据分析”库和图形处理等计算统计量,并根据统计计算结果对问题进行推论,达到解决实际问题的目的。
在课堂教学中,我们应注意以下几个问题:第一,注意讲清楚“数据分析”工具与手工统计分析计算上的衔接关系;第二,向学生交代清楚Excel自带“数据分析”适用对象、适用条件,并教会他们分析和判断;第三,详细讲授运用Excel自带函数公式和“数据分析”的具体操作步骤,明确Excel计算结果中各个数量所代表的意义。下面举例说明两种安眠药的疗效有无极显著的差异:
对10名失眠患者,服用甲乙两种安眠药。以XiYi分别表示使用甲乙两种安眠药后各个患者睡眠的延长小时数,结果如下表:
分析说明:第一,利用Excel自带的“数据分析”工具解此题的步骤同手工统计法,也要求有以下4个步骤,①提出假设;②确定显著水平;③计算概率值;④推断H0的正误。其中提出假设、确定显著水平和推断H0的正误这三步与手工统计分析相同;而Excel自带的函数公式和“数据分析”工具仅仅用于计算概率值。第二,Excel自带的“数据分析”工具的选定和运用分析。本题具有两组样本数据,而且两个样本是相互关联的,样本容量一样,每对数据都是同一总体在不同条件下抽取的样本,如第1组数据1.9和0.7是同一个患者服用甲乙两种药睡眠延长的时间数。所以应选用Excel“数据分析”工具中的“t-检验:成对双样本均值分析”。第三,讲清具体操作步骤,并注意对结果进行说明。
解:①检验假设:H0:u1=u2即两种药疗效相同;HA:u1≠u2即两种药疗效不相同
②取α的值为0.01(判断这两种安眠药的疗效有无极显著的差异)
③统计计算:此步需用Excel“数据分析”工具,具体操作步骤如下:
打开Excel,把数据输入Excel表格,点击“工具”,再点击“数据分析”,在对话框中选取“t-检验:成对双样本均值分析”,点击“确定”。在随后出现的对话框内单击“变量1的区域”后的对话框,而后拖动鼠标选定Excel表中的第1组数据;同理,单击“变量2的区域”后的对话框,而后拖动鼠标选定Excel表中的第2组数据;把“(Α)”后对话框的值改成0.01。然后在“输出选项”下面的“输出区域”前的圆圈内单击鼠标表示选定,再用鼠标点击“输出区域”后面长形对话框,并在Excel数据表中鼠标点击适当的单元格作为输出区域。最后用鼠标点击“确定”,此时Excel就会自动生成如上表的结果:“df”为自由度;“tStat”是“t-检验:成对双样本均值分析”的统计值,即t=4.062128;“t单尾临界”是单尾检验临界值,即单尾t0.01=2.8214;“t双尾临界”是双尾检验临界值,即双尾t0.01=3.2498;“P”为概率,“P(T