ecel在统计中的应用_第1页
ecel在统计中的应用_第2页
ecel在统计中的应用_第3页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Excel在统计中的应用MicrosoftExcel是美国微软公司开发的Office办公软件中最重要的组件之一,它是目前应用最为广泛的表格处理软件之一。随着Excel版本的不断提高,统计分析功能也逐渐强大,目前通过加载宏添加的数据分析工具使复杂的统计分析变得快捷和易于计算完成。与标准统计学软件SASSPS游相比较,Excel的最大优势在于普及率高、容易得到:正规渠道购买的电脑内大多数预装有Office办公软件,且为中文界面,使用它进行统计分析物版权问题。强大的数据填充功能:这使在Excel工作表中输入数据变得相当简单使用简单,不用记许多特殊指令“数据分析”工具可完成大多数常用的统计分析:对于较

2、复杂的统计学方法可简单利用内置函数自编程序完成其缺点:自动化程度不高,功能不够强大,有些统计计算不能直接完成。一利用分析工具进行描述性统计二样本直方图三假设检验四方差分析五相关与回归一、利用分析工具进行描述性统计此分析工具用于对输入区域中数据的单变量分析,并提供数据趋中性和易变性等有关信息。例1.某班20名学生考试成绩单如下表,试用分析工具中的描述统计对班级成绩进行分析汇总,并给出相关的统计指标。操作步骤:1.新建一个工作表表1?2.选择“工具”菜单的“数据分析”子菜单,选择“描述统计”选项,单击确定出现描述性统计对话筐;3.出现“描述统计”对话框,对话框内各选项的含义如下:输入区域:在此输入

3、待分析数据区域的单元格范围。一般情况下Excel会自动根据当前单元格确定待分析数据区域。分组方式:如果需要指出输入区域中的数据是按行还是按列排列,则单击“行”或“列”,“描述统计”工具可以同时对多列或多行数据进行统计分析。标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”复选框;如果输入区域没有标志项,则不需要选择该复选框,Excel将在输出表中生成适宜数据标志。输出区域:填写输出结果表左上角单元格地址,用于控制输出结果的存放位置。整个输出结果分为两歹0,左边一歹0包含统计标志项,右边一歹0

4、包含统计值。根据所选择的“分组方式”选项的不同,Excel将为输入表中的每一行或每一列生成一个两列的统计表。新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始存放计算结果。如果需要给新工作表命名,则在右侧编辑框中键入名称。新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中存放计算结果。汇总统计:指定输出表中生成以下统计结果,则选中此复选框。这些统计结果有:平均值、标准误差、中值、众数、标准偏差、方差、峰值、偏斜度、极差全距最小值、最大值、总和、样本个数。均值置信度:假设需要输出由样本均值推断总体均值的置信区问,则选中此复选框,然后在右侧的编辑框中,输

5、入所要使用的置信度。例如,假设置信度95咐算出的总体样本均值置信区间为10,则表示:在5祁显著水平下总体均值的置信区问为(-10,+10。第K个最大/小值:如果需要输出每个区域的数据的第k个最大或最小值,则选中此复选框。然后在右侧的编辑框中,输入k的数值。4.填写完“描述统计”对话框之后,按“确定”按扭即可。结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值,标准误差(),组中值(Medium),众数(Mode),样本标准差(S),样本方差(S2),峰度值,偏度值,极差(Max-Min),最小值(Min),最大值(Max),样本总和,样本个数n和一定显著水平下总体均

6、值的置信区问。二、样本直方图在实际的问题中,总体的分布情况往往是不活楚的,利用样本资料通过作出适当的统计图作直观观查,当总体的数量指标是连续型随机变量时,可作样本频率密度直方图,作为总体概率密度函数的进似。例2.100包颗粒剂每包称重如下,试推断每包颗粒剂重量的概率分布情况。操作步骤:1.新建一个工作表表2表2中填入分好组:1找出样本数据的最大值和最小值,这里是0.78和1.06;2确定分组的组距和组数?2.选择“工具”菜单的“数据分析”子菜单,选择“直方图”选项,单击确定出现直方图对话筐;3.出现“直方图”对话框,对话框内主要选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。接收

7、区域可选:在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel将统计在各个相邻边界直之间的数据出现的次数。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间O标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则活除此该复选框,Excel将在输出表中生成适宜的数据标志。输出区域:在此输入结果输出表的左上角单元格的地址用于控制计算结果的显示位置。如果输出表将覆盖已有的数据,Excel会自动确定输出区域的大小并显示信息。柏拉图:选中此复选框,可以在输出表中

8、同时显示按降序排列频率数据。如果此复选框被活除,Excel将只按升序来排列数据。累积白分比:选中此复选框,可以在输出结果中添加一列累积白分比数值,并同时在直方图表中添加累积白分比折线。如果活除此选项,则会省略以上结果。图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。4.按需要填写完“直方图”对话框之后,按“确定”按扭即可。结果说明:完整的结果包括三列数据和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积白分比。三假设检验假设检验是统计推断中的重要内容。假设检验主要分为两种类型:双侧尾检验和单侧尾检验。当需要检验:H0:(t1=(t2,HA

9、:。1丈(T2H0:(t1=(t2,HA:1<2H0:1=b2,HA:b1>b2一两正态总体方差的假设检验对于来自两个正态总体的样本,其总体方差分别为b12和b22,从两个总体中独立地抽取容量为n1和n2的样本,对应的样本方差分别为S12和S22,假设需要检验b12=b22,则可利用分析工具的F检验。例3.合成车间某中问体生产的工艺条件改革后,收率似有提高,但工人师傅反映新工艺的条件不易控制,收率波动较大,为此,对新老工艺分别抽取假设十批,结果如表所示。试检验推断老师傅反应的问题是否届实。单击“工具”菜单的“数据分析”子菜单,选择“F-检验一一双样本方差”结论:由统计数据知道样本统

10、计量F=2.990066994,其对应的的概率P=0.06884784>0.05,说明抽样的结果不是小概率事件,所以接受H0:bi2=b22拒绝HA(T12>b22说工工人师傅反映的问题显著有误的。二两正态总体均数的假设检验1、配比照较例4、某中医师用中药宵木香治疗高血压患者,治疗前后的情况下表所示。问该中药治疗高血压是否有效?操作步骤:1.新建一个工作表表42.单击“工具”菜单的“数据分析”子菜单,选择“t-检验一一平均值的成对二样本分析”选项,单击确定出现t-检验一一平均值的成对二样本分析对话筐;3.在对话框中,按要求填入相应选项,单击确定按钮,输出分析结果。5.结论:由统计数

11、据知道样本统计量t=-5.81435,其对应的的概率P=0.000117<0.01,说明抽样的结果是小概率事件,所以拒绝H011-以2=0,接受HA11-12丈0.说明该中药对质量高血压有极显著效果。2、成组比较1已知b12=b22例5.例3中合成车间某中问体生产的工艺条件改革后,收率似有提高,为此,对新老工艺分别抽取假设十批,结果如表3所示。试推断检验新老工艺的收率是否有差异。操作步骤:单击“工具”菜单的“数据分析”子菜单,选择“t-检验一一双样本等方差假设”选项,5.结论:由统计数据知道样本统计量t=-5.04748,其对应的的概率P=0.00009929.92E-05<0.0

12、1,说明抽样的结果是小概率事件,所以拒绝H0:1-2=0,接受HA从1-从2丰0.说明新老工艺的收率有极显著差异。2已知b12丈b22单击“工具”菜单的“数据分析”子菜单,选择“t-检验一一双样本等方差假设”选项三单个正态总体的假设检验例6、根据大量调查,已知健康成年男子脉搏均数为72次/分。某医生在某山区抽查了25名成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否据此认为该山区健康成年男子脉搏高于一般水平?操作步骤:1.在工作表中键入已知数据表52.计算t统计量及P值等:3. ?在G4中键入"=ABS(C4-C7)/D7*B7A0.5”;在G5中键入“=B7-1”求

13、自由度;在G6中键入"=TDIST(G4,G5,1),求单侧P值;在G7中键入"=TDIST(G4,G5,2),求双侧P值;在G8中键入"=C7-C4'',求X-0;结果分析:根据专业知识,已知山区不会低于一般水平,故作单侧检验,t值=1.692308,P值单侧=0.052,按0.05水平不拒绝H0,可认为该山区健康成年男子脉搏与一般人群健康成年男子脉搏的差异无统计学意义。四方差分析单因素方差分析可用于检验两个或两个以上的总体均值相等的假设是否成立。该检验假定总体是服从正太分布的,总体方差是相等的,并且随机样本是独立的。这种工具适用于完全随机化试验

14、的结果分析。例8.某公司研制出A,B,C,D4种新型压片机,在单位时间内每台压片机进行了6次压片操作,统计它们压片数量如下表,试在a=0.01的显著水平下检验这4种设备在相同时间生产的数量是否存在显著差异。结果分析:按照如上的操作步骤即可得到计算结果。其中表格的第二部分则是方差分析的结果。SS列分别给出了四个分组的组问方差、组内方差以及总方差,DF列分别给出了对应方差的自由度,MS列是平均值方差,由SS除于DF得到,它是总体方差的两个估计值。F列是F统计量的计算结果,如果四个总体均值相等的假设成立的化,它应该服从F分布,即近似为1,它是最终的计算结果,通过将它与一定置信水平下的F临界值Fcri

15、t比较,可以判断均值相等的假设是否成立,在本例中,1.67761<2.94668,所以不能拒绝四个总体均值相等的假设。P-value列,是单尾概率值,说明如果四个总体均值相等的假设成立的化,得到如上样本结果的概率是19.442%,即得到以上样本并不是小概率事件,同样也得到不能拒绝四个总体均值相等的假设的结论。按相似方法可进行无重复双因素方差分析,有重复双因素方差分析。五相关与回归相关分析按照讨论的相关变量多少可分为简单相关和多元相关乂称复相关,简单相关是指一个因变量与一个自变量的相关关系,而多元相关则是一个因变量与两个或两个以上自变得相关关系。这里着重讨论如何应用EXCEI确定和度量变量

16、间的简单线性相关与回归分析。一散点图对于两变量相关关系确实定,可以采用散点图的方法,通过在EXCEI重绘出两变量的散点图,根据散点分布确定两变量的相关关系,当然散点图仅能定性地确定出相关关系,不能给出定量的度量。例9用双波长薄层扫描仪对紫草含量进行测定,得气浓度c与测得积分值h的数据如下表。试作出浓度c与测得积分值h的散点图。操作步骤:1.新建一个工作表表102.单击“插入”菜单的“图表”子菜单,选择“XY-散点图”选项,在“子图表类型”选定最上段类型,单击“下一步”3.出现“源数据”-选定“数据区域”-“列”-“下一步”4.在“图表向导4步骤3”对话筐中,单击“网格线”-删去“主要网格线”-

17、单击“下一步”输出结果。二相关系数使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应正相关;或者一个集合的较小数据是否与另一个集合的较小数据相对应负相关;还是两个集合中的数据互不相关相关性为零。操作步骤:1.新建一个工作表表92.单击“工具”菜单的“数据分析”子菜单,选择“相关系数”选项,3.填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相关系数矩阵。三回归方程线性回归分析通过使用“最小二乘法”对样本数据进行直线拟合,用于分析单个因变量是如何受一个或几个自变量影响的。操作步骤:1.新建一个工作表表92.单击“工具”菜

18、单的“数据分析”子菜单,选择“回归”选项,弹出回归分析对话框。3.对话框主要选项的含义如下:Y值输入区域:输入因变量数据区域,该区域必须由单列数据组成;X值输入区域:输入对自变量数据区域,自变量的个数最多为16;置信度:如果需要在汇总输出表中包含附加的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度,95利默认值;常数为零:如果要强制回归线通过原点,则选中此复选框;输出区域:在此输入输出表左上角单元格的地址,用于控制计算结果的输出位置。汇总输出表至少需要有七列的宽度,包含的内容有anova表、系数、y估计值的标准误差、r2值、观察值个数,以及系数的标准误差;新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始显示计算结果,如果需要给新工作表命名,则在右侧的编辑框中键入名称;新工作簿:单击此选项,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论