统计实验指导书范文.doc_第1页
统计实验指导书范文.doc_第2页
统计实验指导书范文.doc_第3页
统计实验指导书范文.doc_第4页
统计实验指导书范文.doc_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计实验指导书范文 一、目的要求统计学是指导我们在日常工作生活中如何进行数据资料的收集、和分析的一门方法论科学。 对统计数据进行处理一般需要借助一定的统计分析工具来完成。 因此,统计学的实验课教学非常重要。 通过本课程学习可以使学生加深对统计学基本理论和方法的理解,掌握Excel的统计分析功能,培养和提高学生理论联系实际、分析和解决问题的能力,为学生的科研素质打下坚实的统计学基础。 二、实验内容实验一统计与描述统计1实验类别专业2实验目的能熟练的进行统计数据的录入、分组、汇总及各种常用统计图表的绘制,能用Excel的描述统计工具计算。 3实验主要内容 (1)统计数据的录入 (2)数据分析工具库宏程序的开启 (3)数据的分组和汇总 (4)常用统计图表的绘制 (5)数据透视分析 (6)统计函数的使用 (7)单变量数列的分布特征值指标的计算4实验类型操作5实验要求必修6实验仪器计算机实验二时间序列分析1实验类别专业2实验目的能熟练运用Excel数据分析工具进行长期趋势的预测,掌握平均发展水平和平均发展速度的计算方法,了解季节变动的分析方法。 3实验主要内容 (1)平均发展水平和平均发展速度的计算 (2)用移动平均法进行长期趋势预测 (3)用指数平滑法进行长期趋势预测 (4)季节变动的分析4实验类型操作5实验要求必修6实验仪器计算机实验三参数估计与假设检验1实验类别专业2实验目的了解Excel中的各种参数估计与假设检验统计函数,能够运用Excel统计函数对正态单总体参数进行区间估计和假设检验。 3实验主要内容 (1)熟悉用于参数估计和假设检验的各种统计函数 (2)正态单总体参数的区间估计 (3)正态单总体参数的假设检验4实验类型操作5实验要求必修6实验仪器计算机实验四相关与回归分析1实验类别专业2实验目的掌握相关系数的求解方法,能够熟练运用回归分析工具进行一元和多元线性回归分析,了解单因素方差分析工具的使用。 3实验主要内容 (1)相关系数的计算 (2)单因素方差分析 (3)一元线性回归分析 (4)多元线性回归分析4实验类型操作5实验要求必修6实验仪器计算机 三、学时分配序号教学内容实验课时实验一统计与描述统计6实验二时间序列分析4实验三参数估计与假设检验2实验四相关与回归分析4合计16 四、大纲说明(一)作业量和对自学的要求本课程要求教师在学生完成各实验内容后根据需要布置一定量的思考题和练习题。 独立完成作业是学好本课程的重要手段。 作业题目应根据教学基本要求选择,学生要通过习题加深对知识点的理解和掌握。 对作业要评分并作为学生期末成绩的一部分。 并要求学生进行预习,预习是学生获得本课程知识的重要方式,教师要注意对学生自学能力的培养,学生自己更应重视自学和自学能力的培养。 (二)课程考核方式与要求1每次实验都有具体的实验题目,在规定的时间内完成实验要求的按完成的情况给定相应的成绩。 占总实验成绩的50%。 2期未考核时,安排相应的实验考核,在规定的时间内现场完成教师当场给定考核内容,根据完成情况给定相应的成绩。 占总实验成绩的50%。 (三)推荐使用教材杨世莹编著Excel数据统计与分析范例应用中国青年出版社xx年版(四)主要参考书1.徐国祥等编著统计学上海财经大学出版社xx年版2.王文中编著Excel在统计分析中的应用中国铁道出版社xx年版3.邱振昆编著Excel在经济统计中的应用中国青年出版社xx年版4.孙志刚、杨聪编著Excel在经济与数理统计中的应用中国电力出版社xx年1月第一版实验1数据与数据分析1.1数据 一、实验目的和要求能熟练的进行统计数据的录入、分组、汇总及各种常用统计图表的绘制。 二、实验内容 1、数据的录入 2、数据的排序 3、数据的分组 4、数据透视分析 5、常用统计图表的绘制 三、统计函数频数分布函数(FREQUENCY)的语法形式为:FREQUENCY(data_array,bins_array)其中Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。 四、实验步骤 1、数据的录入数据的录入是指把调查得到的结果输入到一张叫数据清单的EXCEL工作表中。 数据清单是指包含相关数据的一系列工作表的数据行,如发货单数据库,或一组客户名称和联系电话。 数据清单可以作为数据库使用,其中行表示记录,列表示字段。 例某集团公司欲在某地区投资于医疗卫生事业,为了减少风险,获得利润,该集团企划部门决定先了解一下市场潜力。 企划部王经理随机访问了该地区几家医院中就医的36名患者,询问其等候看病的时间,根据这些数据,王经理会得到什么信息呢?打开EXCEL工作表,在列中输入数据的名称,称为变量。 然后依次输入相应调查数据。 2、数据的排序打开“数据.xls”工作簿,选定“等候时间”工作表。 利用鼠标选定单元格A1:B37区域在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。 在排序对话框窗口中,选择“主要关键字”列表中的“等候时间”作为排序关键字,并选择按“递增”排序。 由于所选取数据中已经包含标题,所以在“当前数据清单”中选择“有标题行”,然后单击“确定”按钮,即可得到排序的结果。 在数据清单中使用分类汇总的方法如下先选择需要分类汇总的数据区域A1B37,然后选择“数据”菜单中的“分类汇总”选项,则打开“分类汇总”对话框。 在“分类字段”的下拉式列表中选择要进行分类的列标题,在“汇总方式”的下拉式列表中选择行汇总的方式,本例中选择按“等候时间”进行分类,选择按“计数”进行汇总,单击“确定”按钮,便得到分类汇总的结果。 在对数据进行了分类汇总之后,可以观察到等候时间为1分钟的人次为1,等候时间为3分钟的人次为2等等。 尽管分类汇总可以给出各个数值所出现的次数,但从这些次数中还是无法得出其数据分布的规律性。 这是因为没有将数值相近的数据进行合并,因而不能理想地抽象概括现象的数量特征。 3、数据的分组利用Excel频数分布函数进行分组建立频数分布的步骤为先对数据进行排序,以了解全部数据的变动范围;然后选择全部数据的分组组数;再确定分组的组限,最后对各组数值所出现的频数进行计数。 打开“数据.xls”工作簿,选择“等候时间”工作表。 在单元格C2中输入“分组”,在单元格D2中输入“频数”。 在C3C8区域中依次输入10,20,30,40,50,60,作为频数接受区域,它们分别表明等时间在10分钟以下的人数,等候时间在10分钟以上,20分钟以下的人数等。 选定D3D8区域,在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框在“函数分类”列表中选择“统计”,在“函数名”列表中选择“FREQUENCY”,单击“确定”按钮,Excel弹出“频数分布”对话窗口。 在数据区域“Data_array”中输入单元格B2B37,在数据接受区间Bins_array中输入单元格C3C8,在对话窗口中可以看到其相应的频数是6,7,9,8,5,1,0。 由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl+Shift组合键,同时敲“回车”键,得到频数分布。 4、数据透视分析数据透视主要是处理以文字形式表现的资料,如性别、职业、文化程度等。 分为单变量表格与双变量表格,前者称为单向表,后者称为交叉表。 单向表例某移动通讯公司要制定新一年的销售计划,需要向市场了解移动用户对数字移动电话类型的需求。 经过问卷设计,在该地区抽取了1000个样本进行问卷调查,获得关于移动电话用户消费行为的一些数据资料,试根据工作表中的数据分析该地区移动电话用户的电话类型偏好。 打开“数据.xls”工作簿,选定“移动电话调查”工作表。 单击“数据”菜单中的“数据透视表和图表报告”选项,Excel弹出数据透视表向导对话框。 根据向导要求,第1步是指定“数据源类型”和确定所需创建的“报表类型”。 选择“数据清单或数据库”作为数据源,选择“数据透视表”作为报表类型。 最后单击“下一步”。 第2步是确定数据区域,本例中数据所覆盖区域为A1:D1001单元格,单击“下一步”按钮,向导给出第3步操作对话框窗口。 第3步确定数据透视表的位置。 选择现有工作表,并利用鼠标将数据透视表的位置确定在E1单元格中,如果单击“完成”按钮,可以结束操作。 单击“版式”,Excel弹出对话框窗口,选择右边的“数字移动电话类型”字段,并将它拖到左边的“行”区,再选择“数字移动电话类型”字段,将其拖放在“数据”区域中,显示为“计数项数字移动电话类型”,以便进行数据汇总。 双击数据区域中的“计数项数字移动电话类型”字段,打开“数据透视表字段”对话框,在“汇总方式”列表中选择“计数”。 如果想选择数据显示方式,可单击图右侧的“选项”按钮,则EXCEL弹出“数据显示方式”。 在“数据显示方式”的下拉选项中确定“占同列数据总和的百分比”选项,单击“确定”按钮,则版式调整完毕。 再单击“确定”按钮,回到数据透视表步骤3。 单击数据透视表步骤3中的“完成”按钮。 交叉表例该公司市场部经理希望根据上例中的调查结果,确认不同性别的用户,其移动电话类型偏好是否存在着不同。 打开“数据.xls”工作簿,选定“移动电话调查”工作表。 从“数据”菜单中选择“数据透视表和图表报告”选项,得到“数据透视表对话框”窗口。 在第1步之中选择“数据清单或数据库”与“数据透视表”,单击“下一步”按钮。 在第2步中,确定数据区域A1:D1001,单击“下一步”按钮在第3步中,确定数据透视表的位置,如图所示,但将其位置调整到“H1”单元格。 然后,单击“版式”按钮,打开“版式”对话框。 将对话框右边的“数字移动电话类型”字段拖到左边的“行”区作为分组变量,再将右边的“性别”字段拖到“列”区,作为交叉分析的变量,最后将右边的“性别”字段拖放到“数据”区域中,并选择计数项。 如果希望结果是以百分比的形式显示,则可双击数据区域中的“计数项,性别”,则会弹出“数据透视表字段”对话框。 选择“占同列数据总和的百分比”选项,来表示所出现的频率,最后,单击“确定”按钮,又回到“版式”对话框。 单击“确定”按钮,回到第3步,要注意数据透视表的位置定在单元格H1,最后,单击“完成”按钮,得到交叉表。 5、常用统计图表的绘制条形图与柱形图例薪酬是众人所关心的主题,也更是当代经理人所关心的主题。 北京、上海、深圳三个市经理人的薪酬是我国经理人“薪酬市场”的晴雨表。 1999年经理人杂志所作的薪酬调查发现所调查的经理人中,平均月收入最高的是上海经理人,为7767元;其次是深圳经理人,为7602元;最后是北京经理人,为7288元。 结论应当是最高为上海经理人。 那么此结论是否可以用图形来表示呢?打开“数据xls“工作簿,选择“薪酬”工作表。 在Excel的“插入”菜单中选择“图表”选项,Excel会启动图表向导,弹出“图表向导”对话框窗口。 在“图表类型”列表中选择“柱形图”,在“子图表类型”列表中选择“三维簇状柱形图”,单击“下一步”按钮,进入数据源对话框.在这步对话框中,主要是选择数据源。 单击“数据区域”右端的“压缩对话框”按钮,打开工作表,在工作表上将鼠标指向单元格A1,按下鼠标左键,拖到B4单元格,再单击“压缩对话框”按钮,回到源数据对话框。 确定A1:B4单元格作为此图的数据源,同时,也应注意数据系列是以行还是以列方式排列,如果正确,此时,便有一个预览的图形如图所示,如满意可单击“下一步”按钮,进入“图表选项”对话框.单击对话框上方的“标题”页面,在标题中输入“三城市薪酬比较”;在“图例”页面中选择底部,至于其他功能则不需改动与填加,这些过程都会在图表预览框中看到,如果满意,单击“完成”按钮结束,得到图形。 双击所绘制的图形,则会得到对话框。 单击“字体”页面,在“字体”列表中选择“宋体”,在“字形”列表中选择“常规”,在“字号”列表选择“10”。 折线图将平面中的交点相继联接起来所得图形称为折线图,它一般用于描述某一变量在一段时期内的变动情况。 例已知1990年至1999年各月社会商品零售总额,试观察一下社会商品零售总额的发展趋势及其变动规律。 打开“数据.xls”工作簿,选择“零售额”工作表。 在B列后插入一列以便输入年份与月份。 先选择B列单元格,再打开“插入”菜单,选择“列”项,则自动在B列后填加一列C,原来C列的内容变成了D列。 在单元格C1中输入“时间”,在C2单元格中输入公式“=B2&CHAR (13)&A2”,从单元格C3开始复制这个公式到C117。 打开Excel“插入”菜单,选择“插入”菜单中的“图表”选项,Excel会启动“图表向导”。 在步骤1“图表类型”中选择“折线图”,及“数据点折线图”,单击“下一步”按钮,进入步骤2的向导窗口。 在步骤2中的数据区域中输入C1D117,单击“下一步”按钮,进入向导“步骤3”。 在步骤3中单击图表“标题”页面,输入标题“社会消费品零售额趋势图”;单击“图例”页面,取消显示图例,如果通过图表预览,认为满意,即可单击“完成”按钮。 饼形图例中国人如何看WTO。 由中国社会调查事务所组织的最新一次问卷调查显示有58.4%的被调查者对中国加入WTO非常有信心;有19.3%的被调查者没有态度;有9.2%的被调查者表示担心;有13.1%的被调查者反对中国加入WTO。 试用饼形图描述一下中国人对加入WTO的看法。 打开“数据.xls”工作簿,选择“WTO”工作表。 打开Excel“插入”菜单,并单击“插入”菜单中的“图表”选项,Excel会启动图表向导。 在步骤1的“图表类型”中选择“饼图”,并在“子类型图表”中选择“三维饼图”,单击“下一步”按钮,进入向导2。 在步骤2中的数据区域中输入A3B6单元格,单击“下一步”按钮,进入向导3。 在步骤3中单击“标题”页面,输入标题“中国人看WTO”;单击“图例”页面,取消显示图例;单击“数据标志”页面,在“数据标志”列表中选择“同时显示百分比及数据标志”。 如果通过图表预览,认为满意,即可单击“完成”按钮。 五、作业洛伦茨曲线与居民收入差异分析洛伦茨曲线是本世纪初美国经济统计学家洛伦茨根据意大利经济学家巴雷特提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。 曲线横轴是累计人口百分比,纵轴是累计收入或财富的百分比。 当一个国家的收入分配完全按人均分配时,同一累计百分比的人口就一定占有相同的累计收入百分比。 此时该国的收入分配程度曲线就与对角线重合。 如果绝大多数人口占有很少的财富和收入,而少部分人占有了绝大部分的收入,则该国的曲线就靠近下横轴和右纵轴。 一般来说,国家的收入分配不会是绝对平均的,也不会是绝对不平均的。 将任一国家或地区的收入分配情况绘制成洛伦茨曲线就可以观察分析该国家或地区收入分配的平均程度。 例某地区1999年的人口及收入情况见图所示,试绘制该地区的洛伦茨曲线。 思考你能否依据宁波市有关的统计资料,分析宁波市不同行业收入的洛伦兹曲线?1.2数据描述与分析 一、实验目的能熟练的用Excel的描述统计工具进行数据的描述和分析。 二、实验主要内容 1、集中趋势的测定与分析 2、离中趋势的测定与分析 3、分布形态的测定与分析 三、理论基础均值是所有的标志值之和除以其观察值的个数。 它考虑了所有数值,因而均值的大小受总体中极端数值的影响。 如果总体中有极大值出现,则会使均值偏于分布的右边,如果总体中出现极小值,均值则会偏于分布的左边。 众数是总体中出现次数最多的数值,它只考虑总体中各数值出现频数的多少,不受极端数值的影响,但当总体中出现多个众数时,众数便没有意义。 中位数只是考虑各单位数值在总体中的顺序变化,它受极端数值的影响不大。 将总体分成相等的四个部分的测定数为四分位数。 位于总体第25%位置的数值是第1四分位数Q1;位于总体第50%位置的数值是第2四分位数Q2;位于总体第75%位置的数值是第3四分位数Q3。 四分位距是总体中第3四分位数与第1四分数之差,四分位距可包括位于总体分布中心的50%,它能集中地反映总体的特征。 四、统计函数 1、均值函数(AVERAGE)均值函数是应用比较广泛的一种平均数函数,它能够计算一组数据的算术平均数。 其语法结构为AVERAGE(number1,number2,.)。 其中number1,number2,.为要计算平均数的130个参数。 2、中位数函数(MEDIAN)中位数函数用于描述居于数据分布中心位置的数值。 其语法结构为MEDIAN(number1,number2,.)。 其中number1,number2,.是需要找出中位数的130个数字参数。 3、众数函数(MODE)众数函数用于计算一组数据中出现频率最多的数值。 其语法结构为MODE(number1,number2,.)。 其中number1,number2,.是用于众数计算的130个参数,也可以使用单一数组(即对数组区域的引用)来代替由逗号分隔的参数。 4、总体标准差函数(STDEVP)总体标准差函数用来反映相对于均值的离散程度。 其语法结构为STDEVP(number1,number2,.)。 其中,number1,number2,.为对应于样本总体的130个参数。 5、样本标准差函数(STDEV)样本标准差函数用来计算样本中相对于均值的离散程度。 其语法结构为STDEV(number1,number2,.)其中,Number1,number2,.为对应于总体样本的130个参数 6、四分位数函数QUARTILE可以计算一组数据的四分位数。 其语法结构为QUARTILE(array,quart)其中 (1)Array为计算四分位数的数组或数据区域。 (2)Quart决定返回第几个四分位数。 如果quart等于0,函数QUARTILE返回最小值;quart等于1,函数QUARTILE返回第1四分位数(第25个百分排位);quart等于2,函数QUARTILE返回中位数(第50个百分排位);如果quart等于3,函数QUARTILE返回第3四分位数(第75个百分排位);如果quart等于4,函数QUARTILE返回最大值。 7、偏度函数(SKEW)用于计算次数分布的不对称程度。 其语法结构为SKEW(number1,number2,.)其中number1,number2.为需要计算偏斜度的130个参数。 峰度函数(KURT)用于反映次数分布的尖锐度或平坦度。 其语法结构为KURT(number1,number2,.)其中number1,number2,为需要计算其峰值的130个参数。 五、实验步骤 11、集集中中趋趋势势的的测测定定与与分分析析 (1)均值函数的使用例某企业的生产部门使用抽样方法检测一批新产品的质量,该批产品的抗拉强度见原始数据。 管理人员希望知道这批产品的抗拉强度的平均水平,以决定产品质量是否合格。 由此需要计算抗拉强度的均值、中位数与众数。 操作步骤如下打打开开“数数据据描描述述分分析析.x xlls s”工工作作簿簿,选选择择“抗抗拉拉强强度度”工工作作表表。 在在单单元元格格A A77中中输输入入“均均值值”,在在A A88中中输输入入“中中位位数数”,在在A A99中中输输入入“众众数数”。 选定单元格B7,单击“插入”菜单,选择“函数”选项,Excel会弹出“粘贴函数”对话框窗口。 在在“函函数数分分类类”列列表表中中选选择择“统统计计”,在在“函函数数名名”列列表表中中选选均均值值函函数数“A AVVE ERRA AGGE E”。 单单击击“确确定定”,则则弹弹出出“A AVVE ERRA AGGE E”函函数数对对话话窗窗口口。 在“Number1”区域中输入数据B2B6后,对话窗口底部便显示出计算结果30。 如果对话窗口中没有计算结果,便说明计算有错误,需要再检查一下。 单击“确定”按钮,计算完成。 也可以直接在单元格B7中输入均值函数公式“=AVERAGE(B2:B6)”,然后敲回车键,得到同样结果。 在单元格B8中输入公式“=MEDIAN(B2B6)”计算中位数。 在单元格B9中输入公式“=MODE(B2B6)”计算众数。 案案例例研研究究网网上上冲冲浪浪者者的的年年龄龄?据报道,越来越多的人热心于网上冲浪,因为它能够打开空间的界限,带给人许多新的知识。 现随机抽取一些上网人进行调查,得知其年龄数据如下 22、 58、 24、 50、 29、 52、 57、 31、 30、 41、 44、 40、 46、 29、 31、 37、 32、 44、 49、29。 ?试根据此样本资料对网上冲浪者的年龄水平给以描述。 操操作作步步骤骤如如下下打打开开“数数据据描描述述分分析析.x xlls s”工工作作簿簿,选选择择“网网上上冲冲浪浪”工工作作表表在在单单元元格格A A2222A A2255中中分分别别输输入入“均均值值”、“中中位位数数”、“众众数数”。 在单元格B22中输入公式“=AVERAGE(B2:B21)”,计算均值为为38.75。 在单元格B23中输入公式“=MEDIAN(B2:B21)”,计算中位数为38.5。 在单元格B24中输入公式“=MODE(B2:B21)”,计算众数为29。 22、离离中中趋趋势势的的测测定定与与分分析析如下如所示,三个不同的曲线表示三个不同的总体,其均值相同,但离中趋势不同。 ( (11)用用E Exxc ceel l函函数数计计算算标标准准差差与与样本标准差可以利用Excel来创建公式进行标准差测定,也可以利用Excel中的工作表函数来直接进行计算。 操作步骤如下建立如前述的“网上冲浪”工作表。 单击工具栏中的“函数”快捷按钮,弹出对话框如前述所示的“粘贴函数”的对话框。 在“函数分类”列表中选择“统计”,在“函数名”列表中选择总体标准差函数STDEVP。 在数据区域中输入B2B21,则计算结果便显示在对话窗口下面,其值为10.61543687,单击“确定”按钮结束。 样本标准差的计算方法与其相同。 (2)四分位数与四分位距将总体分成相等的四个部分的测定数为四分位数。 位于总体第25%位置的数值是第1四分位数Q1;位于总体第50%位置的数值是第2四分位数Q2;位于总体第75%位置的数值是第3四分位数Q3。 四分位距是总体中第3四分位数与第1四分数之差。 四分位距可包括位于总体分布中心的50%,它能集中地反映总体的特征。 仍以网上冲浪者年龄为例,计算数据的最小值、第1四分位数、第2四分位数、第3四分位数和四分位距。 打开“数据描述分析.xls”工作簿,选择“网上冲浪”工作表。 在单元格A 27、A 28、A 29、A30和A31中分别输入“最小值”、“第1四分位数”、“第2四分位数”、“第3四分位数”、“最大值”和“四分位距”。 在B27单元格中打开“插入”菜单,单击“函数”选项,在“函数类型”列表中选择“统计”,在“函数名”列表中选择四分位数函数QUARTILE,单击“确定”按钮,进入四分位数对话框窗口。 在四分位数函数QUARTILE的对话框中,?在Array中输入数据区域B2:B21;?在Quart中输入0,表示计算最小值或第0四分位数;?单击“确定”按钮,其值便显示在单元格B27中。 在单元格B28中输入“=QUARTILE(B2:B21,1)”,计算第1四分位数,显示29.75。 在单元格B29中输入“=QUARTILE(B2:B21,2)”,计算第2四分位数,显示38.5。 在单元格B30中输入“=QUARTILE(B2:B21,3)”,计算第3四分位数,显示46.75。 在单元格B31中输入“=QUARTILE(B2:B21,4)”,计算最大值,显示58。 在单元格B32中输入“=B30-B28”,计算四分位距,显示值为17。 四分位距表明整个总体中位于29.75到46.75之间的数值有50%。 换句话说,从29.75到46.75这个17岁范围内可包括总体的50%。 33、分分布布形形态态的的测测定定与与分分析析对于一组数据,不仅要描述其集中趋势、离中趋势,而且也要描述其分布形态。 这是因为一个总体如果均值相同,标准差相同,但也可能分布形态不同。 另外,分布的形态有助于识别整个总体的数量特征。 总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。 前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。 在统计分析中,用偏度指标对其进行测定。 偏度数值等于零,说明分布为对称;偏度数值大于零,说明分布呈现右偏态;如果偏度数值小于零,说明分布呈左偏态。 峰度是掌握分布形态的另一个指标,它能够描述分布的平缓或陡峭。 如果峰度数值等于0,说明分布为正态;如果峰度数值大于0,说明分布呈陡峭状态;如果峰度值小于0,则说明分布形态趋于平缓。 仍以网上冲浪者年龄为例,计算其偏态与峰度。 计算步骤如下建立“网上冲浪”工作表。 在A33单元格中输入“偏态”,在B33单元格中输入“=SKEW(B2:B21)”,其显示值为0.27701322。 在A34单元格中输入“峰度”,在B34单元格中输入“=KURT(B2:B21)”,其显示值为-1.0811953。 结果如下图所示。 从图中偏度与峰度计算结果中可以看出,偏度0.27701322,说明其分布形态呈轻微右偏态,基本接近于对称分布。 峰度系数为-1.0811953,小于0,说明其分布形态趋势于平坦。 这主要是由于观察数据过少,不能表现其应有的峰度。 实验2参数估计 一、实验目的和要求了解Excel中的各种参数估计统计函数,能够运用Excel统计函数对正态单总体参数进行区间估计。 二、实验主要内容 (1)熟悉用于参数估计的各种统计函数 (2)正态单总体参数的区间估计 (3)正态单总体参数的假设检验 三、基础理论知识 1、总体均值区间估计的基本内容当总体方差2已知时总体均值的区间估计对于给定的显著性水平,可以构造均值的置信区间为总体方差时总体均值的区间估计对于给定的显著性水平,总体均值的置信区间为 2、必要样本容量的计算公式样本量n的大小为e为抽样极限误差必要样本容量n与总体方差、抽样极限误差,置信水平之间具有下述关系在其他条件不变的情况下,总体方差越大,必要样本容量n便越大,必要样本容量与总体方差成正比;置信水平越大,必要样本容量便越大,二者成正方向关系;抽样极限误差越大,样本容量就越小,二者成反方向关系。 3、总体比例区间估计比例抽样分布的标准差或标准误差为为总体比例p为抽样比例比例置信区间是/2/2,SSXtXtnn?+2222/eZn=nppnip)1()1(?=?=/2/2,XZXZnn?+估计总体比例的必要样本容量 四、各种统计函数count()COUNTIF()AVERAGE()STDEV()SQRT()TINV()NORMSINV()CEILING() 五、实验步骤 1、利用Excel计算总体均值置信区间例某工厂想检验一批灯泡的质量,抽取10个样本对其耐用小时进行检测,结果如下1326133613511365120913431259136513081349试以95%的置信度估计这批灯泡的平均耐用小时。 打开“参数估计.xls“工作薄,选择“均值”工作表。 选择单元格D1,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。 在“函数分类”列表中选择“统计”,在“函数名”列表中选择计数函数COUNT。 单击“确定”按钮,打开计数函数对话框。 在value1中输入数据范围。 单击A列列头,或输入“A:A”,这相当于选择整个列,包括标题和所有的空单元格。 单击“确定”按钮。 单元格D1中会显示结果为10,即A列中数据的个数。 在单元格D2中输入公式“=AVERAGE(A:A)”,计算A列的均值,显示值为1321.1。 在单元格D3中输入公式“=STDEV(A:A)”,计算A列的标准差,显示值为50.38397。 在单元格D4中输入公式“=D3/SQRT(D1)”,计算标准误差,即标准差除以样本容量的平方根,D4中显示15.932.81。 在单元格D5中输入置信度95%。 在单元格D6中使用TINV函数计算在95%置信度和自由度下的t值。 选择单元格D6,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。 /2/2 (1) (1),pppppZpZnn?+2222)1(p)1(ezpezn?=?=在“函数分类”列表中选择“统计”,在“函数名”列表中选择TINV函数。 单击“确定”按钮,打开TINV函数对话框。 在“Probability”中输入“1D5”,所显示的值是0.05;在“Deg_freedom中输入自由度的表达式,即“D11”,所显示值是9,单击“确定”按钮,单元格D6中显示值为2.262159。 在单元格D7中输入计算抽样极限误差的公式,它是t值和标准误差的乘积,公式为“=D6*D4”,显示值为36.04255。 在单元格D8和D9中输入计算置信区间上限和下限的公式,下限为样本均值减抽样极限误差,上限为样本均值加抽样极限误差。 其公式分别为“=D2-D7”和“=D2+D7”,显示值为1285.057和1357.143。 这样,总体均值的95%的置信区间为置信度越高,下限值越低,上限值越高,置信区间越宽;反之,置信度越低,置信区间越小。 2、样本容量的计算样本量n的大小为从上式可以看出,必要样本容量n与总体方差、抽样极限误差,置信水平之间具有下述关系在其他条件不变的情况下,总体方差越大,必要样本容量n便越大,必要样本容量与总体方差成正比;置信水平越大,必要样本容量便越大,二者成正方向关系;抽样极限误差越大,样本容量就越小,二者成反方向关系。 例某快餐店想在置信度为96%的条件下估计午餐时间每位顾客的平均支出,根据过去经验,每个顾客平均支出的标准差不超过5元,要抽取多少样本才能使其抽样极限误差不超过2元呢?打开“参数估计.xls”工作簿,选择“样本容量”工作表;在单元格B1中输入极限误差2,在单元格B2中输入置信度0.96。 在单元格B4中输入标准差5。 单元格B3中需要输入与B2中置信度相对应的Z值。 使用NORNSINV函数,可以把左侧概率转换成Z值。 在单元格B3中输入公式“=NORMSINV(B2+(1-B2)/2)”,计算与B2的置信度相应的左侧Z值。 显示对应于置信度为96%的Z值为2.05。 在B5单元格中根据上面样本容量的计算公式,输入公式“=(B32*B42)/B12”,计算样本容量,显示值为7.30。 在B6单元格输入“=CEILING(B5,2)”,显示值为8。 3、利用Excel模拟区间估计打开“参数估计.xls”工作簿,选择“模拟区间”工作表。 143.1357057.1285 在单元格Y2中输入置信度95%,它表示有95%样本所构造的置信区间包含总体均值。 在单元格A2中输入65。 选择A2,在“”菜单中选择“填充”选项,在填充选项中选择“序列”,打开序列对话框。 在“序列产生在”框中选择“行”,在步长值中输入5,在终止值中输入135,单击“确定”按钮。 数据出现在A2O2区域中。 在单元格P2中输入公式为“=AVERAGE(A2:O2)”,计算样本的均值,显示的值是100。 在单元格Q2中输入公式“=STDEV(A2:O2)”,计算样本的标准差。 显示的值是22.36068。 在单元格R2中输入公式“=Q2/SQRT (15)”,计算标准误差,即样本标准差除以15的平方根,显示值为5.773503。 选定单元格S2,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。 在“函数分类”列表中选择“统计”,在“函数名”列表中选择函数TINV。 单击“确定”按钮,打开TINV函数对话框。 在Probability中输入1$Y$2,Y2要绝对引用,在Deg_freedom中输入151。 单击“确定”按钮后,在单元格S2中显示的值是2.144789。 在单元格T2中输入公式“=P2-S2*R2”,以计算估计下限,其值为87.61706。 在单元格U2中输入公式“=P2+S2*R2”,以计算估计下限,其值为112.3829。 在V列输入函数用来确认置信区间是否包括总体均值100。 显然如果满足两个条件,即单元格T2的值(下限)一定小于或等于100,单元格U2的值(上限)一定大于或等于100。 则置信区间便包括100。 利用逻辑函数可以完成这个任务。 操作如下选择单元格V2,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。 在“函数分类”列表中选择“逻辑”选项,在“函数名”列表中选择“AND”函数,单击“确定”,打开AND函数对话框。 在“Logical1”中输入表达式“t2=100”。 表中估计下限T2的值是87.61706,小于100,估计上限U2的值是112.3829,大于100,所以计算结果为真,显示为“TRUE”,单击“确定”按钮。 可以看到符合条件的结果。 4、总体比例区间估计例某食品厂准备上市一种新产品,并配合以相应的广告宣传,企业想通过调查孩子们对其品牌的认知情况来评估广告的效用,以制定下一步的市场推广计划。 他们在该地区随机抽取350个小孩作访问对象,进行儿童消费者行为与消费习惯调查,其中有一个问句是“你听说过这个牌子吗?”,在350个孩子中,有112个小孩的回答是“听说过”。 根据这个问句,可以分析这一消费群体对该品牌的认知情况。 所以,食品厂市场部经理要求,根据这些样本,给定95的置信度,估计该地区孩子认知该品牌的比例。 打开“参数估计.xls”工作簿,选择“比例估计”工作表;在单元格B2中输入n值为350。 在单元格B3中键入公式“=112350”,用Excel来计算抽样比例Pi值为0.32。 在单元格B4中键入公式“=SQRT(B3*(1-B3)/B2)”计算比例标准误差。 其显示值为0.024934。 在单元格E2中键入置信度0.95。 单元格E3中的Z值是与单元格E2中的置信度所对应的标准正态分布的区间点,它是位于中间部分的临界值。 使用函数NORMSINV可以确定Z值。 确定与中心区域概率对应的Z值时有两种方法一种是输入Z值左侧的“概率”,即0.25,函数将计算E2单元格中左侧部分的Z值,即返回的是-Z。 这意味着在E2单元格中须用绝对值的方法将标准正态分布函数NORMSINV返回的Z值改为正数。 另一种方法是把中间区域的概率与Z值左侧的概率相加,即0.95+0.25,所计算的是从左侧起一直到Z值区域的概率,通过这部分概率的计算,也可确定出Z值。 选定E3单元格,输入公式“=ABS(NORMSINV(0.025)”或“=NORMSINV(E2+(1-E2)/2)”,便可确定Z值,单元格E3中将显示1.959961。 在E4单元格中输入公式“=E3*B4”,计算极限误差,其结果显示为0.04887。 在单元格E5中输入“=B3-E4”计算估计下限,在E6单元格中输入“=B3+E4”计算估计上限。 结果分别显示为0.27113和0.36887。 5、估计总体比例的必要样本容量例联想集团希望了解购买“天禧”品牌计算机的消费者满意比例,集团确信“天禧”品牌计算机满意比例不会小于70%。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论