高中数学第二章统计2.2用样本估计总体_第1页
高中数学第二章统计2.2用样本估计总体_第2页
高中数学第二章统计2.2用样本估计总体_第3页
高中数学第二章统计2.2用样本估计总体_第4页
高中数学第二章统计2.2用样本估计总体_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2用样本预计总体(2)1/45画频率分布直方图步骤:

第一步:求极差:(数据组中最大值与最小值差距)

第二步:决定组距与组数:(强调取整)

第三步:将数据分组

(给出组界限)

第四步:列频率分布表.

(包含分组、频数、频率、频率/组距)

第五步:画频率分布直方图(在频率分布表基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)

组距:指每个小组两个端点距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。复习:绘制频率分布直方图有哪几个步骤呢?

2/45在样本频率分布直方图中,当样本容量增加,作图时所分组数增加,组距降低,对应频率折线图会越来越靠近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够准确地反应了总体在各个范围内取值百分比,它能给我们提供愈加精细信息.总体密度曲线:月均用水量/t频率组距0ab3/45茎叶图作法:(1)将每个数据分为茎(高位)和叶(低位)两部分,如本例中,用茎表示十位上数字,用叶表示个位上数字;(2)将最小茎和最大茎之间数按大小次序排成一列,写在左(右)侧;(3)将各个数据叶按大小次序写在其茎右(左)侧.甲 乙012345254511667949086438639831叶 茎叶4/45茎叶图、频率分布表与频率分布直方图比较(1)茎叶图、频率分布表与频率分布直方图都是用来描述样本数据分布情况。(2)茎叶图由全部样本数据组成,没有损失任何样本信息;同时,茎叶图中数据能够随时统计,随时添加,方便统计与表示(这对于教练员发觉运动员现场状态尤其有用).但当样本数据较多时,枝叶就会很长,茎叶图就显得不太方便;(3)频率分布表与频率分布直方图则损失了样本一些信息,必须在完成抽样后才能制作。5/45某校高一(1)班同学在老师布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同条件下进行测试,得到以下试验数据(单位:m/s2):9.629.59.789.9410.019.669.889.6810.329.769.459.999.819.569.789.729.939.949.659.799.429.689.709.849.90怎样用这些数据对重力加速度进行预计?问题引入:6/45知识新授:一、众数、中位数、平均数概念普通地,n个数据按大小次序排列,处于最中间位置一个数据(或最中间两个数据平均数)叫做这组数中位数(median).一组数据中出现次数最多那个数据叫做这组数众数(mode).

算术平均数是指资料中各观察值总和除以观察值个数所得商,简称平均数或均数.

用这些特征数据对总体进行预计优缺点是什么?7/45平均数、中位数、众数都是描述数据“集中趋势”“特征数”,它们各自特点以下:用平均数作为一组数据代表,比较可靠和稳定,它与这组数据中每一个数都相关系.对这些数据所包含信息反应最为充分,因而应用最为广泛,尤其是在进行统计推断时有主要作用,但计算较繁琐,而且易受极端数据影响.用众数作为一组数据代表,可靠性较差,但众数不受极端数据影响,而且求法简便,当一组数据中个别数据变动较大时,适宜选择众数来表示这组数据“集中趋势”.用中位数作为一组数据代表,可靠性也较差,但中位数也不受极端数据影响,也可选择中位数来表示这组数据“集中趋势”.8/45我们惯用算术平均数(其中ai(i=1,2,…,n)为n个试验数据)作为重力加速度近似值,它依据是什么呢?任何一个样本数据改变都会引发平均数改变.这是中位数、众数都不具备性质,也正是这个原因,与众数、中位数比较起来,平均数能够反应出更多关于样本数据全体信息.9/45

练习:在一次中学生田径运动会上,参加男子跳高17名运动员成绩以下表所表示:成绩(单位:米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩众数,中位数与平均数10/45解:在17个数据中,1.75出现了4次,出现次数最多,即这组数据众数是1.75.上面表里17个数据可看成是按从小到大次序排列,其中第9个数据1.70是最中间一个数据,即这组数据中位数是1.70;

这组数据平均数是

答:17名运动员成绩众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).用这些特征数据对总体进行预计优缺点是什么?11/45二、众数、中位数、平均数与频率分布直方图关系

1、众数在样本数据频率分布直方图中,就是最高矩形中点横坐标。比如,在上一节调查100位居民月均用水量问题中,从这些样本数据频率分布直方图能够看出,月均用水量众数是2.25t.如图所表示:12/453.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2100位居民月均用水量(单位:t)13/45频率分布直方图以下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.52.2514/45

2、在样本中,有50%个体小于或等于中位数,也有50%个体大于或等于中位数.所以,在频率分布直方图中,中位数左边和右边直方图面积应该相等,由此能够预计中位数值。下列图中虚线代表居民月均用水量中位数预计值,此数据值为2.03t.15/45频率分布直方图以下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.52.0316/45说明:2.03这个中位数预计值,与样本中位数值2.0不一样,这是因为样本数据频率分布直方图,只是直观地表明分布形状,不过从直方图本身得不出原始数据内容,所以由频率分布直方图得到中位数预计值往往与样本实际中位数值不一致.17/45

3、平均数是频率分布直方图“重心”.是直方图平衡点.n个样本数据平均数公式:X=下列图显示了居民月均用水量平均数:x=1.97318/45频率分布直方图以下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.51.97319/45三.

三种数字特征优缺点

1、众数表达了样本数据最大集中点,但它对其它数据信息忽略使得无法客观地反应总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t居民数比月均用水量为其它数值居民数多,但它并没有告诉我们多多少.20/45

2、中位数是样本数据所占频率等分线,它不受少数几个极端值影响,这在一些情况下是优点,但它对极端值不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽略。21/45

3、因为平均数与每一个样本数据相关,所以任何一个样本数据改变都会引发平均数改变,这是众数、中位数都不含有性质。也正因如此,与众数、中位数比较起来,平均数能够反应出更多关于样本数据全体信息,但平均数受数据中极端值影响较大,使平均数在预计时可靠性降低。22/45四、众数、中位数、平均数简单应用例1某工厂人员及工资组成以下:人员经理管理人员高级技工工人学徒累计周工资2200250220200100人数16510123累计2200150011001006900(1)指出这个问题中周工资众数、中位数、平均数(2)这个问题中,工资平均数能客观地反应该厂工资水平吗?为何?23/45(加权平均数)分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出数据可见,只有经理周工资在平均数以上,其余人都在平均数以下,故用平均数不能客观真实地反应该工厂工资水平。24/45问题:有两位射击运动员在一次射击测试中各射靶十次,每次命中环数以下:甲78795491074乙9578768677假如你是教练,你应该怎样对这次射击情况作出评价?假如这是一次选拔性考评,你应该怎样作出选择?

两人射击平均成绩是一样.那么两个人水平就没有什么差异吗?25/4545678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)发觉什么?为此,我们还需要从另外一个角度去考查这2组数据!26/45直观上看,还是有差异.如:甲成绩比较分散,乙成绩相对集中(如图示).所以,我们还需要从另外角度来考查这两组数据.比如:在作统计图表时提到过极差.甲环数极差=10-4=6乙环数极差=9-5=4.它们在一定程度上表明了样本数据分散程度,与平均数一起,能够给我们许多关于样本数据信息.显然,极差对极端值非常敏感,注意到这一点,我们能够得到一个“去掉一个最高分,去掉一个最低分”统计策略.27/45四、标准差考查样本数据分散程度大小,最惯用统计量是标准差.标准差是样本平均数一个平均距离,普通用s表示.所谓“平均距离”,其含义可作以下了解:28/45方差、标准差是样本数据到平均数一个平均距离。它用来描述样本数据分散程度。在实际应用中,标准差常被了解为稳定性。1、方差(标准差平方)公式为:假设样本数据是平均数是2、标准差公式为:在刻画样本数据分散程度上,二者是一致!29/45标准差方差、标准差是样本数据到平均数一个平均距离。它用来描述样本数据离散程度。在实际应用中,标准差常被了解为稳定性。规律:标准差越大,则a越大,数据离散程度越大;反之,数据离散程度越小。30/45例2.已知有一个样本数据为1,2,3,4,5,求平均数,方差,标准差.31/45例3甲乙两人同时生产内径为25.40mm一个零件.为了对两人生产质量进行评选,从他们生产零件中各抽出20件,量得其内径尺寸以下(单位:mm)甲25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论