北师大版必修3-用样本估计总体_第1页
北师大版必修3-用样本估计总体_第2页
北师大版必修3-用样本估计总体_第3页
北师大版必修3-用样本估计总体_第4页
北师大版必修3-用样本估计总体_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复习回顾抽样方法简单随机抽样分层抽样抽签法随机数表法

抽样过程中每个个体被抽取机会相等,表达了抽样客观性与公平性系统抽样为了考查一个总体情况,在统计中通常是从总体中抽取一个样本,用样本相关情况去预计总体对应情况.这种预计大致分为两类:

一类是用样本某种数字特征(比如平均数、标准差等)去预计总体对应数字特征.一类是用样本频率分布去预计总体分布;第1页§5用样本预计总体(1)一、预计总体分布例1

.为了了解某地域高二学生身体发育情况,抽查了地域100名年纪为16.5岁至17岁男生体重情况,结果以下(单位:kg):60.569.56561.564.566.56464.56258.573.559677057.565.568717568.562.56659.563.564.567.573687266.5746360557064.5586470.55762.5656971.573625874716663.560.559.563.5657074.568.56455.572.566.568766160685769.57464.55961.5676863.5585965.562.569.57264.56168.5646265.558.567.570.5656666.5706359.5请你预计该地域年纪为16.5岁至17岁男生体重分布情况.第2页解:

这里,假如把总体看作是该地域年纪为16.5岁至17岁男生体重,那么我们就要经过上面样本信息,来预计总体分布情况.但从抽样数据极难直接预计出总体分布情况.60.569.56561.564.566.56464.56258.573.559677057.565.568717568.562.56659.563.564.567.573687266.5746360557064.5586470.55762.5656971.573625874716663.560.559.563.5657074.568.56455.572.566.568766160685769.57464.55961.5676863.5585965.562.569.57264.56168.5646265.558.567.570.5656666.5706359.5第3页

为此,我们能够先将抽样数据按每个数据出现频数和频率汇成下表:体重/kg频数频率5510.0155.510.015720.0257.510.015830.0358.520.025930.0359.530.036020.0260.520.026120.0261.520.026240.04体重/kg频数频率62.530.036320.0263.540.046450.0564.560.066540.0465.530.036630.0366.540.046720.0267.520.026850.0568.530.03体重/kg频数频率6910.0169.530.037040.0470.520.027120.0271.510.017230.0372.510.017320.0273.510.017430.0374.510.017510.017610.01解:

这里,假如把总体看作是该地域年纪为16.5岁至17岁男生体重,那么我们就要经过上面样本信息,来预计总体分布情况.但从抽样数据极难直接预计出总体分布情况.第4页

为此,我们能够先将抽样数据按每个数据出现频数和频率汇成下表:体重/kg频数频率5510.0155.510.015720.0257.510.015830.0358.520.025930.0359.530.036020.0260.520.026120.0261.520.026240.04体重/kg频数频率62.530.036320.0263.540.046450.0564.560.066540.0465.530.036630.0366.540.046720.0267.520.026850.0568.530.03体重/kg频数频率6910.0169.530.037040.0470.520.027120.0271.510.017230.0372.510.017320.0273.510.017430.0374.510.017510.017610.01解:

这里,假如把总体看作是该地域年纪为16.5岁至17岁男生体重,那么我们就要经过上面样本信息,来预计总体分布情况.但从抽样数据极难直接预计出总体分布情况.

从表格中,我们就能预计出总体大致分布情况了,如在年纪为16.5岁至17岁之间,男生体重主要在58~72kg之间,58kg以下及72kg以上所占比率相对较小等.不过,这些关于分布情况描述仍不够直观形象,为了得到更为直观信息,我们能够再将表中数据按照下表方式分组.第5页

为此,我们能够先将抽样数据按照下表进行分组:解:

这里,假如把总体看作是该地域年纪为16.5岁至17岁男生体重,那么我们就要经过上面样本信息,来预计总体分布情况.但从抽样数据极难直接预计出总体分布情况.分组(△xi)频数(ni)频率(fi)[54.5,56.5)20.02[56.5,58.5)60.06[58.5,60.5)100.10[60.5,62.5)100.10[62.5,64.5)140.14[64.5,66.5)160.16[66.5,68.5)130.13[68.5,70.5)110.11[70.5,72.5)80.08[72.5,74.5)70.07[74.5,76.5)30.03频数0454.5812162056.558.560.562.564.566.568.570.572.574.576.5体重频数分布直方图第6页

为此,我们能够先将抽样数据按照下表进行分组:解:

这里,假如把总体看作是该地域年纪为16.5岁至17岁男生体重,那么我们就要经过上面样本信息,来预计总体分布情况.但从抽样数据极难直接预计出总体分布情况.分组(△xi)频数(ni)频率(fi)[54.5,56.5)20.02[56.5,58.5)60.06[58.5,60.5)100.10[60.5,62.5)100.10[62.5,64.5)140.14[64.5,66.5)160.16[66.5,68.5)130.13[68.5,70.5)110.11[70.5,72.5)80.08[72.5,74.5)70.07[74.5,76.5)30.03fi/△xi0.010.030.050.050.070.080.0650.0550.040.0350.015第7页分组(△xi)fi/△xi[54.5,56.5)0.01[56.5,58.5)0.03[58.5,60.5)0.05[60.5,62.5)0.05[62.5,64.5)0.07[64.5,66.5)0.08[66.5,68.5)0.065[68.5,70.5)0.055[70.5,72.5)0.04[72.5,74.5)0.035[74.5,76.5)0.01500.0254.556.558.560.562.564.566.568.570.572.574.576.5体重0.040.060.080.10思索交流1.体重位于哪个区间人数最多?2.体重在64.5~66.5kg频率约是多数?3.体重小于64.5kg频率约是多数?4.体重在63.5~65.5kg频率约是多数?[64.5,66.5)16%42%15%第8页抽象概括:00.0254.556.558.560.562.564.566.568.570.572.574.576.5体重(kg)0.040.060.080.1052.578.5上图中,每个小矩形宽度为△xi(分组宽度),高为,小矩形面积恰为对应频率fi.通常称这么图形为频率分布直方图.当样本容量较大时,样本中落在每个区间内样本数频率会稳定于总体在对应区间内取值概率.所以,我们就能够用样本频率分布直方图来预计总体在任意区间内取值概率,也即总体分布情况.频率折线图第9页00.0254.556.558.560.562.564.566.568.570.572.574.576.5体重(kg)0.040.060.080.1052.578.5频率折线图注意:折线与横轴所围成面积是1.第10页00.0254.556.558.560.562.564.566.568.570.572.574.576.5体重(kg)0.040.060.080.1052.578.5频率折线图假如样本容量取得足够大,分组组距取得足够小,则对应频率折线图将趋于一条光滑曲线.我们称这条光滑曲线为总体密度曲线.第11页例2.为了了解一大片经济林生长情况.随机测量其中100株树木底部周长,得到以下数据表(单位:cm)135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表;(2)绘制频率分布直方图;(3)预计该片经济林中底部周长小于100cm树木约占多少,周长大于120cm树木约占多少.第12页解:(1)这组数据最大值是135,最小值是80,全距是55.135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108可将其分为11组,组距为5.第13页解:(1)这组数据最大值是135,最小值是80,全距是55.可将其分为11组,组距为5.分组(△xi)频数(ni)频率(fi)fi/△xi[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.190.018[120,125)110.110.022[125,130)60.060.012[130,135)20.020.004(2)直方图如图:00.0180859095100105110115120125130135周长/cm0.020.030.040.05(3)样本小于100频率为:0.21样本大于120频率为:0.19预计该片经济林中底部周长小于100cm树木约占21%,周长大于120cm树木约占19%.第14页问题提出在日常生活中,我们不但需要了解总体分布形态,有时会更关心总体一些数字特征.第15页§5用样本预计总体(2)一、预计总体数字特征1.分析了解1996年奥运会风帆比赛前7场比赛(共比赛11场)结束后,排名前5名选手积分以下:排名运动员比赛场次总分12345678910111李丽珊(香港)3222427222简度(新西兰)23611055323贺根(挪威)7844318354威尔逊(英国)55145564445李科4135927646依据上面比赛结果,我们怎样比较各选手之间成绩及稳定情况呢?假如此时让你预测谁将取得最终胜利,你会怎样看?第16页5位选手前7场比赛积分平均数和标准差以下:3.336.57李科53.196.29威尔逊(英国)42.515.00贺根(挪威)32.774.57简度(新西兰)21.733.14李丽珊(香港)1积分标准差(s)平均积分运动员排名)(x从上表中可见:李丽珊平均积分及积分标准差都比其它选手小,这说明,在前7场比赛中,她成绩最为优异,且表现最为稳定.假定每位运动员在各自11场比赛中发挥水平大致相同,因而能够把前7场比赛看作是总体一个样本,并由此预计每位运动员最终比赛成绩.事试验证了我们预测:李丽珊正是凭着自己优异而稳定表现,成为香港首位奥运金牌得主.第17页2.思索交流(1)若取前3场比赛、前5场比赛、前9场比赛作为样本去估计总体结果各会怎样?哪一个与11场比赛结束后结果最靠近?(2)若全部比赛已结束,假如你同桌与你抽取样本容量相同,你们两人样本平均积分和积分标准差一定相同吗?样本频率分布直方图呢?(3)若全部比赛已结束,假如你用一样方法先后从总体中抽取了两个大小相同样本,两次得到样本平均积分和积分标准差一定相同吗?样本频率分布直方图呢?为何?排名运动员比赛场次总分12345678910111李丽珊(香港)3222427222简度(新西兰)23611055323贺根(挪威)7844318354威尔逊(英国)55145564445李科4135927646第18页3.抽象概括用样本预计总体时,假如抽样方法比较合理,那么样本可以反应总体信息,但从样本得到信息会有偏差.在随机抽样中,这种偏差是不可防止.即使我们从样本数据得到分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正分布、平均数和标准差.而只是总体一个预计,但这种预计是合理,尤其是当样本容量很大时,它们确实反应了总体信息.第19页4.例题与练习例1.在一批试验田里对某种早稻品种进行栽培试验,抽测了其中15块试验田单位面积产量以下(单位:㎏)504402495492500501405409460486460371420456395这批试验田单位面积产量约是多少?解:把这批试验田里每块试验田单位面积产量全体称为总体,那么这15块试验田单位面积产量就是这个总体一个样本.用计算器算得样本平均数为(㎏),由此能够预计,这批试验田单位面积产量约是450㎏.第20页504402495492500501405409460486460371420456395这批试验田单位面积产量约是多少?解:把这批试验田里每块试验田单位面积产量全体称为总体,难么这15块试验田单位面积产量就是这个总体一个样本.由此能够预计,这批试验田单位面积产量约是450㎏.发觉这些数据都在460附近波动,每个数据都减去460,得到一组新数据,44-5835324041-55-5126-89-40-4-65新数据平均数是∴样本平均数是(㎏)例1.在一批试验田里对某种早稻品种进行栽培试验,抽测了其中15块试验田单位面积产量以下(单位:㎏)样本平均数公式(1)当所给数据比较分散时(2)当所给数据都在某一数据a附近波动时,(3)当所给数据重复出现时,(加权平均数)第21页灯泡甲:16101590154016501450165015701630169017201580162015001700153016701520169016001590灯泡乙:16701610155014901430161015301430141015801520144015001510154014001420153015201510依据上述两个样本,你准备选哪种灯泡?请说明理由例2.某工厂研制甲、乙两种电灯泡,从两种电灯泡中各抽取了20只进行寿命试验,得到以下数据(单位:小时):第22页甲、乙两种灯泡样本平均数分别是能够预计,甲种灯泡比乙种灯泡平均使用寿命长一些.想一想:1.用样本平均值去预计总体平均值一定准确吗?2.你认为降低错误发生路径有哪些?▲采取更合理抽样方法▲增大样本容量解:第23页例3.要从甲、乙两名男跳远运动员选拔一名参加一次田径比赛.为此,对两名运动员进行了15次测验比赛,成绩以下(单位:cm)甲755752757744743729721731778768761773764736741乙729767744750745753745752769743760755748752

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论