用样本估计总体及线性相关关系_第1页
用样本估计总体及线性相关关系_第2页
用样本估计总体及线性相关关系_第3页
用样本估计总体及线性相关关系_第4页
用样本估计总体及线性相关关系_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、普通高中课程标准实验教科书一 数学人教版高三新数学第一轮复习教案(讲座19)用样本估计总体及线性相关关系一课标要求:1 用样本估计总体 通过实例体会分布的意义和作用,在表示样本数据的过程中, 学会列频率分布表、 画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点; 通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; 能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释; 在解决统计问题的过程中, 进一步体会用样本估计总体的思想, 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布

2、和数字特征的随机性; 会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异; 形成对数据处理过程进行初步评价的意识。2. 变量的相关性 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系; 经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。二.命题走向“统计”是在初中“统计初步” 基础上的深化和扩展,本讲主要会用样本的频率分布估 计总体的分布,并会用样本的特征来估计总体的分布。预测200

3、7年高考对本讲的考察是:1 以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为 背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。 三要点精讲1 用样本的数字特征估计总体的数字特征(1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小 (或从小到大)排列,处在中间位置上的一个数据(或中间两 位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n个数据是x1, x2,xn,那么x-Xin i 1叫做这n个数据平均数;如果这n个数据是x1, x2,Xn

4、,那么S21 (Xi x)叫做这n个数据方差;同n i 1、1 n (xi x)叫做这n个数据的标准差。.n i 12 频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比, 就是该数据的频率。所有数据(或茎叶图来数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、 表示。频率分布直方图:具体做法如下:(1) 求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图。注:频率分布直方图中小正方形的面积频率 组距 =频率。折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线

5、图。总体密度曲线:当样本容量足够大, 分组越多,折线越接近于一条光滑的曲线,此光滑 曲线为总体密度曲线。3. 线性回归回归分析:对于两个变量,当自变量取值一定时, 因变量的取值带有一定随机性的两个 变量之间的关系叫相关关系或回归关系。回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:a bx。n_(Xi x)(yi y) 其中b (为 x)2i 1回归直线方程。四典例解析题型1:数字特征ni 1n2Xii 1nxy-2nxy bx。我们称这个方程为 y对x的例1 为了检查一批手榴弹的杀伤半径,抽取了其

6、中20颗做试验,得到这 20颗手榴弹的杀伤半径,并列表如下:杀伤半径(米)789101112手桶彈数154631(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均 杀伤半径.解析:(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的 20颗手榴弹的杀伤半径;样本容量是20。(2)在20个数据中,10出现了 6次,次数最多,所以众数是10 (米)。20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为 9 (米)1和10 (米),所以中位数是(9+10)

7、=9.5 (米)。2样本平均数 x 丄(7 1 8 5 9 4 10 6 11 3 12 1)9.4 (米)20所以,估计这批手榴弹的平均杀伤半径约为9.4米。点评:(1)根据总体、个体、样本、样本容量的概念答题要注意:总体、个体和样本 所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。(2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均 杀伤半径另外在这里要会简便计算有多个重复数据的样本的平均数。例2 .为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0

8、.6 3.7 2.2 1.5 2.81.7 1.2 2.1 3.2 1.0(1) 通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);(2) 2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);(3) 在(2)的条件下,若生产一套学生桌椅需木材0.07m3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。 计算中需用的有关数据为: 每盒筷

9、子100双,每双筷子 的质量为5g,所用木材的密度为 0.5 x 103kg/m3;(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做, 简要地用文字表述出来。1解析:(1) x 丄(0.6 3.7 2.2 1.5 2.8 1.7 1.2 2.1 3.2 1.0)2.010所以,该县1999年消耗一次性筷子为 2X 600 x 350=420000 (盒)。(2) 设平均每年增长的百分率为X,则2 (1+X) 2=2.42,解得X1=0.仁10%, X2= 2.1 (不合题意,舍去)。所以,平均每年增长的百分率为10%(3) 可以生产学生桌椅套数为.5 2.42罗

10、 600 350 7260 (套)。0.5 103 0.07先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家 饭店作样本,统计一次性筷子的用量.点评:本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解对于 第 小题,用到了物理公式m= pv,体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的

11、统计思想就可解决,在文字表述上要注意简洁、明了、正确。题型2:数字特征的应用例3. (2002年全国高考天津文科卷(15)甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8其中产量比较稳定的小麦品种是甲解析:x甲 = 3( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0 , x乙 = -5( 9.4 + 10.3 + 10.8 + 9.7 + 9.8)=10.0;s甲=f( 9.82 + + 10.22) -102 = 0.02, s甲=5(

12、 9.42 + + 9.82) T02 = 0.244 0.02。点评:方差与平均数在反映样本的特征上一定要区分开。例4. (2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(A) 9.4, 0.484(B) 9.4,0.016(C) 9.5, 0.04(D)9.5,0.016答案:D ;解析:7个数据中去掉一个最高分和一个最低分后,余下的5个数为:9.4,9.4,9.6,9.4,9.5。则平均数为:x 9.4 9.4 6 9.4 9.59.469.5,即 x 9.5。1方差为

13、:S2(9.4 9.5)2(9.4 9.5)2(9.5 9.5)20.0165即 s20.016,故选 D。点评:一定要根据实际的题意解决问题,并还原实际情景。题型3:频率分布直方图与条形图例5 为检测,某种产品的质量,抽取了一个容量为 30的样本,检测结果为一级品5件,而 极品8件,三级品13件,次品14件.(1) 列出样本频率分布表;(2) 画出表示样本频率分布的条形图;(3) 根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少解析:(1)样本的频率分布表为产品频数频率一级晶50.17二级晶80.27三级晶130.43次品40.13(2)样本频率分布的条形图为:点评:条形图中纵坐标一

14、般是频数或频率。例6. (2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁一18岁的男生体重(kg),得到频率分布直方图如下:(A)20(B)30(C)40(D) 50答案:C ;解析:根据运算的算式:体重在56.5,64.5丨学生的累积频率为 2 X 0.03 + 2X 0.05 +2X 0.05 + 2X 0.07=0.4,则体重在56.5,64.5学生的人数为 0.4 X 100=40。点评:熟悉频率、频数、组距间的关系式。例7 某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)分组140,145)145,

15、150)150,155)155,160)160,165)165,170)170,175)175,180)合计人数12591363140(1) 列出频率分布表;(2) 画出频率分布直方图;(3) 估计数据落在150, 170 范围内的概率。解析:(1)根据题意可列出频率分布表:分值频数频率:140, 14510.025:145, 15020.050:150, 15550.125:155, 16090.225:160, 165130.325:165, 17060.15:170, 17530.075:175, 18010.025合计401.00(2 )频率分布直方图如下:(3)数据落在150, 17

16、0范围内的概率约为 0.825。题型4:茎叶图例8.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录。下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯马利斯0813 465 223 685 433 997 661149445061解析:鲁斯的成绩相对集中,稳定在46左右;马利斯成绩相对发散,成绩稳定在26左右。题型5:线性回归方程例9.由施肥量x与水稻产量y试验数据的关系,画出散点图,并指明相关性。30354D 45 1水囲产量$330彳3砧405445450455 |解析:散点图为:再列麻给出

17、务对驻张住平也虫角世辅第中衷冠曲朮.通过图象可知是正相关。例10.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s)5101520304050607090120深度y( m)610101316171923252946(1) 画出散点图;(2) 试求腐蚀深度y对时间t的回归直线方程。 略解:(1 )散点图略,呈直线形。(2)经计算可得_ _ 11 11 11 2 2t =46.36, y =19.45,ti =36750, yi =5442,ti yi =13910。i 1i 1i 111 _tiyi 11 tyi 113910 11 46.36 19.45

18、B= 71=20.3.,2236750 11 46.362ti 11 ti 1A= y bt =19.45 03 46.365.542。故所求的回归直线方程为y =0.3t+5.542。题型6:创新题例11把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为.答案:16点评:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1 - 0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计 算后三组的共有频数。由已知知前七组的累积

19、频数为0.79 X 100=79,故后三组共有的频数(13)为21,依题意 空 q一=21, a1 (1+q+q2) =21. - ag , q=4。后三组频数最高的一组的1 q频数为16。此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?例12.某班学生在一次数学考试中成绩分布如下表:分数段0, 80)80, 90)90, 100)人数256分数段100, 110)110, 120 )120, 130)人数8126分数段130, 140)140, 150)人数42那么分数在100, 110)中的频率和分数不满 110分的累积频率分别是 (精确到0.01).解析:由频率计算方法知:总人

20、数 =45.8分数在100, 110)中的频率为 =0.178疋0.18.45分数不满110分的累积频率为 2_5_6_8 =却 0.47.4545答案:0.180.47五.思维总结1 统计是为了从数据中提取信息,学习时根据实际问题的需求选择不同的方法合理地 选取样本,并从样本数据中提取需要的数字特征。不应把统计处理成数字运算和画图表。对统计中的概念(如”总体、”样本等)应结合具体问题进行描述性说明,不应追求严格的形 式化定义。2当总体中个体取不同值很少时,我们党用样本的频率分布标记频率分布梯形图取估 计总体体分布,总体分布排除了抽样造成的错误,精确反映了总体取值的概率分布规律。对 于所取不同数值较多或可以在实数区间范围内取值的总体,需用频率分布直方图来表示 相应的频率分布。当样本容量无限增大,分组的组距无限缩小时,频率分布直方图无限 接近一条光滑曲线一一总体密度曲线由于总体分布通常不易知道,往往是用样本的频 率分布估计总体分布。样本容量越大,估计就越精确。3相关关系研究两个变量间的相关关系是学习本节的目的。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论