高三数学教案:用样本估计总体及线性相关关系_第1页
高三数学教案:用样本估计总体及线性相关关系_第2页
高三数学教案:用样本估计总体及线性相关关系_第3页
高三数学教案:用样本估计总体及线性相关关系_第4页
高三数学教案:用样本估计总体及线性相关关系_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、普通高中课程标准实验教科书数学人教版 高三新数学第一轮复习教案 (讲座 19)用样本估计总体及线性相关关系一课标要求:1用样本估计总体通过实例体会分布的意义和作用, 在表示样本数据的过程中, 学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差) ,并作出合理的解释;在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征

2、的随机性;会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;形成对数据处理过程进行初步评价的意识。2变量的相关性通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。二命题走向“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。预测 2007 年高考对本讲的考察是:

3、1以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。三要点精讲1用样本的数字特征估计总体的数字特征( 1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;( 2)平均数与方差如果这 n 个数据是 x1 , x2,., xn1 nxi 叫做这 n 个数据平均数;,那么 xn i1第 1页共 10页如果这 n 个数据是 x

4、1 , x2 ,. , xn ,那么 s2 1n( xi x) 叫做这 n 个数据方差;ni1同时 s1 n( xi x) 叫做这 n 个数据的标准差。n i12频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。所有数据(或数据组) 的频率的分布变化规律叫做频率分布, 可以用频率分布直方图、 折线图、茎叶图来表示。频率分布直方图:具体做法如下:( 1)求极差(即一组数据中最大值与最小值的差);( 2)决定组距与组数;( 3)将数据分组;( 4)列频率分布表;( 5)画频率分布直方图。注:频率分布直方图中小正方形的面积频率=组距=频率。组距折线图:连

5、接频率分布直方图中小长方形上端中点,就得到频率分布折线图。总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。3线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。回归直线方程:设x 与 y 是具有相关关系的两个变量,且相应于n 个观测值的 n 个点大致分布在某一条直线的附近,就可以认为y对 x 的回归函数的类型为直线型:nn(xi x)( yi y)xi yinx y?a bx。其中 bi 1i 1, ay b x 。我们称这个nny22( xi x) 2xin xi 1i 1方程

6、为 y 对 x 的回归直线方程。四典例解析题型 1:数字特征例 1为了检查一批手榴弹的杀伤半径,抽取了其中20 颗做试验, 得到这 20 颗手榴弹的杀伤半径,并列表如下:第 2页共 10页(1) 在这个问题中,总体、个体、样本和样本容量各是什么?(2) 求出这 20 颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径解析: (1) 总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20 颗手榴弹的杀伤半径;样本容量是20。(2) 在 20 个数据中, 10 出现了 6 次,次数最多,所以众数是10(米)。20 个数据从小到大排列, 第

7、10 个和第11 个数据是最中间的两个数, 分别为9(米)和 10(米),所以中位数是1 ( 9+10) =9.5 (米)。2样本平均数 x1 (7 18 5 9 4 106 113 12 1)9.4 (米)209.4所以,估计这批手榴弹的平均杀伤半径约为米。点评: (1)根据总体、个体、样本、样本容量的概念答题要注意:总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。(2) 读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均杀伤半径另外在这里要会简便计算有多个重复数据的样本的平均数。例 2为估计一次性木质筷子的用量,19

8、99 年从某县共 600 家高、中、低档饭店抽取 10 家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0.63.72.21.52.81.71.22.13.21.0(1) 通过对样本的计算,估计该县1999 年消耗了多少盒一次性筷子(每年按350 个营业日计算);(2)2001 年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是 10 个样本饭店,每个饭店平均每天使用一次性筷子2.42 盒求该县2000 年、 2001年这两年一次性木质筷子用量平均每年增长的百分率(2001 年该县饭店数、全年营业天数均与 1999 年相同);(3) 在 (2) 的条件下, 若生产一套学生桌

9、椅需木材0.07m3,求该县 2001 年使用一次性筷子的木材可以生产多少套学生桌椅。计算中需用的有关数据为:每盒筷子100 双,每双筷子的质量为5g,所用木材的密度为0.5 103kg/m3;(4) 假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。解析: (1) x1 (0.6 3.7 2.21.5 2.8 1.7 1.2 2.1 3.2 1.0) 2.010所以 , 该县 1999 年消耗一次性筷子为2600 350=420000(盒)。第 3页共 10页(2) 平均每年增 的百分率 x, 2( 1+x) 2=2.42,解得 x1=0.1=

10、10%, x2 = 2.1 (不合 意,舍去) 。所以 , 平均每年增 的百分率 10%;(3) 可以生 学生桌椅套数 0.0052.421006003507260 (套)。0.51030.07(4) 先抽取若干个 (或市、州)作 本,再分 从 些 (或市、州)中抽取若干家 店作 本, 一次性筷子的用量点 :本 是一道 合 ,涉及的知 点很多,需要灵活运用各种知 分析解决 于第(1) 小 ,可先求得 本平均数,再利用 本估 体的思想来求得 的解 于第 (2)小 , 是一个增 率 的 用 ,可通 未知数列方程的方法来解 于第 (3)小 ,用到了物理公式m v, 体 了各学科知 之 的 系, 学生

11、触 旁通,在解决 能 合运用多种知 灵活地解决 第(4)小 只要能 运用随机抽 方法,能体会到用 本估 体的 思想就可解决,在文字表述上要注意 、明了、正确。 型 2:数字特征的 用例 3( 2002 年全国高考天津文科卷(15))甲、乙两种冬小麦 品种 5 年的平均 位面 量如下( 位:t/hm2)品种第 1 年第 2 年第 3 年第 4 年第 5 年甲9.89.910.11010.2乙9.410.310.89.79.8其中 量比 定的小麦品种是甲。1乙1解析:x甲 =5=5 ( 9.4 + 10.3 + 10.8 + 9.7 + 9.8)( 9.8 + 9.9 + 10.1 + 10 +

12、10.2) = 10.0 ,x= 10.0 ;s甲2 = 51 ( 9.82+ + 10.22) 10 2 = 0.02, s甲2 = 51( 9.42+ + 9.82) 102 = 0.244 0.02 。点 :方差与平均数在反映 本的特征上一定要区分开。例 4( 2005 江 7)在一次歌手大 上,七位 委 歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均 和方差分 ( a )9.4,0.484 ( b) 9.4,0.016( c) 9.5,0.04( d) 9.5, 0.016答案: d;解析:7个数据中去掉一个最高分和一个最低分

13、后,余下的5 个数 : 9.4, 9.4, 9.6,9.4, 9.5。9.49.49.69.49.59.46 9.5 ,即 x9.5。 平均数 : x5第 4页共 10页方差为: s21 (9.4 9.5)2(9.4 9.5)2(9.5 9.5) 2 0.0165即 s20.016,故选 d。点评:一定要根据实际的题意解决问题,并还原实际情景。题型 3:频率分布直方图与条形图例 5为检测 ,某种产品的质量 ,抽取了一个容量为 30 的样本 ,检测结果为一级品 5 件 , 而极品 8 件,三级品 13 件 ,次品 14 件 .( 1)列出样本频率分布表 ;( 2)画出表示样本频率分布的条形图;(

14、 3)根据上述结果 ,估计辞呈商品为二极品或三极品的概率约是多少解析: (1) 样本的频率分布表为产品频数频率一级晶5017二级晶8027三级晶13043次品4013(2) 样本频率分布的条形图为:(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7 。点评:条形图中纵坐标一般是频数或频率。例 6( 2006 重庆理, 6)为了了解某地区高三学生的身体发育情况,抽查了该地区100 名年龄为17.5 岁岁的男生体重(kg) , 得到频率分布直方图如下:第 5页共 10页根据上图可得这100 名学生中体重在56.5,64.5的学生人数是(a)20(b)30(c)40( d) 50答案

15、: c;解析:根据运算的算式:体重在56.5,64.5学生的累积频率为 2 0.03 2 0.05 2 0.05 2 0.07=0.4,则体重在 56.5,64.5学生的人数为0.4 100=40。点评:熟悉频率、频数、组距间的关系式。例 7某中学对高三年级进行身高统计,测量随机抽取的40 名学生的身高,其结果如下(单位: cm)分140, 145, 150, 155, 160, 165, 170, 175,合组145)150)155)160)165)170)175)180)计人1259136314数0( 1)列出频率分布表;( 2)画出频率分布直方图;( 3)估计数据落在 150, 170范

16、围内的概率。解析:( 1)根据题意可列出频率分布表:分 值频数频 率140, 14510.025145, 15020.050150, 15550.125155, 16090.225160, 165130.325第 6页共 10页165, 17060.15170, 17530.075175, 18010.025合 计401.00( 2)频率分布直方图如下:( 3)数据落在 150, 170范围内的概率约为 0.825。题型 4:茎叶图例 8观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。1961 年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60 个全垒打的记录。下面是扬基队的历年比赛中

17、的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯马利斯0813465223685433997661149445061解析:鲁斯的成绩相对集中,稳定在 46左右;马利斯成绩相对发散,成绩稳定在 26左右。题型 5:线性回归方程例 9由施肥量x 与水稻产量y 试验数据的关系,画出散点图,并指明相关性。第 7页共 10页解析:散点图为:通过图象可知是正相关。例 10在某种产品表面进行腐蚀线实验, 得到腐蚀深度 y 与腐蚀时间 t 之间对应的一组数据:时间 t(s)5101520304050607090120深度 y( m)610101316171923252946(1) 画出散点图;(2) 试求腐蚀深度

18、 y 对时间 t 的回归直线方程。略解:( 1)散点图略,呈直线形。( 2)经计算可得t =46.36, y =19.45,11ti211yi211=36750 ,=5442,t i yi =13910 。i 1i 1i 111ti yi11ty11 46.3619.45i 113910b= 1111 t=3675011 46.3620.3.t i22i 1a= y bt =19.45 03 46.365.542。故所求的回归直线方程为y =0.3t+5.542 。题型 6:创新题例 11把容量为100 的某个样本数据分为10 组,并填写频率分布表, 若前七组的累积频率为 0.79,而剩下三组

19、的频数成公比大于2 的整数等比数列,则剩下三组中频数最第 8页共 10页高的一组的频数为 _.答案: 16点评:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为10.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数。由已知知前七组的累积频数为0.79 100=79 ,故后三组共有a (1q 3 )的频数为 21,依题意1=21, a1( 1+q+q2)=21. a1=1 ,q=4。后三组频数最1q高的一组的频数为16。此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?例 12某班学生在一次数学考试中成绩分布如

20、下表:分数段 0,80)80,90)90,100)人数256分数段100,110)110, 120 ) 120, 130)人数8126分数段 130, 140)140 ,150)人数42那么分数在 100,110)中的频率和分数不满110 分的累积频率分别是_ 、_ (精确到0.01) .解析:由频率计算方法知:总人数=45.分数在 100,110)中的频率为8=0.178 0.18.45分数不满 110 分的累积频率为256845= 21 0.47.45答案: 0.180.47五思维总结1统计是为了从数据中提取信息,学习时根据实际问题的需求选择不同的方法合理地选取样本,并从样本数据中提取需要

21、的数字特征。不应把统计处理成数字运算和画图表。对统计中的概念(如 总体 、 样本 等)应结合具体问题进行描述性说明,不应追求严格的形式化定义。2当总体中个体取不同值很少时,我们党用样本的频率分布标记频率分布梯形图取估计总体体分布 ,总体分布排除了抽样造成的错误, 精确反映了总体取值的概率分布规律。对于所取不同数值较多或可以在实数区间范围内取值的总体,需用频率分布直方图来表示相应的频率分布。当样本容量无限增大,分组的组距无限缩小时,频率分布直方图无限接近一条光滑曲线总体密度曲线由于总体分布通常不易知道,往往是用样本的频率分布估计总体分布。样本容量越大,估计就越精确。3相关关系研究两个变量间的相关关系是学习本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论