已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本节授课核心:三种抽样方法的概念和一般步骤 一:情景引入 1.要考察某公司生产的500袋装牛奶的质量是否达标,现从中抽取60袋进行检验,则总体是 ?总体个数N是 ?样本是 ?样本个数n ? 500袋牛奶,500,60袋牛奶,60 2如何判断一锅汤的味道的好坏? A 全部喝完 B 舀上面油多的一勺汤品尝 C舀下面味道重的一勺汤品尝 D搅拌均匀后再随机舀一勺汤品尝 D 思考:要获取一个有代表性的好的样本,关键是 。 使总体内的各个个体被抽到的机会都相等 二、新课: (一)简单随机抽样 1思考: 例1要在我们班选出五个人去参加劳动,怎样选才是最公平的呢? 2简单随机数法的概念: P58 3简单随机抽样必须具备下列特点: (1)总体个数N是 限的。 有 (2)样本个数n 总体的个数N。 不大于 (3) 放回的抽样。 不 (4)每个个体被抽到的机会 . 相等 4简单随机抽样的方法有 和 抽签法和随机数法 5既学即练: (1)下列抽样的方式是否属于简单随机抽样?为什么? A.从无限多个个体中抽取50个个体作为样本. B.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子. 错 (2)为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是 A总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是40 D (3)从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 。 1/10 (二)系统抽样 1思考: 例2我校为了了解高一年级学生对教师教学的意见,打算从高一年级的500名学生中抽取50名进行调查.你怎样进行操作呢?P60 2系统抽样概念:P60 3进行系统抽样的步骤: , , 和 P60 编号,分段,确定起始个体的编号L, 抽取样本,通常是将起始编号L加上间隔k得到 第2个个体编号L+K,再加上K得到第3个个 体编号L+2K,这样继续下去,直到获取整个样 本。 4既学即练: (1)下列抽样中不是系统抽样的是 ( ) A、从标有115号的15号的15个小球中任选 3个作为样本,按从小号到 大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样 B工厂生产的产品,用传关带将产品送入包装 车间前,检验人员从传送带上每隔五分钟抽 一件产品检验 C、搞某一市场调查,规定在商场门口随机抽一 个人进行询问,直到调查到事先规定的调查 人数为止 D、电影院调查观众的某一指标,通知每排(每 排人数相等)座位号为14的观众留下来座 谈 C不是系统抽样,因为事先不知道总体,抽样 方法不能保证每个个体按事先规定的概率 入样。 (三)分层抽样 1思考: 例3假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本? 高中生24人,初中生109人,小学生110人 2分层抽样定义:P63 3分层抽样的步骤: , , 和 . (1)分层:按某种特征将总体分成若干部分。 (2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。 (4)综合每层抽样,组成样本。 4分层抽样应遵循以下要求: (1)分层遵循不重复、不遗漏的原则。 (2)在各层中进行简单随机抽样,每层样本数 量与每层个体数量的比与这层个体数量 与总体容量的比相等。 5既学即练: (1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( ) A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样 C (2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为 ( ) 1 A N 1 B. n n C. N n D. N C (3)某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( ) A.15,5,25 B.15,15,15 C.10,5,30 D.15,10,20 D (4)某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n= 。 360 (四) 简单随机抽样、系统抽样、分层抽样的比较 类 适 用 共同点 各自特点 联 系 别 范 围 (1)抽样过 简 程中每 总体 单 从总体中逐 个个体个数 随 个抽取 被抽到 较少 机 的可能 抽 性相等 样 在起 (2)每次抽 将总体均 始部分 出个体 分成几部 总体 采样时 系 后不再 分,按预先制个数 采用简 统 将它放 定的规则在较多 随机抽 抽 回,即 各部分抽取 样 样 不放回 总体 抽样 分层抽 由差 样时采 将总体分成异明 分 用简单 几层,分层进显的 层 随机抽 行抽取 几部 抽 样或系 分组 样 统抽样 成 五体验探究: 1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( ) A简单随机抽样 B系统抽样 C分层抽样 D先从老人中剔除1人,然后再分层抽样 D 2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 8 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 2 人。 8,5,5,2 3从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ) A5,10,15,20,25 B、3,13,23,33,43 C1,2,3,4,5 D、2,4,6,16,32 B 4、一个地区共有5个乡镇,人口3万人,其中人口 比例为3:2:5:2:3,从3万人中抽取一个300 人的样本,分析某种疾病的发病率,已知这种疾 病与不同的地理位置及水土有关,问应采取什么 样的方法?并写出具体过程。 60,40,100,40,60 二、新课: (一)频率分布直方图的作法: 1探究:P 67 aa确定一个居民月用水量标准,用水量不超过的 a部分按平价收费,超出的部分按议价收费. 如果希 a望大部分居民的日常生活不受影响,那么标准定为多少比较合理呢 ?为了较为合理地确定出这个标准,需要做哪些工作? 给出100位居民的月均用水量表,讨论:如何分析数据? 2频率分布表和频率分布图,是从各个小组数据在样本容量中 的角度,来表示数据分布的规律。 所占比例大小 一频率分布的概念: 频率分布是指一个样本数据在各个小范围内所占 。 比例大小 一般用频率分布直方图反映样本的频率分布。 其一般步骤为: , , , 和 (1)求极差 (2)决定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图 3动手作图 以课本P制定居民用水标准问题为例,经过以上几 68个步骤画出频率分布直方图。 4既学即练: (1)频率分布直方图2.2-1纵坐标表示 ? (2)直方图是用 表示在各个区间内取值的频率,小长方形面积的和为 . 面积,1 (3)频率分布直方图2.2-1表示每月用水量在1吨到3吨之间的居民所占比例是 076 (4)如果当地政府希望使88%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,那么制定月用水量标准是 吨? 3 (二)频率分布折线图、总体密度曲线 1定义频率分布折线图: 2定义总体密度曲线: 3既学即练: (1)下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位) 122, 区间126,130,134,138,142, 界限126)130)134)138)142)146) 人数 146,150,154, 区间 界限150)154)158) 人数1165()列出样本频率分布表 ()画出频率分布直方图; ()估计身高小于134的人数占总人数的百分比. 解:()样本频率分布表如下: 分组频数频率 122,126)50.04 126,130)80.07 130,134)100.08 134,138)220.18 138,142)330.28 142,146)200.17 146,150)110.09 150,154)60.05 154,158)50.04 合计1201 ()其频率分布直方图如下: / 频率组距 0.07 0.06 0.05 0.04 0.03 0.02 0.01 o 122 126 130 134 138 142 146 150 154 158 身高(cm) (3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%. (2)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12. ()第二小组的频率是多少?样本容量是多少? ()若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? ()在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。 / 频率组距 0.036 0.032 0.028 0.024 0.020 0.016 0.012 0.008 0.004 o 次数 100 110 120 130 140 150 90 分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小 因此第二小组的频率为: 4 =0.08 2+4+17+15+9+3 第二小组频数又因为频率= 样本容量 第二小组频数12 =150样本容量=所以 第二小组频率0.08(2)由图可估计该学校高一学生的达标率约为 17+15+9+3 100%=88% 2+4+17+15+9+3(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。 三茎叶图 茎叶图的概念: 当数据是两位有效数字时,用中间的数字表示 ,即第一个有效数字,两边的数字表示 ,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。 十位数、个位数 2茎叶图的特征: ()用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。 ()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 3既学即练:试将下列两组数据制作出茎叶图,并计算两组数据的平均数和方差. 甲得分:13 ,51,23,8,26,38,16,33,14,25,39, 乙得分:49,24,12,31,60,31,44,36,15,37,24 同步 (一)、众数、中位数、平均数 1已知数据:10,11,12,12,13,13,13,14,15, 根据 _初中所学的知识,中位数是、众数是 _ 、平均数是 13,13,126 _ 2在样本数据的频率分布直方图中是众数。 最高的矩形的中点 3在频率分布直方图中,矩形的 大小正好表示对应组的频率的大小,即中位数左边和右边的 _直方图的相等。 小矩形的面积,面积相等 4估计平均数:频率分布直方图中每个小矩形的 _ 乘以小矩形之和 面积,底边中点的横坐标 5众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计. 样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”. (二)、标准差、方差 标准差 考察样本数据的分散程度的大小,最常用的统计 _量是标准差。标准差是,一般用s表示。 标准差是样本数据到平均数的一种平均距离 _ 其计算公式为:。 1 222 s=(x-x)+(x-x)+L+(x-x) 12n n _2(1)标准差用来表示,标准差越大,数 _据的离散程度就,也就越. 数据的离散程度,大,分散 _ (2)标准差为的样本数据的特点是 数据相等 x-2s,x+2s (3)几乎包含了所有样本数据. 2 s (4)习惯用标准差的平方方差来表示数据的分散程度, 222 (x-x)+(x-x)+(x-x) 2 12n s= 即. 两者都 n是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差. 周末练习同步P.23P.26的(1)(16) P.62P.66的(1)(19) 变量之间的相关关系一创设情境: 1某种笔记本每个5元,买 x1,2,3,4个笔记本的钱数记为y(元),试写出以x为自变量的函数y的解析式,并画出这个函数的图像 函数的解析式为y=5x,x1,2,3,4 它的图象由4个孤立点A (1, 5) B (2, 10)C (3, 15) D (4, 20)组成 2关于“名师出高徒”解释正确的是( ) A教师的水平越高,则学生的成绩一定越好 B学生的成绩越好,则教师的水平越高 C从总体来看教师的水平越高,则学生的成绩越好的可能性更大 D教师的水平越高与学生的成绩越好没有关系 C 二、讲授新课: (一)相关关系的概念 1函数关系:两个变量之间的关系是_ _的关系(当自变量取值一定时,因变量也确定,则为确定关系)。 确定 :_ 2.相关关系的概念两个变量之间的关系是_的 关系。(当自变量取值一定时,因变量带有随机性),这种变量之间的关系称为相关关系。相关关系是一种非确定性关系。 非确定性 (二)散点图 例1出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 38 41 45 49 50 23 27 年龄 9.5 17.8 21.2 25.9 27.5 26.3 28.2 脂肪 54 56 57 58 60 61 53 年龄 29.6 30.2 31.4 30.8 33.5 35.2 34.6 脂肪 分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加。我们可以作散点图来进一步分析。 2散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。 (1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有_关系 函数 (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有_关系。 相关 (3). 如果所有的样本点都落在某一直线附近,变量之间就有_关系。 线形相关 3正相关与负相关概念: (1)如果散点图中的点散布在从_到_ _的区域内,称为正相关。 左下角,右上角 (2)如果散点图中的点散布在从_到_ _的区域内,称为负相关。 左上角,右下角 (三).回归直线: 1从例1散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近。 如果散点图中的点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫_,直线方程叫_。 回归直线,回归直线方程 2提问:怎样确定这条直线呢?P91 (讨论:1.选择能反映直线变化的两个点。 2. 在图中放上一根细绳,使得上面和下面点 的个数相同或基本相同。 3. 多取几组点对,确定几条直线方程。再分 别算出各个直线方程斜率、截距的算术平均值,作为 所求直线的斜率、截距。)。 教师:分别分析各方法的可靠性。 3回归直线的求法 (1)求回归直线,关键是使得样本数据的点_。 到它的距离的平方和最小 (2)回归公式见课本P.92 () 3,10,(7,20),(11,24) 例2三点的线性回归方程是 ( ) =5.75-1.75xy=1.75+5.75xy B A =1.75-5.75xy=5.75+1.75xy D C D 4求线性回归方程的步骤: x y (1)计算平均数、, xy xy (2)计算与的积,求 ii ii 2 x (3)计算, i b,a (4)将上述有关结果代入公式,求,写出回归直线 方程 例3有一间商店,为了研究气温对冰箕淋销售的影 响。经过统计,得到一个卖出的冰箕淋与当天气温的 对比表。 气温 -5 0 4 12 19 21 23 27 31 36 冰箕淋2 10 26 75 104 143 128 132 145 156 个数 (1)画出散点图。 (2)求回归方程。 (3)如果气温是25,预测这天卖出的冰箕淋个数。 点评:对一组数据进行线性回归分析时,应先画出其 a,b 散点图,看其是否呈直线形,再依系数的计算公 a,b 式,算出由于计算量较大,所以在计算时应借 助技术手段,认真细致,谨防计算中产生错误,求线 xy x,y 性回归方程的步骤:计算平均数;计算与的 ii 2 x xy b 积,求;计算;将结果代入公式求; i ii a a=y-bx 用求;写出回归直线方程 (07#18)(本小题满分12分) 下表提供了某厂节能降耗技术改造后生产甲产 x y 品过程中记录的产量(吨)与相应的生产能耗(吨 标准煤)的几组对照数据 x 35 6 4 y 2.534.5 4 (1)请画出上表数据的散点图; y (2)请根据上表提供的数据,用最小二乘法求出关 +ay=bx x ; 于的线性回归方程 (3)已知该厂技改前100吨甲产品的生产能耗为90吨 标准煤试根据(2)求出的线性回归方程,预测生 产100吨甲产品的生产能耗比技改前降低多少吨标准 煤? 32.5+43+54+64.5=66.5 (参考数值:) 18解:(1)如下图 7 6 5 4 耗 能 3 2 1 0 产量 n=4 xy(2)325435464566.5, ii i=1 3+4+5+6 x 4.5, 4 2.5+3+4+4.5 y 3.5, 4 n 2 2222 x =3+4+5+6=86 , i i=1 n=4 xy-4xy ii 66.5-44.53.5 i=1 =0.7 =b , 2 n=4 86-44.5 2 2 -4xx i i=1 =- xyba 3.50.74.50.35 故线性回归方程为y0.7x0.35 (3)根据回归方程的预测,现在生产100吨产品消 耗的标准煤的数量为0.71000.3570.35, 故耗能减少了9070.3519.65(吨) 补充作业: 1一个车间为了规定工时定额,需要确定加工零件 所花费的时间为此进行了10次试验,测得数据如 下: x 20 30 40 50 60 70 80 10 90 100 零件个数(个) y加工时间(分) 62 68 75 81 89 95 102 108 115 122 x yy 请判断与是否具有线性相关关系,如果与 x 具有线性相关关系,求线性回归方程 2已知10只狗的血球体积及红血球数的测量值如下: x 45 42 46 48 42 35 58 40 39 50 y 6.6.9.7.6.5.9.6.6.8. 53 30 52 50 99 90 49 20 59 72 x ,ml y (血球体积),(红血球数,百万) (1)画出上表的散点图; (2)求出回归直线度且画出图形 练习1一个车间为了规定工时定额,需要确定加工 零件所花费的时间为此进行了10次试验,测得数 据如下: x 20 30 40 50 60 70 80 10 90 100 零件个数(个) y加工时间(分) 62 68 75 81 89 95 102 108 115 122 x yy 请判断与是否具有线性相关关系,如果与 x 具有线性相关关系,求线性回归方程 解:在直角坐标系中画出数据的散点图,直观判断散 点在一条直线附近,故具有线性相关关系由测得的 数据表可知: 1010 2 x=55,y=91.7,x=38500,xy=55950 iii i=1i=1 10 xy-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 25028-2025轮胎式装载机制动系统用加力器
- 2025年阳泉辅警招聘考试题库含答案详解(黄金题型)
- 2025年马鞍山辅警协警招聘考试真题含答案详解(a卷)
- 2025年锦州辅警协警招聘考试真题有答案详解
- 2025年黑龙江辅警招聘考试题库附答案详解(培优)
- 2025年连云港辅警协警招聘考试真题附答案详解(a卷)
- 2025年石嘴山辅警招聘考试真题及答案详解(易错题)
- 2025年陕西辅警协警招聘考试备考题库及答案详解(真题汇编)
- 2025年聊城辅警招聘考试真题含答案详解(达标题)
- 2025年长沙辅警协警招聘考试真题及参考答案详解
- 新能源产业2025年私募股权投资热点:退出策略与风险控制分析报告
- 热管真空管太阳能集热器测试报告
- 肾挫裂伤护理
- 公司大米策划方案
- 矿山机电运输安全知识培训
- JJG(烟草)30-2016卷烟端部落丝测定仪检定规程振动法
- 邮政社招考试试题及答案
- 2025民宿装修合同
- 基于BIM技术的市政工程设计试题及答案
- 低钾血症诊疗与护理要点
- 《放射诊疗许可讲解》课件
评论
0/150
提交评论