




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.了解分布的意义和作用,会列频了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作理解样本数据标准差的意义和作用,会计算数据标准差用,会计算数据标准差.3.能从样本数据中提取基本的数字能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合特征(如平均数、标准差),并做出合理的解释理的解释.4.会用样本的频率分布估计总体分布会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本会用样本的基本数字特征估计总体的基本数字特征数字特征
2、,理解用样本估计总体的思想理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题计总体的思想,解决一些简单的实际问题.6.通过实际问题,借助直观(如实际通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特问题的直方图),认识正态分布曲线的特点及曲线所表示的意义点及曲线所表示的意义.1.某初级中学共有某初级中学共有30个班,其中初一有个班,其中初一有12个个班,初二有班,初二有12个班,初三有个班,初三有6个班个班.现从中现从中抽出抽出5个班进行调查,则应在初三个班进行调查,则应在初三6个班中个班中抽取抽取 个
3、班个班.12.把数据把数据x1,x2,xn分成若干组分成若干组,已知某数已知某数xi的频的频数和频率分别为数和频率分别为4和和0.125,则则n的值是的值是( )CA.16 B.24C.32 D.643.数据数据5,10,73,1,3,105,111的中位的中位数与极差的差为数与极差的差为 .-100 因为中位数是因为中位数是10,极差是,极差是111-1=110,故所求的值为故所求的值为10-110=-100.4.将一组数据同时减去将一组数据同时减去3.1,得到一组新数,得到一组新数据据,若原数据的平均数、方差分别为、若原数据的平均数、方差分别为、s2,则新数据的平均数是则新数据的平均数是
4、,方差是方差是 .-3.1s2x 设设= (x1+x2+xn),则则 = (x1-3.1)+(x2-3.1)+(xn-3.1) =-3.1.s2= (xi- )2= (xi-3.1)-(-3.1)2= (xi- )2=s2.x1n1n1n1nix1n1ni1n1nix5.随机变量随机变量的概率密度函数为的概率密度函数为 (x)= x(-,+).若若N(0,1),且,且=a+b(a0),则则=( )2(5)812 2xeA. B.C. D.525252 252 2A 因为因为E=0,D=1,E=-5,D=4,而而E=E(a+b)=aE+b,D=D(a+b)=a2D. -5a+b=0 a= 4a2
5、=1 b= ,所以所以= + ,故选,故选A.又又a0,所以所以,解得解得125212526.已知正态曲线已知正态曲线,(x)= ,当当=时,曲时,曲线最高点的纵坐标是标准正态曲线最高点的线最高点的纵坐标是标准正态曲线最高点的纵坐标的纵坐标的 倍倍.22()212xe2332 当当= 时,正态曲线最高点的纵时,正态曲线最高点的纵坐标为坐标为 ,而标准正态曲线最高点,而标准正态曲线最高点的纵坐标为的纵坐标为 ,故答案是,故答案是 .23122312321.数据的基本数字特征数据的基本数字特征(1)平均数:一组数据的平均数,记为平均数:一组数据的平均数,记为.设有设有n个数据个数据x1,x2,xn
6、,则平均数为,则平均数为 = .(2)中位数:一组数据按照从小到大或从中位数:一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的大到小的顺序进行排列时,处于中间位置的数数.当这组数据的个数为奇数时,中位数为当这组数据的个数为奇数时,中位数为中间一个数;当这组数据的个数为偶数时,中间一个数;当这组数据的个数为偶数时,中位数为中间的两个数的平均数中位数为中间的两个数的平均数.x12nxxxn(3)众数众数:一组数据中出现次数最多的数一组数据中出现次数最多的数.(4)极差极差:一组数据中最大数与最小数的差一组数据中最大数与最小数的差.(5)方差方差:一组数据中所有数与平均数的差一组数据中
7、所有数与平均数的差的平方和的平均数的平方和的平均数,记为记为s2,即即s2= .(6)标准差:方差的算术平方根标准差:方差的算术平方根,记作记作s.2.主要统计图表主要统计图表(1)基本统计图表:象形、条形、折线、基本统计图表:象形、条形、折线、扇形统计图扇形统计图.22212()()()nxxxxxxn(2)频率分布直方图的画图步骤:频率分布直方图的画图步骤:()求极差;求极差;()决定组距与组数;决定组距与组数;()将将数据分组;数据分组;()列频率分布表;列频率分布表;()画频率分画频率分布直方图布直方图(以频率组距为纵坐标以频率组距为纵坐标).(3)频率分布折线图:连接频率分布直方频率
8、分布折线图:连接频率分布直方图中各小长方形上端的中点所得的折线图中各小长方形上端的中点所得的折线.(4)总体密度曲线:随着样本容量的增加总体密度曲线:随着样本容量的增加,作频率分布折线图时所分的组数增加作频率分布折线图时所分的组数增加,组距减组距减小小,相应的频率折线图会越来越接近于一条光相应的频率折线图会越来越接近于一条光滑曲线滑曲线,则称这条光滑曲线为总体密度曲线则称这条光滑曲线为总体密度曲线.(5)茎叶图:中间的数字表示数据的十位茎叶图:中间的数字表示数据的十位数字,旁边的数字分别表示两组数据中各数字,旁边的数字分别表示两组数据中各个数据的个位数字个数据的个位数字.3.抽样方法抽样方法(
9、1)简单随机抽样:从含有简单随机抽样:从含有N个个体的总个个体的总体中逐个不放回地抽取体中逐个不放回地抽取n个个体作为样本个个体作为样本(nN),如果每次抽取时总体内的各个个体,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法被抽到的机会都相等,就把这种抽样方法叫做叫做 .有两种常用方法:有两种常用方法:简单随机抽样简单随机抽样() :就是把总体中的就是把总体中的N个个体编个个体编号号,把号码写在号签上把号码写在号签上,将号签放在一个容器中将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签搅拌均匀后,每次从中取出一个号签,连续抽连续抽取取n次次,就得到一个容量为就得到一个
10、容量为n的样本的样本.() :利用随机数表、随机利用随机数表、随机数骰子或计算机产生的随机数进行抽样数骰子或计算机产生的随机数进行抽样.(2)系统抽样:按下列步骤进行抽样:系统抽样:按下列步骤进行抽样:()先将总体的先将总体的N个个体编号;个个体编号;()确定确定分段间隔分段间隔k,对编号进行分段;,对编号进行分段;()在第在第1段用段用简单随机抽样确定第一个个体编号简单随机抽样确定第一个个体编号l(lk);()按照一定的规则抽取样本按照一定的规则抽取样本.抽签法抽签法随机数表法随机数表法 (3)分层抽样分层抽样:即即 . . . . 4.正态分布正态分布 (1)如果随机变量如果随机变量的概率
11、密度为的概率密度为 ,(x)= . 其中其中、分别表示总体的平均数与标准分别表示总体的平均数与标准差,称差,称服从参数为服从参数为、的正态分布,记作的正态分布,记作N(,2),函数图象称为正态密度曲线,简函数图象称为正态密度曲线,简称正态曲线称正态曲线.在抽样时在抽样时,将总体分成将总体分成互不交叉的层互不交叉的层,然后按照一定的比例然后按照一定的比例,从各层从各层独立地抽出一定数量的个体独立地抽出一定数量的个体,将各层取出的将各层取出的个体合在一起作为样本个体合在一起作为样本(x(-,+)22()212xe一般的,如果对于任何实数一般的,如果对于任何实数ab,随机变随机变量量满足满足P(ab
12、)= ,(x)dx,则称,则称的分布为的分布为 .(2)标准正态分布标准正态分布在正态分布中在正态分布中,当当= ,= 时时,正态总正态总体称为标准正态总体,正态分布体称为标准正态总体,正态分布N(0,1),称,称为标准正态分布,记作为标准正态分布,记作N(0,1).(3)正态曲线的性质正态曲线的性质()曲线在曲线在x轴的上方,与轴的上方,与x轴不相交;轴不相交;()曲线关于直线曲线关于直线x=对称;对称;ba正态分布正态分布01()曲线在)曲线在x=时位于最高点;时位于最高点;()当)当x时时,曲线下降曲线下降,并且当曲线向左、右两边无限延并且当曲线向左、右两边无限延伸时伸时,以以x轴为渐近
13、线向它无限靠近;轴为渐近线向它无限靠近;()当)当一定时,曲线的形状由一定时,曲线的形状由确定,确定,越大,曲线越越大,曲线越“矮胖矮胖”,表示总体的分布,表示总体的分布越分散;越分散;越小,曲线越越小,曲线越“瘦高瘦高”,表示总,表示总体的分布越集中体的分布越集中.(4)若若N(,2),则则E=,D=2.(5)若若XN(,2),则则P(-X+i)=0.6826,P(-2X+2)=0.9544,P(-3X+3)=0.9974.(6)通常认为服从正态分布通常认为服从正态分布N(,2)的随机的随机变量变量X只取只取 ,并并简称之为简称之为3原则原则.(-3,+3)之间的值之间的值1111例例1 在
14、我国东南沿海有在我国东南沿海有60个人均个人均GDP在在3万万元以上的城市,其中人均元以上的城市,其中人均GDP在在34万元之万元之间的有间的有36个,在个,在45万元之间的有万元之间的有18个,在个,在5万元以上的有万元以上的有6个个.国家环保总局欲用分层抽国家环保总局欲用分层抽样从中随机抽取部分城市进行环境调查,若样从中随机抽取部分城市进行环境调查,若抽取的人均抽取的人均GDP在在45万元之间的城市个数万元之间的城市个数为为3,则抽取的人均,则抽取的人均GDP在在34万元之间的万元之间的城市个数为城市个数为. 根据分层抽样的特征,在各层抽根据分层抽样的特征,在各层抽取的比例是相同的,故可先
15、依据已知求取的比例是相同的,故可先依据已知求出这个比例,再求解出这个比例,再求解. 抽取的人均抽取的人均GDP在在45万元之间的万元之间的城市的比例为城市的比例为 ,故抽取的人均,故抽取的人均GDP在在34万元之间的城市的比例也是万元之间的城市的比例也是 ,则抽,则抽取的城市个数为取的城市个数为36 .318318318 分层抽样在各层抽取样本的比例是相分层抽样在各层抽取样本的比例是相等的等的,这是解决分层抽样计算问题的主要依据这是解决分层抽样计算问题的主要依据.例例2 某 批 材 料 的 强 度某 批 材 料 的 强 度 服 从 正 态 分 布服 从 正 态 分 布N(200,182),任取
16、一件这种材料,强度在,任取一件这种材料,强度在164236的概率是多少?的概率是多少? 依题意,得依题意,得=200,=18.则则P(164236)=P(200-218200+218)P(-2+2)=0.9544.故任取一件材料故任取一件材料,其强度在其强度在164236的概率是的概率是0.9544. 求此概率问题需化为服从正态分布求此概率问题需化为服从正态分布的随机变量的几种特殊值的概率形式的随机变量的几种特殊值的概率形式. 设在一次数学考试中,某班学设在一次数学考试中,某班学生的分数服从生的分数服从N(110,202),且已知,且已知满分为满分为150分,这个班的学生共分,这个班的学生共5
17、0人,人,求这个班在这次考试中不小于求这个班在这次考试中不小于90分的分的人数和超过人数和超过130分以上的人数分以上的人数. 因为因为N(110,202),则则=110,=20,P(110-20130)=12(1-0.6826)=0.1587.P(90)=0.6826+0.1587=0.8413.故不小于故不小于90分的人数为分的人数为500.841342(人人).超过超过130分以上的人数为分以上的人数为500.15878(人人). 求此概率需将问题化为正态随机变求此概率需将问题化为正态随机变量的几种特殊值的概率形式,然后利用量的几种特殊值的概率形式,然后利用对称性求解对称性求解.例例3
18、在生产过程中,测得纤维产品的纤度在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量表示纤维粗细的一种量)共有共有100个数据,个数据,数据分组如下表数据分组如下表分组1.30,1.34)1.34,1.38)1.38,1.42)1.42,1.46)1.46,1.50)1.50,1.54)合计频数4253029102100(1)完成频率分布表,并在给定的坐标系完成频率分布表,并在给定的坐标系中画出频率分布直方图;中画出频率分布直方图;分组频数频率1.30,1.34)41.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.54)2合计100
19、(2)估计纤度落在估计纤度落在1.38,1.50)中的概中的概率及纤度小于率及纤度小于1.40的概率是多少?的概率是多少?(3)统计方法中,同一组数据常用该统计方法中,同一组数据常用该组区间的中点值(例如区间组区间的中点值(例如区间1.30,1.34)的中点值是的中点值是1.32)作为代表)作为代表.据此,估计据此,估计纤度的期望纤度的期望.分组频数频率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.31.42,1.46)290.291.46,1.50)100.101.50,1.54)20.02合计1001.00(1)频率分布表为:频率分布表为:(2)
20、纤度落在纤度落在1.38,1.50)中的概率约)中的概率约为为0.30+0.29+0.100.69,纤度小于,纤度小于1.40的概率约为的概率约为0.04+0.25+120.300.44.( 3 ) 总 体 数 据 的 期 望 约 为总 体 数 据 的 期 望 约 为1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088. 1.解答本题时,第解答本题时,第(1)问首先需计问首先需计算出每组的频率(利用频数算出每组的频率(利用频数100);第);第(2)问注意问注意1.38,1.42)中既有小于中既有小于1.40,又,又有大于有大
21、于1.40的,可以认为各一半;第的,可以认为各一半;第(3)问先计算出中点的概率,然后根据期望问先计算出中点的概率,然后根据期望的定义求解的定义求解. 2.本题主要考查频率分布直方图、本题主要考查频率分布直方图、频率、期望等概念和用样本频率估计整频率、期望等概念和用样本频率估计整体分布的统计方法,考查运用概率、统体分布的统计方法,考查运用概率、统计知识解决实际问题的能力计知识解决实际问题的能力.例例3 对甲、乙两名自行车赛手在相同条件下进对甲、乙两名自行车赛手在相同条件下进行了行了6次测试,测得他们的最大速度次测试,测得他们的最大速度(m/s)的数据的数据如下表:如下表:(1)画出茎叶图画出茎
22、叶图,由茎叶图你能获得哪些信息由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速分别求出甲、乙两名自行车赛手最大速度度(m/s)数据的平均数、中位数、标准差,并判数据的平均数、中位数、标准差,并判断选谁参加比赛更合适断选谁参加比赛更合适.甲273830373531乙332938342836 (1)画茎叶图画茎叶图,中间数为数据的十位数字中间数为数据的十位数字: 从这个茎叶图上可以看出从这个茎叶图上可以看出,甲、乙的最甲、乙的最大速度情况都是分布均匀的大速度情况都是分布均匀的,只是乙更好一只是乙更好一些些;乙的中位数是乙的中位数是33.5,甲的中位数是甲的中位数是33.因因此此,
23、乙发挥比较稳定乙发挥比较稳定,总体情况比甲好总体情况比甲好.(2) =33, =33;s甲甲=3.96,s乙乙=3.56;甲的中位数是甲的中位数是33,乙的中位数是,乙的中位数是33.5.综合比较,选乙参加比赛较为合适综合比较,选乙参加比赛较为合适.x甲x乙 在某篮球比赛中,根据甲和乙两人的得分在某篮球比赛中,根据甲和乙两人的得分情况得到如图所示的茎叶图情况得到如图所示的茎叶图. (1)从茎叶图的特征来说明他们谁发挥得更稳定从茎叶图的特征来说明他们谁发挥得更稳定; (2)用样本的数字特征验证他们谁发挥得更好用样本的数字特征验证他们谁发挥得更好. 茎叶图的直观形状像横放的频茎叶图的直观形状像横放
24、的频率分布直方图,且保留了所有原始数率分布直方图,且保留了所有原始数据的信息,所以从数与形的特征来看,据的信息,所以从数与形的特征来看,甲和乙的得分都是对称的,叶的分布甲和乙的得分都是对称的,叶的分布是是“单峰单峰”的,但甲全部的叶都集中的,但甲全部的叶都集中在茎在茎2上,而乙只有上,而乙只有57的叶集中在茎的叶集中在茎2上,这说明甲发挥得更稳定上,这说明甲发挥得更稳定.(2) = =25, = =25, = (20-25)2+(21-25)2+(25-25)2+(26-25)2+(27-25)2+(28-25)2+(28-25)29.14, = (17-25)2+(23-25)2+(24-2
25、5)2+(25-25)2+(26-25)2+(29-25)2+(31-25)217.43.因为因为 = , ,所以甲发挥得更好所以甲发挥得更好.x甲x乙2021252627282871723242526293172s甲2s乙1717x甲x乙2s甲2s乙1.统计的基本思想方法是用样本估计总统计的基本思想方法是用样本估计总体,即用局部推断整体,这就要求样本应具体,即用局部推断整体,这就要求样本应具有很好的代表性,而样本良好客观的代表性,有很好的代表性,而样本良好客观的代表性,完全依赖抽样方法,弄清简单随机抽样和分完全依赖抽样方法,弄清简单随机抽样和分层抽样的客观合理性,从而会在不同的情况层抽样的客
26、观合理性,从而会在不同的情况下采用适当的抽样方法下采用适当的抽样方法.掌握三种抽样方法掌握三种抽样方法的抽样步骤的抽样步骤.三种抽样方法的比较:三种抽样方法的比较:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相等的;均属于不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少分层抽样将总体分成几层进行抽取各层抽样时采用简单随机抽样总体由差异明显的几部分组成系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多2.频率分布直方图会使样本的一些数字频率分布直方图会使样本的一些数字特征更明显特征更明显,绘制频率分布直方图时绘制频率分布直方图时,要合理分要合理分组组,以便使数据中的特征能更好地反映出来以便使数据中的特征能更好地反映出来.总体分布估计中总体分布估计中,(1)先确定分组的组数先确定分组的组数,其其方法是:最大数据与最小数据之差除组距得方法是:最大数据与最小数据之差除组距得组数组数.(2)计算每组中的频数及频率,其中频率计算每组中的频数及频率,其中频率= .(3)画出直方图画出直方图.3.画茎叶图的步骤如下:画茎叶图的步骤如下:(1)将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两两部分部分;频数总数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 联考书法考试题及答案
- 乐理知识考试题及答案
- 考试题目及解析答案
- 药物合成反应工综合考核试卷及答案
- 拼布工职业考核试卷及答案
- 警方护航考试题及答案
- 塑料编织工操作考核试卷及答案
- 课件文案精简指南
- 炼钢准备工操作考核试卷及答案
- 金融培训考试题及答案
- 2025石油交易居间合同石油居间协议
- 初中拔高几何题目及答案
- 2024小学劳动技术课标考试模拟试卷及参考答案
- 人保农险理赔员考试题及答案
- JG/T 328-2011建筑装饰用石材蜂窝复合板
- 炼钢钢厂辅料管理制度
- 工程项目廉洁培训
- 2025年年中考物理综合复习(压轴特训100题55大考点)(原卷版+解析)
- 井工煤矿智能化管理培训课件
- 以患者为中心区块链在提升口腔治疗效率的应用
- 大学生文明养成教育主题班会
评论
0/150
提交评论