




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章统计学初步1随机抽样整理、估计、分析简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布评估总体分布用样本的数字特征估计总体的数字特征(线性)回归分析统计知识结构图预测散点图相关系数独立性检验收集数据普查2随机抽样3三种随机抽样方法的比较类别各自特点相互联系适用范围
简单随机抽样(包括有随机数法、抽签法等)
系统抽样
分层抽样从总体中逐个抽取将总体均匀分成几个部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取总体中的个体数较少?在起始部分抽样时采用简单随机抽样总体中的个数较多各层抽样时根据个数的多少可采用简单随机抽样或系统抽样总体由差异明显的几部分组成共同点:每个个体被抽到的可能性相等4【互动探究】1.下列关于简单随机抽样的说法不正确的是()D
A.要求总体的个数有限
B.从总体中逐个抽取
C.它是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后有关2.从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行.则每人入选的概率()A.不全相等B.均不相等C5抽样方法的选择例1
(1)下列问题中,最适合用简单随机抽样方法的是()A.某电影院有32排座位,每排有40个座位,座位号1~
40,有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某校有在编人员160人,其中行政人员16人,教师
112人,后勤人员32人,教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡农田有山地8000亩,丘陵12000亩,平地24000
亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量6抽样方法的辨识例1(2)某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人.为了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依简单随机抽样、系统抽样、分层抽样的顺序排列是()
方法1:将140人从1~140编号,然后制作出有编号1~140的140个形状、大小相同的号签,并将号签放入同一箱子里进行均匀搅拌,然后从中抽取20个号签,编号与签号相同的20个人被选出;
方法2:将140人分成20组,每组7人,并将每组7人按1~7编号,在第一组采用抽签法抽出k号(1≤k≤7),则其余各组k号也被抽到,20个人被选出;
方法3:按20∶140=1∶7的比例,从教师中抽取13人,从教辅行政人员中抽取4人,从总务后勤人员中抽取3人,从各类人员中抽取所需人员时,均采用随机数法,可抽到20个人.7
A.方法2,方法1,方法3
B.方法2,方法3,方法1
C.方法1,方法2,方法3
D.方法3,方法1,方法2抽样方法的辨识8第四步,在第一段中随机地抽取1个号码i0,则i0,i0+50,i0+100,…,i0+950就可组成抽取的样本第一步,将1003个学生用随机方式进行编号0000,0001,0002,…,1002例1:要从1003个学生中选取一个容量为20的样本,试叙述系统抽样的步骤?解:采用系统抽样,可用下面的步骤设计方案:第二步,从总体中用简单随机抽样的方法剔除3个个体第三步,将剩下的1000个学生重新编号分别为000,001,002,…
,999并平均分成20段写抽样步骤9例2
某学校有教师160人,后勤服务人员40人,行政管理人员20人,要从中抽选22人参加学区召开的职工代表大会,为了使所抽的人员更具有代表性,应采用什么方法?写出抽样的步骤。解:应采用分层抽样法。(2)确定应抽取教师16人,后勤服务人员4人,行政管理人员2人;(1)确定该调查中总体个数为:160+40+20=220,则总体与样本容量的比例为220:22=10:1;(3)用系统抽样抽出16位教师,用简单随机抽样抽样抽出4位后勤服务人员和2位行政管理人员。写抽样步骤10感受高考题读扇形统计图,考抽样方法11读统计表,考抽样方法(概率)12(2005高考湖北卷)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是()A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样由抽样结果,判断使用的抽样方法13样本的数字特征估计:用样本估计总体分析:用数字特征、统计图进行数据分析14数字特征一:1、平均数:一组数据的总和除以数据的个数所得的商就是平均数。2、中位数:如果将一组数据从大到小的顺序依次排列,当数据有奇数个时,处在最中间的一个数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数。3、众数:出现次数最多的数(若有两个或几个数据出现的最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中每个数据出现的次数一样,则认为这组数据没有众数。15共同点:三个统计量都是表示一组数据的集中趋势。1、众数:体现了样本数据的最大集中点,但它显然对其他数据信息的忽视使得无法客观地反映总体特征。2、中位数:不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值。但它对极端值不敏感有时也会成为缺点.3、平均数:受样本中每一个数据的影响,“越离群”的数据,对平均数的影响越大。与众数和中位数相比,平均数代表了数据更多的信息。但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低。如:现在社会贫富差距大,很多人的收入都“被平均”了。特点:16
一组完全符合正态分布的理想数据,中位数=平均数;如果样本平均数>中位数,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值。在实际应用中,若同时知道样本中位数和样本平均数,可以使我们了解样本信息,帮助我们作出决策。平均数是日常生活中最常用的一个数字特征,如:在比赛评分中,使用的是平均数,计分过程中要采用“去掉一个最高分,去掉一个最低分”的方法,这样做有什么好处?联系:由于各个统计量有各自的特征,所以需要我们根据实际问题来选择合适的统计量。?!17标准差公式:方差公式:极差公式:最大值-最小值数字特征二:18①标准差、方差反映一组数据的离散程度
。②标准差、方差的取值范围:标准差、方差为0时,共同点:三个统计量都是表示一组数据的离散程度
。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。标准差和变量的计算单位相同.样本所有数据全部相等。19
例3
将10听罐装饮料分成甲、乙两组,对其含量进行测量,数据如下表所示(单位:mL):
请问哪组饮料的含量更稳定些?并说明理由.计算数字特征,精确分析数据稳定性20解:∴x甲=x乙,且甲>乙.∴乙组饮料的含量更稳定.21读茎叶图,计算平均数,由样本估计总体22由数字特征反求原始数据23用样本估计总体24组别频数频率145.5~149.580.16149.5~153.560.12153.5~157.5140.28157.5~161.5100.20161.5~165.580.16165.5~169.5mn合计MN频率分布直方图的绘制及其应用“例1”:某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:(1)求出表中字母m,n,M,N所对应的数值;(2)在给出的直角坐标系中画出频率分布直方图(图16-2-5);(3)估计该校高一女生身高在149.5~165.5cm范围内有多少人?25据频数m=50-(8+6+14+10+8)=4,频率为n=0.08,总频率N=1.00. (2)频率分布直方图如图D57: 图D5726
(3)该所学校高一女生身高在149.5~165.5cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342(人).271.如何从频率分布直方图中估计众数?0.200.400.1000.511.522.533.544.50.500.30频率/组距月均用水量/t众数:2.25280.200.400.1000.511.522.533.544.50.500.30频率/组距月均用水量/t怎样从立方图中找到中位数?左边的数据个数等于右边的数据个数即左边的样本频数等于右边的样本频数即左边的样本频率等于右边的样本频率即直方图左、右边的小矩形的面积相等2.如何从频率分布直方图中估计中位数?即中位数左边直方图的小矩形面积为0.5293.如何从频率分布直方图中估计中位数?中位数左边直方图的小矩形面积为0.50~2的小矩形面积之和为:0.5×(0.08+0.16+0.30+0.44)=0.490.200.400.1000.511.522.533.544.50.500.30频率/组距月均用水量/t0.080.160.440.5-0.49=0.010.01÷0.5=0.02在t=2.02之前所有小矩形的面积为0.5所以该样本的中位数为2.02303.如何从频率分布直方图中估计平均数?0.200.400.1000.511.522.533.544.50.500.30频率/组距月均用水量/t0.080.160.440.280.120.080.04每个小矩形的面积乘以小矩形底边中点的横坐标之和31方法总结:众数、中位数、平均数与频率分布直方图的关系:(1)众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
(2)中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。(3)平均数是每个小矩形的面积乘以小矩形底边中点的横坐标之和.32(08广东)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论