版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
页脚页脚【知识点:统计】一.简单随机抽样1.总体和样本总体:在统计学中,把研究对象的全体叫做总体.个体:把每个研究对象叫做个体.总体容量:把总体中个体的总数叫做总体容量.为了研究总体;的有关性质,一般从总体中随机抽取一部分:可,花,…,“研究,我们称它为样本.其中个体的个数称为样本容量。2•简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差围;③概率保证程度。抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。系统抽样系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。d(抽样距离)=N(总体规模)/n(样本规模)分层抽样分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,
然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。四.样本频率分布图作图步骤:(1)求极差(一组数据中最大值和最小值得差)(2)决定组距和组数;(3)将数据分组;(4)计算各小组的频率,列频率分布表;(5)画频率分布直方图特点:(1)以面积的形式反映数据落在各小组的频率大小;(2)小长方形的面积二(2)小长方形的面积二组距x频率组距3)各小长方形的面积的总和等于1.五.茎叶图适用围:在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录。当样本数据较多时,茎叶图就不太方便了。六.用样本的数字特征估计总体的数字特征TOC\o"1-5"\h\zx+xHFx1、本均值:X=—2nnI——————(X-X)2+(x-X)2FF(X-X)22、.样本标准差:s=Js2=讣—12nn3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍五.两个变量的线性相关1、概念:(1)回归直线方程y二bx+a2.3.2)回归系数最小二乘法2.3.2)回归系数最小二乘法直线回归方程的应用y(x-x)(y—y)yiib=4=y(x-x)2ii=1xy-nxyii4=1y-2x2一nx2ii=1a二y-bx1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的围来实现统计控制的目标。(4)回归直线一定经过样本的中心点(x,y),据此性质可以解决有关的计算问题.【例题讲解】某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15那么由此求出的平均数与实际平均数的差是()A3.5B—3C3D—0.5设有一个直线回归方程为y=2—1.5x,则变量x增加一个单位时()Ay平均增加1.5个单位by平均增加2个单位Cy平均减少1.5个单位dy平均减少2个单位从N个编号中抽取n个入样,若采用系统抽样方法进行抽取,则分段间隔应为()4.从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.5.为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有;①2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本;④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等数据70,71,72,73的标准差是数据a,a,aa的方差为b2,平均数为卩,贝qTOC\o"1-5"\h\z123n数据ka+b,ka+b,ka+b,...,ka+b,(kb丰0)的标准差为,123n平均数为数据k(a+b),k(a+b),k(a+b),...,k(a+b),(kb丰0)的标准差为,123n平均数为用样本频率分布估计总体频率分布的过程中,下列说确的是()A总体容量越大,估计越精确B总体容量越小,估计越精确C样本容量越大,估计越精确D样本容量越小,估计越精确9从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班76748296667678725268乙班86846276789282748885画出茎叶图并分析两个班学生的数学学习情况【课堂练习】相关关系与函数关系的区别是从10个篮球中任取一个,检验其质量,则应采用的抽样方法为下列说法错误的是()A在统计里,把所需考察对象的全体叫作总体B一组数据的平均数一定大于这组数据中的每个数据C平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D一组数据的方差越大,说明这组数据的波动越大要了解全市高一学生身高在某一围的学生所占比例的大小,需知道相应样本的()A平均数B方差C众数D频率分布要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验用每部分选取的间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是()A5,10,15,20,25,30B3,13,23,33,43,53C1,2,3,4,5,6D2,4,8,16,32,48数据a,a,aa的方差为b2,则数据2a,2a,2a2a的方差为()123n123nb2ABb2C2b2D4b22已知样本9,10,11,x,y的平均数是10,标准差是,则xy二8.有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为(B5,15,20,35,40DB5,15,20,35,40D10,20,30,40,50C5,11,17,23,29(2013•武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1〜160编号,按编号顺序平均分成20组(1〜8号,9〜16号,…,153〜160号),若第16组抽出的为126,则第1组中用抽签的方法确定的是.(2012・)样本(x,x,—,x)的平均数为x,样本(y,y,…,y)的平均数为y(x12n12mMy).若样本(x,x,—,x,y,y,—,y)的平均数z=ax+(1—a)y,其中12n12m0<a<2,则n,m的大小关系为().A.n<mB.n>mC.n=mD.不能确定已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是相关(填“正”或“负”).施化肥量x15202530354045水稻产量y330345365405445450455
(2013•调研)已知x,y取值如下表:x014568y1.31.85.66.17.49.3从所得的散点图分析可知:y与x线性相关,且y=0.95x+a,则a=().A.1.30B.1.45C.1.65D.1.80某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄碳族”,得到如下统计表和各年龄(1)补全频率分布直方图;(2)求n,a,p的值.14以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积㈣115110S0135105誚售价格(万元〕24.821.618.429.2221)画出数据对应的散点图;2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格(2012•揭阳调研)某校髙一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1〜50编号,并按编号顺序S'TOC\o"1-5"\h\z703689平均分成10组,按各组抽取的编号依次增加5进行系统抽样.6257若第5组抽出的为22,写出所有被抽出职工”①的;分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(273公斤)的职工,求体重为76公斤的职工被抽取到的概率.【课后作业】一个容量为20的样本,已知某组的频率为0.25,则该组的频数为用随机数表法从100名学生(男生25人)中抽取20人进行评教,某男生被抽取的机率是(2013•质检)市某髙中有髙一学生600人,髙二学生500人,髙三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中髙三学生有11人,则n的值等于一个容量为20的样本数据,分组后组距与频数如下表:组距110,20组距110,20)120,30)130,40)140,50)150,60)频数234542则样本在区间(一8,50)上的频率为ko,7O)某单位有老年人28人,中年人54人,青年人81人,为调查身体健康状况,需要从中抽取一个容量为36的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取—人、人、人某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在不到40岁的教师中应抽取的人数为多少人?如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的组距频率分布直方图如下:观察图形,回答下列问题:组距0.03□.025□.0150.01□.0051)79.589.5这一组的频数、频率分别是多少?2)估计这次环保知识竞赛的及格率(60分及以上为及格)统计答案统计答案例题答案】例1.B少输入90,90=3,例1.B少输入90,90=3,平均数少3,求出的平均数减去实际的平均数等于-3例2.0.714=0.720例3.C剔除零头[审题视点]因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.解由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:800莎第一步:先从802辆轿车中剔除2800莎第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含k=10个个体;第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.方沅锦解决系统抽样问题的两个关键步骤为:分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定5•④,⑤,⑥2000名运动员的年龄情况是总体;每个运动员的年龄是个体;6.70+6.70+71+72+734=71.5,s=■'1[(70—71.5)2+(71-71.5)2+(72—71.5)2+(73—71.5)2]二7(1)1)中,k卩+b(2)lk何,k卩7(1)1)ka+b+ka+b+...+ka+ba+a+...+aX=―12n=k•2n+b=k卩+bn[(ka+b—kH—b)2+(ka+b—k|lx—b)2+...+(ka+b—k|lx—b)2]n12n=Ik[(a—卩)2+(a—卩)2+...+(a—卩)2]=Ikpn12nk(a+b)+k(a+b)+...+k(a+b)a+a+...+a(2)X=+2n=k•2n+nb=k卩+nbn
=ikn[(ai—y)2+(a—卩)2+...+(a—卩)2]=|k|q[(ka+kb—k卩一kb)+(ka+kb=ikn[(ai—y)2+(a—卩)2+...+(a—卩)2]=|k|q&C9.解:甲班乙班2566286642746828245686922乙班级总体成绩优于甲班【课堂练习】函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性简单随机抽样3.B平均数不大于最大值,不小于最小值4D5B=10,间隔应为106Dc2二-工(X—X)2,1工(2X—2X)2二4-1工(X—X)2二4c2,nininii=1i=1i=1969+10+11+x+y=50,x+y=20,1+1+(x一10)2+(y一10)2=10,x2+y2—20(x+y)=—192,(x+y)2—2xy—20(x+y)=—192,xy=—96D间隔为106解析设第1组抽取的为b,则第n组抽取的为8(n—l)+b,:8X(16—l)+b=126,.•.b=6,故第1组抽取的为6.解析依题意得x+x-Ix=nx,y+y-|y=my,12n12mx—xx—y—yy=(m—n)z=(m—n)ax—(m+n)(1—a)y,12n12mnx—my=(m—n)ax—(m—n)(1—a)y,,n=m—na,于是有n—m=(m—n)[a—(1—a)]=(m—n)(2a—1),m=m—n1—a,•.•O〈a〈2,.:2a—1〈O,.:n—m〈O,即m〉n.答案A11.正
11解析依题意得,x=—X(0+1+4+5+6+8)=4,y=tX(1.3+1.8+5.6+6.1+7.466+9.3)=5.25.又直线y=0.95x+a必过样本中心点(匚,T),即点(4,5.25),于是有5.25=0.95X4+a,由此解得a=1.45,选B.[审题视点](1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系频率式:组组率X频率式:组组率X组距=频率,频数样本容量=频率求解.解(1)第二组的频率为1—(0.04+0.04+0.03+0.02+0.01)X5=0.3,所以小长方形03的髙为W—o.06.频率分布直方图如图所示.由(1)知,第二组的频率为0.3,所以第二组的人数为1000X0.3=300,所以卩=而=0.65.第四组的频率为0.03X5=0.15,所以第四组的人数为1000X0.15=150,所以a=150X0.4=60.方乐锦丘》(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频频率率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是组距,而不是频率.频率(2)由频率分布直方图进行相关计算时,需掌握下列关系式:组距X组距=频率.解:(1)数据对应的散点图如图所示:(2)x=fx=109,l二工(x一x)2=1570,TOC\o"1-5"\h\z5ixxii=1i=1y=23.2,l=f(x一x)(y一y)=308xyiii=1设所求回归直线方程为y=bx+a,
l308则b=二u0.1962则l1570xx308a=y-bx=23.2-109x沁1.8166,故所求回归直线方程为y=0.1962x+1.8166据(2),当x=150m2时,销售价格的估计值为:y=0.1962x150+1.8166=31.2466(万元)解(1)分数在[50,60]的频率为0.008X10=0.08.2由
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电子邮件营销行为规范条款
- 2026湖北民族大学附属民大医院招聘2人备考题库含答案详解(精练)
- 2026江西旅游商贸职业学院高层次人才招聘15人备考题库(36)附答案详解(考试直接用)
- 2026广东云浮市招募就业见习人员299人备考题库含答案详解(预热题)
- 2026年马鞍山市和县文化旅游体育局度校园招聘备考题库附答案详解(巩固)
- 2026四川长虹电子控股集团有限公司招聘综合管理主办岗位1人备考题库及完整答案详解1套
- 2026四川达州大竹县国有资产事务服务中心县属国有企业招聘工作人员28人备考题库含答案详解(夺分金卷)
- 2026浙江台州市温岭市市场监督管理局招聘编外人员3人备考题库含答案详解
- 2026上海对外经贸大学国际经贸学院行政管理人员招聘1人备考题库及答案详解(考点梳理)
- 2026河南事业单位联考驻马店市招聘142人备考题库及答案详解(夺冠系列)
- 广西三支一扶2026年真题
- 危重病人血液透析护理
- 音体美新教师培训
- 《半纤维素》团体标准(征求意见稿)-0629
- 2026年叉车人员培训考试题库及完整答案一套
- (正式版)DB61∕T 2103-2025 《砖瓦用页岩矿资源储量核实技术规范》
- 药用植物育种学课件
- 2025苏超联赛考试真题及答案
- 运动时合理的呼吸方法
- 中医诊所医生聘用合同(标准版)4篇
- 敦煌壁画教学课件
评论
0/150
提交评论