


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学必求其心得,业必贵于专精第1章 统计1抽样方法(1)用随机数表法抽样时,对个体所编号码位数要相等,当问题所给位数不等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数(2)用系统抽样法时,如果总体容量n能被样本容量n整除,抽样间隔为k;如果总体容量n不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k.(3)应用三种抽样方法时需要搞清楚它们的使用原则当总体容量较小,样本容量也较小时,可采用抽签法当总体容量较大,样本容量较小时,可用随机数表法当总体容量较大,样本容量也较大时,可用系统抽样法当总体由差异明显的几部分组成时,常用分层抽样2用样本估计总体(1)用样本频率分布估计总
2、体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示.但数据较多时不方便(3)平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度3变量间的相关关系除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变量之间的关系-相关关系,对于一元线性相关关系,通过建立线性回归方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图、写出线性回归方程典例1 某工厂有1 003名工人,从中抽取10人参加体检,试采
3、用简单随机抽样和系统抽样进行具体实施解(1)简单随机抽样:将每一个人编一个号由0001至1003。制作大小相同的号签,并写上号码放入一个大容器内,均匀搅拌依次抽取10个号签具有这十个编号的人组成一个样本(2)系统抽样:将每个人编一个号由0001至1003。利用随机数表抽取3个号,将这3个人剔除重新编号0001至1000.分段100,所以0001至0100为第一段在第一段内由简单随机抽样方法抽得一个号l。按编号将l,100l,900l,共10个号选出,这10个号所对应的人组成样本借题发挥1。当总体容量n能被样本容量n整除时,分段间隔k,利用系统抽样的方法抽样2当总体容量不能被样本容量整除时,可先
4、从总体中随机剔除n个个体3要注意三种抽样方法的使用条件对点训练1将参加夏令营的600名学生编号为:001,002,,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003。这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为()a26,16,8b25,17,8 c25,16,9 d24,17,9解析:选b 由题意知间隔为12,故抽到的号码为12k3(k0,1,,49),列出不等式可解得:第营区抽25人,第营区抽17人,第营区抽8人典例2有一容量为200的样本,数据的分组以及各组的频数如下:20
5、,15),7;15,10),11;10,5),15;5,0),40;0,5),49;5,10),41;10,15),20;15,20,17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率解(1)频率分布表如下:分组频数频率20,15)70。03515,10)110.05510,5)150.0755,0)400.20,5)490。2455,10)410.20510,15)200.115,20170。085合计2001。00(2)如图是频率分布直方图和频率分布折线图:(3)样本数据不足0的频率为:00350.0550.0750。20。365。借题
6、发挥1。频率分布直方图的绘制方法与步骤(1)先制作频率分布表,然后作直角坐标系,横轴表示总体,纵轴表示。(2)把横轴分成若干段,每一段对应一个组以每个组距为底,以各频率除以组距的商为高,分别画成矩形这样得到的直方图就是频率分布直方图2频率分布折线图反映的是数据的变化趋势,可用来对数据进行估计和预测对点训练2从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示)由图中数据可知a_。若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_解析:0.0
7、05100.03510a100.020100.010101,a0.030。设身高在120,130),130,140),140,150三组的学生各有x,y,z人,则0。03010,解得x30.同理,y20,z10。故从140,150中抽取的学生人数为183。答案:0.03033某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标)所得数据均在区间5,40中,其频率分布直方图如图所示,则在抽测的100根中,有_根棉花纤维的长度小于20 mm.解析:(0.0450.0150.015)10030.答案:30 借题发挥在实际问题中,仅靠平均数不能完全反
8、映问题,还要研究数据偏离平均数的离散程度(即方差或标准差)标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定对点训练4甲、乙两位学生参加数学竞赛培训,在培训期间他们参加5项预赛,成绩记录如下:甲:7876749082乙:9070758580(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由解:(1)用茎叶图表示如下:(2)甲80,乙80,而s(7880)2(7680)2(7480)2(9080)2(8280)232,s(9080)2(7080)2(7580)2(8580)2(8080)25
9、0.甲乙,ss,从统计学的角度考虑,选甲参加更合适.典例4某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这种服装件数x之间有如下一组数据:x3456789y66697381899091已知:280,45 309,3 487。(1)求,;(2)求纯利y与每天销售件数x之间的线性回归方程;(3)估计每天销售10件这种服装时纯利润为多少元?解(1)由已知得(3456789)6,(66697381899091)79.86。(2)设线性回归方程为ybxa,则b4.75,ab 79.864.75651.36.所求线性回归方程为y4.75x51。36。(3)当x10时,y98。86,估计每天销
10、售这种服装10件可获纯利98.86元借题发挥要对y与x进行线性相关检验,只要画出散点图,看各数据是否集中在某一条直线附近即可,采用数形结合思想,若线性相关,则根据公式求出回归方程对点训练5炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:x(0。01%)104180190177147134150191204121y(min)100200210185155135170205235125(1)作出散点图,你能从中发现含碳量与冶炼时间的一般规律吗?
11、(2)求回归方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟解:(1)用x表示含碳量,y表示冶炼时间,可作散点图如下图所示从上图中可以看出,各点散布在一条直线附近,即它们线性相关(2)列出下表,并用科学计算器进行计算:i12345xi104180190177147yi100200210185155xiyi10 40036 00039 90032 74522 785i678910xi134150191204121yi135170205235125xiyi18 09025 50039 15547 94015 125159.8,172;x265 448,xiyi287 640设所求回归方程为y
12、bxa。b1。267,ab30。47.即所求的回归方程为y1。267x30.47.(3)当x160时,y1.26716030。47172(min),即大约冶炼172 min。(时间:90分钟满分:120分)一、选择题(本大题共10小题,每小题5分,共50分在每小题给出的四个选项中,只有一项是符合题目要求的)1为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为()a40b30 c20 d12解析:选b 系统抽样也叫间隔抽样,抽多少个就分成多少组,总数组数间隔数,即k30.2某学校为了调查高一年级的200名学生完成课后作业所需时间,
13、采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行抽查;第二种由教务处对该年级的学生进行编号,从001到200,抽取学号最后一位为2的同学进行调查则这两种抽样的方法依次是()a分层抽样,简单随机抽样b简单随机抽样,分层抽样c分层抽样,系统抽样d简单随机抽样,系统抽样解析:选d 由抽样方法的概念知选d.3一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为()a10组 b9组 c8组 d7组解析:选b 根据列频率分布表的步骤,8.9,所以分9组4(陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,84
14、0随机编号,则抽取的42人中,编号落入区间481,720的人数为()a11 b12 c13 d14解析:选b 依据系统抽样为等距抽样的特点,分42组,每组20人,区间481,720包含25组到36组,每组抽1人,则抽到的人数为12。5某大学数学系共有本科生5 000人,其中一、二、三、四年级的人数比为4321,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为()a80 b40 c60 d20解析::选b 应抽取三年级的学生人数为20040。6已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在60,70)的汽车辆数为()a8 b80 c6
15、5 d70解析:选b 时速在60,70)的汽车频率为0。04100.4,时速在60,70)的汽车大约有2000。480(辆)7已知回归直线斜率的估计值为1。23,样本点的中心为(4,5),则回归方程为()ay1.23x4by1。23x5cy1。23x0。08dy0.08x1。23解析:选c 回归直线的斜率就是b,则回归方程为y1.23xa,将(4,5)代入方程得a0.08。8某班的数学考试成绩的平均分为70分,方差为s2。后来发现成绩记录有误,同学甲得80分却误记为50分,同学乙得70分却误记为100分,更正后计算得方差为s,则s2与s的大小关系是()as2s bs2s cs2s d无法判断解
16、析:选 a 根据方差的计算公式,s2的算式中含有(5070)2(10070)2,s的算式中含有(8070)2(7070)2,而两算式的其他部分完全相同,故易知s2s。9.甲、乙两名同学在5次体育测试中的成绩统计如图的茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列结论正确的是()ax甲x乙;乙比甲成绩稳定bx甲x乙;甲比乙成绩稳定cx甲x乙;乙比甲成绩稳定dx甲x乙;甲比乙成绩稳定解析:选a 甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95,x甲81,x乙86。8,x甲x乙从茎叶图中数据的分布情况看,乙同学的成绩更集中于平均数附近,这说明乙比甲成
17、绩稳定10在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()a甲地:总体平均值为3,中位数为4b乙地:总体平均值为1,总体方差大于0c丙地:中位数为2,众数为3d丁地:总体平均值为2,总体方差为3解析:选d 根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项a中,中位数为4,可能存在大于7的数;同理,在选项c中也有可能;选项b中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项d中,根据方差公式,如果有大于7
18、的数存在,那么方差不会为3.二、填空题(本大题共4小题,每小题5分,共20分把答案填写在题中的横线上)11某社区对居民进行2017天津全运会知晓情况的分层抽样调查已知该社区的青年人、中年人和老年人分别有800人、1 600人、1 400人若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是_解析:抽取的比例为k,故在中年人中应该抽取的人数为1 60080.答案:8012对具有线性相关关系的变量x和y,测得一组数据如下:x24568y3040605070若已求得它们的回归方程的斜率为6.5,则这条直线的回归方程为_解析:设回归方程为y6。5xa。由已知,(24568)5。(30406050
19、70)50.a6。5506。5517.5.y6。5x17。5。答案:y6。5x17.513从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为_;(2)在这些用户中,用电量落在区间100,250)内的户数为_解析:(1)根据频率和为1,得(0.002 40.003 60。006 0x0。002 40。001 2)501,解得x0.004 4;(2)(0.003 60.006 00.004 4)5010070.答案:(1)0.004 4(2)7014.甲、乙两位同学某学科连续五次考试成绩用茎叶图表示,如图所示,则平均数较高的是
20、_,成绩较为稳定的是_解析:甲的平均分为70,乙的平均分为68;甲的方差为:s2,同理乙的方差为s7.2,故甲的平均分高于乙,甲的成绩比乙稳定答案:甲甲三、解答题(本大题共4小题,共50分解答应写出必要的文字说明、证明过程或演算步骤)15(12分)某车间有189名职工,现要按121的比例选质量检查员,采用系统抽样的方式进行,写出抽样过程解:以随机方式对189名职工编号(比如可直接采用工资表上号码编号),设其分别为1,2,3,189,由已知样本容量是总体个数的,故样本容量为1899(个),将1,2,3,189编9段,每段21个号如121为第一段,2242为第二段,169189为第九段,在第一段1
21、21个号码中随机抽样产生一个号码,如设为l,则l,l21,l42,,l168就是所产生的9个样本号码,对应的就是质量检查员16(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况解:(1)茎叶图如图所示:(2)甲12,乙13,s13.67,s16.67。因为甲乙,所以乙种麦苗平均株高较高,又因为ss,所以甲种麦苗长的较为整齐17(12分)为了了解中学生的身体发育情况,对某一中学同年龄的50名男生的身高进行了测量,结果如下:157,161)3人; 161,165)4人; 165,169)12人;169,173)13人;173,177)12人;177,1816人(1)列出频率分布表;(2)画出频率分布直方图;(3)估计总体在165,177)间的比例解:(1)列出频率分布表:分组频数频率157,161)30。060.015161,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB43-T 2791-2023 茭白-鳖共生综合种养技术规程
- 插画技术课件图片大全
- 睢宁中级消防员课件视频
- 《断头台》测试题带答案
- 挫折心理健康课件
- 年中工作汇报
- 2025年农业生物技术在红枣种子抗病育种中的应用突破报告
- 肿瘤病人靶向治疗的护查房讲课件
- 外贸业务开放题目及答案
- DB61-T 1699-2023 1:10000基础地理信息要素图库一体化数据规范
- 2024中考复习必背初中英语单词词汇表(苏教译林版)
- 大坝模型制作方案
- 2024年北京门头沟区社区工作者招聘笔试参考题库附带答案详解
- 气缸的工作原理课件
- 2023国机集团财务资产纪检监察中心公开招聘2人历年高频难易度、易错点模拟试题(共500题)附带答案详解
- 易罐疗法及其作用
- 过敏性皮炎大查房课件
- 老年健康与老年服务名词术语
- 2023年秋季国家开放大学-02154-数据库应用技术期末考试题带答案
- 山东省德州市宁津县房地产市场报告
- 中华护理学会精神科专科护士理论考试试题
评论
0/150
提交评论