版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学112/12/2021知识点知识点考纲下载考纲下载统计案例统计案例1.会作两个有关联变量数据的散点图,会利用散点图直观认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用.(2)了解实际推断原理和假设检验的基本思想、方法及其简单应用.(3)进一步了解回归的基本思想、方法及其简单应用.第1页/共117页12/12/20211.简单随机抽样简单随机抽样(1)定义:设一个总体含有N个个体,从中 抽取n个个体作为样本(nN
2、),如果每次抽取时总体内的各个个体被抽到的机会 ,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法: 和 .逐个不放逐个不放回回都相等都相等抽签法抽签法 随机数随机数法法第2页/共117页12/12/2021编号编号分段间隔分段间隔k 分段分段简单随机抽样简单随机抽样l+k l+2k第3页/共117页12/12/20213.分层抽样分层抽样(1)定义:在抽样时,将总体的层,然后按照,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由 .组成的,往往选用分层抽样.【思考探究思考探究】 三种抽样方法有
3、什么共同点?提示:提示:抽样过程中每个个体被抽取的机会均等. 分成互不交叉分成互不交叉 一定的比例一定的比例 差异明显的几个部分差异明显的几个部分第4页/共117页12/12/20211从2 014名学生中选取10名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样法从2 014人中剔除4人,剩下的2 010人再按系统抽样的方法抽取,则每人入选的概率()A.不全相等 B.均不相等C.都相等,且为 D.都相等,且为【解析】从N个个体中抽取M个个体,则每个个体被抽到的概率都等于M/N.【答案】C100752011第5页/共117页12/12/20212将参加英语口语测试的1 000名学生
4、编号为000,001,002,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700 B.669 C.695 D.676【解析】由题意可知,第一组随机抽取的编号l15,分段间隔数kN/n1 000/5020,则抽取的第35个编号为a3515(351)20695.【答案】C第6页/共117页12/12/20213.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且鲜奶、酸奶、婴幼儿奶粉、成人奶粉分别有45种、10种、25种、20种不同的品牌,现从中抽取
5、一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是()A.7B.6C.5D.4第7页/共117页12/12/20214某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号, 196200号)若第5组抽出的号码为22,则第8组抽出的号码应是若用分层抽样方法,则40岁以下年龄段应抽取人【解析】由系统抽样知识可知,将总体分成均等的若干部分指的是将总体分段,且分段的间隔相等在第1段内采用简单随机抽样的方法确定一个起始编号,在此编号的基础上加上分
6、段间隔的整数倍即为抽样编号由题意,第5组抽出的号码为22,因为2(51)522,则第1组抽出的号码应该为2,第8组抽出的号码应该为2(81)537.由分层抽样知识可知,40岁以下年龄段的职工占50%,按比例应抽取4050%20(人)【答案】37 20第8页/共117页12/12/2021简单随机抽样简单随机抽样简单随机抽样的特点:简单随机抽样的特点:(1)抽取的个体数较少;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.【注意注意】抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.第9页/共117页12/12/2021(1)下列抽取样本的方式属于简单随机抽样的个
7、数是.从无限多个个体中抽取100个个体作为样本盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里从20件玩具中一次性抽取3件进行质量检验某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛(2)总体编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第11列和第12列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为第10页/共117页12/12/20217816 6572 0802 6314 0702 4369 9728 01983204 9234 4935
8、 8200 3623 4869 6938 7418【解析】(1)不是简单随机抽样由于被抽取的样本总体的个体数是无限的,而不是有限的不是简单随机抽样由于它是放回抽样不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取不是简单随机抽样因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样第11页/共117页12/12/2021(2)依题意,第一次得到的两个数字为02,由于0220,将它去掉;第三次得到的两个数字为14,由于1420,说明号码14在总体内,将它取出;继续向右读,依次可以取出07,02,01;但由于02在前面已经选出,故需要继续选一个再选一个就是04.故选出来的
9、第5个个体是04.【答案】(1)0(2)04第12页/共117页12/12/2021【变式训练变式训练】1.某项大赛举行群众参与活动,现在要从6名入围的幸运观众中抽取三人获得大赛一等奖.问:第一次抽取时,每个个体被抽到的概率是多少?第二次抽取时,余下的每个个体被抽到的概率是多少?第三次抽取时,余下的每个个体被抽到的概率是多少?整个抽样过程中,每个个体被抽取的概率是多少?应当选用什么样的方法抽取获奖观众更公平?第13页/共117页12/12/2021第14页/共117页12/12/2021系统抽样系统抽样第15页/共117页12/12/2021 将参加夏令营的600名学生编号为001,002,6
10、00.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为( )A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9第16页/共117页12/12/2021【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN*)组抽中的号码是312(k1)令312(k1)300得k1034,因此第营区被抽中的人数是25;令300312(k1)495得1034bcB.bcaC.cabD
11、.cba【解析】平均数 a101(15171410151717161412)14.7.中位数 b15,众数 c17.cba.【答案】D第39页/共117页12/12/20212.已知下列说法:众数所在的组的频率最大;各组频数之和为1;如果一组数据的最大值与最小值的差是15,组距为3,那么这组数据应分为5组;频率分布直方图中每个小长方形的高与这一组的频数成正比例.正确的说法是()A.B.C.D.第40页/共117页12/12/20213若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则()A.5,s22C.5,s25,s22【解
12、析】18(x1x2x8)5,19(x1x2x85)5, 5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,s2B,因此A药的疗效更好(2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A药疗效的试验结果有7/10的叶集中在茎2,3上;B药疗效的试验结果有7/10的叶集中在茎0,1上由上述可看出A药的疗效更好第62页/共117页12/12/2021 1.几种表示频率分布方法的优点与不足几种表示频率分布方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我
13、们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.第63页/共117页12/12/2021第64页/共117页12/12/2021从近两年的高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率
14、、平均数等知识结合在一起,考查学生应用知识解决问题的能力.第65页/共117页12/12/2021(2012陕西卷)假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解它们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如图所示:(1)估计甲品牌产品寿命小于200小时的概率;(2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率第66页/共117页12/12/2021【规范解答】(1)甲品牌产品寿命小于200小时的频率为 用频率估计概率,所以甲品牌产品寿命小于200小时的概率为 .(2)根据抽样结果,寿命大于200小时的产品共有757014
15、5(个),其中甲品牌产品是75个,所以在样本中,寿命大于200小时的产品是甲品牌的频率是 用频率估计概率,所以已使用了200小时的该产品是甲品牌的概率为 .【阅后报告】(1)注意本题中的图是频数分布图不是频率分布直方图(2)弄清楚寿命小于200小时,大于200小时的频数便于求频率41100205412915145752915第67页/共117页12/12/20211(2014山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17将其按从左到右的顺序分别编号为第一组,第二组,
16、第五组,下图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.18【解析】因为第一组与第二组共有20人,并且根据图象知第一组与第二组的频率之比是0.24 0.163 2,所以第一组的人数为203512.又因为第一组与第三组的频率之比是0.24 0.362 3 ,所以第三组有 122318人因为第三组中没有疗效的人数为6,所以第三组中有疗效的人数是18612.【答案】C第68页/共117页12/12/20212(2014陕西卷)某公司 10 位员工的月工资(单位:元)为 x1,x2,x10,其均值
17、和方差分别为x和s2,若从下月起每位员工的月工资增加100 元,则这10 位员工下月工资的均值和方差分别为 ()A. x,s21002B. x100,s21002C. x,s2D. x100,s2第69页/共117页12/12/2021【 解 析 】由 题 目 中 所 给 的 数 据 可 知 xx1x2x3x1010,不妨设这10 位员工下月工资的均值为y,则 y(x1x2x3x10)1 00010 x100, 易知方差没发生变化【答案】D第70页/共117页12/12/20213.(2013辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为
18、样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .第71页/共117页12/12/20214(2014山东卷)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如表所示工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率第72页/共117页12/12/2021第73页/共117页课课 时时 作作 业业第74页/共117页12/12/20211.两个变量的线性相
19、关两个变量的线性相关(1)正相关在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为负相关.左下角右上角左下角右上角左上角右下角左上角右下角第75页/共117页12/12/2021(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.【思考探究思考探究】相关关系与函数关系有什么异同点?提示:提示:相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系
20、,而相关关系不一定是因果关系,也可能是伴随关系.一条直线附近一条直线附近第76页/共117页12/12/2021距离的平方距离的平方和和最小最小121niiiniixxyyxx()()()121 2niiiniix ynxyxnx第77页/共117页12/12/20213回归分析回归分析(1)定义:对具有_的两个变量进行统计分析的一种常用方法(2)随机误差:线性回归模型用ybxae表示,其中a和b为模型的_,_称为随机误差 相关关系相关关系未知参数未知参数e第78页/共117页12/12/2021当r0时,表明两个变量_;当r0时,表明两个变量_r的绝对值越接近于1,表明两个变量的线性相关性_
21、r的绝对值越接近于0时,表明两个变量之间_通常|r|大于_时,认为两个变量有很强的线性相关性 正相关正相关负相关负相关越强越强几乎不存在线性相关几乎不存在线性相关关系关系0.75第79页/共117页12/12/202121.niiyy()随机误差随机误差差差iiieyy第80页/共117页12/12/2021第81页/共117页12/12/20215.独立性检验独立性检验(1)分类变量:变量的不同“值”表示个体所属的_,像这样的变量称为分类变量(2)列联表:列出两个分类变量的_,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为
22、不同类别不同类别频数表频数表y1y2总计x1ababx2cdcd总计acbdabcd22列联表第82页/共117页12/12/2021构造一个随机变量K2_,其中n_为样本容量(3)独立性检验利用随机变量、_来确定是否一定有把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验 abcd独立性假设独立性假设第83页/共117页12/12/20211判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图 B.二维条形图C.等高条形图 D.独立性检验【解析】前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度独立性检验通过计算得出相关的可能性
23、,较为准确【答案】D第84页/共117页12/12/2021【解析解析】 据相关指数的定义可知,相关指数R2的值越大,残差平方和越小,即模型的拟合效果越好.【答案答案】 A第85页/共117页12/12/2021【解析】散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强.【答案】D第86页/共117页12/12/20214(2014合肥检测)由数据(x1,y1),(x2,y2),(x10,y10)求得线性回归方程ybxa,则“(x0,y0)满足线性回归方程ybxa”是“x0 x1x2x1010,y0y1y2y1010”的()A充分不必要条件B必要不充分
24、条件C充要条件D既不充分也不必要条件第87页/共117页12/12/2021【解析】(x0,y0)为这 10 组数据的平均值,又因为回归直线ybxa必过样本中心点( x, y),因此(x0,y0)一定满足线性回归方程,但坐标满足线性回归方程的点不一定是( x, y)【答案】B第88页/共117页12/12/20215某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程ybxa中的b2,预测当气温为5 时,热茶销售量为 杯气温(气温()181310-1杯数24343864第89页/共117页1
25、2/12/2021【解析】根据表格中的数据可得,x14(1813101)10,y14(24343864)40.则 a yb x40(2)1060,故y2x60.当 x5 时,y2(5)6070.【答案】70第90页/共117页12/12/2021相关关系的判断相关关系的判断第91页/共117页12/12/2021第92页/共117页12/12/2021【变式训练变式训练】 1.下面是水稻产量与施化肥量的一组观测数据:施化肥量:15202530354045水稻产量:320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水
26、稻产量会一直随施化肥量的增加而增长吗?第93页/共117页12/12/2021【解析解析】(1)散点图如图:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.第94页/共117页12/12/2021回归方程的求法及回归分析回归方程的求法及回归分析第95页/共117页12/12/2021为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率
27、y之间的关系:小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 时间x12345命中率y0.40.50.60.60.4【解析】小李这5天的平均投篮命中率y(0.40.50.60.60.4)/50.5,可求得小李这5天的平均打篮球时间3.根据表中数据可求得 b0.01, a0.47,故线性回归方程为y 0.470.01x,将x6代入得6号打6小时篮球的投篮命中率约为0.53.【答案】0.5 0.53第96页/共117页12/12/2021【变式训练】2.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在
28、给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程x,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注: )零件个数零件个数x(个)(个)2345加工时间(小时)2.5344.5xbyaxnxyxnyxbniiinii1221,第97页/共117页12/12/2021【解析】(1)散点图如图第98页/共117页12/12/2021独立性检验独立性检验第99页/共117页12/12/2021有甲、乙两个班级进行数学考试,按照大于等于85 分为优秀,85 分以下为非优秀统计成绩后,得到如下的列联表 .优秀非优秀总计甲班10乙班30合计105已知从全部105
29、人中随机抽取1 人为优秀的概率为27.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”;第100页/共117页12/12/2021(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10 名学生从 2 到 11 进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号试求抽到6 号或 10 号的概率P(K2k)0.05 0.01k3.8416.635附:K2n(adbc)2(ab) (cd) (ac) (bd),第101页/共117页12/12/2021第102页/共117页12/12/2021【变式训练】3.某中学对“
30、学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的5/6,女生喜欢看NBA的人数占女生人数的1/3.(1)若被调查的男生人数为n,根据题意建立一个22列联表;(2)若有95%的把握认为是否喜欢看NBA和性别有关,求男生至少有多少人?附:)()()()(22dbcadcbabcaddcbaKP0.1000.0500.010k2.7063.8416.635第103页/共117页12/12/2021第104页/共117页12/12/2021 1.线性相关关系的理解:相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系.例如正方形面
31、积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.2.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同)第105页/共117页12/12/20213.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程.4.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K22.706应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断.第106页/共117页12/12/2021本部分内容是新课标数学的新增内容,在目前高考中时有出现,2012年全国各地高考都有考查本小节内容,今后的复习中应引起重视.第107页/共117页12/12/2021(2013福建卷)某工厂有25周岁以上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47625-2026精细陶瓷平行光束X射线衍射法测定单晶薄膜(晶圆)结晶质量
- 七年级上册社会法治期末复习宝典(知识清单)
- 豌豆形薹草复合体:多维度解析物种生物学奥秘
- 调强放射治疗(IMRT)对鼻咽癌患者唾液腺及眼部组织影响的深度剖析
- 课堂显性语用教学:大学生语用能力提升的关键路径
- 诺丁斯幸福教育理论:内涵、实践与启示
- 语音交互赋能独居老人社交机器人:设计、应用与前景探索
- 2026云南保山市商务局开招聘城镇公益性岗位人员1人考试模拟试题及答案详解
- 语用学视域下英若诚戏剧翻译的艺术呈现与文化传递
- 语文教学应对网络语言冲击的多维探索
- 数据中心DCIM技术系统培训
- 2026湖北十堰市茅箭区人民法院招聘协理员8人笔试备考试题及答案详解
- 2026广西北海市市场监督管理局招聘后勤人员控制数2人笔试备考试题及答案详解
- 2026年山东定期医师考核题库及答案
- 河南省开封市2026届九年级中考二模历史试卷(有答案)
- 2026内蒙古乌海市国创数字产业发展有限责任公司招聘15人考试备考题库及答案解析
- 2026年济南商标审查协作中心招聘(10名)考试参考试题及答案解析
- 2026云南昆明昆明晋宁产业园区运营管理有限公司员工招聘4人笔试参考题库及答案解析
- ERCP诊疗指南课件
- 小升初2025~2026学年浙江省宁波市鄞州区(人教版)数学考试试题 含答案
- 2026天津市河北区产业发展集团有限公司社会招聘工作人员3人考试备考题库及答案解析
评论
0/150
提交评论