版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一章概率与统计第八课时统计案例知识梳理一、残差分析1.线性回归模型y=bx+a+e中,a,b叫做模型的未知参数,e叫做随机误差.我们可以建立回归方程为bx+a中的估计量,由于
,所以
是e的估计量,这样,对于样本点(i=1,2,…,n)相对于它们的随机误差为ei=yi-
=yi-bxi-a(i=1,2,…,n),其估计值为(i=1,2,…,n),
称为相应于样本点(i=1,2,…,n)的残差.2.残差平方和Q=当Q的值越小,说明线性回归模型的拟合效果越好.3.相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.二、独立性检验1.用变量的不同“值”表示个体所属的不同类别,这种变量成为分类变量.例如:是否吸烟,宗教信仰,国籍等.2.列出两个变量的频数表,成为列联表.3.一般地,假设有两个分类变量X和Y,它们的值域分别是{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表K2=(其中n=a+b+c+d为样本容量),则利用独立性检验判断表来判断“x与y的关系”.注意:常将k=叫做K2的观测值.这种利用随机变量K2(或说用K2的观测值k)来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.经过对统计量分布的研究,已经得到了两个临界值:3.841与6.635.当根据具体的数据算出的观测值k>3.841时,有95%的把握说事件A与B有关;当k>6.635时,有99%的把握说事件A与B有关;当k≤3.841时,认为事件A与B是无关的.基础自测1.用独立性检验来考察两个变量x与y是否有关系,当统计量K2的值()A.越大,“x与y是有关系的”成立可能性越小B.越大,“x与y是有关系的”成立可能性越大C.越小,“x与y是没有关系的”成立可能性越小D.与“x与y有关系”成立的可能性无关B2.已知随机事件A与B,经计算得到K2的范围是3.841<K2<6.635,则(下表是K2的临界值表,供参考)()A.有95%把握说事件A与B有关B.有95%把握说事件A与B无关C.有99%把握说事件A与B有关D.有99%把握说事件A与B无关A3.样本相关系数r的取值范围是___________.[-1,1]4.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=a+bxi+ei(i=1,2,…,n),若ei=0恒成立,r为相关系数,则r2=____________.1为了对2010年佛山市中考成绩进行分析,从60分以上的全体同学中随机抽出8位,他们的数学(已折算为百分制)、物理、化学分数对应如下表:(1)若规定85分(包括85分)以上为优秀,求这8位同学中数学和物理分数均为优秀的频率;(2)用变量y与x、z与x的相关系数说明物理与数学、化学与数学的相关程度;(3)求y与x、z与x的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.参考数据:解析:(1)由表中可以看出,所选出的8位同学中,数学和物理分数均为优秀的人数是3人,其频率是.(2)变量y与x、z与x的相关系数分别是
r=≈0.99,r′=≈0.99.可以看出,物理与数学、化学与数学的成绩都是高度正相关.(3)设y与x、z与x的线性回归方程分别是根据所给的数据,可以计算出
b=≈0.65,a=85-0.65×77.5=34.63,
b′=≈0.72,a′=81-0.72×77.5=25.20.所以y与x和z与x的回归方程分别是
=0.72x+25.20.又y与x、z与x的相关指数是
R2=1-≈0.98、R′2=1-≈0.83.故回归模型
=0.65x+34.63比回归模型
=0.72x+25.20的拟合效果好.变式探究1.某校医务室抽查了10名学生在高一和高二时的体重(单位:kg)如下表:(1)利用相关系数r判断y与x是否具有相关关系?(2)若y与x具有相关关系,试估计高一体重为78kg的学生在高二时的体重.解析:(1)=71,=72.3,
=51467,10·=51333,=110,∵r>0.75,y与x具有很强的相关性.
(2)b=≈1.218,
a=72.3-1.218×71≈-14.178,∴回归直线方程为:=1.218x-14.178,当x=78时,y=1.218×78-14.178≈81.即估计高一体重为78kg的学生在高二时的体重约为81kg.(2010年广州二模)某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表所示:若单科成绩85分以上(含85分),则该科成绩为优秀.(1)根据上表完成下面的2×2列联表(单位:人):(2)根据题(1)中表格的数据计算,有多大的把握,认为学生的数学成绩与物理成绩之间有关系?(3)若从这20个人中抽出1人来了解有关情况,求抽到的学生数学成绩与物理成绩至少有一门不优秀的概率.参考数据:①假设有两个分类变量X和Y,它们的值域分别为和,其样本频数列联表(称为2×2列联表)为:则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表:解析:(1)2×2列联表为(单位:人):(2)提出假设H0:学生数学成绩与物理成绩之间没有关系.根据列联表可以求得K2=≈8.802>7.879.当H0成立时,P(K2>7.879)=0.005.
所以我们有99.5%的把握认为:学生的数学成绩与物理成绩之间有关系.(3)由(1)可知数学成绩与物理成绩都优秀的学生的人数为5人,则数学成绩与物理成绩至少有一门不优秀的学生人数为15人.故从20名学生中抽出1名,抽到的学生数学成绩与物理成绩至少有一门不优秀的概率为变式探究2.某校高二(1)、(2)班共100名同学,在分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生15人)选择了历史.你能否有99%的把握说选科与性别有关?解析:(1)列出2×2列联表:
(2)提出假设
H0:选科与性别没有关系.(3)根据列联表中的数据计算K2的值
K2=≈21.24.(4)作出判断因为当H0成立时,K2≥6.635的概率约为0.01,所以我们有99%的把握说:选科与性别有关.3.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.解析:由公式K2=2≈1.78,因为1.78<3.841,所以我们没有理由说“心脏搭桥手术”与“又发作过心脏病”有关,可以认为病人又发作与否与其做过任何手术无关.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系.解析:(1)2×2列联表如下:(2)假设“休闲方式与性别无关”,计算K2=≈6.201.因为K2>5.024.所以,有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”.变式探究4.在一次恶劣气候的航海过程中,调查了89位男女乘客的晕船的情况,男乘客晕船的有8人,不晕船的26人;女乘客晕船的有24人,不晕船的31人;请你根据所给数据判断是否在恶劣气候下航行,女人比男人更容易晕船?解析:(1)列联表(2)假设:“晕船与性别无关”,由公式得K2≈3.689,因为K2>2.706,所以我们有90%的把握说晕船与性别有关(女人更容易晕船).1.虽然两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好.为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型.2.独立性检验的必要性:为什么不能只凭列联表和图形下结论?原因是列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此需要用列联表检验这个方法来确认所得结论在多大程度上适用于总体.3.独立性检验的思想来自于统计上的假设检验思想,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中建八局第一建设有限公司2026届春季校园招聘考试备考题库及答案解析
- 癫痫护理查房:护理效果评价
- 2026年安徽省合燃长城天然气有限公司校园招聘笔试模拟试题及答案解析
- 2026浙江湖州市公路水运工程监理咨询有限公司招聘18人笔试参考题库及答案解析
- 2026辽宁抚顺矿业集团有限责任公司招聘69人考试备考题库及答案解析
- 2026云南西双版纳景洪市妇幼保健院招聘工作人员3人考试模拟试题及答案解析
- 2026江西宜春铜鼓县社区工作者招聘5人笔试备考题库及答案解析
- 2026中山大学孙逸仙纪念医院消毒供应中心助理技师岗位招聘1人笔试参考题库及答案解析
- 中国石油2026年春季高校毕业生招聘考试备考题库及答案解析
- 2026春季中国石油哈尔滨石化分公司高校毕业生招聘5人笔试模拟试题及答案解析
- 《农业推广学》第05章 农业推广沟通
- 妊娠期高血压疾病诊治指南2020完整版
- 《园艺植物栽培学》课程教学大纲
- 精选测试技术部分课后习题参考答案
- 监理员安全责任书
- 高速公路改扩建经验交流会总结报告
- 2018年-2022年山东历史高考真题五年合集
- GB/T 35125-2017天文望远镜试验方法
- GB/T 24211-2009蒽油
- GB/T 10045-2018非合金钢及细晶粒钢药芯焊丝
- GA/T 832-2014道路交通安全违法行为图像取证技术规范
评论
0/150
提交评论