




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计案例章末复习提升课,线性回归分析问题展示(选修23 P101复习参考题A组T2)如果美国10家工业公司提供了以下数据:公司销售总额x1/百万美元利润x2/百万美元通用汽车126 9744 224福特96 9333 835埃克森86 6563 510IBM63 4383 758通用电气55 2643 939美孚50 9761 809菲利普莫利斯39 0692 946克莱斯勒36 156359杜邦35 2092 480德士古32 4162 413(1)作销售总额和利润的散点图,根据该图猜想它们之间的关系应是什么形式;(2)建立销售总额为解释变量,利润为预报变量的回归模型,并计算残差;(3)计算R2,你认为这个模型能较好地刻画销售总额和利润之间的关系吗?请说明理由【解】(1)将销售总额作为横轴x,利润作为纵轴y,根据表中数据绘制散点图如图由于散点图中的样本点基本上在一个带状区域内分布,猜想销售总额与利润之间呈线性相关关系(2)由最小二乘法的计算公式,得1 334.5,0.026,则线性回归方程为0.026x1 334.5.其残差值计算结果见下表:销售总额126 97496 93386 65663 43855 264利润4 2243 8353 5103 7583 939残差411.82419.75877.556774.1121 167.636销售总额50 97639 06936 15635 20932 416利润1 8092 9463592 4802 413残差850.876595.7061 915.556230.066235.684(3)对于(2)中所建立的线性回归方程,R20.457,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系经分析预测,美国通用汽车等10家大公司的销售总额xi(i1,2,10,单位:百万美元)与利润yi(i1,2,10,单位:百万美元)的近似线性关系为0.026x,经(2)若通用汽车公司的销售总额x1126 974(百万美元),残差387,估计通用汽车的利润;(3)福特公司的销售总额为96 933百万美元,利润为3 835,比较通用汽车与福特公司利润的解释变量对于预报变量变化的贡献率说明了什么?,(以上答案精确到个位)得样本中心点为(62 309,2 930),所以2 9300.02662 3091 310.(2)由(1)知0.026x1 310,当x1126 974时,10.026126 9741 3104 611,所以y1114 611(387)4 224,估计通用汽车的利润为4 224百万美元(3)由(1)(2)可得通用汽车利润的解释变量对于预报变量变化的贡献率为R,则R110.91191.1%.设福特公司利润的解释变量对于预报变量变化的贡献率为R,由0.026x1 310得20.02696 9331 3103 830,则R110.999 999.99%.由RR知,用0.026x1 310作为解释变量与预报变量的关系,预报通用汽车的效果没有预报福特公司的效果好,或者说预报通用汽车的精确度低于预报福特公司的精确度非线性回归分析问题展示(选修23 P86例2)一只红铃虫的产卵数y和温度x有关现收集了7组观测数据列于表中,试建立y关于x的回归方程温度x/21232527293235产卵数y/个711212466115325【解】根据收集的数据,作散点图:由散点图知,样本点分布在某条指数函数曲线周围,故该回归方程为yc1ec2x,两边取对数得ln yc2xln c1,作变换(c2,ln c1),得x,且变化后所得样本数据表为x21232527293235z1.9462.3983.0453.1784.1904.7455.784经计算得z关于x的线性回归方程为0.272x3.849,所以y关于x的回归方程为e0.272x3.849即e0.272x.拓展1“指数型”回归方程选择的等价性(1)选择指数函数yax(a0且a1)不科学,因为指数函数yax(a0且a1)恒过定点(0,1),且仅有一个估计值a,不能有效体现解释变量x与预报变量y之间的关系,即拟合效果很差(2)“平移型”指数函数与yc1ec2x的等价性回归方程为yaxb由yaxb得ln y(xb)ln a(ln a)xbln a,作变换(ln a,bln a),则有x.回归方程为yaxb,令axkex,tex,可得变换得yktb(k,b)(3)一般“指数型”函数与yc1ec2x的等价性回归方程为yk1ek2xb因为yk1ek2xbk1ek2xebk1ebek2x,ln yln(k1eb)k2xln k1bk2x,作变换(k2,ln k1b),则有x.拓展2从散点图看回归方程的设置(1)由本例从散点图可以看出,样本点集中在某二次函数(抛物线)的附近,因此可选择二次函数yax2b作为回归方程作变换即得yatb(其中a,b)(2)若选用yax2bxc模型,则具有不确定性;因为yax2bxca,虽然作变换可得出线性关系yat,但由于a、b、c未确定,从而变换t的t值不确定,从而不能列出样本点(ti,yi)数据表,即yat不能确定因此,我们根据散点图设置回归方程应特别注意:变换可列出(ti,zi)的数据表注重变换后的线性回归方程中的与与变换前参数的关系利用求出的线性回归方程替换变量后还原成原问题的回归方程最后根据需要进行回归分析独立性检验问题展示(选修23 P97练习)有甲乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表:班级与成绩列联表优秀不优秀总计甲班103545乙班73845总计177390请画出列联表的等高条形图,并通过图形判断成绩与班级是否有关系;根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为成绩与班级有关系?【解】列联表的等高条形图如图由图及表直观判断,好像“成绩优秀与班级有关系”假设成绩与班级没有关系,则有a10,b35,c7,d38,ab45,cd45,ac17,bd73,n90,代入K2公式,得K2的观测值k0.653.由于k0.6536.635,所以在犯错误的概率不超过0.01的前提下不能认为成绩与班级有关系甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表班级与成绩列联表优秀不优秀总计甲班ab45乙班cd45总计256590若K2的观测值为.(1)求a,b,c,d的值;(2)根据观测值表,能否在犯错误的概率不超过0.25的前提下认为成绩与班级无关【解】(1)由表知,c25a,b45a,d45c45(25a)20a,n90.由K2得,化简得(2a25)225,所以2a255或2a255,所以a15或a10,当a10时,优秀不优秀总计甲班103545乙班153045总计256590当a15时,优秀不优秀总计甲班153045乙班103545总计256590说明甲班与乙班编号不同而已,故当a10时,b35,c15,d30,或当a15时,b30,c10,d35.(2)因为K2的观测值k1.3851.323,而P(K21.323)0.25,所以在犯错误的概率不超过0.25的前提下可以认为成绩与班级无关数学教师STC对他所任教的高二两个班进行一次数学考试(满分100分),从两个班学生考试成绩中,都随机抽取了15名学生的数学成绩的茎叶图如下,(1)从茎叶图能否判断乙班的成绩好于甲班的成绩;(2)若记成绩在区间80,100)为优秀,小于80为不优秀,你有多少把握判断乙班的成绩比甲班的成绩优良【解】(1)甲班成绩集中在“茎7”,乙班的成绩集中在“茎8”,从茎叶图可判断乙班的成绩好于甲班的成绩(2)根据茎叶图列出22列联表优秀不优秀总计甲班51015乙班7815总计121830K2的观测值k0.5560.455,且k0.5560.708,又P(K20.455)0.50,P(K20.708)0.40,故仅有50%至60%的把握认为乙班的成绩比甲班的成绩优良1甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差的平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A甲B乙C丙 D丁解析:选D.相关系数r越接近于1和残差平方和m越小,两变量A、B的线性相关性越强,故选D.2某大学数学系学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的大学生是否爱好游泳运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2算得K2的观测值k7.8.附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A在犯错误的概率不超过0.1%的前提下,认为“爱好游泳运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好游泳运动与性别无关”C在犯错误的概率不超过1%的前提下认为“爱好游泳运动与性别有关”D在犯错误的概率不超过1%的前提下认为“爱好游泳运动与性别无关”解析:选C.因为K27.86.635,但7.810.828,故在犯错误的概率不超过1%的前提下认为“爱好游泳运动与性别有关”,故选C.3为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)根据收集到的数据可知x1x2x3x4x5150,由最小二乘法求得回归直线方程为0.67x54.9,则y1y2y3y4y5的值为_解析:由题意,得(x1x2x3x4x5)30,且回归直线0.67x54.9 恒过点(,),则0.673054.975,所以y1y2y3y4y55375.答案:3754在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:感染未感染总计服用104050未服用203050总计3070100附表:P(K2k0)0.100.050.025k02.7063.8415.024参照附表,在犯错误的概率不超过_(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关”解析:K2的观测值k4.7623.841,所以在犯错误的概率不超过5%的前提下,认为“小鼠是否被感染与服用疫苗有关”答案:5%5某中学对高二甲、乙两个同类班级进行了“加强语文阅读理解训练对提高数学应用题得分率的作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分及以下6170分7180分8190分91100分甲班(人数)36111812乙班(人数)48131510现规定平均成绩在80分以上(不含80分)的为优秀(1)试分别估计两个班级的优秀率;(2)由以上统计数据填写下面22列联表,并判断能否在犯错误概率不超过0.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 热力公司安全培训方案(3篇)
- 地方产业调整方案模板(3篇)
- 2025年网络编辑师考试网络编辑伦理与法规试卷
- 教育心理学在K12家长指导中的作用与实践
- 前交叉韧带重建手术质量评价规范编制说明
- 威海市招聘专职调解员笔试真题2024
- 2025年社区矫正对象电话个人谈话记录范文
- 2025年环境保护工程师职业资格考试题及答案
- 2025年公文写作与处理考核题库(含标准答案)
- 2025年公文比赛试题及答案
- 养生茶基础知识培训课件
- 2025年暑假反电信网络诈骗试题及答案
- 新学期教学工作会议上校长讲话:把功夫下在课堂里把心思放在学生上把质量落到细节中
- 电工教学空气开关课件
- 5Why原因分析方法培训
- 2025至2030中国电子产品散热器行业市场现状分析及竞争格局与投资发展报告
- 2025年中国真人CS行行业市场调研分析及投资前景预测报告
- YB/T 117-1997高炉用耐火材料抗渣性试验方法
- GB/T 4744-2013纺织品防水性能的检测和评价静水压法
- GB/T 41365-2022中药材种子(种苗)白术
- GB/T 31717-2015病媒生物综合管理技术规范环境治理蚊虫
评论
0/150
提交评论