版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《成对数据的统计分析》1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为通过散点图和经验选择经验回归方程的类型,然后通过一定的规则确定出相应的经验回归方程,通过一定的方法进行检验,最后应用于实际或对响应变量进行预测.2.主要培养数学建模和数据分析的素养.
某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这例
1(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01);
附:样本相关系数(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.采用比例分配的分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
反思感悟解决回归分析问题的一般步骤跟踪训练1
下面给出了根据某市2017年~2023年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和经验回归方程的残差图(2017年~2023年的年份代码x分别为1~7).(1)根据散点图分析y与x之间的相关关系;根据散点图可知,点均匀分布在一条直线附近,且随着x的增大,y增大,故y与x成线性相关,且为正相关.(3)根据经验回归方程的残差图,分析经验回归方程的拟合效果.由残差图可以看出,残差对应点分布在水平带状区域内,且宽度较窄,说明拟合效果较好,经验回归方程的预测精度较高.变量相关性的判断的方法:(1)散点图法;(2)公式法:样本相关系数的取值范围为:当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.求经验回归方程的一般步骤:(1)画出散点图;(2)计算(3)计算(4)写出经验回归方程:(5)依据求得的经验回归方程解决问题.独立性检验的一般步骤(1)根据样本数据制成2X2列联表;(2)零假设为:(3)根据公式计算;(4)比较与临界值的大小关系,做统计推断.(1)样本相关系数的计算和求解经验回归方程(2)非线性回归模型的转化(3)独立性检验与其他知识的结合题型归纳1.某电器企业统计了近10年的年利润额y(千万元)与投入的年广告费用x(十万元)的相关数据,散点图如图,对数据作出如下处理:令,,得到相关数据如表所示:(1)从①;②;③三个函数中选择一个作为年广告费用x和年利润额y的回归类型,判断哪个类型符合,不必说明理由;(2)根据(1)中选择的回归类型,求出y与x的经验回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元)参考数据:非线性回归模型线性回归模型2.某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:(1)填写列联表,能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲,乙两车间产品的优级品率存在差异?优级品非优级品甲车间乙车间(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?3.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)小结1.经验回归方程的一般步骤;2.非线性回归模型的转化方法;3.独立性检验的一般步骤.(2022·新高考Ⅰ卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?不够良好良好病例组4060对照组1090作业(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论