社会统计学习题和问题详解相关与回归分析报告_第1页
社会统计学习题和问题详解相关与回归分析报告_第2页
社会统计学习题和问题详解相关与回归分析报告_第3页
社会统计学习题和问题详解相关与回归分析报告_第4页
社会统计学习题和问题详解相关与回归分析报告_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关与回归分析第一节变量之间的相关关系相关程度与方向?因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)?削减误差比例(PRE)?入系数与t系数第三节定序变量的相关分析同序对、异序对和同分对?Gamma系数?肯德尔等级相关系数(ta系数、Tb与Tc系数)?萨默斯系数(d系数)?斯皮尔曼等级相关(p相关)?肯德尔和谐系数第四节定距变量的相关分析相关表和相关图?积差系数的导出和计算?积差系数的性质第五节回归分析线性回归?积差系数的PRE性质?相关指数R第六节曲线相关与回归可线性化的非线性函数?实例分析(二次曲线指数曲线)一、填空1?对于表现为因果关系的相关关系来说,自变量一般都是确定性

2、变量,依变量则一般是(随机性)变量。2?变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差Ei,减去知道Y与X有关系时预测Y的联系误差巳,再将其化为比例来度量,这就是(削减误差比例)c3?依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值Yc是服从();(2)分布中围绕每个可能的Yc值的()是相同的。4?在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。5?根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变

3、化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这种分析方法,通常又称为(回归分析)。6?积差系数是(协方差)与X和Y的标准差的乘积之比。二、单项选择1.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在(A)关系。A直线正相关B直线负相关C曲线正相关D曲线负相关2?评价直线相关关系的密切程度,当r在0.5?0.8之间时,表示(C)。A无相关B低度相关C中等相关D高度相关3?相关分析和回归分析相辅相成,又各有特点,下面正确的描述有(D)。A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的

4、;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。4.关于相关系数,下面不正确的描述是(B)。A当0兰r<1时,表示两变量不完全相关B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。5. 欲以图形显示两变量X和Y的关系,最好创建(D)。A直方图B圆形图C柱形图D散点图6. 两变量X和Y的相关系数为0.8,则其回归直线的判定系数为(C)。A0.50B0.80C0.647.型后,我们可以(A估计未来所需样本的容量B计算相关系数和判定系数C以给定的因变量的值估计自变量的值D以给定的自变量的

5、值估计因变量的值&两变量的线性相关系数为0,表明两变量之间(A完全相关B无关系C不完全相关9.身高和体重之间的关系是(C)。A函数关系B无关系C共变关系D0.90在完成了构造与评价一个回归模D)。D)。D不存在线性相关D严格的依存关系10.在相关分析中,对两个变量的要求是(A)。A都是随机变量B都不是随机变量C其中一个是随机变量,一个是常数D都是常数11.A都是随机变量在回归分析中,两个变量(D)。B都不是随机变量C自变量是随机变量D因变量是随机变量12.一元线性回归模型和多元线性回归模型的区别在于只有一个(A因变量B自变量C相关系数B)。D判定系数13. 以下指标恒为正的是(DA相关

6、系数rB截距a14.)°C斜率bD复相关系数下列关系中,属于正相关关系得是(A)。A身高与体重C正常商品的价格和需求量B产品与单位成本D商品的零售额和流通费率三、多项选择1.关于积差系数,下面正确的说法是( 差系数是线性相关系数A 积 ABCD )。B 积差系数具有PRE 性质C 在积差系数的计算公式中,变量D 在积差系数的计算公式中,变量X和Y是对等关系X和Y都是随机的2.法是(A 皮尔逊相关系数是线性相关系数关于皮尔逊相关系数,下面正确的说)。B 积差系数能够解释两变量间的因果关系C r 公式中的两个变量都是随机的D r 的取值在1 和 0之间E皮尔逊相关系数具有 PRE性质,但

7、这要通过r2加以反映3?简单线性回归分析的特点是(ABE )。A 两个变量之间不是对等关系B 回归系数有正负号C 两个变量都是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程4. 反映某一线性回归方程A 相关系数C b 的大小y=a+bx 好坏的指标有(ABD )。B 判定系数D 估计标准误E a 的大小5?模拟回归方程进行分析适用于(ACDE )。A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间存在线性相关D 变量之间存在曲线相关E 时间序列变量和时间之间6. 判定系数r2=80% 和含义如下(ABC )。A 自变量和因变量之间的相关关

8、系的密切程度B 因变量 y 的总变化中有80% 可以由回归直线来解释和说明C 总偏差中有80% 可以由回归偏差来解释D 相关系数一定为0.64E 判定系数和相关系数无关7 ?回归分析和相关分析的关系是(ABE )。A 回归分析可用于估计和预测B 相关分析是研究变量之间的相互依存关系的密切程度C 回归分析中自变量和因变量可以互相推导并进行预测D 相关分析需区分自变量和因变量E 相关分析是回归分析的基础&以下指标恒为正的是(BC )。A 相关系数B 判定系数C 复相关系数D 偏相关系数E 回归方程的斜率9.一元线性回归分析中的回归系数b可以表示为(BC)A两个变量之间相关关系的密切程度B两

9、个变量之间相关关系的方向C当自变量增减一个单位时,因变量平均增减的量D当因变量增减一个单位时,自变量平均增减的量E回归模型的拟合优度io.关于回归系数b,下面正确的说法是()。Ab也可以反映X和Y之间的关系强度。;B回归系数不解释两变量间的因果关系;Cb公式中的两个变量都是随机的;Db的取值在1和-1之间;Eb也有正负之分。四、名词解释1 ?消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E。,减去知道Y与X有关系时预测Y的误差Ei,再将其化为比例来度量。将削减误差比例记为PRE。2 .确定性关系当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。3.

10、非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。4 ?因果关系变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。5?单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多兀相关。6 ?正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加

11、;负相关是指一个变量的值增加时,另一变量的值却减少。7 .散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。8 .皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。9 .同序对在观察X序列时,如果看到XiXj,在Y中看到的是YiYj,则称这一配对是同序对。10 .异序对在观察X序列时,如果看到XiXj,在Y中看到的是Yi>Yj,则称这一配对是异序对。11 .同分对如果在X序列中,我们观察到Xi二Xj(此时Y序列中无Yi二丫j),则这个配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们

12、观察到Yi二Yj(此时X序列中无Xi二Xj),则这个配对仅是Y方向而非X方向的同分对;我们观察到Xj二Xj,也观察到Yj二Yj,则称这个配对为X与Y同分对。五、判断题1 ?由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。(V)2.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关。(V)3?不管相关关系表现形式如何,当r=0时,变量X和变量丫都是完全不相关。(x)4?通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着丫的相对频数条件分布相同,且和它的相对频

13、数边际分布相同。(X)5?如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。(V)6.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。(X)六、计算题1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:转化为相对频数的联合分布列联表转化为相对频数的条件分布列联表;指出对于民族音乐的态度与被调查者的年岁有无关系,弁说明理由。对于民族音乐的态度(Y)年岁(X)老中青喜欢/、喜欢3838301533462.已知十名学生

14、身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。身高(cm)171167177154169体重(kg)5356644955身高(cm)175163152172162体重(kg)66524758503.100人的生育情况如下表,平均生育数的相关系数r假定有不同文化程度的 求文化程度与35? 45岁育龄妇女【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X序号-三四五育龄妇女人数2020202020文化程度(年)平均生育数04.7463

15、.3193.08122.41161.94【Y=-0.957X+14.867 r=0.98 4.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5?以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数Tc。f、文化程度婚姻美满大学中学小学美满916583018不美满347【Tc=0.18J6.以下为两位评判员对10名

16、参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010【斯皮尔曼相关系数:0.95】7?某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。Y=-11.48+0.27X【正相关】【相关系数r=0.95X24681012Y14109754&两变量X、Y之间的关系如下表(1)求回归方程;(2)求相关系数。9 ?试就下表所示资料,计算关于身高和

17、体重的皮尔逊相关系数。N0身高(厘米)体重(千克)1016016116516516717017217417618051565966637069738065r=0.7710.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。选手名ABCDEFGHIJ演唱水平(X)123 4 5 6 7 8 9 10综合素质(Y)31527410869【肯德尔系数:0.56,斯皮尔曼系数:0.76】11 ?青年歌手大奖赛,假设五位评委对10名决赛选手的

18、演唱水平进行排序,他们的有关评价结果列于下表,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。1()名决赛选手五位评委ABCDEFGHIJA12345791068B3214589710642153108679E52193846107试求:(1)拟合指数回归方程0.7612.某地区失业率与通货膨胀率之间的资料如下表所示,Yc=abx;(2)失业率与通货膨胀率之间的相关系数。失业率()1.01.62.02.53.13.64.04.55.15.66.06.5通胀率()1.61.51.11.30.60.90.80.80.70.60.60.6【相关系0.76【y=(1

19、.717e)1803x数】13.试就下表所示资料,求算员工工作满足感高与归属感之Gamm系数,弁解释Gamma系数具有削减误差比例PRE性质。工作满足感与归属感归属感(Y)工作满足感(X)Fy低(1)中(2)高(3)低(1)84315中(2)65112高(3)44513Fx1813940【G=0.09214.为62。求:已知相关系数r=0.6,估计标准误差=8,样本容量1)剩余变差值;2)剩余变差占总变差的百分比;3)求总变差值。22215.在相关和回归分析中,已知下列资料:Sx=16,&二25,SXY=19,a=30。要求:1)计算相关系数r,说明相关程度;2)求出直线回归方程。Sx

20、 = 5 , SY = 10, n = 20, r = 0.9,16 .在相关和回归分析中,已知下列有关资料一2'(Y-丫)=2000。试计算:1)回归系数b;2)回归变差和剩余变差;3)估计标准误差0。17 .根据下述假设资料求回归方程。收入(X)20303340151326382543支出(Y)798115481091023.023.424.125.226.118.某10户家庭样本具有下列收入(元)和食品支出(元26.927.3倜)数据:要求:1)写出最小平方法计算的回归直线方程;2)在95.46%巴握下,当X=45时,写出Y的预测区间。19 .根据下述假设资料,试用积差法求相关系

21、数。输出X(亿元)12106168910输出Y(亿元)1286111081120 .对40个企业的横截面样本数据进行一元回归分析,因变量与其平均数的离差平方和为6000,而回归直线拟合的剩余变差为2000,求:1)变量间的相关指数R;2)该方程的估计标准误差。七、问答题1 ?简述积差系数的特性。2 .简述回归分析和相关分析之间的密切联系。部分计算参考:(见计算题六)2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。编号身高(cm)体重(kg)11715321675

22、63177644154495169556175667163528152479172581016250皮尔逊相关系数与回归方程Sfflj七身体重高(cm)(kg)y匚xyx1171532924128099063216756278893136935231776431329409611328415449237162401754651695528561302592956175663062543561155071635226569270484768152472310422097144917258295843364997610162502624425008100合计16625502768623060091

23、830r-n'xy、xly=0.89x2-Cx)2n'y2-cy)nWxy-»xZyb220.659n'x-Cx)'y'xa=b54.479nny=a+bx=-54.479+0.659x斯皮尔曼相关系数编号身高(cm)次序体重(kg)次序d应11714536-24216765642431771642-114154949900516955550061752661117163752700815210471000917235830010162850800合计104.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求

24、环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。6、d2=0.94n(n2-1)斯皮尔曼等级相关系数环境名次397512810211416合计5-249006117-24120080011-1111110113112-11424体质名次d18环境名次397512810211416体质名次5967128111103246瓦d2rs 1- n(n2-1)0.94ABCDEFGHIJKL环境名次(X)397512810211416体质名次(y)596712811110324肯德尔等相关系1) A :同序对AC AB AD AE AF AG AH Al AK2) B:同序对BC BD

25、BG BH BI BJ BK BL BE BF3) C:同序对4) D :同序对CE CF CG CH CI CJ CK CLDE DF DG DH DI DJ DK5) E:同序对6) F:同序对7) G:同序对8) H : 同序对9) I:同序对10) J :同序对11) K:同序对EG EH EI EJ EK EL EFFG FH FI FJ FK FLGH GJ GK GLHI HJ HK HLIJ IK ILJK JLKL9异序对 AJ AL2108异序对CD17异序对 DL1764 异序对GI 14321合计:同序对ns=61异序对nd=5ns nd抽一 1)=0.83Gamma系

26、数和肯德尔相关C。化程度婚姻美满大学中学小学美满916583018不美满3475.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度系数Tns=9X( 30+18+4+7 ) +16X( 18+7) +8X (4+7)+30 X 7=1229nd=5X (30+8+3+4)+18 X (3+4)+16 X (8+3)+30 X 3=617n s nd=0.18l(m-1)/m6?以下试两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。赛 ABCDEFGHIJm1- 参7 / 一一 人rso O 1-1o 2-1-1d 22n 、 /1 6

27、 n59 O参赛人ABCDEFGHIJ评判员112435867910评判员2123456789107.某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;【正相关】(3)求估计标准误差;(4)用积差法求相关系数。XY犬Axy6554225253257375329495119113828116911838813.57744182.251188767577649532534.5280920.25238.5961592162251440676.7448944.89448.982106724100820857761192.7722561818121985.399357621.40.95r:n'x2-Cx)2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论