数据统计与分析课后答案.doc_第1页
数据统计与分析课后答案.doc_第2页
数据统计与分析课后答案.doc_第3页
数据统计与分析课后答案.doc_第4页
数据统计与分析课后答案.doc_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

附录2:数据统计与分析SPSS应用教程习题答案 本“习题答案”也适用于统计分析应用教程SPSS,LISREL & SAS实例精选书中的习题。 习题1答案1(1)答:有错误, 犯了水平互相嵌套的错误; 如“每周去 2次或 2次以上”把第1组的编码嵌套进去了。又比如:“每周去 3次或 3次以上”又把第2组的编码嵌套进去了。 (2)答:正确的编码方案如下: 1=每周去1次 2=每周去2次 3=每周去3次 4=每周去4次或4次以上 2答:该编码问题严重。 (1)80岁不能是缺失值, 缺失值可用00岁。 (2)职业不编码不行, 而必须编码为:1=工人 2=农民 等等。 (3)职业变量用全称(Occupation)超出8个字符。 (4)而且栏目位置占1列即可。 (5)颜色的第1个字母作为变量值会引起重复,应该用单词的前3-4个字符。 (6)Color 变量的栏目位置10被嵌套在“4-14”之内,这是严重的错误。 更正后的编码方案见图1-19:VariableCode栏目位置Age00岁是Missing Value1-2Occupation职业应编码为:1=工人 2=农民3=教师 4=干部5=医生 6=其它职业变量要缩写,如Occu,然后用变量标签注解Occu为“职业”3Color颜色用前三个字母作为变量值,比如: blu=蓝色(blue)bla=黑色(black)4图1-19 纠错后的编码方案3(1) 答:错。错在变量名超过8个字符。 (2) 答:错。错在变量名的首字符是数字领头。 (3) 答:错。错在变量名中间冒出一个空格。 (4) 答:对,#号可以作为变量名。但不提倡。习题2答案1答:合并后的大目标数据文件“BIGab.sav” 中仍然有30个Cases、但每个Cases各有(50+30)=80个变量,即v1、v2、v3、v4v50、x1、x2、x3、x4x30。2答:合并后的大目标数据文件“BIGab2.sav”中仍然是50个变量,即v1、v2、v3、v4v50。但是Cases数目增加为(20+30)=50个Cases。3答:请读者照着书中的方法去使用对话框。排序的命令如下:SORT CASES BY xh (D)sex. LIST xh sex score。4答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:GET File=9293.sav.SELECT IF (location=2 AND sex=2). SORT Cases BY xh (D) sex.LIST xh sex score.5答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:SAMPLE 0.20.LIST xh.6答:对话框的解法请按照书中介绍的去举一反三。命令解法如下: N 50. LIST xh.7答:对话框的解法请按照书中介绍的去举一反三。命令解法如下: WEIGHT BY location.8答案略。9答案略。 习题3答案1(1) 答:DATA LIST 命令本身应有终止符“.”。 (2) 答:在DATA LIST 命令中,File所调用的数据文件名必须用一对左撇号括住。 正确的写法是:DATA LIST File=Myf1.Dat/v1 1-2 v2 3. (3) 答:栏目位置不够变量数目整除。 正确的写法是:DATA LIST/v1 To v12 10-33. (4) 答:数值标签要用一对左撇号括住,而且要加上命令的终止符“.”。 正确的写法是: VALUE LABEL Vf 1 工人 2 农民 3 教师 4 医生. (5) 答:命令后面应有终止符“.”。 正确的写法是: VALUE LABEL Vf 1 工人 2 农民 3 教师 4 医生 5 干部. (6) 答:定义缺失值时只能根据变量的栏目位置赋予一个唯一的值。 正确的写法是:MISSING VALUE v1 To v100 (-1). 或是:MISSING VALUE v1 To v100 (0). (7) 答:变量标签是唯一的;一个变量应该对应唯一的一个标签。 正确的写法是: VARIABLE LABEL Score1 第一次考试的成绩 /Score2 第二次考试的成绩/Score3 第三次考试的成绩2(1)答:此文件的前5个cases见表1-4。表1-4 文件的前5个casesCASESIdageHeight101231.65202221.70306211.75408211.76512211.68(2)答:学号为01的学生有最多的Score1(高考得分)。 (3)答:学号为12的学生家住农村。 (4)答:在Vm变量中,有4个Cases 的数据有效。 3答:至少有8处错误。 (1)A应改为(A) (2)Haircolor超过8个字符,应改为Haircolr (3)Weigh应改为WEIGHT (4)VALUE LABEL中的 Eyecolr应改为 Eyecolor (5)VALUE LABEL中的 Haircolor应改为8个字符以内,如Haircolr (6)MISSING VALUE 中的age(-1)应去掉,因为Data List 中尚未定义age。(7)正确的MISSING VALUE语句应改为:MISSING VALUE Height Weight(000). (8)List Variable语句应改为:List Variable=Height To Eyecolor.4答:“05 F Ll”中的Ll为字母(型),犯了类型不匹配的错误。 正确的写法是:05 F 005答:总体(population)是样本测量值的集合。对于感兴趣的整个组中,每个成员都对应一个这样的值。具体说来是某省的人口(总体)或工业产值(总体)中的某个指标测量值的集合,而不是那些人或物的集合。样本(sample)虽然也是一些值的集合,但不代表整个感兴趣的组。比如,一个样本可以是某省中某县的人口的集合或某县工业产值的集合。6答:由于总体与样本的不同,由此派生出参数与统计量的差别。(1)参数:参数(parameters)是总体的测量值,用希腊字母表示。(2)统计量:统计量(statistics)则是样本的测量值,用一般的英文字母表示(见本章内容)。7答:(1)均值:用以描述数据(值)分布的中心位置。定距以上的数据计算均值才有意义。比如,对于一个总体(某省)的人口,其平均值被称为总体均值(populationg mean),记为。对于某样本(某县)的人口,其平均人口则被称为样本均值(sample average)。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外,还有方差、标准偏差等概念。(2)标准偏差:也被称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差:标准偏差的平方则是方差。方差表示数据内部的变异性。8答:统计学上,一般都是假设被统计的样本是来自正态分布(Normal distribution)的总体。正态分布是关于总体的一种理论分布,是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征如下:(1)均值:均值是观察值的平均值(Mean value)。区间(Interval)型以上变量值的均值才有意义。 (2)众数:众数是最经常发生的频次。众数是对定类变量(Nominal)而言的。比如某班有男生25名、女生15名,那么,该班男生的人数是众数。(3)中位数:中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。中位数的取值方法有两种:单数情况下的观察值的中位数;双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠:将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。9.有哪些经验规则?答:如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。经验规则如下: 68%的观察值是落在离均值一个标准偏差(1)的范围内。 95%的观察值是落在离均值两个标准偏差(2)的范围内。 99%的观察值是落在离均值三个标准偏差(3)的范围内。习题4答案下面是RECODE习题。1答:命令格式如下:RECODE v1,v2 (原值1=新值1)(原值2=新值2). (原值m=新值m)例如:RECODE age (0 thru 30=1)(30 thru 60=2)(60 thru 90=3)(90 thru hi=4). 2答:命令中允许使用的关键词如下: LO(或LOWEST)、HI(或HIGHEST)、THRU、 MISSING、ELSE、SYSMIS3.(1)答:语法正确,但结果不太理想。因为结果只剩下0和2 两组。 (2)答:语法正确,但结果不太理想。原因同上。 4.答:用“/”分隔。例如:RECODE Gage (1,2=1)(3,4=2)/sex(1=1)(2=0). 5.答:对。因为将变量A由原来的4组合并为两组。 6.(1)答:对。这是端点连接法。 (2)答:对。符合语法规则,但是会漏掉各组的端点值。 (3)答:对。符合语法规则。但结果只剩下100卡以内的一组数据。7.RECODE age(MISSING=00).MISSING VALUE age(-1). (进一步将系统缺失值“-1”改为用户缺失值) 8.答:RECODE INCOME (LO THRU 5000=1)(5000 THRU HI=2).9.答:RECODE sex(F=B)(M=A). 10.答:有以下4个变换命令。RECODE sex (1=1)(2=0).COMPUTE Gage=age.COUNT FM=F(1)M(2).IF(sex=2 AND location=2) GROUP=2.下面是Compute习题11.答:COMPUTE score=S1/S2*100.COMPUTE X=ABS(-7.8).12.答:见第4章。13.(1)答:Y1=7.8 (2)答:Y2=-16 (3)答:Y3=25 (4)答:Y4=-1 (5)答:A=10 (6)答:B=0.79 (7)答:C=2.2 (8)答:D=2 (9)答:E=2.72 (10)答:F=0下面是COUNT习题 14.(1) 答:真 (2) 答:真(3) 答:假15.(1) 答:真 (2) 答:真习题5答案下面是FREQUENCIES 习题答案。 1(1) 答:众数(2) 答:众数(3) 答:均值(4) 答:均值 (5) 答:众数 (6) 答:均值(7) 答:均值 2(1) 答:真 (2) 答:真 (3) 答:假 (4) 答:假 (5) 答:真 3. 答:已填补的频次见图5-24中打#标记的数据。图5-24 择偶标准的频率表 4. (1)答:画出的book变量的频率表见图5-25。 图5-25 book变量的频率表 (2)答:用直方图为宜。因为直方图可画出空缺的位置,便于一目了然地看出缺的是何种数据。 (3)答:直方图与条形图的主要区别见表5-1。表5-1 直方图与条形图的主要区别 直方图条形图 适用于区间 (定距)以上的数据,如:收入、年龄、工资、体重等。适用于标称 (定类)型以上的数据。如:性别、肤色、种族、国别等。 以图形的面积为频次以图形的条形为频次 变量的某种水平空缺时仍留空位置变量的某种水平空缺时,不留空位下面是Descriptive习题答案。5.(1)答:Compute pct=income1/income2*100. (2)答:COMPUTE sqrt1=SQRT(x*2).或 COMPUTE sqrt1=SQRT(x*x).(3)答:计算变量s的命令为:COMPUTE s=SQRT(a*a+b*b)*4. (4)答:COMPUTE max1=MAX(a,b,c). 6.(1)答:结果为13(2)答:结果为19 (3)答:结果为15 (4)答:结果为11 (5)答:结果为137.(1)答:结果为2 (2)答:结果为9 (3)答:结果为3 (4)答:结果为8 (5)答:结果为48.(1)答:其范围为:30岁以下的归入第1组,“30.5”岁以上的归入第2组。 (2)答:其范围为:20岁以下的归入第1组,“20.5”岁以上的归入第2组。 (3)答:其范围为:8-10岁的归入第1组,18-20岁的归入第2组,其余的忽略不计。 (4)答:其范围为:18岁以下的归入第1组,18岁-30岁的归入第2组,“30.5”岁45岁的归入第3组,“45.5”岁以上的归入第4组。 (5)答:其范围为:45岁以下的归入第1组,“45.5”岁以上的归入第2组。 (6)答:其范围为:40岁45岁的归入第1组,“45.5”岁以上的不分组。9.(1)答:无意义 (2)答:有意义 (3)答:排序后有意义10.(1)答:无意义 (2)答:有意义 (3)答:无意义11.(1)标称测量 (2)比例测量(3)次序测量(4)比例测量 (5)区间测量 (6)标称测量 12.答:中位数=(355+1)/2=178,即第178个个案为中位数。 13.(1)答:能。因为服从正态分布,其均值、中位数、众数均为0.09(2)答:能。因为服从正态分布,其均值、中位数、众数均为0.09(3)答:能。因为其方差等于标准偏差0.12的平方 (4)答:不能。因为服从正态分布,其峰态系数为0 14.答:需要。因为标准值的均值应是0。 15.答:其含义是女性占了80。 16.(1)答:假 (2)答:有可能,但不一定。 17.答:如果我是该公司的经理,我将用均值统计量描述高支付水平。因为该数据的离散性显著,只有采用均值统计量,才能描述高支付水平。 答:如果我是该公司的雇员,我将用中位数(或众数)描述低支付水平。因为该数据虽然离散性显著,但绝大多数人集中在低收入范畴,采用中位数(或众数)统计量,能描述实际低支付水平。 18.答:填补后的结果见表5-3。 表5-3 填补空缺值后的表格Mean 1.70Variance 0.1236Std Dev 1.06Maximum 4Minimum 0Mode 2Median 2Range 4 19.答:填补后的结果见表5-5。 表5-5 填补标准值Z后的表格StudentStudentStandard Score(Z)175 -0.52850.5380 020.解:Mean=60 Range=60 Minimum=30 Maximum=90 均不变。 只是N=99+1=100(人)。21.解答:略。习题6答案 1.答:有4名学生月伙食费漏答(0元,被当作极小值)。有19名学生月伙食费在500元以上,这些是极大值。 学生月伙食费100元的有5人,120元的有2人。其余照此分析。其中,&表示只列出部分的值。2.答:占半数学生的家中,兄弟姐妹有12人,中位数偏向均值之下。极大值1人,界外值1人。3.答:因为Sig值0.25值0.05,所以没有理由拒绝原假设。说明方差相同。方差相同时数据可以不转换。又因为斜率=-2.286,查表6-1知,该数据可以不转换。 4.答案见书。 习题7答案 1.答:该程序运行之后,输出见图7-20。 图7-20 Crosstabs表格(已填充)2.(1) 答:正确。因为不带选项是允许的。 (2) 答:错误。因为 WITH关键词在此是非法的,可改为: CROSSTABS happy BY marital BY sex. 3.答:没有单个的测量值 (即统计量)能概括所有可能的结合测量,如标称测量的统计量LAMBDA虽好,却也不能用于次序数据的测量中。余者类推。 4.(1)答:见正文的图7-21,如果性别与地区是互为独立的两个变量,则观察图7-21各单元中的第2行频次。例如(1,1)单元中的行百分比为50.0%,(2,1)单元中的行百分比为60.0%等。(2)答:这个交叉表的自由度为:DF=(行-1)*(列-1)=(2-1)*(2-1)=1(3)答:独立性卡方检验的卡方值为0.166,详见图7-22。 图7-22 皮尔逊独立性卡方检验5.(1)答:编码方案见表7-2(供参考):表7-2 编码方案变量名变量标签变量类型栏位数据(变量值)编码Id个案号数值型1-2Sex性别数值型31=男2=女Age年龄数值型4-8比例测量(Ratio Measure)Dq家庭住址数值型91=城市2=农村Height学生身高数值型10-12比例测量(Ratio Measure)Weight学生体重数值型13-16比例测量(Ratio Measure)score1高考得分数值型17-19比例测量(Ratio Measure)score2高考满分数值型20-22比例测量(Ratio Measure)Mz民族数值型231=汉族 2=回族 3=朝鲜族4=满族 5=苗族 6=藏族 (2)答:根据(1)的编码方案,可建立以下的程序7.5。程序7.5: DATA LIST/ID 1-2 sex 3 age 4-8 dq 9 height 10-12(1) weight 13-16(1)score1 17-19 score2 20-22 mz 23. VARIABLE LABEL id 个案号 /sex 性别 /age 年龄 /dq 家庭住址 /height 学生身高 /weight 学生体重/score1 高考得分 /score2 高考满分/mz 民族. VALUE LABEL sex 1 男 2 女 /dq 1 城市 2 农村 /mz 1 汉族 2 回族 3 朝鲜 4 满族 5 苗族 6 藏族. MISSING VALUE sex (9)age (00000) mz (0) WEIGHT(0000) height score1 score2(000).BEGIN DATA.01120.0011691200502640102121.5021711200497640103220.7511661100777900204119.2511761300770900205222.0011600980525640306119.5021731115527640107222.2511580905492600408220.2511601035494600509123.0021751355608720110119.75117012802654006END DATA.SAVE OUTFile=Score.sav. 6.答: COMPUTE score=score1/score2*100.7.答:以下是所要求的命令。程序7.6:COMPUTE gscore=score. RECODE gscore(LO THRU 70=1)(70 THRU 75=2) (75 THRU 80=3)(80 THRU 85=4)(85 THRU HI=5). CROSSTABS age BY score/FORMAT=NOTABLE /STATISTICS=CHISQ CORR.CROSSTABS age BY gscore/CELL=ROW Column Total Count /STATISTICS=CHISQ LAMBDA.评价(略)。习题8答案下面是MEANS过程的习题答案。1.答:其命令为MEANS score BY vf BY location/MISSING=DEPENDENT. 2.(1)答:表达式有误。正确的写法是:IF (vf EQ 1 OR vf=2 OR vf=6) GROUP=1. (2)答:表达式有误。正确的写法是:IF (location=1 AND sex=1) GROUP=1. (3)答:表达式有误。正确的写法是:IF (age GE 20 AND age LE 23) GROUP=1. 3.(1)答:Means (2)答:Crosstabs (3)答:Frequences (4)答:Means (5)答:Crosstabs4.答:这个高考平均成绩的概括表如图8-24所示。 图8-24 按城乡考生分组,并进一步按父亲职业分组的高考平均成绩下面是T-Test习题答案。 5.(1)答:jobcat8的为第1组,jobcat8的为第2组。 (2)答:jobcat=1的为第1组,jobcat=3的为第2组。 (3)答:jobcat=1的为第1组,jobcat=2的为第2组。 6.(1)答:错误。错在缺少命令的终止符.。正确的写法是: T-TEST GROUP=sex/VARIABLES=score/PAIRS=income1 income2. (2)答:错误。错在子命令PAIRS与GROUPS的位置颠倒了。正确的写法是: T-TEST GROUP=sex/VARIABLES=score/PAIRS=income1 income2. (3)答:错误。子命令PAIRS后面少了一个变量INCOME2,正确的写法是: T-TEST PAIRS=income1 income2. (4)答:正确。 (5)答:错误。错在括号内多了一个值。正确的写法是: T-TEST GROUPS=jobcat(1,2)/var=Score. 或T-TEST GROUPS=jobcat(1,3)/var=Score. 或T-TEST GROUPS=jobcat(2,3)/var=Score. 7.(1)答:假 (2)答:假 (3)答:真 (4)答:假 (5)答:假 (6)答:假 8.(1)答:用单尾检验。(2)答:用双尾检验。 9.答:有可能相等。 10.(1)答:两个总体的均值差为0。 (2)答:两个总体的均值差为0。 11.(1)答:当两个总体的方差相等时采用“合并方差”T检验。 (2)答:当两个总体的方差不等时采用“分离方差”T检验。12.(1) 答案如下:检测治疗1 与治疗3 时的命令为T-TEST PAIRS=T1 T3.检测治疗1 与治疗3 时的输出见图8-25。 图8-25 治疗1与治疗3 平均体重减轻的检验 比较治疗1 与治疗3平均体重减轻程度,首先应看治疗1 与治疗3,如此配对检验是否有效。从图8-25可以看到CORR=0.396,但双尾检验概率2-tail Sig值0.257太大。 因此治疗1 与治疗3,如此配对检验勉强有效。(CORR值越大,配对越有效) 然后,观察样本。 治疗1平均体重减轻了1.28公斤,其标准偏差为0.194; 治疗3平均体重减轻了1.47公斤,其标准偏差为0.255。 从此样本看,治疗1与治疗3 平均体重减轻的程度是不同的,治疗3的组间变异性也比治疗1的突出,所以,治疗3比治疗1,平均体重减轻的幅度大。 再推论到总体。 H0:假设两个总体的均值相等 验证如下: t-value=-2.35 其自由度DF=9 ,计算后得到双尾检验概率2-tail Sig为0.044;又 0.044值0.05; 从总体看:可拒绝关于“两个总体的均值差为0”的零假设。(2)答:检测治疗2 与治疗3 时的命令: T-TEST PAIRS=T2 T3.检测治疗2 与治疗3时的图形见图8-26。 (a)配对样本的关系度 (b)样本检验的统计量 (c)总体推论 图8-26 治疗2与治疗3 平均体重减轻的检验 比较治疗2 与治疗3平均体重减轻程度,首先应看治疗2 与治疗3,如此配对检验是否有效。从图8-26可以看到CORR=0.814(它接近于1)且双尾检验概率2-tail Sig为0.004 值0.05; 从总体看:没有足够的理由拒绝关于“两个总体的均值差为0”的零假设。 13.答:(1)“创建一个新变量 T,它等于治疗1 与治疗3体重减轻之差”的命令为 COMPUTE T=T1-T3. (2)“用Frequencies 过程,计算变量T 的均值、标准偏差和标准误差”的命令为 FREQUENCIES T/STATISTICS=MEAN STDDEV SEMEAN. (3)新变量 T(它等于治疗1 与治疗3体重减轻之差)的Frequences输出结果见图8-27 。 图8-27 另一种方法产生的结果 14.答:由第13题的图8-27的结果,与第12题的图8-25的结果相比可以看到,均值之差都等于-0.187,均值的标准偏差都等于0.252,且标准误差也都等于0.08。所以结果完全相同。下面是ANOVA习题答案。 15.答:ANOVA dias BY race(1,4) chd(0,1). 16.(1)答:错。正确的写法为ANOVA score BY region(1,3) sex(1,2). (2)答:错。正确的写法为ANOVA score BY region(1,3) sex(1,2). (3)答:错。正确的写法为ANOVA score BY race(1,3) sex(1,2). (4)答:对。 (5)答:错。正确写法为ANOVA score1 BY race (1,3)/score2 BY sex(1,2).17.(1)答:有12个单元。 (2)答:有 9个单元。 (3)答:有 6个单元。 18.(1)答:假。 (2)答:假。19.答:填空的答案见图8-27后面打“*”的标记。 图8-27 双因素方差分析表20.答:结果见图8-28。图8-28 双因素方差分析表习题9答案 1.(1)答:真 (2)答:假 (3)答:假 (4)答:假 (5)答:真 (6)答:真 2.答:SPSS 9.0以后版本产生这种相关矩阵的命令是(2)。3.(1)答:正的好 (2)答:正的好 (3)答:负的好 (4)答:负的好 (5)答:负的好4.答:假。因为有可能出现曲线相关。5.答:这是零阶偏相关矩阵,和一般的相关矩阵一样不加控制变量。从图中看到,SEX与LIKE1二者的相关系数为-0.3115,呈现负相关。比如女生业余时间更趋向于读书学习,而男生业余时间更趋向于交友或文体活动。性别与恋爱与否之间也呈现负相关,女生已恋爱的人数比男生多。6.答:不加控制变量时,SEX与LIKE1二者的相关系数为-0.3115。控制V变量后SEX与LIKE1之间的一阶偏相关系数为为-0.2736。绝对值减少了约0.004,很小。说明学生恋爱与否(变量V)尚未影响SEX与LIKE1二者的相关系数。 习题10答案 1.(1)答:假。正确的命令为MULT RESPONSEGROUPS=$v1 多重应答分组总变量名(v1 TO v4 (1,3).(2)答:假。正确的命令如下: MULT RESPONSEGROUPS=$v 多重应答组群变量(A B C(1,2) VARIABLES=location(1,2)FREQUENCIES $v location.(3)答:假。正确的命令为MULT RESPONSEGROUPS=$v 多重应答组群变量(v1 TO v3 (1,2)VARIABLES=sex(M,F)(*注:非数字型) FREQUENCIES=$v sex.2答案略。3答:正文图10-12是“业余爱好的复选项频次统计表”,每一个人最多可以选择3次(项),所以Count一栏的频次为369人,而不是实际人数的“Valid Cases=181人”。但Frequences 过程产生的频率表是以Frequency作为频次标签(而不是以Count为标签),而且实际频次将是“Valid Cases=181人”。4答:正文图10-13是一种性别与业余爱好“复选项”的交叉汇总表。是基于复选频次的双变量的交叉汇总表。不像Crosstabs过程那样基于Cases分布的交叉汇总表。5.(1)答:以正文图10-13的男生为例:Row Total(1)=160364=44(%)(2)答:以正文图10-13的“交朋友”一栏为例:Column Total(4)=42364=11.5(%)(3)答:正文图10-13中,男生业余时间选择“看小说读报”的频次最多,占男生总复选频次的39.3%。女生业余时间选择“看小说读报”的频次也是最多,占女生总复选频次的60.7%。从总体看,“看小说读报”的复选频次最多,占总复选频次的41.2%。“听戏看电影”的复选频次次多,占总复选频次的23.4%。“唱歌跳舞”的复选频次最少,占总复选频次的11%。习题11答案 1.(1)答:与Wilcoxon Signed Ranks检验或Sign检验相似 (2)答:与Two Independent Sample 检验相似 (3)答:与Mann-Whitney检验相似。 (4)答:与Two Related Sample检验相似 2.(1)答:两组样本有相同的分布。即来自同一个总体。 (2)答:K个独立样本来自同一个总体 (3)答:一对样本没有差异。 (4)答:实际值与理论值相等。3.(1)答:H0:男生和女生期末成绩有相同的分布。如正文的图11-13(c)所示,男生和女生的“均秩”相似,而且逼近的Sig值0.572,大于值0.05。所以没有足够的理由拒绝H0,表明男生和女生期末成绩有相同的分布。(2)答:H0:男生和女生的期中成绩有相同的正态分布。从正文的图11-14看,男生和女生逼近的Sig值0.000,小于值0.05。所以有理由拒绝H0,表明男生和女生期中成绩不是正态分布。 (3)答:根据正文图11-15的结果,要检验甲乙两班期中考试的成绩有无差异,先假设如下(配对样本检验)。 H0:甲乙两班期中成绩没有差别。图11-15(c)中的男生和女生的逼近的Sig值0.000,小于值0.05。有理由拒绝H0。表明甲乙两班期中成绩有差别。习题12答案1.答:在回归模型的假设与检验中,它是F检验的有意义的基本假设。在回归系数为0的假设与检验中,它又是T检验的有意义的基本假设。2.答:因为当F的实际值F的理论值,或SIG 值0.05时,B1=B2=B3=Bk=0的假设便被拒绝。3.答:错。因为每次进入一个自变量时,R2应该增加,而不是减少。所以第3步的R2不应该是0.4310。4.答:下一个进入方程的变量是“入学成绩”变量。因为它的Partial Correlation(偏相关系数)最大,而Sig值最小,且 0.02值0.05。5答:下一次应淘汰“父亲的职业”变量,因为t=0.434(最小),且0.4340时,eBi将大于1,它意味着事件发生的Odd率增大了。 当Bii值0.05。 没有理由拒绝H0(零假设)。它说明变量进入方程后的最后一步,模型的系数为0;也说明模型不理想。 下面是Curve Regression习题的答案。8.答:从正文图13-13的Sig f值看,显著性水平是显著的,模型是合格的。但线性回归模型更便于解释。9.答:从正文图13-13看,三次曲线的R2=0.708虽然最大,但是与线性回归的R2=0.696相比,几乎相近。为了便于解释回归,应该采用线性回归。习题14答案1.答:其一是Descriptive过程中的Z分(标准分)。例:Descriptive age weight(Zage Zweight)/save.(存储年龄、体重变量的标准分)。其二是Cluster过程本身的Zscore功能。 2.答:0.02。3.答:单一连接法。远距离的紧邻连接法。4.答:第1步:第4、3个案合并为一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论