社会统计学与SPSS应用.ppt_第1页
社会统计学与SPSS应用.ppt_第2页
社会统计学与SPSS应用.ppt_第3页
社会统计学与SPSS应用.ppt_第4页
社会统计学与SPSS应用.ppt_第5页
已阅读5页,还剩388页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主讲人:石 伟 Email:,社 会 统计学 R=Max-Min=2,B:4, 5, 7, 8, 9, 11, 12,Md 8; =8; R=Max-Min=8,C:1, 4, 7, 8, 9, 12, 15,Md 8; =8; R=Max-Min=14,这三组数据的均值、中位值都是8,但它们的整齐程度却不一样,一、离散趋势测量法(measures of dispersion) 是用一个值来代表数据之间的差异情况,这样的代表值就叫做离散值或离散趋势,对这样的值的求取就叫做离散趋势测量。 二、离散趋势与集中趋势的关系 集中值代表性的高低要受数据之间差异情形的影响。 要全面反映一个变量的数据特征,

2、必须同时考察集中趋势和离散趋势。,三、离中趋势的类型 异众比率 全距 四分位差 方差与标准差 四、异众比率 异众比率是非众值的频次之和在总数N中所占的比例。,五、全距或极差(range,简称R) 全距R最大变量值最小变量值,R越大,数据越分散;R越小,数据越集中。 只受最大变量值和最小变量值的影响,没有考虑其他变量值的差异。难以准确反映变量的变异情况。 适用于定序、定距、定比变量。,六、四分位差(interquartile range,简称Q) (一)四分位值 四分位值的概念,四分位值是指位于一组数据数列中第25、第50、第75三个位置上的值。,中位值或Q50,Q1或Q25,Q3或Q75,四分

3、位值的位置 中位值位于(N1)/2 Q25位于 Q75位于 Q1表明至少有25的变量值小于等于它;同时至少有75的变量值大于等于它。 Q3表明至少有75的变量值小于等于它;同时至少有25的变量值大于等于它。,(N1)/4,3(N1)/4,例:抽样调查甲村和乙村的家庭人数。甲村11户人家,每户人数如下: 2,2,3,4,6,9,10,10,11,13,15 Md的位置:(n1)/2=(111)/2=6 Md=9 Q1的位置:(n+1)/4=(111)/43 Q13 Q3的位置:3(n+1)/4=3(111)/49 Q3=11,乙村8户人家,每户人数如下: 2,3,4,7,9,10,12,12 M

4、d的位置:(n1)/2=(81)/2=4.5 Md=8 Q1的位置:(n+1)/4=(81)/42.25 Q13+0.25(4-3)=3.25 Q3的位置:3(n+1)/4=3(81)/46.75 Q3=10+0.75(12-10)=11.5,(二)四分位差 四分位差的概念 QQ75Q25 上例: 甲村:Q甲=Q3Q1=1138 乙村:Q乙=Q3Q1=11.53.258.25,四分位差的意义 Q愈大,表示有50的变量值愈远离中位值,因而中位值的代表性愈小。 四分位差通常与中位值一起使用。 上例:因Q甲 Q乙 若以中位值作估计,在甲村所犯的错误会略小于在乙村所犯的错误。,练习,1. 7位评审对华

5、裔溜冰选手关颖珊的溜冰成绩评分为 5.8 , 5.6 , 5.8 ,5.7 , 5.6 , 5.9 , 5.8, 求Q1、Q2、Q3与四分位差。 2. 12位学生各在罚球在线投篮十次,投中次数分别为3,2,3,7,5,3,6,4,1,3,6,8,求Q1、Q2、Q3与四分位差。,3. 有4,6,6,7,7,10,11,11,13,15等十个样本,求下列各统计量: Q1、Q2、Q3与四分位差。 4. 试求下列8个数值的四分位差:90, 60, 75, 86, 80, 78, 92, 68。,百分位值简介 “中新网11月29日电 11月2日,由某杂志主办的“2004中国MBA商学院排行”揭晓,排行榜

6、显示复旦MBA毕业生起薪排行最高,平均年薪19万。复旦大学管理学院职业发展中心代理主任黄智颖告诉记者,近日有很多复旦MBA学生问他这个数据的可信度。”,该杂志主编杨俊杰先生在给记者的电子邮件中如此解释:“排行榜中薪酬部分,是以该校全部毕业生起薪点的80分位值的平均收入来计算的,收入的80分位值反映出该校毕业生的收入的中高端水平,最能体现一个学院毕业生薪酬的整体水准及未来发展趋势。复旦MBA毕业生首份工作的起薪点,即指有20%的毕业生达到或超过了年薪19万,而80%的人则达不到19万。”,七、方差(variance)与标准差(standard deviation) 方差也称变异或均方差(mean

7、 square deviation),表示一组数据平均的离散程度。,样本方差,总体方差,标准差:是方差的正平方根;其单位与原变量X的单位相同。,样本 标准差,总体 标准差,例:随机抽取6个被试,测量其对死刑的态度。态度量表为5点量表,1表示坚决反对,5表示坚决支持,依次类推。,1.33,-1.67,- 0.67,- 0.67,1.33,0.33,1.77,2.79,0.45,0.45,1.77,0.11,简化计算,如果数据已被整理为频次分布,则:,SD=1.85,对于等距分组数据,用组中值来代替变量值xi,公式同上。这样的计算不及用原始数据计算精确。,SD=7.87,方差与标准差是使用了所有的

8、数据来计算变异情形的。 方差与标准差的意义 值越大,数据的离散程度越大,分布的范围越广,以均值来估计或预测变量值犯错的可能性越大,均值的代表性越小。 标准差通常与均值一起使用。 适用于定距和定比变量。,第四节 正态分布与标准分数,单峰、对称 MoMd 离差 y , y0,当恒定时,当恒定时,标准分数(standard score)又称为Z分数,是以标准差为单位,表示一个数在团体中所处位置的相对位置量数。,正态曲线各部分面积表 例:一学生分数115分,总体平均数100分,标准差15,问该生的成绩所处位置。 例:一学生分数82分,总体平均数100分,标准差15,问该生的成绩所处位置。 ,练习,数据

9、文件:SAQ.sav,第三章 双变量关系的描述统计,第一节 统计相关的性质,例:调查100人快乐之源,3个选项,其中40人选金钱,50人选工作,10的人选情感。,一、相关的概念,如果一个变量的取值发生变化,另外一个变量的值也相应发生变化,则这两个变量相关。,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值发生了变化,因此性别与考试通过率相关。,二、相关的程度,大多数的统计法是以0代表无相关或零相关,以1代表全相关。介于0与

10、1之间的数值如果愈大,就表示相关的程度愈强。,a,b,c,d,X,1,2,1,2,Y,全相关是指在一个变量上的每个增量都对应于另一个变量上的一个增量。 零相关是指两个变量值变化方向无一定规律,即当一个变量值变大时,另一个变量值可能变大也可能变小,并且变大变小的机会趋于相等。如学生身高与学习成绩的关系。,三、相关的方向,正相关:是指当一个变量的值增加时,另一个变量的值也增加。,负相关:是指当一个变量的值增加时,另一个变量的值却减少。,相关方向的分析不适合于定类变量。,三、相关的方向 正相关:是指当一个变量的值增加时,另一个变量的值也增加。 负相关:是指当一个变量的值增加时,另一个变量的值却减少。

11、 相关方向的分析不适合于定类变量。,四、变量间的对称性,相关关系不代表因果关系,如果假定变量X影响变量Y,而变量Y不影响变量X,则变量X和Y之间的关系为不对称关系。,如果不确定或不区分变量X与变量Y影响的方向,则变量X和Y之间的关系为对称关系。,四、变量间的对称性 相关关系不代表因果关系。 如果假定变量X影响变量Y,而变量Y不影响变量X,则变量X和Y之间的关系为不对称关系。 如果不确定或不区分变量X与变量Y影响的方向,则变量X和Y之间的关系为对称关系。,第二节 列联描述统计,一、列联表的概念 就是同时依据两个变量的值,将所研究的个案分类统计的频次或频率分布表。 二、列联表的格式,边缘次数,边缘

12、次数,条件次数,条件次数表,行百分比,列百分比,三、列联表的大小 表的大小就是横行数目(rows,简写r)乘上纵列数目(columns,简写c),即 表的大小rc 一般用横行表示因变量,纵列表示自变量。 列联表的简单分析,第三节 相关测量法,一、两个定类变量:Lambda,tau-y,(一)Lambda相关测量法,E1,Y,E2,Y,X,E1- E2,在不知道X值的情况下预测Y值所产生的全部误差,根据X的每个值来预测Y值所产生的误差总数,以X值来预测Y值时所减少的误差,消减误差比例(proportionate reduction in error,简称PRE),PRE愈大,以X值预测Y值能够减

13、少的误差所占的比例愈大;即X与Y的相关愈强。,Lambda相关测量法就是以一个定类变量的众值来预测另一个定类变量的值时,可以减除多少误差。如果消减的误差在全部误差中所占的比例愈大,就表示这两个变量的相关越强。,例:若性别为自变量X,快乐之源为因变量Y。依PRE的定义,E1=nMY;E2nmy; E1- E2=(nMY)-(nmy)= my- MY,Y变量的众值次数,X变量的每个值之下Y变量的众值次数,对于2个不对称的定类变量,若X为自变量,Y为因变量,则PRE表示为,其中,My为Y变量的众值次数; my为X变量的每个值之下Y变量的众值次数; n为全部个案数目。,对于2个对称的定类变量,则PRE

14、表示为,其中,Mx为X变量的众值次数; mx为Y变量的每个值之下X变量的众值次数。,若全部众值集中在条件次数表的同一列或同一行中,则Lambda系数就会等于0。这时就不适合于采用Lambda相关测量法。,及y介于0与1之间。其值越大,消减的误差越大,2个变量之间的相关越强。,(二)tau-y相关测量法,tau-y系数属于不对称相关测量法。,tau-y系数的计算公式,n:全部个案数目,Fy:Y变量的边缘次数,Fx:X变量的边缘次数,f:条件次数,tau-y系数的解释,由于tau-y测量法考虑了全部的次数,故其敏感度高于Lambda测量法。,对于不对称关系,最好选用tau-y来简化两个变量的相关情

15、形。,二、两个定序变量:Gamma,dy,对称关系Gamma系数; 不对称关系dy系数或Somersd,其值范围1,1,都具有消减误差比例的意义。,(一)Gamma相关测量法,同序对数Ns:在两个变量上的相对等级相同的一对个案为1个同序对。,异序对数Nd:在两个变量上的相对等级不同的一对个案为1个异序对。,若全部个案数目为n,则会组成0.5n(n-1)对个案。,Ns=4,Nd=3,G=(4-3)/(4+3)=+0.14,可见,工人积极性与产量成正相关。然而,二者的相关程度很弱。若以一个变量来预测另一个变量,只可以消减14的误差。,(二)dy相关测量法,在因变量上的同分对数Ty:只在因变量上的等

16、级相同的一对个案为1个同分对。,Ns=4,Nd=3,(三)列联表计算Gamma和dy,22表,23表,32表,Ty=f11(f12)+f21(f22)+f31(f32),f11,f12,f13,f21,f22,f23,f31,f32,f33,1 2 3,1 2 3,X,Y,NS=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22(f33) Nd=f13(f22+f21+f32+f31)+f12(f21+f31)+f23(f32+f31)+f22(f31) Ty=f11(f12+f13)+f12(f13)+f21(f22+f23)+f22(f23

17、)+f31(f32+f33)+f32(f33),33表,NS=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22(f33) =23(55+28+94)+20(28+24)+11(27+24)+55(24)6003,Nd=f13(f22+f21+f32+f31)+f12(f21+f31)+f23(f32+f31)+f22(f31) 4(55+11+27+8)+20(11+8)+28(27+8)+55(8)=2204,Ty=f11(f12+f13)+f12(f13)+f21(f22+f23)+f22(f23)+f31(f32+f33)+f32(f3

18、3) =23(20+4)+20(4)+11(55+28)+55(28)+8(27+24)+27 (24)=4141,可见,婆媳冲突与住户密度呈正相关,即住户的人口密度越高,婆媳冲突越大。如果以住户人口密度来预测或估计婆媳冲突的大小,可以消减30.8%的误差。,(四)斯皮尔曼等级相关系数rs,D表示每个个案在两个变量上的等级差异量,适用于对称关系,rs取值范围为-1,+1,rs2具有消减误差比例的意义,Rs=+0.47,(五)Kendalls tau系数,三、两个定距变量:Pearson积差相关,(一)公式,(二)r取值范围-1,+1,(三)计算示例,(四)r系数适用于对称关系,也可近似用于非对

19、称关系,(五)r2具有消减误差的意义,四、定类变量与定距变量:相关比率E2,(一)适用于一个定类变量X为自变量,一个定距变量Y为因变量的情形,(二)计算公式,(三)E2具有消减误差比例的意义;E值范围0,1。,E2=0.70, E=0.84,五、定类变量与定序变量: Lambda,tau-y,练习:请分别计算tau-y,tau-y1.138; tau-y2.224,相关系数值在相互比较时,更显出其意义。然而要相互比较,就要尽可能采用同样的相关测量法。,六、定序变量与定距变量:相关比率E2,练习:请分别计算E2及E,E21=0.02, E1=0.14; E22=0.70, E2=0.84,七、本

20、章小节,第四章 概率与统计推断,第一节 抽样的意义与问题 第二节 抽样的历程 第三节 随机与非随机抽样法 参阅 风笑天:现代社会调查方法,第四节 概率与抽样分布,推断统计(inferential statistics):通过对样本数据的统计分析,在一定可靠程度上推测相应的总体的数据特征及规律。 统计值(statistic):即样本值 参数值(parameter):即总体值 代表性样本(representative sample):是指可以从这个样本的数据对总体的特征做出准确的、无偏估计的一个样本。,一、二项抽样分布,二项抽样分布特征: 每次抽样只有两种可能结果; 每次抽样“成功”的概率为P,失

21、败的概率为Q,P+Q=1,且每次抽样的概率都相同; 每次抽样相互独立; 抽样可重复N次; 在N次抽样中,出现“成功”的次数的概率分布就叫二项分布。,二、均值抽样分布,均值抽样分布特征: 如果样本相当大,则抽样分布接近正态分布; 抽样分布的均值就是总体均值,抽样分布的标准差叫标准误(standard error);,有95%的样本均值在M1.96SE范围内,有99%的样本均值在M2.58SE范围内。,三、参数估计与假设检验 参数估计:统计值(样本)参数值(总体) 假设检验:假设参数值,用样本统计值检验参数值是否正确。,第五章 参数估计,一、点估计与区间估计 (一)点估计:用样本统计值来代表总体参

22、数值。 无偏估计与有偏估计 (二)区间估计:估计总体参数值可能落入的区间范围。 置信度:总体参数值落在某一区间时正确的概率。 置信区间:总体参数值的区间范围。,置信区间与置信度成正比。 二、均值的区间估计 =.05, =.01,置信区间的大小与样本的大小成反比。,例:,三、百分比的区间估计 =.05, =.01,例:,四、积矩相关系数的区间估计,0.489 r0.695,第六章 假设检验,一、研究假设与虚无假设 研究假设H1 虚无假设H0 抽样分布 H0为真,则H1为假; H0为假,则H1为真。,二、否定域与显著性水平,而显著水平表示否定域在整个抽样分布中所占的比例,也即表示样本的统计值落在否

23、定域内的概率。,否定域CR就是抽样分布内一端或两端的小区域,如何样本的统计值在此区域范围内,则否定虚无假设。,三、单侧(尾)与双侧(尾)检验,四、型错误与型错误 型错误:拒绝H0时所犯的错误。犯型错误的概率通常以表示,故又称型错误。 型错误:接受H0时所犯的错误。犯型错误的概率通常以表示,故又称 型错误。 型错误与 型错误成反比。,五、单均值的Z检验 适用条件 样本是随机抽取的 n100或n30 均值的抽样分布近似为正态分布,例:从全区工人中随机抽取n=120名工人进行一项政治水平的测验,发现样本平均分为 =57分,标准差S=18.5。可否证明全区工人该项测验的平均分M=60分。设p=0.05

24、。,解: n=120,Z-1.96,故接受H0,即全区工人该项测验的平均分为60分。,若H1:M60 H0:M=60 解:这是单尾检验,查表得Z-1.65,Z-1. 65,故否定H0,接受H1,即全区工人该项测验的平均分小于60分。 若p=0.01,仍为左侧单尾检验,查表得Z-2.33,样本统计值Z=-1.78-2.33,故接受H0,即该区工人该项测验的平均分为60分。,例:有人调查早期教育对儿童智力发展的影响,从受过良好早期教育的儿童中随机抽取n=70人进行韦氏儿童智力测验,结果样本平均数为 =103.3,能否认为受过良好早期教育的儿童智力高于一般水平(总体M=100,=15)。,H1:M1

25、00 H0:M=100 p=.05 查表得:Z1.65 依题意:,Z=1.84 1.65 拒绝H0,接受H1,即即受过良好早期教育的儿童的平均智力要优于一般儿童的智力。,六、单均值的t检验 适用条件 样本是随机抽取的 n30,自由度(degrees of freedom,df):有多少个案的数值可以随意变更。 自由度是指样本中独立的或能自由变化的数据的个数。 例:一个样本n=4,数据分别为 8、9、11、12 , =10 要保证平均数恒定,只能自由改变3个数据,如7、15、8,第四个数必定为10。,对于样本,由于 是固定的,所以df=n-1 对于总体,由于是未知的,所以df=n,t的抽样分布的

26、形状(如扁平或高耸的程度)取决于自由度。,t分布表(P391,附录5:t分布),例:一个随机样本,n=26, =65,S=10。 H1:M60 H0:M=60 p.05 解:df=n-1=26-1=25,查表得:t1.708 样本,t=2.51.708 拒绝H0,接受H1,即全校学生的平均成绩优于60分。,七、两个均值差异的Z检验 H1:M1M2 or M1M20 H0:M1=M2 or M1M2=0,适用条件 两个样本都是随机抽样; 两个总体都是正态分布; 两个总体的标准差(方差)是相等的(?) 大样本,n1+n2100或n30,例:,解:,Z=1.311.96,故接受H0,即甲乙两地农民请

27、客送礼平均支出无显著差异(两样本均值的差异只是抽样误差造成的而已)。,练习:从某地区的六岁儿童中随机抽取男生30人,测量身高,平均为=114cm;抽取女生27人,平均身高=112.5 c m。根据以往累积资料,该地区六岁儿童身高的标准差1=5cm,女童身高标准差2=6.5cm,能否根据这一次抽样测量的结果下结论:该地区六岁男女儿童身高有显著差异? 参考答案:Z=0.961.96,即P0.05,所以该地区六岁儿童男女身高差异不显著。,八、两个均值差异的t检验 适用条件 两个样本都是随机抽样; 两个总体的标准差(方差)是相等的(?) 小样本,n1+n2100或n30,例:,解:,查表得:,t=2.

28、5302.528,故否定虚无假设,接受备择假设,即戒烟运动可显著减少抽烟量。,例:从某地区的六岁儿童中随机抽取男生30人,测量身高,平均为=114cm;抽取女生27人,平均身高=112.5 c m。根据以往累积资料,该地区六岁儿童身高的标准差1=5cm,女童身高标准差2=6.5cm,能否根据这一次抽样测量的结果下结论:该地区六岁男女儿童身高有显著差异?,解:,查表得:t0.05/2(30+27-2)=t0.05/2(55)=2.00, 所以t=0.96t0.05/2(55)=2.00,即该地区男女儿童身高差异不显著。,相关样本的t检验 例:某幼儿园在儿童入园时对49名儿童进行比奈智力测验, 结

29、果平均智商为106,一年后再对同组被试施测,结果智商平均分为110,已知两次测验结果的相关系数为0.74,问能否说随着年龄的增长与一年的教育,儿童的智商有了显著提高?,例:,t=1.6672.015,故接受虚无假设,即计划生育宣传不能达到减少男青年的理想儿女数目。,查表得:,例:某幼儿园在儿童入园时对49名儿童进行比奈智力测验, 结果平均智商为106,一年后再对同组被试施测,结果智商平均分为110,已知两次测验结果的相关系数为0.74,问能否说随着年龄的增长与一年的教育,儿童的智商有了显著提高?,t0.05(49-1)=t0.05(48)1.684 t0.01(49-1)=t0.01(48)2

30、.423,例:某研究者认为哥哥比弟弟更具创造性,故随机抽取10对兄弟进行创造性测验,结果如下,假设测验成绩符合正态分布。问兄弟之间的创造性是否有显著的差异? 哥哥:65 48 63 52 61 53 63 70 65 66 合计 弟弟: 61 42 66 52 47 58 65 62 64 69 d 4 6 -3 0 14 -5 -2 8 1 -3 20 d2 16 36 9 0 196 25 4 64 1 9 360,查表得:t0.05(10-1)=t0.05(9)=2.263,SPSS演示与实作,九、单百分率与百分率差异的检验 百分率是均值的一种特殊形式 (一)单百分率的Z检验 当n30,

31、且nP5 & n(1P)5,样本较大,百分率的抽样分布近似正态分布,可用Z作为检验统计量。,回忆比较:百分比的区间估计 =.05, =.01,例:一休闲娱乐杂志声称其读者群中女性占80%,为验证这一说法是否属实,某研究机构抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%。,解:H0=80%,H180% P0.05,则|Z|1.96,检验统计量,Z=2.4751.96,故否定H0,接受H1,即该杂志的说法并不属实,该杂志女性读者的比例应超过80%。,(二)两个百分率差异的Z检验 两个随机样本百分

32、率之差的抽样分布接近正态分布,用Z检验法。,例: P0.001,查表得,Z=6.5603.30,故否定H0,接受H1,即两地小家庭所占比例是不同的。,练习: 国际色觉障碍讨论会宣布,每12个男子中,有一个是先天性色盲。从某校抽取的1200名男生中有60人是色盲,问该校男子色盲比率与上述比例是否有显著差异?(答案:Z=1.211.96) 从甲乙两校各自随机抽出学生160名和150名,发觉体育“达标”人数分别是115和130,问甲乙两校学生体育“达标”率是否有显著差异?(答案: Z=3.1961.96 ),第七章 双变量关系的假设检验,相关,样本,总体,E1=40(10040)/100+ 50(1

33、0050)/100+ 10(10010)/100=58 E2=10(60-10)+40(60-40)+10(60-10)/60 +30(40-30)+10(40-10)+0(40-0)/40 =45 tau-y=(58-40)/58=0.224,一、卡方检验(chi square test) 适用条件: (1)随机样本; (2)两个变量都是定类变量或一个定类一个定序变量。,实际次数,预期次数,边缘次数,边缘次数,条件次数,条件次数表,列联表的大小 表的大小就是横行数目(rows,简写r)乘上纵列数目(columns,简写c),即 表的大小rc 一般用横行表示因变量,纵列表示自变量。 列联表的简

34、单分析,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值发生了变化,因此性别与考试通过率相关。,例:,df=(r1) (c1)= (21) (21)=1,,查附录六表得,23.841 2=30.3893.841,故否定H0,接受H1,即性别与最敬佩父亲还是母亲有关。 2越大,H0正确的可能性越小,H1正确的可能性越大。,SPSS演示及练习 P404(八A)前三个问题。 P82,表4-1。 P83,表4-2。 P85,表4-

35、3。,边缘次数,边缘次数,条件次数,条件次数表,P0.001,df=4,218.465,2=35.83318.465,故否定H0,接受H1,即青年人的受教育水平与其最大志愿显著相关。,Pearson卡方:n40,e 5 Continunity correction卡方:22表(df=1), n40, 1e 5,与卡方有关的相关测量法: Phi相关系数 列联相关系数 V相关系数,Ns=4,Nd=3,G=(4-3)/(4+3)=+0.14,可见,工人积极性与产量成正相关。然而,二者的相关程度很弱。若以一个变量来预测另一个变量,只可以消减14的误差。,回顾两个定序变量的相关,dy相关测量法,在因变量

36、上的同分对数Ty:只在因变量上的等级相同的一对个案为1个同分对。,Ns=4,Nd=3,二、两个定序变量相关的检验 适用条件: (1)随机样本; (2)两个变量都是定序变量; (3)n100,G=0时,G值的抽样分布近似正态分布,大样本 n30,小样本 n30,NS=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22(f33) =23(55+28+94)+20(28+24)+11(27+24)+55(24)6003,Nd=f13(f22+f21+f32+f31)+f12(f21+f31)+f23(f32+f31)+f22(f31) 4(55+11

37、+27+8)+20(11+8)+28(27+8)+55(8)=2204,Ty=f11(f12+f13)+f12(f13)+f21(f22+f23)+f22(f23)+f31(f32+f33)+f32(f33) =23(20+4)+20(4)+11(55+28)+55(28)+8(27+24)+27 (24)=4141,可见,婆媳冲突与住户密度呈正相关,即住户的人口密度越高,婆媳冲突越大。如果以住户人口密度来预测或估计婆媳冲突的大小,可以消减30.8%的误差。,200,单尾检验,查表得:,Z=3.3463.09,故否定H0,接受H1,即住户人口密度与婆媳冲突呈正相关。,SPSS演示及练习 P404(八A)最后一个问题。 P405(八B)。 P400(三) P401402(四A)、(四B)、(四C),三、单因素方差分析与F检验 ANOVAanalysis of variance one-way ANOVA,回顾一个定类变量与一个定距变量的相关,单因素方差分析(one-way ANOVA) F检验 适用条件 (1)随机样本; (2)一个定类变量,一个定距变量; (3)各组总体正态分布。,查附录七 F分布表得:F6.11 F=19.836.11,故否定H0,接受H1,即三类家庭背景学生的英文平均成绩有显著差异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论