外语研究中的统计方法总结.doc_第1页
外语研究中的统计方法总结.doc_第2页
外语研究中的统计方法总结.doc_第3页
外语研究中的统计方法总结.doc_第4页
外语研究中的统计方法总结.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

T-检验方差分析定义两组平均数的差异检验:(1)两个样本(2)单一样本与总体比较多组平均数;组间差异与组内差异比值前提1、抽取样本的总体呈正态分布2、数据随机从一个总体中通过样本抽取3、因变量必须是连续性数据,即定距变量或定必变量4、自变量必须是分类的、离散性数据,水平必须是21、样本所来自的总体呈方差齐性2、因变量数据在总体中呈正态分布3、数据由随即抽样获得;4、因变量的数据必须是区间级变量或分类不多的比率级变量5、自变量必须是名称级或顺序变量形式单一样本t-检验定义:检验某个变量的总体均值和某指定值之间是否存在显著差异样本均数与已知总体均数之间的比较)F检验:方差分析以F检验来推断几个平均数差异的显著性。如果组间与组内方差相等,即F比值等于或接近1,表明各组平均数无显著差异;如果F值很大,大到超过F抽样分布上某种显著性水平的临界值,则拒绝零假设,接受有显著性差异的备择假设前提:样本总体服从正态分布F分布:形态随F比值分子和分母中的自由度的变化而形成的一簇正态分布组间方差MSb=组间自由度:dfb=K1(组数减1)组内方差组内自由度dfw=K(n-1)=N-K实现过程:analysis-compare means-one-sample t-test几个概念:实验或调查中的自变量称为因素,只有一个自变量的方差分析称为单因素方差分析,用one-way ANOVA命令计算;有两个以上因素的称为多因素方差分析,用Univariate命令计算某一个因素的不同情况称为因素的“水平”各因素水平之间的每个组合叫做一个“单元”(cell)两独立样本t-检验定义:两个样本之间彼此没有任何关联,两个独立样本各自接受相同的测量单因素方差分析单一因素各水平影响的一个(或几个相互独立的)因变量各组平均数之间的差异;对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异尽心分析,即进行均值多重比较前提:(1)两个样本互相独立.05 方差齐性;.05方差不齐性(2)样本来自的两个总体应该呈正态分布实现过程:analysis-compare means- one-way ANOVA方差不齐性:Tamhanes T2方差齐性:LSD实现形式:analysis-compare means-independent-sample t-test效应幅度: 两配对样本t-检验定义:根据样本数据对样本来自的两配对总体的均值。同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较多因素单因变量方差分析对一个独立变量是否受一个或多个因素或变量影响;可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差、各因素变量与协变量之间的交互作用前提:两个样本应该是配对的;观察数目相同;顺序不能随意改变实现形式:analysis-compare means-paired-sample t-test效应幅度Cohens 公式:d= 单因素:0-0.1 a week effect0.1-0.3 a modest effect0.3-0.5 a moderate effect 0.5 a strong effect效应幅度指数值:0-0.2 a week effect 效果弱0.21-0.5 a modest effect 效果弱强(尚可)0.51-1.00 a moderate effect 效果中强1.00 a strong effect 效果强多因素:在P值小于.05时观察Eta squared=SSmod/SStotal0-0.1 效应幅度弱0.1-0.3 效应幅度弱强0.3-05 效应幅度中强0.5 效应幅度强相关分析相关的概念:两个变量之间不精确、不稳定的变化关系称为相关关系。两个变量值不是一一对应得那样精确、稳定。变化关系:变化方向上:正相关(变化方向一致)、负相关(变化方向相反)、零相关(变化方向无一定规律) 密切程度:强相关或弱相关、中度相关、弱相关或低度相关相关系数(Correlation coefficient):用r 表示。数值范围在-1到+1之间,即0 r1重要知识:相关系数的值,仅仅是一个比值,不能做数学运算。也不能揭示两者之间的内在本质,不一定存在因果关系。相关系数所显示的相关强度:r:0.3低度/弱相关r: 0.3且0.8中度相关r: 0.8高度/强相关相关系数的显著性检验:要看r在抽样分布上出现的概率如何形式:1 皮尔逊相关分析使用条件:1)两个变量都是由测量获得的连续性数据2)呈正态分布3)成对数据,每对数据之间相互独立4)呈线性关系(散点图)实现形式:analyze-correlate-bivariate注意:p指.05 才求效应幅度(相关系数的平方)2 等级相关分析定义:当两个变量之间以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为等级相关。优点:不要求呈正态分布,也不要求大于30,所以应用范围广缺点:若两个变量的原始资料都是较精确的度量资料,则不必化成较粗略大大等级资料,否则会失掉很多信息。前提:不能有较多的个案属于同一等级,这样会严重影响协变关系的产生,因此,用于等级相关的顺序级变量应有较多数量的等级分类,且每一类中的个案较少。3 偏相关分析定义:剔除其他相关因素影响的条件下计算相关系数条件:当两个变量同时与第三个变量有线性关系,求某两个变量之间的相关系数才能用偏相关分析实现形式:analyze-correlation-partial4 距离相关分析定义:距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量使用范围:可用于同一变量内部各个取值之间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。分类:1)根据统计量的不同,可分为 a 不相似性测量,通过计算样本或变量之间的距离表示b 相似性测量,通过计算Person相关系数或Cosine相关来表示 2)根据分析对象的不同,可分为a 个案间分析(只测不相似性)b 变量间分析实现形式:变量之间相似性测量分析: analyze-correlation-distance-between variables-similarities变量之间不相似性测量分析:analyze-correlation-distance-between variables-dissimilarities个案之间不相似性测量分析:analyze-correlation-distance-between cases-dissimilarities注意:相似性数值越大,相似性越好;不相似性数值越大,不相似性越好5 信度分析量表的可靠新1) 同质信度分析内部一致性,指的是测量内部所有项目的一致性Analyze-scale-reliability analysis-alpha Cronbach a 信度系数:连续变量系数在0.8以上较好,离散变量的系数在0.6以上较好2) 分半信度分析在测试以后对测试项目按奇项、偶项或其他标准分成两半,分别记分,有两半分数之间的相关系数得到信度系数。3) 再测信度分析再测信度系数为两次测量结果之间的信度系数,反映两次测试分数的稳定程度。满足假设:a 所测量的特指必须是稳定的;b 遗忘和练习的效果相同 c 两测试期间被试对问题的熟悉程度情况没有差别卡方检验1 概念:交叉列联表分析(crosstabulation),用于非连续变量的分析零假设:行列变量之间独立(即不存在相关性)2 前提1) 两个变量必须是离散变量,即名称和顺序级变量,顺序级变量的分类控制在5个以内2) 每个单元的期待值不能少于1.通过观察expected value得知3) 期待值少于5的单元不能超过20%,否则不能用卡方检验4) 如果观测值有数值小于5的单元,采用卡方检验结果表中的Fishers exact test数值。实现形式:analyze-descriptive statistics-crosstabs效应幅度强弱值:0.000。10 弱0.110.30 有限,尚可0.310.5 中0.510.8 强0.8以上 极强22 phi 超过22 Cramers回归分析1 概念:用数学方程式来表达两变量之间的非确定性因果关系,可利用该方程式,有自变量的值来估计、预测因变量的估计值,这种分析就成为回归分析。回归分析是处理两个及两个以上变量间线性依存关系或依存变化的数学关系的统计方法。形式:1) 一元线性回归一元线性回归是指只有一个自变量的线性回归。回归线:如果散点图有明确的直线趋势,我们就可以配置一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线。一元线性回归方程:Y=a+bx Y为因变量,X 为自变量,a为截距,是个常数项,b为回归系数一元回归方程的检验:1、对回归方程进行方差分析,检验统计量值为F。当F足够大时,拒绝接受b=0的假设 2、对回归系数进行显著性检验,检验统计量的值为t,P小于.05 3、R2判定系数。越大,拟合优度越好实现形式:analyze-regression-linear2) 多元线性回归研究在线性关系下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析。Y=a+b1x1+b2x2+bnxn应用范围:1 筛选有关变量(主要用途)2 获得有实际意义的回归方程一般步骤:1 单因子模型分析 2 逐步筛选变量,建立多因素模型 3 综合单因子和多因素模型,当两者矛盾时,结合专业知识分析原因检验:方差分析;偏回归系数与常数项检验,使用统计量t哪个自变量意义最大要看standardized coefficients拟合优度:0.5以上最好,不低于0.3 adjusted square因子分析1 定义:因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法,即用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息。2 因子的概念代表各类信息的综合指标称为因子。3 特点:因子数量少于原有的变量;根据原有的信息进行重新组构;不存在线性相关关系;具有命名解释性4 几个概念因子载荷:原有变量和因子变量的相关系数。因子载荷的绝对值越大,则公共因子和原有变量的关系越强。变量共同度(公共方差):衡量因子分析效果的一个指标。反映全部公共因子的原有变量的总方差解释说明比例,越接近1,说明解释信息越强。公共因子的方差贡献:反映该因子对所有原始变量总方差的解释能力。其值越高说明因子重要程度越高。核心问题:如何构造因子数量;如何对因子变量进行命名解释。四个基本步骤:1) 确定带分析的原有若干变量是否适合于因子分析2) 构造因子变量3) 因子变量的命名解释4) 计算因子得分就是确定原样本数据在不同因子上的具体数值。Analyze-data reduction-factor统计方法定义形式实现过程前提效应幅度T-test两组平均数单一样本、两独立样本、两配对样本Analyze-compare means-one sample/independent sample/paired sample正态分布、数据随即抽取、因变量是连续数据、自变量是离散数据,水平是2d=0-0.2 a week effect 效果弱0.21-0.5 a modest effect 效果弱强(尚可)0.51-1.00 a moderate effect 效果中强1.00 a strong effect 效果强方差分析 F-test多组平均数单因素、多因素单一变量Analyze-compare means-one-way ANOVA/analyze-general linear model-univariate方差齐性、正态分布、数据随机抽样、因变量是区间级或分类不多的变量、自变量是名称或顺序变量Eta squared=SSmod/SStotal0-0.1效应幅度弱0.1-0.3 效应幅度弱强0.3-05 效应幅度中强0.5 效应幅度强Pearson相关分析Analyze-correlation-bivariate连续性数据、正态分布、成对数据、线性关系P值.05 才求效应幅度(相关系数的平方)等级相关不一定呈正态分布、不一定大于30偏相关Analyze-correlation-partial两变量同时与第三个变量有线性关系距离相关相似性与不相似性个案间、变量间Analyze-correlation-distance信度分析量表的校度考核同质信度、分半信度、再测信度Analyze-scal

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论