SPSS离群值与数学变换.ppt_第1页
SPSS离群值与数学变换.ppt_第2页
SPSS离群值与数学变换.ppt_第3页
SPSS离群值与数学变换.ppt_第4页
SPSS离群值与数学变换.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实用生物统计分析(六),离群值、数学变换及其他,安徽大学生命科学学院,数据集合中与其他数据有明显偏离的取值数值上异常偏大或偏小,或根本不可能存在来源:-读数、录入的错误-真实存在的极端现象离群值对统计分析的影响造成参数估计的偏离(means,SD)造成对统计分布的错判影响对统计方法的选择和结果解释(方差齐性),离群值(outliers),依据常识和科学原理判断谬误直接剔除观察个体值偏离均值程度进行推断箱式图观察Z值观察统计检验方法GrubbstestDixonsQtestHubersmethod,离群值的认定,箱式图推断离群值,分别以四分位数(Q3,Q1)为箱型方框的上、下边,以不超出区间Q1-1.5*IQR,Q3+1.5*IQR的最大、最小观测值为线的上、下端,超出该区域的数据视为离群值。其中:IQR(interquartilerange)=Q3-Q1SPSS中:GraphsInteractiveboxplot注:SPSS还定义了所谓极端值,即超出区间Q1-3*IQR,Q3+3*IQR范围的数值。,箱式图推断离群值,数据集:2,57,60,60,65,68,70,71,72,74,74,76,77,98,150,220,箱式图推断离群值,离群值,离群(极端)值,离群(极端)值,离群(极端)值,Z值推断离群值,以Z值区间(-3.0,+3.0)为标准,超过者为可能的离群值。这相当于以平均值为中心的99.9%置信区间。SPSS中:AnalyzeDescriptivestatisticsDescriptives,Z值推断离群值,勾选,将标准化变量Z值视为变量存入数据列表中,Z值推断离群值,可以看到,哪怕是220其Z值也只为2.969,未过此标准(3)。与箱式图相比,Z值法更为保守。原因与算术平均值的特点有关。,Grubbstest推断离群值,在线检验:,220的Z值=2.972.59,为离群值(alpha=0.05)。,离群值的判定,Z值法最保守,原因是Z值本身就受极端值影响较大;上述方法都不是硬性规定,只为参考;对于离群值的判定要慎重,宁可保守,不可贸然删除,对较小数据集(比如30)的情况下。除非特别必要,慎用数学变换。,数学变换,存在下述情况可尝试数学变换:数据极度偏态分布:J型分布或严重左、右偏组间均值与标准差之间存在中度至高度的相关性必须使用多元统计方法,但正态性和线性不满足样本含量少(n0)。考虑到单位面积杂草数最有可能服从泊松分布(=2),最适合平方根变换,数学变换举例,对响应变量取平方根,TransformComputevariable,数学变换举例,对响应变量取平方根,TransformComputevariable,转换后的相关系数0.693,有所改善,数学变换举例,做过平方根变换后,再作频数分析,可见其分布有了较大改善,更接近正态(偏斜度curtosis=-0.044)。,数学变换举例,转换后的方差齐性达到要求,可以进行单因素方差分析,样本含量的确定,理论上讲,样本含量当然越多越好;但究竟达到什么水平就足够好,这也是试验设计中关心的问题之一。在数学上要回答这个问题相当繁难,这里只对常见分析提出简略的计算方法:1)两均值的比较2)两百分数的比较3)方差分析,样本含量的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论