




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实用生物统计分析(六),离群值、数学变换及其他,安徽大学生命科学学院,数据集合中与其他数据有明显偏离的取值 数值上异常偏大或偏小,或根本不可能存在 来源: - 读数、录入的错误 - 真实存在的极端现象 离群值对统计分析的影响 造成参数估计的偏离 (means, SD) 造成对统计分布的错判 影响对统计方法的选择和结果解释(方差齐性),离群值 (outliers),依据常识和科学原理判断谬误 直接剔除 观察个体值偏离均值程度进行推断 箱式图观察 Z值观察 统计检验方法 Grubbs test Dixons Q test Hubers method,离群值的认定,箱式图推断离群值,分别以四分位数(Q3, Q1)为箱型方框的上、下边,以不超出区间Q1-1.5*IQR,Q3+1.5*IQR的最大、最小观测值为线的上、下端,超出该区域的数据视为离群值。 其中:IQR(interquartile range)= Q3-Q1 SPSS中:Graphs Interactive boxplot 注:SPSS还定义了所谓极端值,即超出区间Q1-3*IQR,Q3+3*IQR范围的数值。,箱式图推断离群值,数据集:2,57,60,60,65,68,70,71,72,74,74,76,77,98,150,220,箱式图推断离群值,离群值,离群(极端)值,离群(极端)值,离群(极端)值,Z值推断离群值,以Z值区间(-3.0, +3.0)为标准,超过者为可能的离群值。这相当于以平均值为中心的99.9%置信区间。 SPSS中:Analyze Descriptive statistics Descriptives,Z值推断离群值,勾选,将标准化变量Z值视为变量存入数据列表中,Z值推断离群值,可以看到,哪怕是220其Z值也只为2.969,未过此标准(3)。与箱式图相比,Z值法更为保守。原因与算术平均值的特点有关。,Grubbs test推断离群值,在线检验:/quickcalcs/Grubbs1.cfm,220的Z值=2.972.59 ,为离群值(alpha=0.05)。,离群值的判定,Z值法最保守, 原因是Z值本身就受极端值影响较大; 上述方法都不是硬性规定,只为参考; 对于离群值的判定要慎重,宁可保守,不可贸然删除,对较小数据集(比如100)尤其如此; 不能为追求显著性结论而人为主观地删除某些个离群值,这有违科学道德。,数学变换,参数性统计分析方法通常对数据的正态性、方差齐性、变量间的线性等有着明确或潜在的要求。若违背了这些前提,可能降低方法的可靠性,甚至导致其完全失效。 当数据不满足这些条件,可以尝试通过数学变换加以改善,以达到顺利使用这些统计方法的目的。,数学变换,数学变换的使用存在争议,实践中也会给结果的解释带来困难。 多数参数性方法是相当稳健的,即:对正态性、方差齐性的稍许偏离并不妨碍正常使用,可能因此损失的检验效力对常规分析仍可接受,尤其在样本量较大(n30)的情况下。 除非特别必要,慎用数学变换。,数学变换,存在下述情况可尝试数学变换: 数据极度偏态分布:J型分布或严重左、右偏 组间均值与标准差之间存在中度至高度的相关性 必须使用多元统计方法,但正态性和线性不满足 样本含量少(n30)且正态性、齐性不满足,数学变换,常见类型 对数变换 平方根变换 反正弦变换 倒数变换 或上述变换的组合,适合极度偏态分布,组间呈数量级变化,适合中度偏态分布,有泊松分布特征,适合偏大或偏小的百分数资料,适合J型分布资料,数学变换举例,除草剂试验,响应变量为单位面积杂草数量,均值大,标准差也大,似乎存在相关关系,数学变换举例,均值与标准差相关系数达到0.825,散点图也看出相关趋势,数学变换举例,若直接对原始数据进行annova分析,未通过方差齐性检验,说明各组间方差差异不能忽略。,数学变换举例,对杂草数量作频数分析,可见其分布明显右偏(偏斜度curtosis=3.2490)。考虑到单位面积杂草数最有可能服从泊松分布(=2),最适合平方根变换,数学变换举例,对响应变量取平方根,Transform Compute variable,数学变换举例,对响应变量取平方根,TransformCompute variable,转换后的相关系数0.693,有所改善,数学变换举例,做过平方根变换后,再作频数分析,可见其分布有了较大改善,更接近正态(偏斜度curtosis=-0.044)。,数学变换举例,转换后的方差齐性达到要求,可以进行单因素方差分析,样本含量的确定,理论上讲,样本含量当然越多越好;但究竟达到什么水平就足够好,这也是试验设计中关心的问题之一。 在数学上要回答这个问题相当繁难,这里只对常见分析提出简略的计算方法: 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 星座起源课件
- 大疆T系无人机培训
- 2026届福建省泉州市永春一中学英语九上期末统考试题含解析
- 农村发展专业解读课件
- 公共卫生体系规则解读
- 湖南省长沙市望城区2026届九年级化学第一学期期中考试试题含解析
- Android基础培训:炫彩商务应用开发与总结
- 2026届安徽省合肥市行知学校化学九年级第一学期期中考试模拟试题含解析
- 2026届贵州省毕节市九上化学期中考试模拟试题含解析
- 2026届四川省绵阳地区化学九年级第一学期期中联考试题含解析
- 软件和信息技术服务定制化开发解决方案
- 医学实验室安全培训
- 水井清污协议书
- 水利工程施工防火措施
- 2025年煤炭生产经营单位(一通三防安全管理人员)考试笔试试题(400题)附答案
- 音乐基础-乐理篇
- 塑胶地板施工合同
- 布鲁克纳操作手册
- 全案设计落地合同标准文本
- 2025年企业信用报告-上海仪恩埃半导体设备有限公司
- 企业员工打架斗殴教育
评论
0/150
提交评论