




已阅读5页,还剩80页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章平均数与变异数 第一节总体与样本第二节平均数第三节变异数第四节可疑数值取舍第五节数据标准化第六节数据转化第七节t检验 第一节总体与样本 总体 具有共同性质的个体所组成的集团无限总体 总体有无穷多个个体构成有限总体 总体由有限个个体构成参数 由总体的全部观察值而算得的总体特征数 第一节总体与样本 样本 从总体中抽取若干个个体的集合统计数 测定样本中的各个体而得的样本特征数 如平均数等 统计数是总体相应参数的估计值 第二节平均数 算术平均数中位数几何平均数 一 算术平均数Mean1定义各单项测定值的总和除以测定值的个数 所得的商 2计算方法 1 如样本较小 即资料包含的观察值个数不多 可直接计算平均数 第二节平均数 例 在同一稀释度的9个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 127 86 单位 个 试计算其平均数 一 算术平均数2计算方法 2 若样本较大 且已进行了分组 可采用加权法计算算术平均数 即用组中点值代表该组出现的观测值以计算平均数 其公式为 第二节平均数 二 中位数 Median 1定义将资料内所有观察值从大到小排序 居中间位置的观察值称为中数 计作Md 2计算方法将观察值排序 如观察值个数为奇数 则以中间的观察值为中位数 如观察值个数为偶数 则以中间二个观察值的算术平均数为中位数 第二节平均数 例 在同一稀释度的9个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 127 86 单位 个 试计算其中位数 第二节平均数 三几何平均数 GeometricmeanGeomean 1定义如有n个观察值 其相乘积开n次方 即为几何平均数 用G代表 2计算方法 例 在同一稀释度的9个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 127 86 单位 个 试计算其几何平均数 比较甲 乙两个小组 各5人 某门课成绩的优劣 甲班 50 50 50 80 20乙班 100 0 50 80 20 比较甲 乙两个小组 各5人 某门课成绩的优劣 甲班 100 0 50 80 20乙班 100 0 50 70 30 比较甲 乙两个小组 分别为5 7人 某门课成绩的优劣 甲班 100 0 50 80 20乙班 100 0 50 80 20 70 30 第三节变异数 变异程度指标偏差极差方差标准差标准误变异系数 第三节变异数 一 偏差 Deviation 定义 测定值与平均值之差 特点 有单位 有正负 个数与样本个数相等 第三节变异数 二 极差 Range 极差 又称全距 记作R 是资料中最大观察值与最小观察值的差数 R ymax ymin特点 有单位 一个值 表述较偏差简单 例 在同一稀释度的9个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 127 86 单位 个 试计算其极差 第三节变异数 三 方差离差平方和每一个观察值均有一个偏离平均数的度量指标 离均差 但各个离均差的总和为0 不能用来度量变异 那么可将各个离均差平方后加起来 求得离均差平方和 简称平方和 SS sumofsquaresofdeviationsfrommean 定义如下 样本总体 第三节变异数 由于各个样本所包含的观察值数目不同 为便于比较起见 用观察值数目来除平方和 得到平均平方和 简称均方或方差 variance 样本均方 meansquare 用s2表示 定义为 第三节变异数 它是总体方差 的无偏估计值 此处除数为自由度 n 1 而不用n 其中 N为有限总体所含个体数 均方和方差这两个名称常常通用 但习惯上称样本的s2为均方 总体的为方差 第三节变异数 自由度Degreeoffreedom自由度记作df 它的统计意义是指样本内独立而能自由变动的离均差个数 例如一样本为 3 4 5 6 7 平均数为5 前 个离差为 2 1 0和1 则第5个离均差为前4个离均差之和的变号数 即 2 2 一般地 样本自由度等于观察值的个数 n 减去约束条件的个数 k 即df n k 第三节变异数 同样 样本标准差是总体标准差的估计值 总体标准差用表示 第三节变异数 自由度Degreeoffreedom样本标准差不以样本容量n 而以自由度n 1作为除数 这是因为通常所掌握的是样本资料 不知 的数值 不得不用样本平均数代替 与 有差异 由算术平均数的性质可知 比小 因此 由算出的标准差将偏小 如分母用n 1代替 则可免除偏小的弊病 第三节变异数 四 标准差Standarddeviation SD 标准差为方差的正平方根值 用以表示资料的变异度 其单位与观察值的度量单位相同 样本资料计算标准差的公式为 第三节变异数 在应用上 小样本一定要用自由度来估计标准差 如为大样本 因n和n 1相差微小 也可不用自由度 而直接用n作除数 但样本大小的界限没有统一规定 所以一般样本资料在估计标准差时 皆用自由度 第三节变异数 标准差的计算方法分四个步骤 先求出 再求出各个和各个 求和得 即可代入下式算得标准差 例 在同一稀释度的9个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 127 86 单位 个 试计算其标准差 表达方法 表格中 Means SDMeans SD 图中 误差线 正 负 正负 第三节变异数 五 标准误Standarderror SE 第三节变异数 Adaptedfrom Jacobsetal 2005 Relativecontributionofinitialrootandshootmorphologyinpredictingfieldperformanceofhardwoodseedlings NewForests 30 235 251 第三节变异数 Adaptedfrom Boivinetal 2004 Late seasonfertilizationofPiceamarianaseedlings intensiveloadingandoutplantingresponseongreenhousebioassays Ann For Sci 61 737 745 第三节变异数 Adaptedfrom Rixetal 2012 PaternalandmaternaleffectsontheresponseofseedgerminationtohightemperaturesinEucalyptusglobulus Ann For Sci 69 673 679 第三节变异数 Adaptedfrom Campoetal 2007 RelationshipbetweenrootgrowthpotentialandfieldperformanceinAleppopine Ann For Sci 64 541 548 第三节变异数 六 变异系数标准差和观察值的单位相同 表示一个样本的变异度 若比较两个样本的变异度 则因单位不同或均数不同 不能用标准差进行直接比较 这时可计算样本的标准差对均数的百分数 称为变异系数 例 在同一稀释度的10个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 96 127 86 单位 个 试计算其变异系数 第三节变异数 两个小麦品种主茎高度的平均数 标准差和变异系数 第三节变异数 如只从标准差看 品种甲比乙的变异大些 但因两者的均数不同 标准差间不宜直接比较 如果算出变异系数 就可以相互比较 这里乙品种的变异系数为11 3 甲品种为9 5 可见乙品种的相对变异程度较大 第三节变异数 但是在使用变异系数时 应该认识到它同时受标准差和平均数的影响 因此 在使用变异系数表示样本变异程度时 宜同时列举平均数和标准差 否则可能会引起误解 将变量送入右侧文本框 选择点击Continue 点击Ok 练习题1 在同一稀释度的10个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 96 127 86 单位 个 利用Excel和SPSS分别计算其变异系数 练习题2 见附注课题数表 多组变量与SPSS统计值实现 1 利用SPSS分别计算其平均值 标准差 标准误 2 利用Sigmaplot作柱形图 含标准误 要求苗高为一张图 地径为另一张图 第四节可疑数值的取舍 1 可疑数据的概念在测量中有时会出现过高或过低的测量值 这种数据称为可疑数据或逸出值 outlier 2 可以数值的取舍 拉依达法 肖维纳特法 格拉布斯法 拉伊达法 当试验次数较多时 可简单地用3倍标准偏差 3s 作为确定可疑数据取舍的标准 当某一测量数据 与其测量结果的算术平均值 之差大于3倍标准偏差时 用公式表示为 则该测量数据应舍弃 先对数据排序 然后对极值按公式取舍 例 对一批苗木随机抽取10株测定其苗高 测定值分别为24 8 27 0 25 5 25 2 58 0 25 8 25 0 26 0 24 5 10 3cm 试用拉伊达法排除可疑值 取3 的理由是 根据随机变量的正态分布规律 在多次试验中 测量值落在x 3 与x 3 之间的概率为99 73 出现在此范围之外的概率仅为0 27 也就是在近400次试验中才能遇到一次 这种事件为小概率事件 出现的可能性很小 几乎是不可能 因而在实际试验中 一旦出现 就认为该测量数据是不可能的 应将其舍弃 第四节可疑数值剔除及正态与方差齐次性判断 SPSS实现1建立数表2Analyze DescriptiveStatistics Explore3选择分析变量Dependent 分组变量Factor及标示变量Labelcasesby4选择描述统计量Statistics5剔除可疑值 判断正态性与方差齐次性 选择Plots菜单6读取结果 第五节数据标准化 一 数据标准化的意义不同要素的数据往往具有不同的单位和量纲 其数值的变异可能是很大的 这就会对统计结果产生影响 因此 在聚类分析 主成分分析之前 首先要对要素进行数据处理 第五节数据标准化 二 数据标准化的方法 标准差标准化 标准化后各要素平均值为0 标准差为1 SPSS实现 第五节数据标准化 二 数据标准化的方法 极差标准化 标准化后各要素的极大值为1 极小值为0 其余的数值均在0与1之间 第五节数据标准化 二 数据标准化的方法 极大值标准化 例 在同一稀释度的9个培养皿中 计算出微生物数量分别为148 92 115 132 89 108 160 127 86 单位 个 分别试用标准差法 极差法和最大值法对上述数据进行标准化处理 第六节数据转化 为什么进行数据转化参数统计分析方法对资料有一定的要求 如t检验和方差分析要求样本来自正态分布总体 并且方差齐同 直线相关 回归 分析要求两变量间呈直线关系 但实际工作中并非所有的统计资料都能满足参数统计分析方法的条件 对于不能满足条件的资料 则不能直接应用参数统计分析方法 否则有可能导致错误的结论 数据转换的常用方法 对数变换 transformationoflogarithm 将原始数据X取对数 以其对数值作为分析变量 对数变换的用途 使服从对数正态分布的资料正态化 使方差不齐且各组的接近的资料达到方差齐的要求 使曲线直线化 常用于曲线拟合 数据转换的常用方法 平方根变换 squareroottransformation 将原始数据X的平方根作为分析变量 平方根变换的用途 使服从Poisson分布的计数资料 或轻度偏态资料正态化 使方差不齐且各样本的方差与均数间呈正相关的资料达到方差齐的要求 数据转换的常用方法 平方根反正弦变换 arcsinetrasformationofsquareroot 将原始数据X的平方根反正弦作为分析变量 平方根反正弦变换的用途 使总体率较小 70 的二项分布资料达到正态或方差齐的要求 三角函数转换有范围限制 在 1到 1范围之内的数值才能进行转换 如成活率 浓度 小数 相对生长率 小数 SPSS如何实现数据转化 对数Transform Compute过程目标变量框 Traget 取要转换后生成的新变量名字表达式框 NumericExpress 中如下设置 对数 LN 原始变量名 点击OK完成平方根Transform Compute过程目标变量框 Traget 取要转换后生成的新变量名字表达式框 NumericExpress 中如下设置 对数 SQRT 原始变量名 点击OK完成平方根反正弦Transform Compute过程目标变量框 Traget 取要转换后生成的新变量名字表达式框 NumericExpress 中如下设置 反正弦 ARSIN SQRT 原始变量名 点击OK完成 举例 应用 Therelativegrowthrate RGR foreachmethodwascalculatedfromthefollowingexpression RGR ln M2 ln M1 t2 t1 whereln M2 andln M1 denotethemeanln transformedplantdrymassattimet1andt2 respectively Gonz lez Rodr guezV Navarro CerrilloRM andVillarR 2011 ArtificialregenerationwithQuercusilexL andQuercussuberL bydirectseedingandplantinginsouthernSpain AnnalsofForestScience 68 637 646 描述 DatawereanalyzedstatisticallyusingSPSSv 18 SPSSInc Chicago IL USA TheexplorefunctionofSPSSwasusedtoexaminedatafornormality andpercentrootbiomassandpercentEMFcolonizationwerearcsinetransformedpriortoanalyses Kleczewskietal 2012 KleczewskiNM HermsDA BonelloP 2012 Nutrientandwateravailabilityalterbelowgroundpattersofbiomassallocation carbonpartitioning andectomycorrhizalabundanceinBetulanigra Tree 26 525 533 第七节t检验 T检验 亦称studentt检验 Student sttest 主要用于样本含量较小 例如n 30 总体标准差 未知的正态分布资料 t检验是戈斯特为了观测酿酒质量而发明的 戈斯特在位于都柏林的健力士酿酒厂担任统计学家 基于ClaudeGuinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策 戈斯特于1908年在Biometrika上公布t检验 但因其老板认为其为商业机密而被迫使用笔名 学生 第七节t检验 t检验前 首先利用explore进行判断数据是否满足正态 方差齐次性条件 满足即可进行t检验 若不满足 则需将数据进行转换 然后再次利用explore进行判断是否满足 满足后才能进行t检验 如果数据转换后实在无法条件 则进行非参数检验 非参数检验单样本检验 Wilcoxon符号秩检验两配对样本检验 Wilcoxon符号秩检验两独立样本检验 Mann WhitneyU检验 第七节t检验 单总体t检验 检验一个样本平均数与一个已知的总体平均数的差异是否显著 样本平均数 整体平均数 样本标准差 样本数量查t表判断显著性 如 全国大学生英语四级平均成绩为66分 北林2010级林学1班参加英语四级考试的人数为25人 平均成绩为75分 标准差为4 82 该班级学生英语成绩是否与全国成绩存在显著差异 第七节t检验 双总体t检验 相关样本 配对 独立样本 相关样本平均数差异的显著性检验 用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性 这两种情况组成的样本即为相关样本 独立样本平均数的显著性检验 各实验处理组之间毫无相关存在 即为独立样本 该检验用于检验两组非相关样本被试所获得的数据的差异性 第七节t检验 双总体检验 配对样本 为检验人对某品牌酒饮用清晰度的影响 随机选取8个人 分别测定饮用该酒前后的清晰度 数据如下 第七节t检验 双总体检验 配对样本 配对样本t检验实际上是先求出每对观测值之差值 对差值变量求均值 检验配对变量均值之间差异是否显著 其实质检验的假设 是差值变量的均值与零均值之间差异的显著性 如果差值变量为x 差值变量的均值为 样本观测数为n 差值变量的标准差为S 差值变量的均值标准误为 配对样本t检验的t值计算公式为 第七节t检验 双总体检验 配对样本 SPSS实现建立数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年绿色循环农业租赁合作协议书
- 2025太原市商业地产租赁合同(含装修及运营管理)
- 2025年度甲级商务办公场地租赁及设备安装合同
- 2025年跨境电商进口食品代理协议
- 2025年仓库日常管理实操指南及答案速查
- 文化产业基金合伙协议
- 2025年新型环保城市清洁车租赁与综合垃圾清运管理合同
- 2025年电工技术考核模拟题及答案参考
- 2025年个人住房抵押贷款合同样本:房产抵押贷款流程与法律保障
- 太平洋保险营销策划书范本
- 护士临床思维建立
- 公共场所卫生知识培训材料
- 证据目录范本
- 标准档案盒脊背(格式已设置好)
- GB/T 21475-2008造船指示灯颜色
- 园林绿化工高级技师知识考试题库(附含答案)
- 安医大生殖医学课件04胚胎的培养
- 可下载打印的公司章程
- 关于推荐评审高级工程师专业技术职务的推荐意见报告
- Q∕GDW 10356-2020 三相智能电能表型式规范
- 教研工作手册
评论
0/150
提交评论