统计分析-P值的含义_第1页
统计分析-P值的含义_第2页
统计分析-P值的含义_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

P 值是怎么来的值是怎么来的 从某总体中抽从某总体中抽 这一样本是由该总体抽出 其差别是由抽样误差所致 这一样本是由该总体抽出 其差别是由抽样误差所致 这一样本不是从该总体抽出 所以有所不同 这一样本不是从该总体抽出 所以有所不同 如何判断是那种原因呢 统计学中用显著性检验赖判断 其步骤是 如何判断是那种原因呢 统计学中用显著性检验赖判断 其步骤是 建立检验假设 又称 建立检验假设 又称无效假设无效假设 符号为 符号为 H0 如要比较 如要比较 A 药和药和 B 药的疗效是否相等 则假设两组样药的疗效是否相等 则假设两组样 本来自同一总体 即本来自同一总体 即 A 药的总体疗效和药的总体疗效和 B 药相等 差别仅由抽样误差引起的碰巧出现的 药相等 差别仅由抽样误差引起的碰巧出现的 选择适当的统 选择适当的统 计方法计算计方法计算 H0 成立的可能性即概率有多大 概率用成立的可能性即概率有多大 概率用 P 值表示 值表示 根据选定的显著性水平 根据选定的显著性水平 0 05 或或 0 01 决定接受还是拒绝决定接受还是拒绝 H0 如果 如果 P 0 05 不能否定 不能否定 差别由抽样误差引起差别由抽样误差引起 则接受 则接受 H0 如果如果 P 0 05 或或 P 0 01 可以认为差别不由抽样误差引起 可以拒绝 可以认为差别不由抽样误差引起 可以拒绝 H0 则 则可以接受令一种可能性的假设 又称备选假设 可以接受令一种可能性的假设 又称备选假设 符号为符号为 H1 即两样本来自不同的总体 所以两药疗效有差别 即两样本来自不同的总体 所以两药疗效有差别 统计学上规定的统计学上规定的 P 值意义见下表值意义见下表 P 值值 碰巧的概率碰巧的概率 对无效假设对无效假设 统计意义统计意义 P 0 05 碰巧出现的可能性大于碰巧出现的可能性大于 5 不能否定无效假设不能否定无效假设 两组差别无显著意义两组差别无显著意义 P 0 05 碰巧出现的可能性小于碰巧出现的可能性小于 5 可以否定无效假设可以否定无效假设 两组差别有显著意义两组差别有显著意义 P 0 01 碰巧出现的可能性小于碰巧出现的可能性小于 1 可以否定无效假设可以否定无效假设 两者差别有非常显著意义两者差别有非常显著意义 理解理解 P 值 下述几点必须注意 值 下述几点必须注意 P 的意义不表示两组差别的大小 的意义不表示两组差别的大小 P 反映两组差别有无统计学意义 并不表示差别大小 因此 与对照反映两组差别有无统计学意义 并不表示差别大小 因此 与对照 组相比 组相比 C 药取得药取得 P 0 05 D 药取得药取得 P 0 01 并不表示并不表示 D 的药效比的药效比 C 强 强 P 0 05 时 差异无显著意义 根据统计学原理可知 不能否认无效假设 但并不认为无效假设肯定成时 差异无显著意义 根据统计学原理可知 不能否认无效假设 但并不认为无效假设肯定成 立 在药效统计分析中 更不表示两药等效 哪种将立 在药效统计分析中 更不表示两药等效 哪种将 两组差别无显著意义两组差别无显著意义 与与 两组基本等效两组基本等效 相同的做法是缺相同的做法是缺 乏统计学依据的 乏统计学依据的 统计学主要用上述三种统计学主要用上述三种 P 值表示 也可以计算出确切的值表示 也可以计算出确切的 P 值 有人用值 有人用 P 0 001 无此必要 无此必要 显著性检验只是统计结论 判断差别还要根据专业知识 样所得的样本 其统计量会与总体参数有所不显著性检验只是统计结论 判断差别还要根据专业知识 样所得的样本 其统计量会与总体参数有所不 同 这可能是由于两种原因同 这可能是由于两种原因 P P 值是最常用的一个统计学指标 几乎统计软件输出结果都有值是最常用的一个统计学指标 几乎统计软件输出结果都有 P P 值 了解值 了解 p p 值的由来 计算和意义很有必值的由来 计算和意义很有必 要 要 统计学意义 统计学意义 p 值 这是经理每次争论的焦点 值 这是经理每次争论的焦点 结果的统计学意义是结果真实程度 能够代表总体 的一种估计方法 专业上 结果的统计学意义是结果真实程度 能够代表总体 的一种估计方法 专业上 p 值为结果可信程度的值为结果可信程度的 一个递减指标 一个递减指标 p 值越大 我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标 值越大 我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标 p 值是将观察值是将观察 结果认为有效即具有总体代表性的犯错概率 如结果认为有效即具有总体代表性的犯错概率 如 p 0 05 提示样本中变量关联有提示样本中变量关联有 5 的可能是由于偶然性造成的可能是由于偶然性造成 的 即假设总体中任意变量间均无关联 我们重复类似实验 会发现约的 即假设总体中任意变量间均无关联 我们重复类似实验 会发现约 20 个实验中有一个实验 我们所研究个实验中有一个实验 我们所研究 的变量关联将等于或强于我们的实验结果 这并不是说如果变量间存在关联 我们可得到的变量关联将等于或强于我们的实验结果 这并不是说如果变量间存在关联 我们可得到 5 或或 95 次数的次数的 相同结果 当总体中的变量存在关联 重复研究和发现关联的可能性与设计的统计学效力有关 在许多研究相同结果 当总体中的变量存在关联 重复研究和发现关联的可能性与设计的统计学效力有关 在许多研究 领域 领域 0 05 的的 p 值通常被认为是可接受错误的边界水平 值通常被认为是可接受错误的边界水平 如何判定结果具有真实的显著性如何判定结果具有真实的显著性 在最后结论中判断什么样的显著性水平具有统计学意义 不可避免地带有武断性 换句话说 认为结果在最后结论中判断什么样的显著性水平具有统计学意义 不可避免地带有武断性 换句话说 认为结果 无效而被拒绝接受的水平的选择具有武断性 实践中 最后的决定通常依赖于数据集比较和分析过程中结果是无效而被拒绝接受的水平的选择具有武断性 实践中 最后的决定通常依赖于数据集比较和分析过程中结果是 先验性还是仅仅为均数之间的两两先验性还是仅仅为均数之间的两两 比较 依赖于总体数据集里结论一致的支持性证据的数量 依赖于以往该比较 依赖于总体数据集里结论一致的支持性证据的数量 依赖于以往该 研究领域的惯例 通常 许多的科学领域中产生研究领域的惯例 通常 许多的科学领域中产生 p 值的结果值的结果 0 05 被认为是统计学意义的边界线 但是这显著被认为是统计学意义的边界线 但是这显著 性水平还包含了相当高的犯错可能性 结果性水平还包含了相当高的犯错可能性 结果 0 05 p 0 01 被认为是具有统计学意义 而被认为是具有统计学意义 而 0 01 p 0 001 被认为被认为 具有高度统计学意义具有高度统计学意义 但要注意这种分类仅仅是研究基础上非正规的判断常规 但要注意这种分类仅仅是研究基础上非正规的判断常规 所有的检验统计都是正态分布的吗 所有的检验统计都是正态分布的吗 并不完全如此 但大多数检验都直接或间接与之有关 可以从正态分布中推导出来 如并不完全如此 但大多数检验都直接或间接与之有关 可以从正态分布中推导出来 如 t 检验 检验 f 检验或检验或 卡方检验 这些检验一般都要求 所分析变量在总体中呈正态分布 即满足所谓的正态假设 许多观察变量的卡方检验 这些检验一般都要求 所分析变量在总体中呈正态分布 即满足所谓的正态假设 许多观察变量的 确是呈正态分布的 这也是正态分布是现实世界的基本特征的原因 当人们用在正态分布基础上建立的检验分确是呈正态分布的 这也是正态分布是现实世界的基本特征的原因 当人们用在正态分布基础上建立的检验分 析非正态分布变量的数据时问题就产生了 参阅非参数和方差分析的正态性检验 这种条件下有两种方法 析非正态分布变量的数据时问题就产生了 参阅非参数和方差分析的正态性检验 这种条件下有两种方法 一是用替代的非参数检验 即无分布性检验 但这种方法不方便 因为从它所提供的结论形式看 这种方法一是用替代的非参数检验 即无分布性检验 但这种方法不方便 因为从它所提供的结论形式看 这种方法 统计效率低下 不灵活 另一种方法是 当确定样本量足够大的情况下 通常还是可以使用基于正态分布前提统计效率低下 不灵活 另一种方法是 当确定样本量足够大的情况下 通常还是可以使用基于正态分布前提 下的检验 后一种方法是基于一个相当重要的原则产生的 该原则对正态方程基础上的总体检验有极其重要的下的检验 后一种方法是基于一个相当重要的原则产生的 该原则对正态方程基础上的总体检验有极其重要的 作用 即 随着样本量的增加 样本分布形状趋于正态 即使所研究的变量分布并不呈正态 作用 即 随着样本量的增加 样本分布形状趋于正态 即使所研究的变量分布并不呈正态 1 统计软件的选择统计软件的选择 在进行统计分析时 作者常使用非专门的数理统计软件在进行统计分析时 作者常使用非专门的数理统计软件 Excel 进行统计分析 由于进行统计分析 由于 Excel 提供的统计分提供的统计分 析功能十分有限 很难满足实际需要 目前 国际上已开发出的专门用于统计分析的商业软件很多 比较著名析功能十分有限 很难满足实际需要 目前 国际上已开发出的专门用于统计分析的商业软件很多 比较著名 有有 SPSS Statistical Package for Social Sciences SAS Statistical Analysis System BMDP 和和 STATISTICA 等 其中 等 其中 SPSS 是专门为社会科学领域的研究者设计的 但是 此软件在自然科学领域也得到是专门为社会科学领域的研究者设计的 但是 此软件在自然科学领域也得到 广泛应用 广泛应用 BMDP 是专门为生物学和医学领域研究者编制的统计软件 目前 国际学术界有一条不成文的是专门为生物学和医学领域研究者编制的统计软件 目前 国际学术界有一条不成文的 约定 凡是用约定 凡是用 SPSS 和和 SAS 软件进行统计分析所获得的结果 在国际学术交流中不必说明具体算法 由此可软件进行统计分析所获得的结果 在国际学术交流中不必说明具体算法 由此可 见 见 SPSS 和和 SAS 软件已被各领域研究者普遍认可 建议作者们在进行统计分析时尽量使用这软件已被各领域研究者普遍认可 建议作者们在进行统计分析时尽量使用这 2 个专门的统个专门的统 计软件 计软件 2 均值的计算均值的计算 在处理实验数据或采样数据时 经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值在处理实验数据或采样数据时 经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值 进行统计处理的问题 此时 多数作者会不假思索地直接给出算术平均值和标准差 显然 这种做法是不严谨进行统计处理的问题 此时 多数作者会不假思索地直接给出算术平均值和标准差 显然 这种做法是不严谨 的 在数理统计学中 作为描述随机变量总体大小特征的统计量有算术平均值 几何平均值和中位数等 何时的 在数理统计学中 作为描述随机变量总体大小特征的统计量有算术平均值 几何平均值和中位数等 何时 用算术平均值 何时用几何平均值 以及何时用中位数 这不能由研究者根据主观意愿随意确定 而要根据随用算术平均值 何时用几何平均值 以及何时用中位数 这不能由研究者根据主观意愿随意确定 而要根据随 机变量的分布特征确定 反映随机变量总体大小特征的统计量是数学期望 而在随机变量的分布服从正态分布机变量的分布特征确定 反映随机变量总体大小特征的统计量是数学期望 而在随机变量的分布服从正态分布 时 其总体的数学期望就是其算术平均值 此时 可用样本的算术平均值描述随机变量的大小特征 如果所研时 其总体的数学期望就是其算术平均值 此时 可用样本的算术平均值描述随机变量的大小特征 如果所研 究的随机变量不服从正态分布 则算术平均值不能准确反映该变量的大小特征 在这种情况下 可通过假设检究的随机变量不服从正态分布 则算术平均值不能准确反映该变量的大小特征 在这种情况下 可通过假设检 验来判断随机变量是否服从对数正态分布 如果服从对数正态分布 则可用几何平均值描述该随机变量总体的验来判断随机变量是否服从对数正态分布 如果服从对数正态分布 则可用几何平均值描述该随机变量总体的 大小 此时 就可以计算变量的几何平均值 如果随机变量既不服从正态分布也不服从对数正态分布 则按现大小 此时 就可以计算变量的几何平均值 如果随机变量既不服从正态分布也不服从对数正态分布 则按现 有的数理统计学知识 尚无合适的统计量描述该变量的大小特征 退而求其次 此时可用中位数来描述变量的有的数理统计学知识 尚无合适的统计量描述该变量的大小特征 退而求其次 此时可用中位数来描述变量的 大小特征 大小特征 3 相关分析中相关系数的选择相关分析中相关系数的选择 在相关分析中 作者们常犯的错误是简单地计算在相关分析中 作者们常犯的错误是简单地计算 Pearson 积矩相关系数 而且既不给出正态分布检验结积矩相关系数 而且既不给出正态分布检验结 果 也往往不明确指出所计算的相关系数就是果 也往往不明确指出所计算的相关系数就是 Pearson 积矩相关系数 常用的相关系数除有积矩相关系数 常用的相关系数除有 Pearson 积矩相积矩相 关系数外 还有关系数外 还有 Spearman 秩相关系数和秩相关系数和 Kendall 秩相关系数等 其中 秩相关系数等 其中 Pearson 积矩相关系数可用于描述积矩相关系数可用于描述 2 个随机变量的线性相关程度 相应的相关分析方法称为个随机变量的线性相关程度 相应的相关分析方法称为 参数相关分析参数相关分析 该方法的检验功效高 检验结果明 该方法的检验功效高 检验结果明 确 确 Spearman 或或 Kendall 秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势 秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势 而不考虑其变化的幅度 相应的相关分析称为而不考虑其变化的幅度 相应的相关分析称为 非参数相关分析非参数相关分析 该方法的检验功效较参数方法稍差 检验 该方法的检验功效较参数方法稍差 检验 结果也不如参数方法明确 各种成熟的统计软件如结果也不如参数方法明确 各种成熟的统计软件如 SPSS SAS 等均提供了这些相关系数的计算模块 在等均提供了这些相关系数的计算模块 在 相关分析中 计算各种相关系数是有前提的 对于二元相关分析 如果相关分析中 计算各种相关系数是有前提的 对于二元相关分析 如果 2 个随机变量服从二元正态分布 或个随机变量服从二元正态分布 或 2 个随机变量经数据变换后服从二元正态分布 则可以用个随机变量经数据变换后服从二元正态分布 则可以用 Pearson 积矩相关系数描述这积矩相关系数描述这 2 个随机变量间的相关个随机变量间的相关 关系 此时描述的是线性相关关系 而不宜选用功效较低的关系 此时描述的是线性相关关系 而不宜选用功效较低的 Spearman 或或 Kendall 秩相关系数 如果样本秩相关系数 如果样本 数据或其变换值不服从正态分布 则计算数据或其变换值不服从正态分布 则计算 Pearson 积矩相关系数就毫无意义 退而求其次 此时只能计算积矩相关系数就毫无意义 退而求其次 此时只能计算 Spearman 或或 Kendall 秩相关系数 尽管这样做会导致检验功效的降低 因此 在报告相关分析结果时 秩相关系数 尽管这样做会导致检验功效的降低 因此 在报告相关分析结果时 还应提供正态分布检验结果 以证明计算所选择的相关系数是妥当的 需要指出的是 由于还应提供正态分布检验结果 以证明计算所选择的相关系数是妥当的 需要指出的是 由于 Spearman 或或 Kendall 秩相关系数是基于顺序变量 秩 设计的相关系数 因此 如果所采集的数据不是确定的数值而仅仅秩相关系数是基于顺序变量 秩 设计的相关系数 因此 如果所采集的数据不是确定的数值而仅仅 是秩 则使用是秩 则使用 Spearman 或或 Kendall 秩相关系数进行非参数相关分析就成为唯一的选择 秩相关系数进行非参数相关分析就成为唯一的选择 4 相关分析与回归分析的区别相关分析与回归分析的区别 相关分析和回归分析是极为常用的相关分析和回归分析是极为常用的 2 种数理统计方法 在地质学研究领域有着广泛的用途 然而 由于种数理统计方法 在地质学研究领域有着广泛的用途 然而 由于 这这 2 种数理统计方法在计算方面存在很多相似之处 且在一些数理统计教科书中没有系统阐明这种数理统计方法在计算方面存在很多相似之处 且在一些数理统计教科书中没有系统阐明这 2 种数理统计种数理统计 方法的内在差别 从而使一些研究者不能严格区分相关分析与回归分析 最常见的错误是 用回归分析的结果方法的内在差别 从而使一些研究者不能严格区分相关分析与回归分析 最常见的错误是 用回归分析的结果 解释相关性问题 例如 作者将解释相关性问题 例如 作者将 回归直线 曲线 图回归直线 曲线 图 称为称为 相关性图相关性图 或或 相关关系图相关关系图 将回归直线的 将回归直线的 R2 拟拟 合度 或称合度 或称 可决系数可决系数 错误地称为错误地称为 相关系数相关系数 或或 相关系数的平方相关系数的平方 根据回归分析的结果宣称 根据回归分析的结果宣称 2 个变量之间个变量之间 存在正的或负的相关关系 这些情况在国内极为普遍 存在正的或负的相关关系 这些情况在国内极为普遍 相关分析与回归分析均为研究相关分析与回归分析均为研究 2 个或多个随机变量间关联性的方法 但个或多个随机变量间关联性的方法 但 2 种数理统计方法存在本质的差种数理统计方法存在本质的差 别 即它们用于不同的研究目的 相关分析的目的在于检验两个随机变量的共变趋势 即共同变化的程度 别 即它们用于不同的研究目的 相关分析的目的在于检验两个随机变量的共变趋势 即共同变化的程度 回归分析的目的则在于试图用自变量来预测因变量的值 在相关分析中 两个变量必须同时都是随机变量 如回归分析的目的则在于试图用自变量来预测因变量的值 在相关分析中 两个变量必须同时都是随机变量 如 果其中的一个变量不是随机变量 就不能进行相关分析 这是相关分析方法本身所决定的 对于回归分析 其果其中的一个变量不是随机变量 就不能进行相关分析 这是相关分析方法本身所决定的 对于回归分析 其 中的因变量肯定为随机变量 这是回归分析方法本身所决定的 而自变量则可以是普通变量 规范的叫法是中的因变量肯定为随机变量 这是回归分析方法本身所决定的 而自变量则可以是普通变量 规范的叫法是 固定变量固定变量 有确定的取值 也可以是随机变量 如果自变量是普通变量 采用的回归方法就是最为常用的 有确定的取值 也可以是随机变量 如果自变量是普通变量 采用的回归方法就是最为常用的 最小二乘法最小二乘法 即模型 即模型 回归分析 如果自变量是随机变量 所采用的回归方法与计算者的目的有关回归分析 如果自变量是随机变量 所采用的回归方法与计算者的目的有关 在以预在以预 测为目的的情况下 仍采用测为目的的情况下 仍采用 最小二乘法最小二乘法 在以估值为目的的情况下须使用相对严谨的 在以估值为目的的情况下须使用相对严谨的 主轴法主轴法 约化主轴约化主轴

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论