


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
p值是怎么来的从人群中抽取(1)该样本最初是从总体中提取的,差异是由抽样误差引起的;(2)这个样本不是从整体抽取的,所以它是不同的。如何判断原因?统计显著性检验取决于判断。该方法包括以下步骤:(1)建立一个检验假设(也称为无效假设,符号H0):如果要比较甲药和乙药的疗效是否相等,假设两组样本来自同一个人群,即甲药和乙药的总疗效相等,这种差异只是由于抽样误差造成的偶然。选择合适的统计方法计算H0持有的概率,即概率用P值表示。(3)、根据选定的显著性水平(0.05或0.01),决定接受或拒绝H0。如果p 0.05,如果不能拒绝“差异是由采样误差引起的”,则h0被接受。如果p 0.05或p 0.05,符合率大于5%,这不能否定两组间无显著差异的无效假设。P 0.05,符合率小于5%,可用来否定两组间存在显著差异的无效假设。P 0.01,意外发生的概率小于1%,可以否定零假设。两者之间的差异非常显著。为了理解P值,必须注意以下几点:P的显著性并不表示两组之间差异的大小。p反映两组之间的差异是否有统计学意义,并不表示差异的大小。因此,与对照组相比,药物c获得p 0.05,药物d获得p 0.05时,差异不显著。根据统计学原理,无效假设是不可否认的,但是不相信无效假设是绝对正确的。在药物效应的统计分析中,这并不意味着两种药物是等同的。“两组间无显著差异”和“两组基本相当”的同一方法没有统计依据。(3)统计主要由以上三个p值表示,也可以计算出确切的p值。有些人使用p 0.001,这是不必要的。(4)显著性检验只是一个统计结论。判断差异还取决于专业知识。从样本中获得的样本统计数据将不同于总体参数,这可能是由于两个原因。p值是最常用的统计指标。几乎所有的统计软件输出结果都有P值。有必要了解P值的来源、计算和意义。统计显著性(P值)(这是经理们每次争论的焦点)结果的统计显著性是对结果的真实程度的估计方法(它可以代表整个人口)。从专业角度来说,P值是结果可靠性的递减指标。P值越大,我们越不能认为样本中变量的相关性是总体中变量相关性的可靠指标。P值是观察结果被认为是有效的误差概率,也就是说,它通常是有代表性的。例如,p=0.05表示样本中5%的变量关联可能是由偶然因素引起的。也就是说,假设人群中的任何变量之间没有相关性,我们重复类似的实验,并找到大约20个实验中的一个。我们研究的变量的相关性将等于或强于我们的实验结果。(这并不意味着如果变量之间存在相关性,我们可以得到相同结果的5%或95%倍。当群体中的变量之间存在相关性时,重复研究和发现相关性的可能性与设计的统计有效性相关。在许多研究领域,0.05的P值通常被认为是可接受的错误边界水平。如何判断结果具有现实意义在最后的结论中,判断什么程度的显著性在统计学上是显著的,并且不可避免地是任意的。换句话说,对结果无效和被拒绝的级别的选择是任意的。在实践中,最终的决策通常取决于数据集比较和分析过程中的结果是在先的还是仅是平均数之间的两两比较,取决于在整个数据集中具有一致结论的支持证据的数量,以及取决于该研究领域中过去的实践。一般来说,在许多科学领域中,P 0.05的结果被认为是统计显著性的边界,但显著性水平也包括较高的出错可能性。结果0.05p0.01被认为具有统计学意义,而0.01p0.001被认为具有高度统计学意义。然而,应该注意的是,这种分类只是一种基于研究的非正式判断程序。所有的测试统计数据都是正态分布的吗?不完全是,但大多数测试都直接或间接与它相关,并可以从正态分布,如T检验,F检验或卡方检验。这些测试通常要求所分析的变量在人群中呈正态分布,即符合所谓的正态假设。许多观察到的变量确实是正态分布的,这就是为什么正态分布是真实世界的基本特征。当人们使用建立在正态分布基础上的检验来分析非正态分布变量的数据时,就会出现问题(见非参数和方差分析的正态检验)。在这种情况下,有两种方法:一种是使用替代的非参数检验(即无分布检验),但这种方法不方便,因为从它提供的结论形式来看,这种方法在统计学上是低效和不灵活的。另一种方法是:当确定样本量足够大时,通常可以使用基于正态分布的检验。后一种方法基于一个非常重要的原则,在基于正态方程的整体测试中起着极其重要的作用。也就是说,随着样本量的增加,样本分布的形状趋于正态,即使所研究的变量分布不是正态的。1统计软件的选择在统计分析中,作者经常使用非专业的数学统计软件Excel进行统计分析。由于Excel提供的统计分析功能有限,难以满足实际需要。目前,世界上有许多专门为统计分析开发的商业软件,如SPSS(社会科学统计软件包)、SAS(统计分析系统)、BMDP和Statistica。其中,SPSS是专门为社会科学领域的研究人员设计的(然而,该软件也广泛应用于自然科学领域);BMDP是一个专门为生物学和医学研究者编写的统计软件。目前,国际学术界有一个不成文的共识,即在国际学术交流中,用SPSS和SAS软件进行统计分析得到的结果不需要指定具体的算法。因此,SPSS和SAS软件已经被各个领域的研究者广泛认可。建议作者在统计分析中尝试使用这两种特殊的统计软件。2平均值的计算在处理实验数据或采样数据时,我们经常会遇到在相同的采样或相同的实验条件下,同一随机变量的多个不同值的统计处理问题。这时,大多数作者会不假思索地直接给出算术平均值和标准差。显然,这种做法并不严格。在数理统计中,有算术平均数、几何平均数和中位数作为描述随机变量总体大小特征的统计量。算术平均数是什么时候使用的?何时使用几何平均值?何时使用中位数?这不能由研究者根据他们的主观意愿随机决定,而应该根据随机变量的分布特征来决定。反映随机变量总体规模特征的统计是数学期望,当随机变量的分布服从正态分布时,总体的数学期望是其算术平均值。此时,随机变量的大小特征可以用样本的算术平均值来描述。如果研究的随机变量不服从正态分布,算术平均值就不能准确地反映变量的大小特征。在这种情况下,我们可以通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,随机变量总体的大小可以用几何平均来描述。此时,可以计算变量的几何平均值。如果随机变量不服从正态分布或对数正态分布,那么根据现有的数理统计知识,就没有合适的统计量来描述变量的大小特征。其次,中位数可以用来描述变量的大小特征。3相关分析中相关系数的选择在相关分析中,作者经常犯简单计算皮尔逊积矩相关系数的错误,既没有给出正态分布检验结果,也没有明确指出计算出的相关系数就是皮尔逊积矩相关系数。常见的相关系数包括皮尔逊积矩相关系数、斯皮尔曼秩相关系数和肯德尔秩相关系数。其中,皮尔逊积矩相关系数可以用来描述两个随机变量的线性相关程度(相应的相关分析方法称为“参数相关分析”,测试效率高,测试结果清晰);Spearman或Kendall秩相关系数用于判断两个随机变量在二维和多维空间中是否具有一定的协变趋势,而不管其变化幅度如何(相应的相关分析称为“非参数相关分析”,其检验功效略低于参数方法,且检验结果不如参数方法清晰)。各种成熟的统计软件如SPSS和SAS都提供了这些相关系数的计算模块。在相关分析中,计算各种相关系数是有前提的。对于二元相关分析,如果数据转换后两个随机变量服从二元正态分布或两个随机变量服从二元正态分布,可以用皮尔逊积矩相关系数来描述两个随机变量之间的相关性(此时描述的是线性相关),而功效较低的斯皮曼或肯德尔秩相关系数则不合适。如果样本数据或其转换值不服从正态分布,计算皮尔逊积矩相关系数是没有意义的。其次,斯皮曼或肯德尔等级相关系数只能在此时计算(尽管这样做会导致测试功效的降低)。因此,在报告相关分析结果时,还应提供正态分布测试结果,以证明所选相关系数的计算是适当的。应该指出的是,由于Spearman或Kendall秩相关系数是一个基于序列变量(秩)设计的相关系数,如果收集的数据不是一个确定的值,而只是一个秩,则使用Spearman或Kendall秩相关系数的非参数相关分析成为唯一的选择。4相关分析和回归分析的区别相关分析和回归分析是两种常用的数理统计方法,广泛应用于地质研究领域。然而,这两种数理统计方法在计算上有许多相似之处,而且这两种数理统计方法之间的内在差异在一些数理统计教材中没有得到系统的阐述,这使得一些研究者无法严格区分相关分析和回归分析。最常见的错误是用回归分析的结果来解释相关性问题。例如,作者将“回归线(曲线)图”称为“相关图”或“相关图”;回归线的R2(拟合度,或“可确定系数”)被错误地称为“相关系数”或“相关系数的平方”;根据回归分析的结果,这两个变量之间存在正相关或负相关。这些情况在中国非常普遍。相关分析和回归分析都是研究两个或两个以上随机变量之间相关性的方法,但这两种数理统计方法有本质区别,即它们用于不同的研究目的。相关性分析的目的是检验两个随机变量的协变趋势(即协变程度),而回归分析的目的是试图用自变量来预测因变量的值。在相关性分析中,两个变量必须同时是随机变量。如果其中一个变量不是随机的,就不能进行相关性分析。这由相关性分析方法本身决定。对于回归分析,因变量肯定是随机变量(由回归分析方法本身决定),而自变量可以是普通变量(标准名称是“固定变量”,有一个确定的值)或随机变量。如果自变量是一个普通变量,所用的回归方法是最常用的“最小二乘法”,即模型一回归分析;如果自变量是一个随机变量,所用的回归方法与计算器的目的有关“最小二乘法”仍用于预测目的,而相对严格的“主轴法”、“简化主轴法”或“巴特利特法”,即模型二回归分析,必须用于估计目的。显然,对于回归分析,如果是模型一回归分析,就不可能回答变量的“相关性”问题,因为在普通变量和随机变量之间没有“相关性”的概念(问题是大多数回归分析是模型一回归分析!).此时,即使作者想要描述两个变量之间的“协变趋势”并使用相关性分析来代替,分析结果也将是无意义的,因为相关性分析的前提不存在。如果是模型二的回归分析,由于两个随机变量之间客观上存在“相关性”问题,但由于回归分析方法本身不能为自变量和因变量之间的相关性提供准确的检验方法,因此最好不要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年 延安市特岗教师招聘考试笔试试题附答案
- 药用包装材料生产项目可行性研究报告(申请备案案例)
- 中国PBN棒行业市场全景监测及投资前景展望报告
- 中国车间除尘设备行业投资潜力分析及行业发展趋势报告
- 2025年 德州庆云县卫生健康系统招聘考试笔试试题附答案
- 2025年 北京大兴区安定镇委托招聘考试笔试试题附答案
- 年电解水制氢研究分析报告
- 2025年中国汽车用镀锌板行业市场深度分析及投资策略咨询报告
- 2024年全球及中国储能服务行业头部企业市场占有率及排名调研报告
- 民政志愿者培训课件
- 湖南中医药大学湘杏学院《民族地区社会工作》2023-2024学年第一学期期末试卷
- 出版策划实务知到智慧树章节测试课后答案2024年秋吉林师范大学
- 电梯工程师述职报告
- 汽车维修企业安全生产事故隐患排查治理制度
- 《国土空间规划》-实验教学大纲
- 小学英语时态练习大全(附答案)-小学英语时态专项训练及答案
- 带转速微分负反馈的双闭环直流调速系
- 防暑应急救援演练脚本
- 国家公务员考试行测行政职业能力测验(行政执法)2025年模拟试题及答案解析
- 广东省茂名市直属学校2023-2024学年七年级下学期期末数学试题
- 江西省九江市2023–2024学年八年级下学期期末考试道德与法治试题(无答案)
评论
0/150
提交评论