统计学-假设检验的原理与一般步骤_第1页
统计学-假设检验的原理与一般步骤_第2页
统计学-假设检验的原理与一般步骤_第3页
统计学-假设检验的原理与一般步骤_第4页
统计学-假设检验的原理与一般步骤_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验的原理与一般步骤授课教师:褚启龙.回顾:统计工作的步骤设计—以拟解决问题的形式让大家思考并进行了讨论;搜集资料—现场测量了身高、体重和血压值;整理资料—将数据录入计算机保存、频数表和统计表;

统计描述…….用什么指标描述?分析资料参数估计(点值/区间估计)

统计推断

(何方法?)

假设检验

(常用推断方式)

.怎么选择指标?用什么指标来进行描述是一个专业问题,描述一种现象的指标可能很多。如描述“脂质过氧化”的指标就有:SOD、GSH、丙二醛等,他们都是数值变量资料(计量资料);再如描述“DNA损伤”的指标有:细胞核损伤率和尾相(OTM),前者是计数资料,后者是计量资料。为什么反复提资料的类型?因为它决定我们选用何种检验方法.以何种形式来描述资料的趋势?

集中趋势指标(x、G、M、Px)

数值变量资料离散趋势指标(R、S2、S等)

怎么计算主要靠大家自学分类变量资料:相对数(率、构成比、相对比),主要用到的是率和率的标准误。

对于均数/率(构成比)之间的比较,一般采用假设检验注意指标适用范围.代表值算术均数(简称均数),适用于对称分布尤其是正态分布资料.代表值几何均数,适用于等比级数资料或对数正态分布资料.代表值中位数与百分位数,适用于偏态分布或分布不清楚的资料,或有特大/小值,或没有边际的值1、直接由原始数据计算中位数

将观察值从小到大排序X(1)、X(2)、…、X(n)

n奇M=X((n+1)/2)n偶M=(X(n/2)+X(n/2+1))/2.代表值2、频数表法计算中位数与百分位数其中fx为Px所在组段的频数;i为该组段的组距,L为中位数所在组的下限,ΣfL为小于L各组段的累计频数。当x=50,P50即为中位数。.离散趋势指标/变异指标有全距、四分位间距、离均差平方和、方差、标准差和变异系数,其中主要是标准差。

全距(range)极差R=max-min

Q=p75-p25=Qu-QL.离散趋势指标/变异指标方差总体方差σ2=在样本中,μ未知,常用S2替代S2=其中n-1为自由度.离散趋势指标/变异指标标准差(standarddeviation,SD)总体标准差σ=μ未知,样本标准差

.离散趋势指标/变异指标

变异系数(coefficientofvariation,CV)适用于各组观察值单位不同或单位虽同而平均数相差很大的情况。.什么是假设检验?

是先对总体指标或总体分布作出某种假设,然后根据样本提供的信息来推断这种假设是否成立,从而了解总体特征或分布情况。

它是一种统计推断方式,有很多具体的方法,如:t检验、u检验、方差分析、检验、相关分析、回归分析等,而每种方法中又有不同的类型。

是对总体进行假设对于具体问题而言,到底用哪种推断方法中的哪种类型来处理,这是本课程的核心问题,也是难点。.

假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。

假设检验的基本思想与步骤.例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?130.83g/L≠140g/L?原因:1.是抽样造成的(表面上)

2.可能是总体均数不同(本质上)

如果我们排除了抽样误差导致的差异,那么比较双方就实实在在存在差异..③

H1的内容直接反映了检验单双侧。若H1中只是

0或

<

0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。④

单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。.

(3)检验水准

,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取

=0.05。也可根据不同研究目的给予不同设置。重要术语及其意义:

常将P≦0.05或0.01的事件称为小概率事件,小概率事件在一次试验中是不可能发生的。.

根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量,如t值、u值、F值、值等,先选择统计方法,然后计算相应的统计量。

注意:每种方法中又有不同的类型,需要综合判断。2.计算检验统计量.

P的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。

根据统计量、自由度等信息查相应界值表确定P值范围,也就是给P值定性,看它是大于还是小于等于;如果采用SPSS软件分析,则直接给出的是具体的P值,省得我们查表。

3.确定P值.4.下结论.

若,是否也能下“无差别”或“相等”的结论?

.预习:均数比较的t检验(P22~24)样本均数与总体均数比较配对计量资料比较两独立样本均数比较(小样本)两大样本均数比较的u检验(P24~25)方差分析(P50~54)

完全随机设计(成组设计)配伍组设计

主要看资料类型、设计方式、推断目的和应用条件.

谢谢!.抽样误差大小的衡量标准误(standarderrow,SE)样本均数的标准差称为标准误(),反映了用样本均数代替总体均数的可靠性程度的大小,增加样本容量可以降低抽样误差。σ已知时

=σ/(相对准确).

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论