版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计量资料的统计推断计量资料的统计推断教师:卫生统计教研室 胡冬梅统计推断统计推断 在医学研究中,通常在总体中随机抽取一在医学研究中,通常在总体中随机抽取一定数量观察单位作为样本进行抽样研究,定数量观察单位作为样本进行抽样研究,然后有样本信息推断总体特征,这个过程然后有样本信息推断总体特征,这个过程称为统计推断称为统计推断样本样本抽取部分观察单位抽取部分观察单位 统计推断统计推断如:如:样本均数样本均数 样本标准差样本标准差S 样本率样本率 P如:如: 总体均数总体均数 总体标准差总体标准差 总体率总体率X统计推断主要内容:统计推断主要内容:n 均数的抽样误差与标准误均数的抽样误差与标准误n t
2、分布分布n 总体均数的估计总体均数的估计n 假设检验假设检验n t检验检验 抽样误差:由于抽样所引起的样本统计量(样抽样误差:由于抽样所引起的样本统计量(样本均数、标准差、样本率)间以及样本统计量本均数、标准差、样本率)间以及样本统计量与总体参数间的差异。(举例抽样误差的产生)与总体参数间的差异。(举例抽样误差的产生) 均数的抽样误差:由于抽样引起的样本均数以均数的抽样误差:由于抽样引起的样本均数以及样本均数与总体均数间的误差,即为标准误及样本均数与总体均数间的误差,即为标准误(样本均数的标准差,(样本均数的标准差,standard error of mean) 。 一、均数的分布及其标准误一
3、、均数的分布及其标准误 均数的抽样误差均数的抽样误差总体总体=5=5,=0.5=0.5 X样本号红细胞计数( 1012/L, )1234M5.59 5.11 4.26 5.11 4.74 5.554.65 4.65 5.59 5.70 4.46 5.324.56 4.87 5.21 4.53 4.53 4.234.08 4.73 4.84 4.88 4.65 5.33 5.16 4.49 5.26 5.02 4.64 4.565.045.034.714.664.900.440.520.330.460.29S 一、均数的分布及其标准误一、均数的分布及其标准误 数理统计的中心极限定理和大数定理表数
4、理统计的中心极限定理和大数定理表明:明: 从正态总体从正态总体N N(,2 2)中随机抽取)中随机抽取含量为含量为n n的样本,其样本均数服从正态分布;的样本,其样本均数服从正态分布;即使从偏态总体中随机抽样,当即使从偏态总体中随机抽样,当n n足够大时足够大时(如(如n30n30),样本均数也近似正态分布;),样本均数也近似正态分布; 从均数为从均数为,标准差为,标准差为的总体中随机抽取的总体中随机抽取含量为含量为n n的样本,则样本均数的均数也为的样本,则样本均数的均数也为,样本均数的标准差为样本均数的标准差为 。 xS 抽样分布抽样分布 抽样分布示意图抽样分布示意图 中心极限定理中心极限
5、定理: :一、均数的抽样误差与标准误一、均数的抽样误差与标准误 标准误反映了抽样误差的大小,标准误越小,标准误反映了抽样误差的大小,标准误越小,抽样误差越小,当标准误趋近于抽样误差越小,当标准误趋近于0,样本均数,样本均数趋近于总体均数,用样本均数估计总体均数可趋近于总体均数,用样本均数估计总体均数可靠程度高。靠程度高。S一定情况下,一定情况下,n越大,标准误越越大,标准误越小。小。 标准误计算:标准误计算: 当当已知已知 当当未知未知xnxSSn 标准误:样本均数的标准差标准误:样本均数的标准差 标准误标准误 标准差标准差2211kiixxkn个体差异个体差异样本均样本均数差异数差异 例例4
6、.1 4.1 在某地随机抽查成年男子在某地随机抽查成年男子140140人,计算得红人,计算得红细胞均数细胞均数4.774.7710101212/L/L,标准差,标准差0.38 0.38 10101212/L /L ,试计,试计算均数的标准误。算均数的标准误。 标准误是抽样分布的重要特征之一,可用于衡量标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。估计和对不同组之间的参数进行比较。120.380.032( 10 /L)140XSSn 例例 某地随机抽取某地随机抽取2020岁健康男
7、性岁健康男性2020名,求得其血中葡萄糖名,求得其血中葡萄糖样本均数样本均数=39.5mg/100ml=39.5mg/100ml,标准差,标准差S=0.69mg/100ml,S=0.69mg/100ml,问其抽问其抽样误差是多少?样误差是多少? 本例:本例:s=0.69mg/100mls=0.69mg/100ml,n=20n=20,将其代入公式得,将其代入公式得 即该研究的抽样误差为即该研究的抽样误差为0.15mg/100ml0.15mg/100ml。 0.690.15(/100)20 xssmgmln第二节第二节 t t分布分布XuX随机变量随机变量X XN N( , 2 2)标准正态分布标
8、准正态分布N N(0 0,1 12 2)u变换均数均数标准正态分布标准正态分布N N(0 0,1 12 2)nXu),(2nN1,nvSXnSXtXStudent Student t t分布分布自由度:自由度:n n-1-1自由度自由度举例:三个人分举例:三个人分10个苹果个苹果自由度:随意变化量个数自由度:随意变化量个数自由度自由度=变量个数变量个数-约束条件个数约束条件个数t t分布曲线分布曲线0.00.10.10.20.20.30.30.40.4-4-3-2-101234tf(t)自由度为1的t分布自由度为9的t分布标准正态分布 t t 分布分布有如下性质:有如下性质:单峰分布,曲线在单
9、峰分布,曲线在t t0 0 处最高,并以处最高,并以t t0 0为中心为中心左右对称左右对称与正态分布相比,曲线与正态分布相比,曲线最高处较矮,两最高处较矮,两尾部翘得尾部翘得高高(见绿线)(见绿线) 随自由度增大,曲线逐随自由度增大,曲线逐渐接近正态分布;分布的渐接近正态分布;分布的极限为标准正态分布。极限为标准正态分布。t t值的分布与自由度值的分布与自由度 有关(实际是样本含有关(实际是样本含量量n n不同)。不同)。t t 分布的图形不是一条曲线,分布的图形不是一条曲线,而是一簇曲线。而是一簇曲线。 =(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3
10、不同自由度下的不同自由度下的t t分布图分布图t界值界值纵坐标:自由度,纵坐标:自由度, 横坐标:概率,横坐标:概率, P P, , 即曲线下阴影部分的面积即曲线下阴影部分的面积; ; 表中的数字:相应的表中的数字:相应的 | |t | t | 界值界值, ,用用t t(v v)表示。表示。t t 值表规律:值表规律:(1) (1) 自由度(自由度()一定时,)一定时,p p 与与 t t 成反比成反比; ; 概率(概率(p p) 一定时,一定时, 与与 t t 成反比成反比; ;t t双侧双侧t t单侧单侧,t t单侧单侧=t=t22双侧双侧三、三、 总体均数的点估计(总体均数的点估计(po
11、int point estimationestimation)与区间估计)与区间估计pSX、参数的估计参数的估计点估计点估计:由样本统计量:由样本统计量 直接估计直接估计 总体参数总体参数区间估计区间估计:在一定:在一定可信度可信度(Confidence level) 下下,同时考虑抽样误差,同时考虑抽样误差、可信区间可信区间可信区间或置信区间(可信区间或置信区间(CI),根据样本均数,按一),根据样本均数,按一定的定的可信度可信度计算计算 出总体均数很可能在的一个出总体均数很可能在的一个数值范数值范围围,这个范围称为总体均数的可信区间。,这个范围称为总体均数的可信区间。1-1-为可为可信度,
12、常取双侧信度,常取双侧95%95%,即,即=0.05=0.05可信区间的两个要素:可信区间的两个要素:n准确度:可信区间包括准确度:可信区间包括的概率大小,的概率大小,1-来衡量来衡量n精密度:区间的长度,越小,精密度越高精密度:区间的长度,越小,精密度越高n准确度高,精密度就低,同时提高准确度和精密度,准确度高,精密度就低,同时提高准确度和精密度,只能增大样本含量只能增大样本含量n。可信区间的计算可信区间的计算n未知未知n已知或已知或未知但未知但n足够大足够大 已知已知 未知但未知但n足够大足够大 ,vvXXXtSXtS,XXXX,XXXSXS可信区间与参考值范围的区别可信区间与参考值范围的
13、区别四、假设检验四、假设检验 亦称显著性检验是对所估计的总体首先提出一亦称显著性检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这个假设,然后通过样本数据去推断是否拒绝这一假设一假设 科研数据处理的重要工具科研数据处理的重要工具; 某事发生了:某事发生了: 是由于碰巧?还是由于必然的原因?统计学家是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题运用显著性检验来处理这类问题 举例:上课迟到,买鸡蛋举例:上课迟到,买鸡蛋假设检验原因假设检验原因 由于个体差异的存在,即使从同一总体由于个体差异的存在,即使从同一总体中严格的随机抽样,中严格的随机抽样,X X1
14、1、X X2 2、X X3 3、X X4 4、,、,不同。不同。 因此,因此,X X1 1、X X2 2 不同有两种(而且只有两种)不同有两种(而且只有两种)可能:可能:(1 1)分别所代表的总体均数相同,由于抽样误)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性差造成了样本均数的差别。差别无显著性 。(2 2)分别所代表的总体均数不同。差别有显著)分别所代表的总体均数不同。差别有显著性。性。假设检验基本原理假设检验基本原理n假设假设=0,即差异是由于抽样误差引起的,即差异是由于抽样误差引起的, t分布,则分布,则 若若tt 0.05,则,则P0.05 , 小概率事件
15、发生了,拒绝原小概率事件发生了,拒绝原假设,选择备择假设假设,选择备择假设n例题见书例题见书32页页0/xSn00.050.05/xttSn例例4.4已知健康成年男子的脉搏均数为已知健康成年男子的脉搏均数为72次次/分。某分。某医生在某山区随机调查医生在某山区随机调查30名健康男子,求得名健康男子,求得脉搏均数为脉搏均数为74.2次次/分,标准差微分,标准差微6.5次次/分。分。能否认为该山区的成年男子的脉搏均数高于能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?一般成年男子的脉搏均数?样本均数和总体均数的差异有两种可能:样本均数和总体均数的差异有两种可能:n抽样误差所致抽样误差
16、所致1.有本质差异有本质差异假设检验步骤假设检验步骤n建立假设:无效假设建立假设:无效假设 H0:相等,:相等,0 备择假设备择假设 H1:不等,:不等,0 一般采用双侧检验一般采用双侧检验n确定检验水准(显著水准)确定检验水准(显著水准) =0.05,即发生的概率,即发生的概率小于小于为小概率事件为小概率事件n选择检验统计量选择检验统计量n判定结论判定结论 P,拒绝,拒绝H0,接受接受H1 P,不能拒绝,不能拒绝H0n推断得出专业结论推断得出专业结论假设检验特点假设检验特点n类似于数学中的反证法类似于数学中的反证法 先建立假设(假设上课不迟到,鸡蛋是新鲜的),先建立假设(假设上课不迟到,鸡蛋
17、是新鲜的),然后通过计算证明,得出结论是小概率事件发生,然后通过计算证明,得出结论是小概率事件发生,则该假设不成立则该假设不成立n数学推断是确定性的,而统计学是以概率给出的,数学推断是确定性的,而统计学是以概率给出的,因此结论是相对的,得到任何结论都存在发生错误因此结论是相对的,得到任何结论都存在发生错误的可能。的可能。假设检验两类错误假设检验两类错误 P42 当当H H0 0为真时,检验结论拒绝为真时,检验结论拒绝H H0 0接受接受H H1 1,这类错误称为第一,这类错误称为第一类错误或类错误或型错误型错误(type errortype error),亦称假阳性错误),亦称假阳性错误 检验水准,就是预先规定的允许犯检验水准,就是预先规定的允许犯型错误概率的最大值,型错误概率的最大值,用用表示表示 当真实情况为当真实情况为H H0 0不成立而不成立而H H1 1成立时,检验结论不拒绝成立时,检验结论不拒绝H H0 0,这类错误称为第二类错误或这类错误称为第二类错误或型错误型错误(type errortype error),),亦称假阴性错
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026西安市浐灞第二小学招聘笔试题库及参考答案详解(能力提升)
- 2026新疆阿勒泰地区基础教育“银龄人才”招募6人笔试题库(易错题)附答案详解
- 2026年6月江苏扬州市邗江区国有资本投资集团有限公司招聘2人模拟试卷含答案详解(能力提升)
- 2026年上半年四川成都市教育局所属事业单位招聘8名高层次人才笔试题库含答案详解【能力提升】
- 四川绵阳安州高新技术产业园区2026年公开招聘园区产业发展服务专员(第二批)模拟试卷【名校卷】附答案详解
- 2026四川乐山市沐川县人力资源服务中心招募见习人员2人模拟试卷【各地真题】附答案详解
- 2026湖南长沙市开福区面向社会招聘基层医疗卫生机构人员20人模拟试卷【预热题】附答案详解
- 2026四川眉山市洪雅县从农村订单定向医学生中考核招聘乡镇卫生院人员7人模拟试卷含答案详解(A卷)
- 2026重庆机电智能制造有限公司增材制造分公司招聘1人笔试题库(各地真题)附答案详解
- 2026江西农业大学继续教育学院劳动聘用制人员招聘2人模拟试卷汇编附答案详解
- 2026年山东省统考中考语文真题含答案
- 2026年事业单位考试时事政治试题及答案
- 2026年广东深圳市物理中考模拟卷(含答案)
- 2026年全国《安全生产月》知识培训试题及答案
- 东风汽车集团有限公司研发总院2027届“风帆”计划暑期实习生招聘备考题库附答案详解
- 五年级-水中浸物问题-题目+答案
- 西安交通大学2026年强基计划笔试模拟试题及答案解析
- 2026年校园安保测试题及答案
- JCT2128-2012 超白浮法玻璃
- SAT模拟考试试题6(含答案)
- 马克思主义基本原理概论知到章节答案智慧树2023年西安交通大学
评论
0/150
提交评论