版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数值变量资料的统计推断
第三章教学要求掌握标准误计算公式及意义熟悉t分布的特征掌握总体均数的估计方法掌握均数的假设检验方法统计推断的过程总体样本抽样总体均值、比例、方差统计推断样本均数、率、标准差统计量参数现实生活中的抽样现象炒菜时尝尝咸淡评价河水污染情况就医时做血常规检验
假设正常成年男子红细胞N(5.00,0.502)的正态分布总体,从该总体中重复进行1000次抽样,样本量分别为5,10,30。计算其均数和标准差。1000份样本抽样计算结果总体均数总体标准差s均数的均数均数的标准差n=55.000.504.9870.23000.2236n=105.000.505.0110.15860.1581n=305.000.505.0000.09200.0913各样本均数未必等于总体均数;样本均数之间存在差异;样本均数的变异较之原变量的变异大大缩小;4.样本均数分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,服从正态分布。当S一定时,n越大,即样本量越大,标准误越小;故:我们可以通过增加样本量来减小抽样误差。例2003年某地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,计算当地20岁应征男青年身高的标准误。来自同一正态总体的样本:来自同一非正态总体的样本:小样本非正态分布大样本(n≥30)服从正态分布中心极限定理:以数值变量为例,若从正态总体中以固定n反复多次抽样,所得样本均数的分布是正态分布;即使从偏态总体中抽样,只要n足够大,样本均数的分布也近似正态分布
标准差VS标准误第二节t分布以0为中心,左右对称,类似于标准正态分布与标准正态分布相比,曲线峰值较矮,两尾部翘得高;自由度越小,t值越分散,曲线峰值越小。随着自由度逐渐增大,t分布逐渐逼近标准正态分布;当自由度趋于无穷,t分布即为标准正态分布。t分布曲线下面积规律:1.同一下,P值越小,t值越大
2.同一P值下,越大,t值越小0第三节总体均数的估计区间估计置信上限可信/置信区间(区间估计)置信下限样本统计量
(点估计)95%CI的含义:从总体中作随机抽样,例如作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计不正确)。实际中,只作一次抽样,只得到一个可信区间,作为未知总体均数的可能范围的估计,理论上有95%的可能是正确的,而5%的可能发生错误。
设某人群的身高值X~N(155.4,5.32),现从该总体中随机抽出一个n=10的样本,算得均数为158.36cm,S=3.83cm,求得m的95%可信区间为(155.62,161.10),发现该区间未包含总体均数m=155.4cm。若随机从该总体抽取n=10的样本200个,每次都求95%可信区间,问大约有多少个可信区间不包括总体均数m=155.4cm在内?s未知:2003年某地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,估计2003年当地20岁应征男青年身高总体均数的95%的可信区间。解:
,求总体均数的95%可信区间。影响区间宽度的因素数据的离散程度,用S或来测度样本容量,置信水平(1-),影响
或
的大小可信区间95%CI99%CI公式范围
窄宽估计错误概率
大(0.05)小(0.01)精确度准确度1-a在准确度一定的情况下,如何提高精确度?
可信区间参考值范围含义
当=0.05时,CI以95%的可能性包含总体均数。
“正常人”的解剖、生理、生化某项指标个体值的波动范围。计算公式s未知:
正态分布:
s已知或s未知但为大样本:
偏态分布:PX~P100X
用途
总体均数的区间估计
绝大多数(如95%)观察对象某项指标的分布范围
某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业男性工人的血红蛋白是否不同于正常成年男性平均值140g/L?n=36已知总体未知总体第四节假设检验的基本步骤?造成样本均数与已知总体不等的原因:
①
非同一总体,即
②
是同一总体,即,差异是由于抽样误差造成的;
如果与很接近,其差别可用抽样误差解释,可认为来自总体;
如果与相差甚远,不宜用抽样误差来解释,则怀疑不是来自总体。如果与相差较远,t值就大,P值就小。假设成立,当P小于或等于预先规定的概率(如0.05),则有理由怀疑原假设不成立,认为其对立面成立。该结论犯错误的风险仅为。一、假设检验的概念及基本原理概念:事先对总体参数或分布类型作出某种假设,判断这种假设是否成立的方法。特点:反证法;小概率原理。原理:先假定提出的关于总体的假设成立,样本是通过合理设计获得的总体的代表,那么样本应体现总体的特点,如样本均数的值应在总体均数值附近,如果偏离太远,则根据反证法和小概率原理拒绝原假设。链接:反证法即两种说法非A即B,要证明A或B真,只需证明对立方伪。小概率原理:当某事件发生的概率P≤0.05时,称为小概率事件,表示某事件发生的可能性很小,是几乎不可能发生的事件。二、假设检验的基本步骤建立检验假设无效假设:又称零假设,用H0表示。一般是假设总体参数相等或服从某种分布。备择假设:用H1表示。一般是假设总体参数不等或不服从某种分布。①检验假设是针对总体而言,而不是针对样本;如
或。对于检验假设需要注意的几个问题:②H1的内容直接反映了检验单双侧。假设双侧检验单侧检验H0H1假设检验单双侧之分,需根据研究目的和专业知识而定。目的是推断两总体均数是否不等双侧检验H0:=0,H1:≠0;若从专业知识已知不会出现0的情况(或已知不会出现0的情况)单侧检验H0:=0,H1:0(或0)双侧检验的例子单侧检验的例子确定显著性水平又称检验水准,是预先规定的概率值,它确定了小概率事件的标准。当某事件发生的概率P≤时,则认为该事件为小概率事件。在实际工作中常取=0.05或0.01。可根据不同研究目的给予不同设置。计算统计量不同的检验方法采用不同的检验统计量例如:确定概率值P查表得到检验水平所对应的界值,将计算得到的统计量与之比较,得到P值大小。
做出推断结论根据获得的事后概率P与事先规定的检验水准进行比较,看其是否为小概率事件而得出结论。一般来说,推断结论应该包含统计结论和专业结论两部分。统计结论只说明差别有无统计学意义,而不能说明专业上的差异大小。要与专业结论有机地结合,才能得出恰当的推断结论。
若,按所取检验水准,拒绝,接受,样本统计量差别有统计学意义(统计结论)。可以认为总体参数不等或不同(专业结论)。
若,按所取检验水准,不拒绝,样本统计量差别无统计学意义(统计结论)。还不能认为总体参数不等或不同(专业结论)。第五节均数的假设检验单个样本均数的假设检验设计:样本均数与一已知总体均数的比较目的:推断样本均数(代表未知总体均数)和已知总体均数(理论值、标准值、稳定值)有无差别。检验方法:根据样本来自的总体的分布类型、样本含量n的大小及总体标准差是否已知选择t检验、u检验或其他检验方法。计算公式:n60或已知时,用u检验n60时,用t检验
某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业男性工人的血红蛋白是否不同于正常成年男性平均值140g/L?n=36已知总体未知总体?(1)建立检验假设,确定检验水准H0:
=0=140g/L,即从事铅作业的男性工人平均血红蛋白含量与正常成年男性平均值相等H1:≠0=140g/L,即从事铅作业的男性工人平均血红蛋白含量与正常成年男性平均值不等=0.05(2)计算检验统计量本例n=36,=130.83g/L,S=25.74g/L,=140g/L。按公式(3)确定P值,作出推断结论按=0.05水准,拒绝H0,接受H1,36名从事铅作业男性工人的平均血红蛋白含量与正常成年男性血红蛋白含量平均值差别有统计学意义,可认为从事铅作业的男性工人血红蛋白含量均数与正常成年男性血红蛋白含量均数不同。
随机抽样调查泉州市区某医院20名男婴出生体重,其均数为3.34㎏,标准差为0.42㎏。已知泉州市区男婴出生体重均数为3.29㎏。试比较该院男婴出生体重均数与全市男婴出生体重均数是否不同?在郊区抽查20名男婴出生体重,均数为3.23㎏,标准差0.47㎏,问市区和郊区男婴出生体重均数是否不同?二、两个独立样本均数的假设检验设计:两个独立样本均数的比较目的:通过比较两个样本均数的大小,推断两样本均数所代表的总体均数是否相同。检验方法:根据两样本来自的总体分布类型、例数的大小及两样本所代表的总体方差是否相同来选择t检验、u检验或其他检验方法。计算公式:两样本含量均≥60,用U检验样本含量n1和/或n2<60,用t检验两总体方差相同两总体方差不同,校正t检验为了解氨甲喋呤对外周血IL-2水平的影响,某医生将60名哮喘患者随机分为两组。其中对照组29例,采用安慰剂;实验组31例,采用小剂量氨甲喋呤进行治疗。测得对照组治疗前IL-2的均数为20.00IU/ml,标准差为7.00IU/ml;试验组治疗前IL-2的均数为17.00IU/ml,标准差为8.50IU/ml。问两组总体均数有无差别?
判断两组治疗前IL-2的总体方差是否齐性?
本例:(1)建立检验假设,确定检验水准(2)计算检验统计量
(3)确定P值,作出推断结论
按α=0.05水准,不拒绝H0,两组治疗前IL-2均数差异无统计学意义,尚不能认为两组治疗前IL-2水平不同。一般正常成年男子血红蛋白的平均值为155g/L,某研究者随机抽取144名高原地区成年男性进行检查,得到血红蛋白均数为165g/L,标准差25g/L。问:高原地区居民的血红蛋白与一般正常成年男子是否相同?某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。某医师从已确诊的神经衰弱病人中随机抽取40例病人并进行随机分组,一组20例病人服用该种新药,计算得到平均睡眠时间为6.39小时,标准差为2.24小时;另一组20例病人服用旧药,计算得到平均睡眠时间为6.45小时,标准差为2.51小时。试比较新安眠药与旧安眠药平均睡眠时间是否不同?同样研究新安眠药与旧安眠药睡眠时间。另一位医师也从已确诊的神经衰弱病人中随机抽取40例病人,按病人体重、神经衰弱严重程度相近配成对子,共20对。每对的病人随机分至新药组与旧药组。试比较新安眠药与旧安眠药平均睡眠时间是否不同?三、配对设计资料的假设检验设计:配对设计,具体形式有将研究对象按某种特征(主要非处理因素)配成对,同对的两对象随机分别接受不同处理同一对象接受不同的处理同一对象接受某种处理前后目的:控制可能存在的非处理因素的影响,判断不同处理效果或同一处理前后效果是否有差别。某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两只大白鼠随机分到正常饲料组和维生素E缺乏组。用简便法和常规法分别对12份人尿进行尿铅含量测定为观察静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎,某儿科分别测量患儿用药前后血清免疫球蛋白含量。检验方法:根据资料类型不同,选择不同的检验方法公式:配对t检验
ν=对子数-1为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定,其结果见下表。问两法测定结果是否不同?n=10已知总体未知总体?(1)建立检验假设,确定检验水准
H0:d=0,即两种方法的测定结果相同
H1:d≠0,即两种方法的测定结果不同=0.05
(2)计算检验统计量(3)确定P值,作出推断结论查t界值表得P<0.05。按=0.05水准,拒绝H0,接受H1,有统计学意义。认为两种方法对脂肪含量的测定结果不同,哥特里-罗紫法测定结果较高。小白鼠编号12345678910随机数18242207295733496592排序号24315867910分组乙乙甲甲甲乙乙甲甲乙将10只小白鼠按成组设计分成两组,分组方法见下表:独立样本资料比较的数据格式对照组实验组.........
n1
n2糖尿病加钒组糖尿病组26.4646.8925.1947.2128.7042.4223.7047.7024.4840.7525.1941.0328.0145.9823.7043.4626.1044.3424.6245.32
在探讨硫酸氧钒降糖作用的实验中,测得两组动物每日进食量如表所示。试问两组动物每日进食量是否相同?配对号12345小白鼠12345678910随机数18242207295733496592排序号1221121212分组甲乙乙甲甲乙甲乙甲乙将10只小白鼠按配对设计分成两组,分组方法见下表:对子号对照组实验组差值d1...2...3...4...5...........合计...成对样本均数比较的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中共蓬安县委组织部中共蓬安县委社会工作部公开招聘蓬安县新兴领域党建工作专员的备考题库及一套答案详解
- 2026年华润水泥(安顺)有限公司招聘六险两金月薪4300-9000元备考题库及答案详解一套
- 2026年软件测试员专业面试全攻略
- 2026年程序员面试题及编程技术要点详解
- 2026年社交媒体运营顾问面试问题及答案参考
- 《DLT 5111-2024水电水利工程施工监理规范》专题研究报告
- 2026年云南牟定县公安局公开招聘警务辅助人员备考题库及答案详解1套
- 2026年面试题库客服经理职位常见问题及答案
- 2026年公司法律顾问合同审核问题解析
- 2026年职称评审答辩主持人面试问题集含答案
- 知识点及2025秋期末测试卷(附答案)-浙美版(新教材)小学美术三年级上册
- 2025山西大地环境投资控股有限公司社会招聘116人备考笔试题库及答案解析
- 机器人手术术后引流管管理的最佳实践方案
- 2025年产品质量复盘与2026年品控升级指南
- 2025年瓦检员考试题库及答案
- 2025有色金属行业市场发展深度分析及未来趋势与投资战略研究报告
- 2026年广东省第一次普通高中学业水平合格性考试化学仿真模拟卷01(全解全析)
- (新教材)2025年部编人教版一年级上册语文全册期末复习课件
- GB/T 26951-2025焊缝无损检测磁粉检测
- 灯展活动安全协议书
- (2026年)压力性损伤的预防和护理课件
评论
0/150
提交评论