版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
样本含量估计estimationofsamplesize第十七章流行病与统计教研室7/27/20231第一节样本含量估计的意义及应具备的条件【例17-1】已知糖尿病患病率一般为2%~3%,现拟采用单纯随机抽样方法从某社区抽取随机样本,以了解该社区人群中糖尿病患病率。该社区人口为3000人,希望误差不超过1%,取a=0.05,需调查多少人?7/27/20232一、样本含量估计的意义样本含量(samplesize)又称样本容量、样本例数,是指在抽样研究中,每个样本所包含的观察单位的数量。估计样本含量的意义是研究设计的重要内容之一,它是研究设计中重复性原则的体现,即各组的受试对象都应有一定的数量,即每个组都有足够的重复数(样本量)。在调查研究、临床观察或实验研究中,首先要考虑样本含量(或样本大小)的问题。7/27/20233应注意克服两种倾向样本例数过大增加实际工作中的困难,可能引入更多的混杂因素,不易控制研究的质量,影响研究结果的真实性和可靠性,另外还会造成人力、物力和时间上不必要的浪费样本例数过少致使抽样误差较大,所得指标不够稳定,检验效能低,容易得出假阴性的结果,影响结论的可靠程度7/27/20234样本含量的估计是在保证研究结论具有一定可靠性的条件下,确定最少的调查单位或实验单位数。7/27/20235二、样本含量估计应具备的条件
I型错误a的概率或区间估计中的可信度Ⅱ型错误的概率,或检验效能容许误差或差值,即欲比较或估计的总体参数与样本统计量之间或总体参数相差所容许的限度。总体平均数、总体率或总体标准差7/27/20236第二节调查设计常用样本含量估计方法一、单纯随机抽样的样本含量估计(一)估计总体均数的样本含量(二)估计总体率的样本含量二、其它概率抽样方法的样本含量估计(一)分层抽样所需样本含量估计
(二)整群抽样所需样本含量估计7/27/20237单纯随机抽样的样本含量估计估计总体均数的样本含量公式:式中,S为总体标准差的估计值为容许误差需要查t界值表,可先用标准正态分布中的代入,算出一个初步估计的n,再计算初步的自由度v,可查表得,以此带入公式,可算得第二次估计的n,如此迭代,直到稳定为止。7/27/20238若是从有限总体抽样,尚需进一步校正
7/27/20239【例17-2】某研究者拟用抽样方法了解冠心病患者血清胆固醇的平均水平,希望误差不超过0.2mmlo/L,根据文献,冠心病患者血清胆固醇标准差约为0.94mmol/L,如取a=0.05,则需调查多少人?
允许误差=0.2估计标准差s=0.947/27/202310【估计步骤】1.先以=1.96代替,可得2.以自由度,查t界值表得双侧,则因此,本研究应调查88例冠心病患者。7/27/202311第二节调查设计常用样本含量估计方法一、单纯随机抽样的样本含量估计(一)估计总体均数的样本含量(二)估计总体率的样本含量二、其它概率抽样方法的样本含量估计(一)分层抽样所需样本含量估计
(二)整群抽样所需样本含量估计7/27/202312估计总体率的样本含量公式:(用弧度)(用度)7/27/202313当π趋向0.5,且n较大时,随机抽样所得的样本率才趋向于正态分布或近似正态分布:或
7/27/202314【例17-3】某研究者欲了解20岁~24岁妇女生育率,希望误差不超过2%,a取0.05,问需调查多少人?本例未给出20岁~24岁妇女生育率π的估计值,可取p=0.57/27/202315若根据文献知20岁~24岁妇女生育率为5%~25%,则p可取其中较接近0.5的值,即25%7/27/202316【例17-1】已知糖尿病患病率一般为2%~3%,现拟采用单纯随机抽样方法从某社区抽取随机样本,以了解该社区人群中糖尿病患病率。该社区人口为3000人,希望误差不超过1%,取a=0.05,需调查多少人?7/27/202317第二节调查设计常用样本含量估计方法一、单纯随机抽样的样本含量估计(一)估计总体均数的样本含量(二)估计总体率的样本含量二、其它概率抽样方法的样本含量估计(一)分层抽样所需样本含量估计
(二)整群抽样所需样本含量估计7/27/202318分层抽样所需样本含量估计按比例分配是按各层观察单位数占总体观察单位数N的比例抽取样本,使各层样本含量与总样本含量n之比等于各层观察单位数与总体观察单位数N之比,可按下式计算:7/27/2023197/27/202320最优分配是按总体各层观察单位数的多少和标准差(或各层率)大小来分配各层的观察单位数(均数的抽样)(率的抽样)7/27/2023217/27/202322第二节调查设计常用样本含量估计方法一、单纯随机抽样的样本含量估计(一)估计总体均数的样本含量(二)估计总体率的样本含量二、其它概率抽样方法的样本含量估计(一)分层抽样所需样本含量估计
(二)整群抽样所需样本含量估计7/27/202323整群抽样估计总体率的样本含量估计公式:有限总体需校正:无限总体应调查的群体数预调查的群体数预调查的群体中第i群调查人数预调查的群体中第i群某事件的发生频率群的平均调查人数平均发生频率7/27/202324【例17-5】为了解某市40岁以上人群高血压患病率,拟对全市55个街区采用整群抽样调查,随机预调查了2个街区,第一街区调查了4180人,高血压病人1060人,患病率为0.2536;第二街区调查了4970人,高血压病人720人,患病率为0.1449,问需要调查几个街区?(,),,7/27/202325因为该市为有限总体,K=55
需抽样调查3个街区。7/27/202326概率抽样方法不同,样本含量的估计方法不同单纯随机抽样、整群抽样和分层抽样的样本含量估计都有专用公式系统抽样,因抽样间隔不同,其抽样误差也不同,故系统抽样尚无统一的方法估计样本含量7/27/202327一、定量资料的样本含量估计(一)样本均数与总体均数比较所需样本含量的估计(二)完全随机设计两样本均数比较样本含量估计(三)配对设计均数比较时所需样本含量估计(四)完全随机设计多组均数比较所需样本含量估计(五)随机区组设计均数比较时所需样本含量估计第三节实验设计样本含量估计方法7/27/202328样本均数与总体均数比较样本含量的估计公式:式中,和分别是I型和II型错误的概率;估计的标准差;和为t界值无效假设和备选假设间的差距如无效假设为H0:,H1:则
7/27/202329【例17-6】已知健康妇女血清胆固醇平均水平为4.4mmol/L,现欲研究服用类固醇类避孕药对血清胆固醇水平的影响(双侧,即不知升高还是降低)。改变值≤0.2mmol/L时作为无改变,改变值≥1.0mmol/L时作为有改变,,问需研究多少人?
7/27/202330估计步骤用和估计和=1.0-0.2=0.8查t界值表,得双侧单侧7/27/202331一、定量资料的样本含量估计(一)样本均数与总体均数比较所需样本含量的估计(二)完全随机设计两样本均数比较样本含量估计(三)配对设计均数比较时所需样本含量估计(四)完全随机设计多组均数比较所需样本含量估计(五)随机区组设计均数比较时所需样本含量估计7/27/202332完全随机设计两样本均数比较所需样本含量的估计两样本例数相等时:
两样本例数不相等时:7/27/202333【例17-8】为研究A、B两种处理对血流量的影响,已知动物实验时,A处理使血流量平均增加1.8ml/min,B处理平均增加2.5ml/min,两处理的标准差均为1.1ml/min,规定双侧,试估计各组的样本含量。
7/27/202334估计步骤用和估计和查t界值表,得双侧单侧7/27/202335若规定样本分配比为
即A组样本含量为37,B组样本含量为87。若要求相同的检验效能,在两组例数相等时所需样本含量较少,因此在进行研究设计时,最好取两样本例数相等。7/27/202336一、定量资料的样本含量估计(一)样本均数与总体均数比较所需样本含量的估计(二)完全随机设计两样本均数比较样本含量估计(三)配对设计均数比较时所需样本含量估计(四)完全随机设计多组均数比较所需样本含量估计(五)随机区组设计均数比较时所需样本含量估计7/27/202337配对设计均数比较时所需样本含量估计公式:式中,、分别是检验水准a和犯Ⅱ型错误的概率β对应的t值;sd
为每对观察对象差值的总体标准差的估计值;为研究者确定的差值,即;n为所需样本含量的对子数。
7/27/202338【例17-9】研究新药提升白细胞的疗效,由预试验得出用药前后白细胞差值的标准差为1.5×103个/mm3,当白细胞平均上升1×103个/mm3时认为临床有效,单侧临床试验需要多少人?单侧7/27/202339以查t界值表,即本研究需要21对(因为本研究是自身配对设计,所以为21人)参与试验。7/27/202340一、定量资料的样本含量估计(一)样本均数与总体均数比较所需样本含量的估计(二)完全随机设计两样本均数比较样本含量估计(三)配对设计均数比较时所需样本含量估计(四)完全随机设计多组均数比较所需样本含量估计(五)随机区组设计均数比较时所需样本含量估计7/27/202341完全随机设计多组均数比较样本含量估计公式:式中,k为组数;为各组的均数,;为各组的标准差;为界值,由附表22查得。计算时先用自由度时的代入式中求,再用时的代入式中求,如此往复,直至结果趋于稳定为止。7/27/202342一、定量资料的样本含量估计(一)样本均数与总体均数比较所需样本含量的估计(二)完全随机设计两样本均数比较样本含量估计(三)配对设计均数比较时所需样本含量估计(四)完全随机设计多组均数比较所需样本含量估计(五)随机区组设计均数比较时所需样本含量估计
7/27/202343二、定性资料的样本含量估计(一)样本率与已知总体率比较样本含量估计(二)两样本率比较时所需样本含量估计(三)多个样本率比较时所需的样本大小7/27/202344样本率与已知总体率比较时样本含量估计公式:式中,为已知总体率;为预期试验结果的总体率,为预期试验结果的总体率与已知总体率的差值,即此公式适合大样本的研究。7/27/202345【例17-12】用传统方法治疗运动性胫骨结节骨骺损伤的有效率约为85%,现采用小钢针做胫骨结节骨骺穿刺,加上物理治疗方法,估计有效率为95%,现欲比较新疗法的有效率是否高于传统疗法,选定a=0.05(单侧),β=0.1则至少观察多少病例?估计步骤:本例7/27/202346本试验需至少观察110个病例7/27/202347二、定性资料的样本含量估计(一)样本率与已知总体率比较样本含量估计(二)两样本率比较时所需样本含量估计(三)多个样本率比较时所需的样本大小7/27/202348两样本率比较时所需样本含量估计两样本含量相等时两样本含量不相等时7/27/202349二、定性资料的样本含量估计(一)样本率与已知总体率比较样本含量估计(二)两样本率比较时所需样本含量估计(三)多个样本率比较时所需的样本大小7/27/202350多个样本率比较时所需的样本含量公式:式中,n为每组样本含量;Pmax、Pmin分别为最大率与最小率;λ为自由度时的界值;k为组数。按给定的a、β可从附表25查到λ。7/27/202351检验效能的意义检验效能又称假设检验的功效(powerofatest),用1-β表示意义当所研究的总体确有差别时,按照检验水准a能够发现这种差别(拒绝H0)的能力。影响要素样本含量、客观事物差异大小、个体间变异大小和a值增大检验效能(增大1-β
)一是增大a,二是增大样本含量。第四节检验效能的估计7/27/202352当假设检验根据P>0.05作出无统计学意义的结论时,研究者则面临着犯II型错误的可能性,应当考虑是否总体间的差异确实存在,但由于检验效能不足而未能把该差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026解放军总医院海南医院江林院区招聘2人考试参考题库及答案解析
- 2026浙江杭州市西湖小学教育集团诚聘语文、数学教师(非事业)考试模拟试题及答案解析
- 2025年郴州市北湖区幼儿园教师招聘考试试题及答案解析
- 2026年铜仁地区卫生健康系统人员招聘笔试备考试题及答案解析
- 2026重庆市开州区消防救援局招聘26人考试模拟试题及答案解析
- 2026陕西西安思源学院商学院教师招聘考试备考试题及答案解析
- 2026安徽省徽商集团有限公司所属企业招聘23人考试参考题库及答案解析
- 2026中国五环工程有限公司春季校园、暑期实习生招聘笔试备考试题及答案详解
- 2026年乡镇测土配方施肥技术应用知识试题
- 2026年小学数学思维训练与提高题库
- 关节松动技术-课件
- T-BJCC 1003-2024 首店、首发活动、首发中心界定标准
- 小孩励志书籍读后感
- 全麻苏醒期躁动处理
- 2024年吉林长春天然气集团有限公司招聘笔试参考题库含答案解析
- 外科学:胃十二指肠外科疾病(英文版)完整版
- 药用植物资源学
- 酒吧服务员培训计划
- 国网公司十八项反措
- 202X年度医院512国际护士节表彰大会主持背景策划PPT图文课件
- YY/T 1748-2021神经血管植入物颅内弹簧圈
评论
0/150
提交评论