




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,第七章,抽样原理与方法,抽样是从所研究的总体中抽取一定数量的个体构成样本,通过对样本特征的研究和计算,进而 对总体特征作出推断。*,*,*,实际工作中,由于存在无限总体,即使是有限总体,由于受到人力、物力、财力及其他因素的限制,只能通过对样本的研究和分析,推断该样本所在总体的特征。,一、全及总体与样本总体,全及总体简称总体,是指所研究现象的全体。总体单位数用N表示。样本总体简称样本,是指按照随机原则,从全及总体中抽取的一部分单位所组成的小总体,用n表示。,总体成数,总体方差,样本成数,样本方差,二、全及指标(参数)和样本指标(统计量)、全及指标:根据总体各单位的标志或标志属性计算的,反映总体数量特征的综和指标称为全及指标。、样本指标:根据样本各单位标志值或标志属性计算的综合指标称为统计量。,总体平均数全及指标总体标准差,样本平均数样本指标样本标准差,三、样本容量和样本个数,样本容量是指一个样本所包含的单位数。,样本个数又称样本可能数目,指从一个总体中可,能抽取的样本个数,四、重复抽样和不重复抽样,抽样误差的概念:由于生物界变异普遍存在,进行随机抽样时,不可避免地造成样本统计量与总体参数之间或各样本统计量之间的差别,称为抽样误差。,抽样误差存在的根本原因:个体差异由于个体差异的普遍存在,所以抽样误差是不可避免的(但其存在是有规律的),为更加准确地通过样本统计量估计其总体参数,就应该寻找抽样误差的规律,估计抽样误差的大小。,样本平均数的标准误,df=n-1,n, X =置信区间,sn,sx =,(x t0.05sx, x + t0.05sx),样本频率的标准误,置信区间df=n-1,p(1 p)n,sp =,(p u0.05sp, p+ u0.05sp),t0.05s2,4s2,一、平均数资料样本容量的确定根据均值区间估计公式可得样本容量n为:,L置信半径,即参数估计的允许误差,2,n,=,2 2L L,例用某药治疗胃及十二指肠溃疡病人,服药四周后胃镜复查时,患者溃疡面平均缩小0.2cm2,标准差为0.4cm2,假定该药确能使溃疡面缩小或愈合,问需多少病人作疗效观察才能在=0.05的水准上发出用药前后相差显著?,=,= 900,二、频率资料样本容量的确定,例拟了解40岁以上男性冠心病患病率,据以往调查,预测其患病率在10%左右,允许误差为2%,试计算需要调查多少人才比较合适。已知p=10%=0.1,L=2%=0.02,可得,4p(1 p)L 2,n =,n,4p(1 p)L 2,40.10.90.022,=,t0.05sd d 2,4s,三、成对资料样本容量的确定,n,=,2 22 2d d,sd = sx1x2,2t0.05sx 21 2, x,(x1 2),四、非成对资料样本容量的确定,2,2,n,x2,=,8sx1x2(x1 x2)2,例某职业病防治所用两种疗法治疗矽肺患者,一个疗程后,患者血清粘蛋白下降值甲疗法平均为2.6(mg),乙疗法平均为2.0(mg,)两种疗法下降值之合并标准差为1.3(mg)。若要发现两组疗效相差显著,每组至少应观察多少病人?,例据某院初步观察,用甲、乙两种药物治疗慢性气管炎患者,近控率甲药为45%,乙药为25%。现拟进一步试验,问每组需观察多少例,才可能在=0.05的水准上发现两种疗法近控率有显著相差?,一随机(概率)抽样, 简单随机抽样 分层抽样, 系统(等距)抽样 整群(集体)抽样 多阶段抽样 双重抽样,简单随机抽样,它是按随机原则直接从总体个单位中抽出n个单位作为样本,总体中每个总体单位都有同等被抽取的机会,适用于均匀总体。,重置抽样又称重复抽样、有放回抽样,是每次从总体中抽取,一个单位,观察记录后又放回,再抽取下一个。,不重置抽样又称不重复抽样、无放回抽样,是每次从总体中,抽取一个单位,观察记录后不放回,再抽取下一个。,Nt,NX +t,Nt p(1 p),NP +t p(1 p),重复抽样(同前)不重复抽样,2,2 2,2,2,n,=,2 2,2,n,=,优点:,(1)比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。,缺点:,(1)没有利用辅助信息;(2)样本分散,面访费用较高;(3)有可能抽到较差的样本;(4)抽选大样本比较费时,定义:在抽样之前将总体按变异原因或程度或分成若干区层。然后在每一个层独立地随机抽取样本。,将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。分层抽样示意图,分层抽样的步骤:,(1)按某种特征将总体分成互不相交的层(2)按比例k=n/N确定每层抽取个体的个数(n/N)*Ni个。,(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。,例 某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( ),A.15,5,25 B.15,15,15C.10,5,30 D15,10,20,优点:样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。缺点:必须有分层的辅助信息;若调查变量与分层的变量不相关,效率可能降低;估计值的计算比简单随机抽样复杂,定义:又称等距抽样,对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个单元的抽样方法。抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n,在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,。当N不能被n整除时,可采用随机抽样的方法从总体中剔除部分个体,使剩下的个体数能被样本容量整除,然后再采用系统抽样方法。,系统抽样的缺点,(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)不使用辅助信息使抽样效率不高;(3)样本彼此不独立,没有一个无偏的方差估计量,对抽样误差的估计只是近似的。,系统抽样比简单随机抽样更容易实施,可节约抽样成本;我们国家的国家统计局的调查多采用系统抽样,它便于操作。,整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。绿色为总体红色为群白点为基本单元,整群抽样的优点:,(1)能大大减低收集数据的费用;(2)当总体单元自然形成群时,容易取得抽样框,抽样也更容易;(3)当群内单元差异大,而不同群之间的差异小时,可以提高效率。,整群抽样的缺点:,(1)若群内个单元有趋同性,效率将会降低;(2)通常无法预先知道总样本量,因为不知道群内有多少单元;(3)方差估计比简单随机抽样更为复杂,可以综合利用分层和整群抽样技术,采取分层整群抽样,比如人体尺寸调查,采用分层提高样本代表性,采用整群抽样,便于数据的收集。,是由两个或更多个连续的阶段抽取样本的方法。先抽大单位(可以用类型抽样或机械抽样)再在大单位中抽小单位(可用整群抽样或简单随机抽)小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。,优点:(1)当群具有同质性时,多阶抽样的效率高于整群抽样;,(2)样本的分布比简单随机抽样集中,采用面访可以节约时间和费用;(3)不需要整个总体单元的名录框,只要群的名录框和抽中群的单元名录框。,缺点: (1)效率不如简单随机抽样;(2)通常不能提前知道最终的样本量;(3)调查的组织较整群抽样复杂;(4)估计值与抽样方差的计算较为复杂。,又称二重抽样、复式抽样,相关抽样法。是指在抽样时分两次抽取样本的一种抽样方式。双重抽样的主要作用是提高抽样效率、节约调查经费。,双重抽其具体步骤为:,首先抽取一个初步样本,并搜取一些简单项目以获得有关总体的信息; 然后,在此基础上再进行深入抽样。做一次随机抽样,调查y和x两种性状,从中求出y依x的回归方程。这个样本容量n 不一定很大,但希望x和y有较大的幅度。采用双重抽样法,必须注重y和x两性状间不但要有显著相关,而且须有高程度显著相关,才能获得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年医疗器械国产化替代对行业知识产权战略的研究报告
- 领导元旦致辞资料15篇
- 年度安全管理规划方案(3篇)
- 社区食堂复工方案(3篇)
- 吊装证件管理办法
- 后勤用工管理办法
- 呆滞物品管理办法
- 哄抬物价管理办法
- 商业合作管理办法
- 商场安保管理办法
- 【北京市人社局】2025年北京市人力资源市场薪酬数据报告(一季度)
- 监控项目合同书补充协议
- 签劳务派遣合同三方协议
- 初中英语单词总表2182
- 2025全国生态日知识竞赛考试题库(含答案)
- 阿里铁军培训课件
- 非借款股权质押合同范本
- 《Sketch Up 软件运用》课件(共九章)
- 多器官功能障碍综合征(MODS)的系统监测与全程护理管理实践
- 乙方心态培训课件模板
- 比赛抽签活动方案
评论
0/150
提交评论