




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节抽样,汇报人:学号:,管理研究要明确界定研究对象,研究哪些人或哪些事情。总体即研究对象的全部元素的集合,普查研究指研究总体内的所有元素。然而,人们往往难以普查研究,而更偏好抽样研究。,一、基本概念和术语,二、抽样方法,三、抽样误差和偏差,四、样本大小,一、基本概念和术语,一、基本概念和术语,抽样:又称取样。从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。,一、基本概念和术语,概率抽样:概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。又称随机抽样,概率抽样以概率理论和随机原则为依据来抽取样本的抽样,是使总体中的每一个单位都有一个事先已知的非零概率被抽中的抽样。总体单位被抽中的概率可以通过样本设计来规定,通过某种随机化操作来实现,虽然随机样本一般不会与总体完全一致。,一、基本概念和术语,元素:是信息分析单位。元素和分析单位常常相同,前者是抽样研究中的术语,后者则属数据分析的术语。,总体:是所研究元素的集合。,研究总体:指已被抽样的元素集合,一、基本概念和术语,抽样单位:指抽样阶段中供抽样的元素。个体与抽样单位在有些研究中是相同的,但在实际抽样中,抽样单位常常是多层次的。例如在城市中先将行业作为样本,再将该行业的企业中抽样,然后从所选择的企业的工人中抽样,这种情况相应叫初级抽样单位、次级抽样单位和终极抽样单位。,抽样框:指从中抽取样本的抽样单位清单,抽样框与抽样单位的层次相对应,前述三个层次的抽样单位即行业、企业和工人,则对应的抽样框中应有全部行业名单、行业样本中的所有企业名单和企业样本中的所有工人名单。抽样框即样本清单,如果学生样本是从学生名册中抽出的,则学生名册便是抽样框。,一、基本概念和术语,参数值和统计值:参数值是关于总体中某一变量的综合描述,例如,全国工业企业职工年平均收入;统计值则是调查样本中某一变量的综合描述,例如,从一组样本中得到的职工年平均收入;抽样调查时通过样本的统计值去推算总体的参数值。,一、基本概念和术语,抽样误差:指统计值和参数值之间的差异。概率抽样方法很难提供一个统计值能完全精确地等于所估计的参数值,用样本的统计值去推算总体的参数值总会有偏差,这就是抽样误差。,一、基本概念和术语,置信水平和置信区间:置信水平和置信区间是估计抽样误差的两个关键指标,置信水平表示抽样统计值的精度,即指总体参数值落在样本统计值某一区间的概率。而置信区间指在某一置信水平下,样本统计值与总体参数值的误差范围。,二、抽样方法,1,2,3,二、抽样方法,界定总体,确定样本规模,抽样,二、抽样方法,1.界定总体,研究总体的界定就是确定基本构成单位及其时空范围,亦即确定调查对象的内涵、外延以及数量。这种界定要和研究目标及要求相符,并要有理论依据。一般情况下,研究总体就是实施调查的总体,但在某些情况下,两者不一样,调查总体可能是研究总体的一部分。,二、抽样方法,2.确定样本规模,包括确定样本所含个体数目和选择样本的具体方法。,二、抽样方法,3.抽样,抽样常用的方法有四种:随机抽样、分层随机抽样、聚类抽样和系统抽样。,二、抽样方法,(1)随机抽样,随机抽样的重要标志是总体中每个个体被抽到样本中的机会均等,利用随机抽样得到的样本能够代表总体。运用这样的样本估计总体,统计推断出的结论的可靠性才有保障。随机抽样是一种最简单的获取有代表性样本的方法,包括随机抽样在内的所有抽样都不能保证样本完全代表总体,但随机抽样获得有代表性样本的概率较高。,二、抽样方法,【案例1】某市为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组。为了保证对每个志愿者的公平性,如何确定志愿小组的名单?解:案例1的总体中个体数目较少,运用随机抽样法抽样。简单随机抽样法有两种,分别为抽签法和随机数法,两法皆适合此案例。抽样过程可分别设计为以下几个步骤:1.采用抽签法。(1)界定总体:18名志愿者。(2)确定样本规模:6名志愿者。(3)抽样:将18名志愿者编号,号码为01、02、18。将号码分别写在一张纸条上,揉成团,制成号签。将做成的号签放入一个不透明的袋子中,并充分搅匀。从袋子中依次抽取6个号签,并记录上面的编号。(4)所得号码对应的志愿者就是志愿小组的成员。2.采用随机数法。(1)界定总体:18名志愿者。(2)确定样本规模:6名志愿者。(3)抽样:将18名志愿者编号,号码为00、01、17(同抽签法编号一致也可,但号码的位数要相同)。在随机数表中任选一数,如第1行第1列的数0。读表并录号:从选定的数0开始向右读(读数的方向也可向左、向上、向下),得到一个两位数03,由于0317(03理解为3),说明号码在总体内,将它记录;继续向右读,得到47,由于4717,将它去掉。按照这种方法继续向右读,直到记录的号码为03、16、11、14、10、07。(4)所得号码对应的志愿者就是志愿小组的成员。,二、抽样方法,当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明,难以分类,或总体单位之间特性差异程度小时采用此法效果较好。抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便。如果标号的签搅拌得不均匀,会导致抽样不公平。而随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。,二、抽样方法,(2)分层随机抽样,分层抽样又称分类抽样或类型抽样,是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。一般地在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本。分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的。,二、抽样方法,【案例2】某学校有在编教师160人。其中老年教师16人,中年教师112人,青年教师32人。教育部门为了了解教师的健康状况,要从中抽取一个容量为20的样本。试用分层抽样法抽样。抽样过程可设计为以下几个步骤:(1)界定总体:160名某校在编教师。(2)确定样本规模:20名在编教师。(3)抽样:抽样为n/N=20/160=1/8,其中n表示样本容量,N表示总体中个体的数目。所以样本中的老年教师人数为16(1/8)=2;样本中的中年教师人数为112(1/8)=14;样本中的青年教师人数为32(1/8)=4。运用抽签法在16位老年教师中抽取2人,运用系统抽样法在112位中年教师中抽取14人,运用抽签法在32位青年教师中抽取4人。(4)把层内抽样得到的教师集合在一起,得到所求的样本。,二、抽样方法,分层抽样与简单随机抽样相比,往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。分层的原则是增加层内的同质性和层间的异质性。常见的分层变量有性别、年龄、教育、职业等。分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高,二、抽样方法,(3)聚类抽样,聚类抽样又称整群抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。聚类抽样优点是实施方便、节省经费;聚类抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。,二、抽样方法,【案例3】以企业人员状况为例说明聚类抽样的方法步骤:(1)界定总体:全市5000个小企业。(2)确定样本规模:选择总体的10,即500个。(3)界定聚类体。设以街道办事处为聚类体,全市的街道办事处为50个。(4)估计每聚类体的平均个数,然后确定聚类体数。一般样本规模除以聚类体平均的样本数得出聚类体数。尽管各办事处的企业数并不相同,每个办事处平均计有小企业5000/50=100个,则选择的聚类体即办事处500/100=5个。(5)根据随机数表选定5个样本聚类体。(6)选择500个样本。5个样本聚类体中的全部企业都属于样本,调查可以集中在此5个办事处进行,不必去所有50个办事处。,二、抽样方法,聚类抽样与分层抽样在形式上有相似之处,但实际上差别很大。分层抽样要求各层之间的差异很大,层内个体或单元差异小,而聚类抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本时从每个层内抽取若干单元或个体构成,而聚类抽样则是要么整群抽取,要么整群不被抽取。,二、抽样方法,(4)系统抽样,系统抽样也称为等距抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。由于系统抽样法操作简便,实施起来不易出错,因而在生产现场人们乐于使用它。,二、抽样方法,【案例4】某工厂平均每天生产某种零件大约1000件,要求产品检验员每天抽取50件,检查其质量状况,试用系统抽样法抽样。抽样过程可设计为以下几个步骤:(1)界定总体:1000件零件。(2)确定样本规模:50件零件。(3)抽样:把1000个零件编号,号码为000、001、002、999。把编号分成50段,间隔数k1000/5020。在第1段编号为000019的个体中,用简单随机抽样法确定样本中首个个体编号t(t019)。按照一定的规律,通常是首个个体编号t加上间隔数20得到第2个个体编号(t+20);再加20得到第3个个体编号(t+40)依次下去,直到得到最后一个个体编号(t+980),共50个编号。(4)所得编号对应的零件组成样本。,二、抽样方法,系统抽样方式也不是完美的,它相对于简单随机抽样方式最主要的优势就是经济性。系统抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用系统抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。,二、抽样方法,比较以上四种概率抽样方法,纯随机抽样和分层随机抽样应该是最合适的技术,有时候聚类抽样很有用,只是在很少情况下才使用系统抽样。,三、抽样误差和偏差,三、抽样误差和偏差,抽样技术再好,也不能保证样本完全代表总体,也就是说,统计值不可能完全和参数值相等,只是在样本量足够大的情况下两者很接近。抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标的绝对离差。,三、抽样误差和偏差,抽样误差的原因:抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。,三、抽样误差和偏差,抽样偏差并非是由于机遇的原因导致的随机误差,而是研究者的失误造成的系统误差。抽样偏差主要来自非概率抽样技术。由于研究人员怕费时和花钱,往往主观随意抽样。管理研究中也有采用主观抽样的情况,尽管有偏差,但使用简单。主观抽样的方式有三种:简便抽样、判断抽样和配额抽样。,三、抽样误差和偏差,1.简便抽样,研究者将自己所能遇到的人员、时间作为样本,如“街头拦人”作为调查对象,到企业参观,向所遇到的职工提问了解情况,这都属于简便抽样。这种抽样调查可提供信息,但很难据此得出一般适用的结论。,三、抽样误差和偏差,2.判断抽样,判断抽样又称“立意抽样”,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法。判断抽属于非随机抽样技术,与此相关的还有:便利抽样、配额抽样、滚雪球抽样、固定样本调查法等,这些抽样方法在抽样时不遵循随机原则,而是按照调查员主观判断或仅按方便的原则抽取样本。,三、抽样误差和偏差,3.配额抽样,配额抽样也称“定额抽样”,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。,总的来说,非概率抽样方法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年生理实验课考试题及答案
- 2025年美术教育考试试题及答案
- 扑火安全培训心得课件
- 2025年焊工证考试题分类及答案
- 情景表演时空对话课件
- 心理咨询考试试卷及答案
- 山东焊工证考试试题及答案
- 恐龙科普知识课件
- 衢州语文高考试卷及答案
- 公务员岗位招聘考试题及答案
- 苏科版三年级上册信息技术全册教学设计
- 黑龙江:装配式混凝土矩形渠道应用技术规范(DB23-T 2334-2019)
- T/CECS 10001-2019用于混凝土中的防裂抗渗复合材料
- 2024福建农信社春季招聘笔试历年典型考题及考点剖析附带答案详解
- 海关退运协议书
- 新八德教育工作计划、总结模版
- 月嫂 考试题及答案
- 2025保定市涞源县涞源镇社区工作者考试真题
- 物质安全资料脱模剂MSDS
- 2025年中国过敏性鼻炎市场研究报告
- 房建工程总承包EPC项目技术标(投标方案)(技术标)
评论
0/150
提交评论