版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章抽样设计(统计专业)o抽样调查的概念抽样调查的概念o抽样调查方案设计抽样调查方案设计第一节第一节 抽样调查方案设计抽样调查方案设计o抽样调查是按照一定的规则从总体中抽取一抽样调查是按照一定的规则从总体中抽取一部分个体单位作为样本,通过对样本的调查部分个体单位作为样本,通过对样本的调查研究所获得的信息资料,来推断总体的信息研究所获得的信息资料,来推断总体的信息资料的方法。抽样调查也称作抽样推断。资料的方法。抽样调查也称作抽样推断。一、抽样调查的概念一、抽样调查的概念3中国人民大学统计学院中国人民大学统计学院二、抽样调查方案设计二、抽样调查方案设计o抽样调查方案设计的基本原则抽样调查方案设计
2、的基本原则o抽样方案设计的基本内容抽样方案设计的基本内容o抽样误差的控制抽样误差的控制4中国人民大学统计学院中国人民大学统计学院(一)抽样调查方案设计的基本原则(一)抽样调查方案设计的基本原则 如何科学地组织抽样调查是抽样推断中的一个重要问题,在如何科学地组织抽样调查是抽样推断中的一个重要问题,在抽样调查之前首先要有一个抽样方案的设计。抽样方案的设计和抽样调查之前首先要有一个抽样方案的设计。抽样方案的设计和施工的蓝图一样是抽样调查的一个总体规划,它包括如何从总体施工的蓝图一样是抽样调查的一个总体规划,它包括如何从总体中抽取样本,说明调查要取得哪些项目资料,用什么方法去取得中抽取样本,说明调查要
3、取得哪些项目资料,用什么方法去取得这些资料,要求资料的精确程度和确定必要的样本单位数目,等这些资料,要求资料的精确程度和确定必要的样本单位数目,等等。完整的抽样方案还应该包括一些必要的附件,如调查人员的等。完整的抽样方案还应该包括一些必要的附件,如调查人员的培训计划、调查问卷或调查表的设计、调查项目的编码以及汇总培训计划、调查问卷或调查表的设计、调查项目的编码以及汇总表的格式等。表的格式等。抽样方案设计必须遵循两个基本原则:抽样方案设计必须遵循两个基本原则: 1 1、抽样随机性原则(随机抽样条件下)、抽样随机性原则(随机抽样条件下) 2 2、最大抽样效果原则、最大抽样效果原则 5中国人民大学统
4、计学院中国人民大学统计学院(二)抽样方案设计的基本内容(二)抽样方案设计的基本内容 抽样方案是对抽样调查中的总体范围、抽样方式、抽样方法、抽样方案是对抽样调查中的总体范围、抽样方式、抽样方法、抽样数目、抽样框、抽样精度、抽样估计、抽样实施细节等技术抽样数目、抽样框、抽样精度、抽样估计、抽样实施细节等技术性问题所作的安排,其目的在于提高抽样调查和推断的科学性和性问题所作的安排,其目的在于提高抽样调查和推断的科学性和可靠性,控制抽样调查的过程,提高抽样调查的效率,确保抽样可靠性,控制抽样调查的过程,提高抽样调查的效率,确保抽样调查的质量。调查的质量。 抽样方案设计的基本内容如下:抽样方案设计的基本
5、内容如下:1 1、明确抽样调查的目的、明确抽样调查的目的抽样调查的目的应根据统计调查的任务抽样调查的目的应根据统计调查的任务和要求及管理者或用户的信息需求确定。和要求及管理者或用户的信息需求确定。2 2、确定总体范围和总体单位、确定总体范围和总体单位总体范围的确定应根据研究目的从时总体范围的确定应根据研究目的从时间和空间两个方面作出界定,即明确界定调查的总体范围,并对调间和空间两个方面作出界定,即明确界定调查的总体范围,并对调查总体作适当的划分。总体范围明确后,应进一步明确总体单位是查总体作适当的划分。总体范围明确后,应进一步明确总体单位是什么,即明确样本单位。什么,即明确样本单位。6中国人民
6、大学统计学院中国人民大学统计学院(二)抽样方案设计的基本内容(二)抽样方案设计的基本内容3 3、确定抽样推断的主要项目、确定抽样推断的主要项目抽样调查的目的在于用抽样调查的目的在于用样本数据推断总体的数量特征,因此,在抽样方案设计样本数据推断总体的数量特征,因此,在抽样方案设计中,应对抽样调查需要推断的总体指标或项目作出合理的中,应对抽样调查需要推断的总体指标或项目作出合理的规定。不必要作出抽样推断的项目,可列入一般需要了解规定。不必要作出抽样推断的项目,可列入一般需要了解的调查内容。主要推断项目的确定,是为设计抽样精度和的调查内容。主要推断项目的确定,是为设计抽样精度和确定必要的抽样本数目提
7、供依据。如:个体经营户经营情确定必要的抽样本数目提供依据。如:个体经营户经营情况抽样调查,需要抽样推断的总体指标有从业人员、营业况抽样调查,需要抽样推断的总体指标有从业人员、营业收入、营业支出、雇员报酬、缴纳税费、固定资产原值收入、营业支出、雇员报酬、缴纳税费、固定资产原值等,其中,营业收入是最核心的指标,是确定抽样精度和等,其中,营业收入是最核心的指标,是确定抽样精度和样本量的关键指标。样本量的关键指标。 7中国人民大学统计学院中国人民大学统计学院(二)抽样方案设计的基本内容(二)抽样方案设计的基本内容4 4、确定抽样的组织方式、确定抽样的组织方式抽样组织方式多种多样,通常有抽样组织方式多种
8、多样,通常有简单随机抽样、类型抽样、系统抽样、整群抽样、多阶段抽简单随机抽样、类型抽样、系统抽样、整群抽样、多阶段抽样等。应根据总体范围大小、各总体单位分布及变异程度、样等。应根据总体范围大小、各总体单位分布及变异程度、抽样目的和要求、抽样精度和抽样费用的约束等因素确定合抽样目的和要求、抽样精度和抽样费用的约束等因素确定合适的抽样组织方式。适的抽样组织方式。5 5、确定合适的抽样框、确定合适的抽样框抽样框是一个包括全部总体单位的能抽样框是一个包括全部总体单位的能够代表总体全貌的目录或名册,抽样框是抽取样本的依据。抽样框的设计应当够代表总体全貌的目录或名册,抽样框是抽取样本的依据。抽样框的设计应
9、当力求包括总体的全部个体,并列出必要的辅助信息,以便对个体进行分层或排力求包括总体的全部个体,并列出必要的辅助信息,以便对个体进行分层或排序处理,为有效地抽取样本提供依据。序处理,为有效地抽取样本提供依据。8中国人民大学统计学院中国人民大学统计学院(二)抽样方案设计的基本内容(二)抽样方案设计的基本内容6 6、确定恰当的抽样方法、确定恰当的抽样方法如简单随机抽样应明确是重复抽如简单随机抽样应明确是重复抽样还是不重复抽样,以及如何具体实施抽样;类型抽样则应样还是不重复抽样,以及如何具体实施抽样;类型抽样则应明确如何分层,如何从每一层中抽取样本单位组成样本;系明确如何分层,如何从每一层中抽取样本单
10、位组成样本;系统抽样则应明确如何对总体单位进行排序,怎样等距抽取样统抽样则应明确如何对总体单位进行排序,怎样等距抽取样本单位组成样本;整群抽样则应明确怎样对总体进行分群,本单位组成样本;整群抽样则应明确怎样对总体进行分群,怎样抽取样本群组成样本。怎样抽取样本群组成样本。7 7、确定主要指标的抽样精确度、确定主要指标的抽样精确度在抽样方案设计中,为了控制抽在抽样方案设计中,为了控制抽样误差,确定必要的样本量,必须预先提出和明确主要指标的抽样样误差,确定必要的样本量,必须预先提出和明确主要指标的抽样精确度。抽样调查所需要的准确,不是百分之百的准确,只要准确精确度。抽样调查所需要的准确,不是百分之百
11、的准确,只要准确性能满足决策的要求就可以了,不必追求过分性能满足决策的要求就可以了,不必追求过分9中国人民大学统计学院中国人民大学统计学院(二)抽样方案设计的基本内容(二)抽样方案设计的基本内容的精确,以及花费过多的不必要的代价。抽样精确度或准确的精确,以及花费过多的不必要的代价。抽样精确度或准确度的表现形式通常有抽样极限误差、抽样标准误差和相对抽样度的表现形式通常有抽样极限误差、抽样标准误差和相对抽样标准误差。如我国城市家计调查一般要求相对抽样标准误差不标准误差。如我国城市家计调查一般要求相对抽样标准误差不超过超过2%2%3%3%,可信程度应达到,可信程度应达到95.45%95.45%以上。
12、以上。 8 8、确定必要的抽样数目(样本量)、确定必要的抽样数目(样本量)样本量的确定一般可考样本量的确定一般可考虑总体方差、抽样精确度、可信度(概率保证程度)和抽样方虑总体方差、抽样精确度、可信度(概率保证程度)和抽样方式方法进行计算确定。需要注意的是任何精确度和样本量的设式方法进行计算确定。需要注意的是任何精确度和样本量的设计都不能回避调查费用这个基本因素。在很多情况下,提高精计都不能回避调查费用这个基本因素。在很多情况下,提高精确度往往需要增大样本量,而样本量的增大又会导致费用开支确度往往需要增大样本量,而样本量的增大又会导致费用开支的增加。因此,精确度要求与节省费用要求是矛盾的。的增加
13、。因此,精确度要求与节省费用要求是矛盾的。10中国人民大学统计学院中国人民大学统计学院(二)抽样方案设计的基本内容(二)抽样方案设计的基本内容9 9、制定抽样的实施细则、制定抽样的实施细则主要包括样本量的分配,样本单位抽取的操作程主要包括样本量的分配,样本单位抽取的操作程序,样本单位抽取登记,中选样本单位的分布图制作,个别单位拒绝调查或序,样本单位抽取登记,中选样本单位的分布图制作,个别单位拒绝调查或拒绝回答等特殊问题的处理办法,样本挖根生的评价与改进,等等。拒绝回答等特殊问题的处理办法,样本挖根生的评价与改进,等等。1010、设计数据处理与抽样估计的方法、设计数据处理与抽样估计的方法在抽样方
14、案设计在抽样方案设计中,亦可对抽样调查数据的质量控制、审核、汇总处理等作中,亦可对抽样调查数据的质量控制、审核、汇总处理等作出明确的规定,特别是应根据抽样的组织方式和抽样推断的出明确的规定,特别是应根据抽样的组织方式和抽样推断的要求,对统计量(样本指标)的选择与计算方法、抽样标准要求,对统计量(样本指标)的选择与计算方法、抽样标准误差的测定、参数估计或假设检验的方法作出具体的规定。误差的测定、参数估计或假设检验的方法作出具体的规定。 11中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制调查总误差调查总误差代表性误差代表性误差非抽样性误差非抽样性误差系统性误差系统
15、性误差随机抽样误差随机抽样误差回答误差回答误差不回答误差不回答误差调研者误差调研者误差被调查者误差被调查者误差调查员误差调查员误差代用信息误差代用信息误差测量误差测量误差总体定义误差总体定义误差抽样框误差抽样框误差数据处理误差数据处理误差计数误差计数误差记录误差记录误差询问误差询问误差欺骗误差欺骗误差不能正确回答不能正确回答不愿正确回答不愿正确回答填表误差填表误差12中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制1 1、统计调查误差的形成、统计调查误差的形成 从理论上讲,调查误差是指样本指标与总体指标之间数量上的差异。调从理论上讲,调查误差是指样本指标与总体指
16、标之间数量上的差异。调查误差大小受许多因素的影响,按照性质不同可分为代表性误差和非抽样误查误差大小受许多因素的影响,按照性质不同可分为代表性误差和非抽样误差两大类。代表性误差可进一步分为系统性误差和随机抽样误差;非抽样误差两大类。代表性误差可进一步分为系统性误差和随机抽样误差;非抽样误差可进一步分为回答误差和不回答误差。差可进一步分为回答误差和不回答误差。(1)(1)抽样系统性误差抽样系统性误差 抽样系统性误差是指抽样设计没有遵循随机原则而有意抽样系统性误差是指抽样设计没有遵循随机原则而有意选择变量值较大或较小的单位组成样本,从而导致有严重倾选择变量值较大或较小的单位组成样本,从而导致有严重倾
17、向性的估计误差,即样本不能代表总体,致使抽样推断的结向性的估计误差,即样本不能代表总体,致使抽样推断的结果严重偏大或偏小。这种误差是不容许的,应力求避免。果严重偏大或偏小。这种误差是不容许的,应力求避免。13中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制(2)(2)随机抽样误差随机抽样误差 随机抽样误差是指调查者即使遵循随机原则抽取样本进行调查,样本指标与总随机抽样误差是指调查者即使遵循随机原则抽取样本进行调查,样本指标与总体指标之间仍会产生不可避免的误差。这种误差是随机的,没有倾向性,它随样本体指标之间仍会产生不可避免的误差。这种误差是随机的,没有倾向性,它
18、随样本量的增大而减少。当采用全面调查时,代表性误差就不存在了。因此,在采用抽样量的增大而减少。当采用全面调查时,代表性误差就不存在了。因此,在采用抽样调查、典型调查等非全面调查时,应注意防止系统性误差,尽量降低随机抽样误差。调查、典型调查等非全面调查时,应注意防止系统性误差,尽量降低随机抽样误差。 (3)(3)调研者误差调研者误差调研者误差是由调研者的工作差错造成的非抽样误差,主要包括:调研者误差是由调研者的工作差错造成的非抽样误差,主要包括: 1 1)代用信息误差)代用信息误差调研者调研问题所需要的信息与调研者实际搜调研者调研问题所需要的信息与调研者实际搜集的信息之间不一致而导致的误差。集的
19、信息之间不一致而导致的误差。 2 2)测量误差)测量误差调研者期望搜集的信息与调研者采用的测量量表不当而形成调研者期望搜集的信息与调研者采用的测量量表不当而形成的信息之间的误差。的信息之间的误差。 3 3)总体定义误差)总体定义误差调研者所定义的总体与研究问题需要的真正总调研者所定义的总体与研究问题需要的真正总体不一致而产生的误差。体不一致而产生的误差。 14中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制 4 4)抽样框误差)抽样框误差调研者定义的总体与所使用的抽样框隐含的选择不一致,即抽调研者定义的总体与所使用的抽样框隐含的选择不一致,即抽样框中的总体单位有
20、重复或者遗漏而导致的调查误差。样框中的总体单位有重复或者遗漏而导致的调查误差。 5 5)数据处理误差)数据处理误差调研者在由问卷中的原始数据转换为调查结果的过程中调研者在由问卷中的原始数据转换为调查结果的过程中产生的各种误差。产生的各种误差。 (4)(4)调查员误差调查员误差 调查员误差是指由调查员的工作差错造成的误差,主要包括:调查员误差是指由调查员的工作差错造成的误差,主要包括: 1 1)计数误差。)计数误差。 2 2)记录误差。)记录误差。 3 3)询问误差。)询问误差。 4 4)欺骗误差)欺骗误差调查员伪造部分或全部答案而造成的误差。调查员伪造部分或全部答案而造成的误差。 15中国人民
21、大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制(5)(5)被调查者误差被调查者误差 被调查者误差是指由被调查者在回答调查问题时由于不能正确被调查者误差是指由被调查者在回答调查问题时由于不能正确回答或不愿正确回答等原因而导致的误差。回答或不愿正确回答等原因而导致的误差。(6)(6)不回答误差不回答误差 不回答误差是指被调查者不在家或不合作而产生的无回答偏差。不回答误差是指被调查者不在家或不合作而产生的无回答偏差。不回答的主要原因可能有:具体调查时被调查者不在家,未能接触不回答的主要原因可能有:具体调查时被调查者不在家,未能接触到;被调查者认为调查与己无关;工作忙、怕耽误
22、时间;被调查者到;被调查者认为调查与己无关;工作忙、怕耽误时间;被调查者怕调查涉及自己的利益等而拒绝接受调查。怕调查涉及自己的利益等而拒绝接受调查。16中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制2 2、调查中影响抽样误差的主要因素、调查中影响抽样误差的主要因素 抽样误差是样本指标和总体指标之间数量上的差别。抽样调查是抽样误差是样本指标和总体指标之间数量上的差别。抽样调查是用样本指标推断总体指标的一种调查方法,而推断的根据就是抽样误用样本指标推断总体指标的一种调查方法,而推断的根据就是抽样误差。因此,怎样计算、使用和控制抽样误差是抽样调查的重要问题。差。因此
23、,怎样计算、使用和控制抽样误差是抽样调查的重要问题。 为此,首先要把抽样误差的概念搞清楚。为此,首先要把抽样误差的概念搞清楚。 理解抽样误差可以从以下两个方面着手:第一,抽样误差是指理解抽样误差可以从以下两个方面着手:第一,抽样误差是指由于抽样的随机性而产生的那部分代表性误差,不包括登记误差,由于抽样的随机性而产生的那部分代表性误差,不包括登记误差,也不包括可能发生的偏差。第二,随机误差有两种:实际误差和抽也不包括可能发生的偏差。第二,随机误差有两种:实际误差和抽样平均误差。前者是一个样本指标与总体指标之间的差别,这是无样平均误差。前者是一个样本指标与总体指标之间的差别,这是无法知道的误差;后
24、者是可以计算的。因此,在讨论抽样误差时指的法知道的误差;后者是可以计算的。因此,在讨论抽样误差时指的是抽样平均误差。是抽样平均误差。 17中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制 为了计算和控制抽样平均误差,需要分析影响抽样平为了计算和控制抽样平均误差,需要分析影响抽样平均误差的因素。抽样平均误差的大小主要受以下几个因素均误差的因素。抽样平均误差的大小主要受以下几个因素的影响:的影响:(1 1)全及总体标志的变动程度。)全及总体标志的变动程度。(2 2)抽样单位数的多少。)抽样单位数的多少。(3 3)抽样方法。)抽样方法。(4 4)抽样的组织方式。)抽样
25、的组织方式。18中国人民大学统计学院中国人民大学统计学院(三)抽样误差的控制(三)抽样误差的控制3 3、统计调查误差的控制、统计调查误差的控制 统计调查误差的大小,直接影响到调查的质量和成败。如果调查误差统计调查误差的大小,直接影响到调查的质量和成败。如果调查误差太大,出现严重的系统性误差,就会导致调查的失败,因此在统计调查过太大,出现严重的系统性误差,就会导致调查的失败,因此在统计调查过程中应重视调查误差的控制。程中应重视调查误差的控制。 由于调查误差的来源是多方面的,因而决定了调查误差的控制必须是由于调查误差的来源是多方面的,因而决定了调查误差的控制必须是全方位和全过程的。统计调查误差控制
26、的目的在于防止出现抽样的系统性全方位和全过程的。统计调查误差控制的目的在于防止出现抽样的系统性误差,降低各种非抽样性误差,使调查总误差尽可能降低到最小的限度。误差,降低各种非抽样性误差,使调查总误差尽可能降低到最小的限度。这就需要重视统计调查误差的控制这就需要重视统计调查误差的控制既要重视随机抽样误差的控制,更既要重视随机抽样误差的控制,更要重视非抽样误差的控制;既要重视事前控制,又要重视事中和事后控制。要重视非抽样误差的控制;既要重视事前控制,又要重视事中和事后控制。 控制统计调查误差的途径有以下三个方面控制统计调查误差的途径有以下三个方面 19中国人民大学统计学院中国人民大学统计学院(三)
27、抽样误差的控制(三)抽样误差的控制 (1 1)提高样本的代表性)提高样本的代表性应根据总体的分布特征和总体单位的变异情应根据总体的分布特征和总体单位的变异情况,选择最优的抽样组织方式,力求样本分布与总体分布趋于一致。况,选择最优的抽样组织方式,力求样本分布与总体分布趋于一致。 (2 2)注重样本量的控制)注重样本量的控制样本量的大小应注意控制在必要的样本量的大小应注意控制在必要的抽样数目水平上,并考虑对回答率的高低作适当的调整。抽样数目水平上,并考虑对回答率的高低作适当的调整。 (3 3)提高抽样设计的效率)提高抽样设计的效率调研者误差的产生大都是由于抽样设调研者误差的产生大都是由于抽样设计不
28、科学、不严谨、不周密产生的。因此,调研者在抽样设计时,应有事计不科学、不严谨、不周密产生的。因此,调研者在抽样设计时,应有事前控制的理念,对总体定义、抽样框设计、测量工具的选择和测量表(问前控制的理念,对总体定义、抽样框设计、测量工具的选择和测量表(问卷)的设计、样本单位的抽取、调查数据的处理方案等方面进行认真的思卷)的设计、样本单位的抽取、调查数据的处理方案等方面进行认真的思考、研究和设计,力求少出差错。考、研究和设计,力求少出差错。 20中国人民大学统计学院中国人民大学统计学院o随机抽样的概念随机抽样的概念o随机抽样方法随机抽样方法o随机抽样估计随机抽样估计第二节第二节 随机抽样方法随机抽
29、样方法21中国人民大学统计学院中国人民大学统计学院 随机抽样,也称概率抽样,是指在总体中按随随机抽样,也称概率抽样,是指在总体中按随机原则抽取一定数目的单位进行观察,用所得的样机原则抽取一定数目的单位进行观察,用所得的样本数据推断总体指标。它是以本数据推断总体指标。它是以以以概率论概率论与与数理统数理统计计为基础,首先按照随机的原则选取为基础,首先按照随机的原则选取调查样本调查样本,使调查母体中每一个子体均有被选中的可能性,使调查母体中每一个子体均有被选中的可能性,即具有同等被选为样本的可能率,机遇均等。即具有同等被选为样本的可能率,机遇均等。这这种抽样方法在实践中受到人们的普遍重视和广泛应种
30、抽样方法在实践中受到人们的普遍重视和广泛应用。用。 一、一、 随机抽样的概念随机抽样的概念22中国人民大学统计学院中国人民大学统计学院 常见的随机抽样方法有五种,即简单随机抽样、常见的随机抽样方法有五种,即简单随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样。系统抽样、分层抽样、整群抽样和多阶段抽样。二、二、 随机抽样方法随机抽样方法(一)简单随机抽样(一)简单随机抽样 简单随机抽样,又称纯随机抽样,即在抽样之前,对总体简单随机抽样,又称纯随机抽样,即在抽样之前,对总体单位不进行任何分组、排列等处理,完全按随机原则直接从总单位不进行任何分组、排列等处理,完全按随机原则直接从总体中抽取样本。体
31、中抽取样本。 其抽样方法一般有两种:其抽样方法一般有两种:23中国人民大学统计学院中国人民大学统计学院 o1)1)抽签法抽签法o2)2)随机数表法随机数表法(利用随机数字表进行随机抽样)(利用随机数字表进行随机抽样)二、二、 随机抽样方法随机抽样方法24中国人民大学统计学院中国人民大学统计学院 随机数表随机数表( (部分部分) )二、二、 随机抽样方法随机抽样方法25中国人民大学统计学院中国人民大学统计学院(二)(二) 系统抽样系统抽样 系统抽样,也称等距抽样或机械抽样,是指事先将总系统抽样,也称等距抽样或机械抽样,是指事先将总体各单位按某一标志排列,然后依固定顺序和间隔来抽体各单位按某一标志
32、排列,然后依固定顺序和间隔来抽选样本的一种抽样方法。选样本的一种抽样方法。(三)(三) 分层抽样分层抽样 分层抽样,又称类型抽样或分类抽样,是指将总体单位分层抽样,又称类型抽样或分类抽样,是指将总体单位按某一标志按某一标志( (调查对象的属性、特征等调查对象的属性、特征等) )划分为若干层,然后划分为若干层,然后再从各层中用随机方法抽取样本,而不是在总体中直接抽取再从各层中用随机方法抽取样本,而不是在总体中直接抽取样本。样本。二、二、 随机抽样方法随机抽样方法26中国人民大学统计学院中国人民大学统计学院 o1.1.分层比例抽样分层比例抽样o分层比例抽样是指分层后,按随机原则根据分层比例抽样是指
33、分层后,按随机原则根据各层中单位数量占总体单位数量的比例抽取各层中单位数量占总体单位数量的比例抽取各层的样本数量。各层的样本数量。o每层抽取的样本数计算公式为每层抽取的样本数计算公式为o2.2.分层最佳抽样分层最佳抽样二、二、 随机抽样方法随机抽样方法27中国人民大学统计学院中国人民大学统计学院o分层最佳抽样,又称不等比例分层抽样,它分层最佳抽样,又称不等比例分层抽样,它不仅按各层中单位数占总体单位数的比例分不仅按各层中单位数占总体单位数的比例分配各层样本数,而且还根据各层的标准差的配各层样本数,而且还根据各层的标准差的大小来调整各层样本数目的抽样方法。大小来调整各层样本数目的抽样方法。o各层
34、样本数的计算公式为各层样本数的计算公式为o3.3.最低成本抽样最低成本抽样二、二、 随机抽样方法随机抽样方法28中国人民大学统计学院中国人民大学统计学院o最低成本抽样法是在考虑统计效果的前提下,根据费用支出来确最低成本抽样法是在考虑统计效果的前提下,根据费用支出来确定各层应抽取样本数。定各层应抽取样本数。o最低成本抽样法各层抽取样本数的计算公式为最低成本抽样法各层抽取样本数的计算公式为(四)整群抽样(四)整群抽样o整群抽样,是指先将总体按一定的标准整群抽样,是指先将总体按一定的标准( (如地区、单如地区、单位位) )分为若干群,然后根据随机原则从总体中抽取部分分为若干群,然后根据随机原则从总体
35、中抽取部分群体,对抽中的群体内所有单位进行全面调查的抽样调群体,对抽中的群体内所有单位进行全面调查的抽样调查方法。查方法。二、二、 随机抽样方法随机抽样方法29中国人民大学统计学院中国人民大学统计学院 二、二、 随机抽样方法随机抽样方法30中国人民大学统计学院中国人民大学统计学院(五)样本容量的确定(五)样本容量的确定o样本容量的确定,可以从极限抽样误差估算公式推导而得。样本容量的确定,可以从极限抽样误差估算公式推导而得。o其计算公式为:其计算公式为:o1.1.平均数指标样本容量的计算方法平均数指标样本容量的计算方法二、二、 随机抽样方法随机抽样方法31中国人民大学统计学院中国人民大学统计学院
36、o1)1)重复抽样时的计算公式:重复抽样时的计算公式:o我们已经知道,我们已经知道, 因为因为o故有故有o所以所以 o2)2)不重复抽样时的计算公式:不重复抽样时的计算公式:o由于由于二、二、 随机抽样方法随机抽样方法32中国人民大学统计学院中国人民大学统计学院o故有故有o所以所以o2.2.成数指标样本容量的计算方法成数指标样本容量的计算方法o1)1)重复抽样时的计算公式:重复抽样时的计算公式:o由于由于二、二、 随机抽样方法随机抽样方法33中国人民大学统计学院中国人民大学统计学院o故有o所以o2)不重复抽样时的计算公式:o由于 ,因为二、二、 随机抽样方法随机抽样方法34中国人民大学统计学院
37、中国人民大学统计学院o故有故有o所以所以o抽样调查合理的、经济的抽样样本容量的大小一般受以下抽样调查合理的、经济的抽样样本容量的大小一般受以下几个因素的影响:几个因素的影响:o总体各单位之间标志差异程度的大小。总体各单位之间标志差异程度的大小。o允许误差的大小。允许误差的大小。o抽样方式和方法。抽样方式和方法。二、二、 随机抽样方法随机抽样方法35中国人民大学统计学院中国人民大学统计学院(一)概述(一)概述 抽样调查的目的是为了用样本指标推断总体指标。对总体指抽样调查的目的是为了用样本指标推断总体指标。对总体指标的估计方法有两种:一种是点估计,另一种是区间估计。标的估计方法有两种:一种是点估计
38、,另一种是区间估计。三、三、 随机抽样估计随机抽样估计1 1、点估计:、点估计: 或或 它不能说明误差大小,意义不大。但它可以说明优良估它不能说明误差大小,意义不大。但它可以说明优良估计的标准。(无偏性、一致性和有效性)计的标准。(无偏性、一致性和有效性)2 2、区间估计、区间估计 可以将误差控制在一定的范围内(即说明总体指标在某可以将误差控制在一定的范围内(即说明总体指标在某一范围内的可能性大小)一范围内的可能性大小) 。pPxX36中国人民大学统计学院中国人民大学统计学院(二)抽样极限误差(二)抽样极限误差 由于存在误差,而且抽样指标会随着样本的不同而由于存在误差,而且抽样指标会随着样本的
39、不同而变动。这样,可以在统计意义上,推断总体指标在一定变动。这样,可以在统计意义上,推断总体指标在一定范围内。样本指标与总体指标的离差绝对值就是抽样极范围内。样本指标与总体指标的离差绝对值就是抽样极限误差限误差 。由于离差可正可负,整个变动的范围区间。由于离差可正可负,整个变动的范围区间称为置信区间。称为置信区间。变量总体变量总体属性总体属性总体三、三、 随机抽样估计随机抽样估计37中国人民大学统计学院中国人民大学统计学院置信区间:置信区间:对上式去掉绝对值符号,并且移项可得到:对上式去掉绝对值符号,并且移项可得到:置信区间是统计意义上的,即一定概率下,总体置信区间是统计意义上的,即一定概率下
40、,总体指标所落在的区间范围。指标所落在的区间范围。三、三、 随机抽样估计随机抽样估计38中国人民大学统计学院中国人民大学统计学院 抽样平均误差说明估计的准确抽样平均误差说明估计的准确 程度,因此可以将抽样程度,因此可以将抽样平均误差作为误差单位(当然在不同的条件下,这个单位平均误差作为误差单位(当然在不同的条件下,这个单位的具体值是不同的),抽样极限误差可以表示为多少个误的具体值是不同的),抽样极限误差可以表示为多少个误差单位(即抽样平均误差的多少倍),表示为:差单位(即抽样平均误差的多少倍),表示为: 抽样极限误差为抽样极限误差为t个抽样平均误差,或者是抽样平个抽样平均误差,或者是抽样平均误
41、差的均误差的t倍。这个倍。这个t就称为概率度或置信度。就称为概率度或置信度。 显然,概率度与抽样极限误差成正比。显然,概率度与抽样极限误差成正比。三、三、 随机抽样估计随机抽样估计39中国人民大学统计学院中国人民大学统计学院(概率)(概率)常用的常用的t及对应的及对应的F(t) t F(t) 0.68271.64 0.901.96 0.95 0.95453 0.9973三、三、 随机抽样估计随机抽样估计40中国人民大学统计学院中国人民大学统计学院(三)总体参数的区间估计步骤(三)总体参数的区间估计步骤 根据上面根据上面的讨论,全及平均指标推断的最终结果表现为一定概率保的讨论,全及平均指标推断的
42、最终结果表现为一定概率保证程度下的置信区间。证程度下的置信区间。3 3、得出置信区间、得出置信区间 显然,当置信区间已知时,可以根据已知条件倒推,计算抽样显然,当置信区间已知时,可以根据已知条件倒推,计算抽样平均误差、样本容量、概率度等。平均误差、样本容量、概率度等。1 1、根据调查资料计算出抽样平均误差、根据调查资料计算出抽样平均误差三、三、 随机抽样估计随机抽样估计2 2、根据概率保证要求,查表得出、根据概率保证要求,查表得出 值,然后计算出抽样极限值,然后计算出抽样极限误差误差 。t41中国人民大学统计学院中国人民大学统计学院o非随机抽样的概念非随机抽样的概念o非随机抽样方法非随机抽样方
43、法第三节第三节 非随机抽样方法非随机抽样方法42中国人民大学统计学院中国人民大学统计学院 非随机抽样,是指在抽样时不遵循随机原非随机抽样,是指在抽样时不遵循随机原则,而是由调查者根据调查目的和要求,主观设则,而是由调查者根据调查目的和要求,主观设立某个标准从总体中抽选样本的抽样方法。立某个标准从总体中抽选样本的抽样方法。 具体包括以下四种方法:具体包括以下四种方法:一、一、 非随机抽样的概念非随机抽样的概念43中国人民大学统计学院中国人民大学统计学院 o方便抽样方便抽样 方便抽样,又称任意抽样、偶遇抽样,是指调方便抽样,又称任意抽样、偶遇抽样,是指调查者根据调查方便在总体中随意选取样本的方法。查者根据调查方便在总体中随意选取样本的方法。o判断抽样判断抽样 判断抽样,又称目的抽样,是指调查者根据主判断抽样,又称目的抽样,是指调查者根据主观经验判断选定样本的一种非随机抽样法。观经验判断选定样本的一种非随机抽样法。二、二、 非随机抽样方法非随机抽样方法44中国人民大学统计学院中国人民大学统计学院o配额抽样配额抽样 配额抽样,又称定额抽样,是指依据调查配额抽样,又称定额抽样,是指依据调查总总体中的某些属性特征体中的某些属性特征( (控制特性控制特性) )将总体划分成将总体划分成若若干层,依据各层次样本在总体中的比重分配
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 技术创新助力产品差异化发展
- 2026辽宁生态工程职业学院赴高校现场招聘5人备考题库附答案详解(突破训练)
- 2026新疆兵投检验检测有限责任公司招聘5人备考题库及答案详解1套
- 2026甘肃庆阳市市本级新开发城镇公益性岗位备考题库含答案详解(新)
- 2026集团融媒体中心招聘短视频实习编辑10名备考题库及答案详解(基础+提升)
- 2026广东江门公用水务环境股份有限公司招聘2人备考题库含答案详解(能力提升)
- 2026广东东莞中学谢岗实验学校电教辅助员招聘1人备考题库及1套参考答案详解
- 2026恒丰银行青岛分行社会招聘10人备考题库参考答案详解
- 2026湖北民族大学附属民大医院招聘专业技术人员9人备考题库及答案详解(夺冠系列)
- 2026广西南宁市邕宁区中医医院招聘脑病科1人备考题库含答案详解(a卷)
- 2025年下半年浙江杭州市萧山区国有企业招聘人员笔试历年参考题库附带答案详解
- 2026年70周岁以上驾驶人三力测试模拟题
- 2026年4月23日四川省宜宾市五方面人员选拔笔试真题及答案深度解析
- 2025年四川省从“五方面人员”中选拔乡镇领导班子成员考试历年参考题库含答案详解
- GB/T 17498.6-2026室内固定式健身器材第6部分:跑步机附加的特殊安全要求和试验方法
- Costco开市客数据应用研究
- 2026宁夏农垦酒业有限公司社会招聘3人备考题库及答案详解(名校卷)
- 高低压开关柜投标文件技术标
- 新高考教学教研联盟(长郡二十校)2026届高三年级4月第二次联考英语试卷(含答案详解)
- 基于组态王停车场智能监控方案介绍
- 攀枝花市2026年春季人才引进(484人)笔试备考试题及答案解析
评论
0/150
提交评论