抽样与统计推论_第1页
抽样与统计推论_第2页
抽样与统计推论_第3页
抽样与统计推论_第4页
抽样与统计推论_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样与统计推论第1页,课件共55页,创作于2023年2月

一、抽样调查简介第2页,课件共55页,创作于2023年2月抽样与抽样调查抽样调查:从研究对象的整体中选出一部分代表加以调查研究,然后用所得的结果推论和说明总体的特征。从总体中选出一部分的过程就是抽样,选出的代表就是样本。第3页,课件共55页,创作于2023年2月抽样调查的历史始于1891年挪威的人口调查社会学最早运用抽样调查:A.L.Bowleg对英国和威尔士的五城镇调查二战后,日益成为主流的调查方法第4页,课件共55页,创作于2023年2月抽样调查的优越性调查费用较低速度快应用范围广可获得内容丰富的资料准确度高第5页,课件共55页,创作于2023年2月抽样术语调查总体:从中实际抽取调查样本的个体的集合体抽样单位:一次直接的抽样所使用的基本单位抽样框:从中抽取样本的抽样单位的名单参数值:关于总体中某一变量的综合描述统计值:关于样本中某一变量的综合描述抽样误差:用样本的统计值去推算总体的参数值时发生的偏差,是样本代表性的一个标准第6页,课件共55页,创作于2023年2月抽样的基本程序界定调查总体1936年《文学摘要》总统选举民意测验编制抽样框:将总体的各元素毫无遗漏地排列成表;概率抽样的基本要求,决定着抽样的质量设计和抽取样本评估样本和估计总体第7页,课件共55页,创作于2023年2月衡量样本质量的两个标准:准确性——样本没有偏差(系统误差)偏差的来源:1)抽样程序的缺点,即未能严格遵行随机原则;2)无回答。精确性——抽样误差的大小。抽样误差:抽样这种方法所固有的误差,是随机误差第8页,课件共55页,创作于2023年2月抽样方法非概率抽样偶遇抽样判断抽样定额抽样雪球抽样概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样第9页,课件共55页,创作于2023年2月1、非概率抽样抽取调查单位的原则是根据主观判断或其它操作上的方便。基本方法:立意抽样法、偶遇抽样法、定额抽样法。非概率抽样的优点:成本低、花时短。缺点:不能做统计推论第10页,课件共55页,创作于2023年2月2、概率抽样含义:总体中的每一个个体都有一个已知的不为零的被选机会进入样本。分为等概率抽样和不等概率抽样。优点:虽然无法完美地代表总体,但较其他抽样方法更具代表性,能避免各种偏见;能够估计样本的精确度及代表性第11页,课件共55页,创作于2023年2月二、抽样的历程(5个步骤):

1.界定总体。

2.搜集全部名单。3.决定样本大小:必须同时考虑抽样误差和研究代价。4.设计抽样方法5.评估样本的正误(即代表性)第12页,课件共55页,创作于2023年2月三、概率抽样方法

1、简单随机抽样:按照随机原则,直接从总体N个单位中,抽取几个单位作为样本,保证总体中每个单位在抽选时都有同等的机会被选中。分为:简单重复抽样简单不重复抽样第13页,课件共55页,创作于2023年2月2.等距抽样(机械抽样,系统抽样)先将总体按某一因素排列,然后依固定的间隔,每间隔若干单位抽出一个单位。例如:总体单位为N,样本容量为n,则样本间隔为:k=N/n,抽样时,先随机抽取一个单位,假定为a,然后从a单位开始,每间隔K单位都将是入选的单位。优点:简化了抽取过程缺点:可能出现周期性偏差第14页,课件共55页,创作于2023年2月3.分层抽样(类型抽样、分类抽样)分层抽样:先将总体分类或分层,然后在各层中按随机原则抽选一定单位构成样本。

分层(组)标准与研究目的相关性越强越好。(如生育观念和教育水平)组与组之间差别大,组内差距小。第15页,课件共55页,创作于2023年2月分层抽样根据各层抽取比例是否相等,可分作分层定比抽样和分层异比抽样:

分层定比抽样样本中各层抽取的比例是相同的。例如总体单位N=20000,样本容量n=500,则抽样比例:

第16页,课件共55页,创作于2023年2月

设总体按老、中、青三代分层,于是根据总体中三代人的总人数,就可确定三代人的抽样人数:

第17页,课件共55页,创作于2023年2月

分层异比抽样

当总体中某一层人数过少,但又具有较高的研究价值,这时可增大这一层的抽样比例。但这样做的结果,统计分析时要做适当修正。第18页,课件共55页,创作于2023年2月4.整群抽样(集体抽样)

在整群抽样中,总体被分为很多“群”,这些群是抽样的单位。随机抽取若干群,被选入样本的群中的全部个案都进入样本。整群抽样适用于群间差异小,而群内差异大的总体,这点正好和分类抽样相反。第19页,课件共55页,创作于2023年2月5.多段抽样

先抽取若干集体,再从选取的集体中抽取若干较小的单位。如:第一步:从全国的省直辖市中抽取若干省和直辖市第二步:从入选的省和市中抽取县级单位第三步:从县级单位中抽出乡和镇第四步:从乡和镇中确定调查对象第20页,课件共55页,创作于2023年2月

概率与抽样分布第21页,课件共55页,创作于2023年2月机遇(可能性或机会)与概率统计推论以概率论为基础:通过概率论,可以计算由样本推论总体时犯错误的大小。“如果我有当国王的机遇,那么我就有戴上皇冠的命。”(麦克白)概率:机遇的数学。即用数学来了解机遇现象的规律模式。第22页,课件共55页,创作于2023年2月可能性有多大?1986年1月28日,挑战者号航天飞机发射后不久爆炸。总统特别委员会调查:这种发射失败的机会有多大?管理部门:大概10万次才会发生一次。物理学家费曼:“你们的意思是说,如果连续300年每天发射一次,你们预期只会失败1次?”第23页,课件共55页,创作于2023年2月概率的概念概率理论的基础:短期机遇现象无法预测,但是长期下来,会呈现有规则且可预测的模式。掷硬币:投掷的次数越多,正面向上的比例就会靠近0.5,而且会一直维持在0.5附近。0.5—正面出现的概率。第24页,课件共55页,创作于2023年2月掷铜板的人第25页,课件共55页,创作于2023年2月死亡的概率20-24岁的男性中,在任一年中会死的比率为0.0015,这是一个年轻男人明年会死的概率。对于同年龄层的女性,死亡概率大约是0.0005。如果一个保险公司卖人寿保险给20-24岁的年轻人,那么公司会知道,卖给男性的保险明年大约有0.15%要理赔,女性有0.05%要理赔。因为男性理赔比例要高一些,所以收费要多一些。第26页,课件共55页,创作于2023年2月抽样分布的概念根据概率论的原则成立的理论性分布,显示由同一总体反复不断地抽取不同样本时,各个可能出现的样本统计值的分布情况。均值抽样分布二项抽样分布第27页,课件共55页,创作于2023年2月

(一)均值抽样分布第28页,课件共55页,创作于2023年2月例:设某村有5户人家,以下是总体家庭人口的统计表

第29页,课件共55页,创作于2023年2月图1

1/5

45678第30页,课件共55页,创作于2023年2月第31页,课件共55页,创作于2023年2月现从总体(N=5)中,作样本容量n=2的简单随机抽样,它可能选出的样本有55=25种,结果如表2

第32页,课件共55页,创作于2023年2月经过整理,得出样本平均家庭人口数的抽样分布如下(表3)

第33页,课件共55页,创作于2023年2月平均家庭人口数的概率分布图2

p

x45678第34页,课件共55页,创作于2023年2月样本均值的平均值仍等于总体平均值6

可见,样本的均值平均数=第35页,课件共55页,创作于2023年2月

样本均值的方差(所有可能出现样本均值的方差)第36页,课件共55页,创作于2023年2月样本均值的抽样分布:三个令人惊异的事实1、样本均值的抽样分布的均值等于总体均值;意义:利用样本均值来推断总体均值成为可能2、样本均值的抽样分布的标准差(SE)等于总体的标准差除以样本规模的平方根;3、(1)如果从中随机抽取样本的总体服从正态分布,那么样本均值的抽样分布也会服从正态分布;(2)不管总体是不是正态分布,当样本规模越来越大时,样本均值的抽样分布将越来越接近正态分布第37页,课件共55页,创作于2023年2月中心极限定理:设有均值,方差2的分布总体,如随机抽取所有可能容量为n的样本,则样本平均数的抽样分布将随着n的增大而渐渐接近于以下正态分布~N(,)n30为大样本n<30为小样本第38页,课件共55页,创作于2023年2月正态曲线第39页,课件共55页,创作于2023年2月正态曲线方程第40页,课件共55页,创作于2023年2月第41页,课件共55页,创作于2023年2月标准正态分布含义:以标准差为单位的正态分布作用:将不同形态的正态分布简化为一种统计分布,简化统计分析第42页,课件共55页,创作于2023年2月例1:假设某大学拥有手机的所有同学每月的话费支出的均值为100元,标准差为30元,那么,如果从这些拥有手机的同学中随机抽取100人,统计他们每月的平均话费支出,那么:(1)其均值(即样本均值)大于100元/月的概率是多少?(2)其均值分别在97-103元/月,94-106元/月和91-109元/月之间的概率分别是多少?(3)如果出现110元/月这样的均值,你是否会感到惊讶,为什么?第43页,课件共55页,创作于2023年2月

例2,某学院1000名学生,其平均身高是168cm,标准差为22.5cm,现从学生中随机抽出100名,求其样本平均数大于1.70m的概率。解=168cm=22.5,n=100X=170cm

p(x>170)=第44页,课件共55页,创作于2023年2月(二)二项抽样分布所研究的变量只有两个值:是与否、高与低、男与女一个值出现,称为“成功”;另一个值出现,称为“失败”。第45页,课件共55页,创作于2023年2月二项抽样分布(N=样本大小r=成功数)

第46页,课件共55页,创作于2023年2月

1、当P=Q=1/2时的二项分布是对称的2、各个几率是可以相加的例如:N=5时,得到4个或5个成功的几率是:P(4、5)=P(4)+P(5)=0.156+0.031=0.187得到两个或以下是成功的几率是:P(2)=P(0)+P(1)+P(2)=0.031+0.156+0.313=0.500一个也不成功的几率是P(0)=0.031第47页,课件共55页,创作于2023年2月例3:研究青年人是否同意只生一个孩子假设:同意与反对的比例各占50%。从总体中随机抽取五名青年(n=5),发现全部同意(r=5)。根据二项分布,获得这个结果的可能性很小(p=0.031)。所以假设可能不对。第48页,课件共55页,创作于2023年2月上面介绍的二项分布是假定P=Q=1/2其实,只要是P+Q=1,P与Q可以是任何数值:0不成功X(e)=1成功第49页,课件共55页,创作于2023年2月第50页,课件共55页,创

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论