版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Chapter7Sampling&SamplingDistribution
第7章抽样和抽样分布
钱小军清华大学经济管理学院伟伦楼南456B电话:62789934电子邮箱:qianxj@1.SamplingandSamplingDistributions
抽样与抽样分布WhySampling?
为什么需要抽样?SimpleRandomSampling
简单随机抽样PointEstimation
点估计SamplingDistribution
抽样分布:样本均值的抽样
分布,样本比率的抽样分布CentralLimitTheorem
中心极限定理PropertiesofPointEstimation
点估计的评价标准
OtherSamplingMethods
其他抽样方法介绍2.Whydoweneedsampling?
为什么需要抽样?GeneralCensusmightbedifficult.
全面调查可能十分困难——人口普查,经济普查Generalcensusmightbeinfeasible.
全面调查是不可行的——灯泡或汽车轮胎寿命Generalcensusmightbeimpossible.
全面调查根本不可能——药效Samplingmightreducecost.
抽样可能省时、省人、省物、省力;Samplingmightbemoreaccurate.
如果做法得当,抽样调查的结果有可能比全面调查更准确。3.PurposeofSampling
抽样目的Thepurposeofsamplingistoestimatepopulationparametersofinterestusinginformationcontainedinsamples. 抽样的目的是利用样本中所包含的信息对感兴趣的总体参数进行估计。Inthischapter,wewillshowhowdataobtainedfromasimplerandomsamplecanbeusedtocomputeestimatesofapopulationmean,apopulationstandarddeviation,andapopulationproportion.Wewillalsointroducetheimportantconceptofsamplingdistribution. 我们将在本章介绍怎样利用样本信息对总体均值、总体标准差和总体比率进行估计。我们还将介绍抽样分布概念。4.SimpleRandomSampling
简单随机抽样Thepurposeofstatisticalinferenceistodevelopestimatesandtesthypothesesaboutthecharacteristicsofapopulationusinginformationcontainedinasample.
统计推断:从样本含有的信息中提取有关总体特征的信息。P165(EnglishVersionp243),EAI(ElectronicsAssociates,Inc.)公司人力资源调查:如何从2500名员工中抽取出一个包含有30个个体的样本,并利用样本信息对总体参数进行推断?5.Thedefinitionofasimplerandomsamplingandtheprocessofselectingasimplerandomsampledependonwhetherthepopulationisfiniteorinfinite.
简单随机抽样方法取决于总体本身是有限的还是无限的。ForFinitePopulation:AsimplerandomsampleofsizenfromafinitepopulationofsizeNisasmapleselectedsuchthateachpossiblesampleofsizenhasthesameprobabilityofbeingselected.
对于有限总体:如果总体中的每一个个体被抽中的概率都一样,则称这种抽样方法为(有限总体的)简单随机抽样。ForInfinitePopulation:(1)Eachelementselectedcomesfromthesamepopulation.(2)Eachelementisselectedindependently.
对于无限总体:如果(1)每个个体都来自同一个总体,(2)每个个体的选择都是独立的,则称这种抽样方法为(无限总体的)简单随机抽样。6.Methodstogenerateasimplerandomsampling
产生简单随机抽样样本的常用方法应用实例:从300人的工厂中选取一个包含30个个体的样本。把工人编号1到300用Excel中的均匀分布随机数发生函数生成随机数(采用小数点后保留三位)根据生成的随机数表选择样本中的个体组成样本。Samplingwithreplacement
有放回抽样Samplingwithoutreplacement无放回抽样Lot抓阄RandomNumbers
(EnglishVersionp245)随机数表,中文版p167RandomNumbersgeneratedbycomputer.使用计算机产生随机数Excel7.Application
应用实例第169页第8题:选6个篮球队组成一个简单随机样本(similartoEnglishVersionp248Applications8)采用第167页(EVp245)随机数表采用第9列每行前二位数结果13,8,23,25,18,5或马里兰州,衣阿华,佛罗利达州,弗吉尼亚,匹兹堡,俄克拉何马8.ReturntoEAIproblem
回到EAI问题(p165,EnglishVersionp242)EAI公司的人事主管为了制定一份简报,需要了解关于公司全体2500名管理人员的平均年薪以及公司中已经完成公司管理培训项目的管理人员所占的比例。公司全体管理人员的平均年薪——总体均值完成公司管理培训项目的管理人员所占的比例——总体比率为此,该公司的人事主管选择了一个由30个管理人员组成的简单随机样本(说明使用Excel均匀分布随机数发生函数RANDBETWEEN产生样本)。对由30个管理人员组成的样本,人事主管调查了他们的年薪和参加管理培训项目的情况,数据见P185EAI.xls。9.PointEstimation点估计对于一个我们感兴趣的总体参数(比如:平均值或标准差等),怎样从样本数据获得关于它们的估计?
PointEstimation:weusethedatafromthesampletocomputeavalueofasamplestatisticthatservesasanestimateofapopulationparameter.
点估计:用样本数据计算一个样本统计量的值,并用这个值作为对应总体参数的估计。在EAI公司的问题中,我们用样本均值作为总体均值
的点估计量,用样本比率作为总体比率的点估计量。10.EAI公司问题估计结果总体参数参数值(真值)点估计量点估计值年薪的总体均值51800美元年薪的样本均值51814美元年薪的总体标准差4000美元年薪的样本标准差s3347.72美元已完成管理培训项目的总体比率p0.60已完成管理培训项目的样本比率0.6311.CommonPointEstimations
常用点估计
总体参数点估计总体均值样本均值总体标准差样本标准差总体比率样本比率12.MoreCases
更多的实例加利福尼亚高速公路巡警保留着一项事故从报告到警员抵达事故现场所需要时间的记录。一个由十条记录组成的简单随机样本(以分钟为单位)如下:
1263448506823368125103a.事故从报告到警员抵达事故现场所需时间总体平均值的点估计为多少?b.事故从报告到警员抵达事故现场所需时间总体标准差的点估计是多少?样本均值
=59.4分钟
=的点估计样本标准差
=34.6分钟
=的点估计13.MoreCases
更多的实例1996年LouisHarris民意测验通过一项对1005名成人的调查来了解人们使用Internet的情况,调查结果如下:874名成人知道Internet.503名成人是计算机使用者191名成人在过去的12个月中使用过Internet.试求如下总体参数的点估计。a.知道Internet的成人所占的比率。b.成人中计算机使用者所占比率。c.成人中在过去的12个月中使用过Internet的人所占比率知道Internet的成人所占的比率(总体比率)的点估计为0.87.成人中计算机使用者所占比率(总体比率)的点估计为0.5.成人中在过去的12个月中使用过Internet的人所占比率(总体比率)的点估计为0.19.14.SamplingDistribution抽样分布Takingsamplingmeanasanexample
以样本均值为例:Samplingdistribution:Aprobabilitydistributionconsistingofallpossiblevaluesofasamplestatistic.
每一次简单随机抽样将得到不同的样本组成,不同的样本将产生不同的样本估计值,由所有可能的样本估计值以及它们发生的概率组成的随机变量称为抽样分布。Whytodiscussthesamplingdistributionof
为什么要讨论的抽样分布?点估计的代表性如何度量?要回答这个问题,我们需要对抽样误差的大小作出概率度量。15.SamplingDistribution
抽样分布例1:从2,5,8,9中随机地抽取包含2个个体的样本,计算样本均值,共有多少种不同的情况?(这个总体的均值为6,方差为7.5)这是一个新的随机变量,称为样本容量为2的样本均值的抽样分布,它的均值为6,方差为2.5。样本组成样本均值概率2,53.51/62,851/62,95.51/65,86.51/65,971/68,98.51/616.SamplingDistributionof
样本均值的抽样分布Thesamplingdistributionofistheprobabilitydistributionofallpossiblevaluesofthesamplemean,简单随机抽样的样本均值的抽样分布是样本均值的所有可能值的概率分布。ExpectedValueof
的期望值
where
17.Thisresultshowsthatwithsimplerandomsampling,theexpectedvalueormeanforisequaltothemeanofthepopulation.
样本均值的数学期望,其中是总体均值,即样本均值的数学期望就是总体均值,因此我们用样本均值的观测值作为总体均值的估计值。SamplingDistributionof
样本均值的抽样分布18.SamplingDistributionof
样本均值的抽样分布Thestandarddeviationof
样本均值的标准差:InfinitePopulation
FinitePopulation
无限总体 有限总体
thestandarddeviationofthesamplingdistributionof
样本均值抽样分布的标准差
thestandarddeviationofthepopulation
总体标准差
thesamplesize
样本容量
thepopulationsize
有限总体的总体容量Finitepopulationcorrectionfactor有限总体的修正系数19.FurtherThought概念深入思考样本标准差对于一个给定的样本,它是一个数值;对于所有可能的样本,它是一个随机变量;度量样本数据的变异程度。样本均值的标准差对于给定的总体,它总是一个数值;度量样本均值(作为随机变量)的变异程度。20.CalculationoftheStandardDeviationof
样本均值标准差的计算Whenthepopulationisinfinite;orthepopulationisfiniteandthesamplesizeislessthenorequalto5%ofthepopulationsize
当总体是无限的(infinite)或虽然总体是有限的(finite),但是样本容量(samplesize)不大于总体容量(population)的5%时,用以下公式计算样本均值的标准差:
即不用修正。回到例1,计算样本均值的标准差。例1回到EAI公司问题,计算样本均值的标准差。样本标准差是多少?P185EAI21.MeaningofStandardDeviationofSampleMean
样本均值的标准差的意义Whyitisimportant?
为什么需要讨论样本均值的标准差?Thesmallerthesamplemean’sstandarddeviationis,themoretypicalthesamplemeanisasanestimateofpopulationmean.
样本均值的标准差越小,用样本均值作为总体均值的点估计越有代表性。总体方差越小,用样本均值作为总体均值的点估计越有代表性。样本容量越大,用样本均值作为总体均值的点估计越有代表性。22.CentralLimitTheorem
中心极限定理Inselectingsimplerandomsamplesofsizenfromapopulation,thesamplingdistributionofthesamplemeancanbeapproximatedbyanormalprobabilitydistributionasthesamplesizebecomeslarge.
从总体中抽取样本容量很大的简单随机样本,当样本容量很大时,样本均值的抽样分布可以用正态分布来近似。具体来说就是,当样本容量很大时,可近似为均值为标准差为的正态分布。上述结论也可以表述为:当样本容量很大时,标准正态分布23.PracticalValueoftheCentralLimitTheorem
中心极限定理的应用无论总体服从什么分布,只要样本容量充分大,都可以用正态分布近似样本均值的抽样分布。中P177,18Englishp26318可以利用中心极限定理,求样本均值的取值落在某一区间内的概率。P177,19Englishp26319样本容量越大,采用样本均值的观测值作为总体均值的估计值就越有意义。P177,20Englishp26320关于样本容量:当总体服从正态分布时,对于任何样本容量,简单随机样本的样本均值都服从正态分布。对于其他总体分布,一般当样本容量不小于30时,我们就认为它是大样本,可以采用中心极限定理。对于0-1分布的总体,样本容量多大才算大样本不仅取决于样本容量,还依赖于成功的概率。24.SamplingDistributionof
样本比率的抽样分布SamplingDistribution
的抽样分布是样本比率的所有可能取值的抽样分布。ExpectedValue
的数学期望为,其中为总体比率。StandardDeviation
的标准差为Infinitepopulation无限总体:
Finitepopulation
有限总体:0-1分布总体情况下的中心极限定理:当且时,样本比率的抽样分布可以用正态分布近似。25.Applications
应用实例中文版 EnglishVersionP181,31 P269,33P181,32 P269,34P181,34 P269,36P181,35 P270,3726.Propertiesofpointestimation
点估计的评价标准Unbiasedness ThesamplestatisticisanunbiasedestimatorofthepopulationparameterifWhere
无偏性:如果样本统计量满足条件,其中为总体参数,则称样本统计量为总体参数的无偏估计量。27.Biasedestimation
有偏估计σ1σ2σ3Unbiasedestimation无偏估计σ1σ2σ3Propertiesofpointestimation
点估计的评价标准28.CommonUnbiasedEstimates
常用无偏估计样本均值是总体均值的无偏估计样本比率是总体比率的无偏估计样本方差是总体方差的无偏估计
29.Propertiesofpointestimation
点估计的评价标准Efficiency:Assumethatasimplerandomsampleofnelementscanbeusedtoprovidetwounbiasedpointestimatorsofthesamepopulationparameters.Inthissituation,wewouldprefertousethepointestimatorwiththesmallerstandarddeviation.
有效性:对于样本容量相同的同一总体参数的两个无偏估计量,我们称标准差较小的那个估计量比另一个更有效。
比更有效30.Propertiesofpointestimation
点估计的评价标准Consistency Looselyspeaking,apointestimatorisconsistentifthevaluesofthepointestimatortendtobecomeclosertothepopulationparameterasthesamplesizebecomeslarger.一致性 粗略的讲,样本容量越大,点估计量的值越接近于总体参数。我们前面讨论过的样本均值和样本比率都满足一致性要求。满足一致性要求的有效估计量成为一致有效无偏估计量。31.OtherSamplingMethods
其他抽样方法StratifiedSampling
分层抽样Thepopulationisfirstdividedintogroupsofelements(eachelementinthepopulationbelongstooneandonlyonestratum).Andthen,combiningthestratumsampleresultswhicharetakenfromeachstratumintoonepopulationparameterestimate.ItiscalledStratifiedSampling.将总体分成若干子总体(每一个个体属于且仅属于一个子总体),然后对每一个子总体采用一定的抽样方法进行抽样,将得到的各个样本合起来组成总体的一个样本,这个抽样方法称为分层抽样。32.StratifiedRandomSampling
分层随机抽样StratifiedRandomSampling
分层随机抽样Ifasimplerandomsampleistakenfromeachstratum,andwascombinedintoonepopulationparameterestimate,thismethodiscalledStratifiedRandomSampling.
如果对各子总体采用简单随机抽样,并将各样本合起来组成总体的一个样本,这个抽样方法称为分层随机抽样。Ifstrataarehomogeneous,thismethodisas“precise”assimplerandomsamplingbutwithasmallertotalsamplesize.当每一个层内部的个体特征比较接近(同质性高,因而方差小)时,分层随机抽样的样本较具代表性。Advantage:Wecangetthestratumparameterestimatetogetherwiththepopulationparameterestimate.它的好处是:在得到总体参数的估计的同时,还可以得到各子总体参数的估计。33.Clustersampling
整群抽样
Thepopulationisfirstdividedintoseparategroupsofelementscalledclusters.Ideally,eachclusterisarepresentativesmall-scaleversionofthepopulation,andthenAsimplerandomsampleoftheclustersisthentaken.Allelementswithineachsampled(chosen)clusterformthesample.ThissamplingmethodiscalledClustersampling.
将总体分成独立的个体群体,总体中的每一个个体都属于且仅属于某一个群。简单随机抽样的单位为群,这种抽样方法称为整群抽样。34.Clustersampling
整群抽样Ifallclustersarealikeinthisregards,samplingasmallnumberofclusterswillprovidegoodestimatedofthepopulationparameters.
如果所有的群在意义上是同质的,则抽取小量的群就可以得到对总体参数好的估计。Oneoftheprimaryapplicationsofclustersamplingisareasampling.Wecanobtainalargersamplewithasignificantlylowertotalcost.
整群抽样适用于区域抽样。它具有省时、省力、省钱的特点。35.SystematicSampling
系统抽样Firstfindingarandomnumberandthencountingorsearchingthroughthelistofthepopulationuntilthecorrespondingelementisfound.ItiscallSystematicSampling. 随机选定抽样的起始个体,然后按照一定的间隔选定样本的其他个体组成样本,这样的抽样方法称为系统抽样。Thereisonlyoneelementselectedrandomly.theotherelementsaredecidedbythefirstrandomlyselectedelement.系统抽样只有一个个体是随机抽取的,初始个体一旦被选定,其余个体均由间隔大小唯一决定。36.SystematicSampling
系统抽样Thereisonlyoneelementselectedrandomly.the
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 清洁能源技术推进承诺函4篇
- 创新项目管理与创意激发模板
- 科技公司数据备份恢复流程手册
- 工业产品质量保障承诺书9篇
- 四川省简阳市简城区重点名校2026年中考英语试题目标测试卷(1)含解析
- 产品开发流程管理与支持工具
- 居民区服务品质承诺书(4篇)
- (正式版)DB3210∕T 1057-2020 《淮扬美食品鉴师服务评价规范》
- 2026年入河排污口布局优化与总量控制研究
- 2026年地铁电梯逆行伤人事故责任认定与改进案例
- 充装站安全绩效考核制度
- 2025年审计工作工作总结及2026年工作计划
- 2026年安徽广播影视职业技术学院单招职业适应性测试题库及参考答案详解一套
- 2026国家外交部所属事业单位招聘126人笔试备考试题及答案解析
- 《民间玩具大集》教案-2025-2026学年冀美版(新教材)小学美术三年级下册
- 2026年六安职业技术学院单招职业适应性考试题库及答案详解一套
- 模特课基础讲解课件
- 2026年2026江苏省人民医院心血管内科打字员招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 岳阳2025年湖南岳阳市事业单位“四海揽才”人才集中引进319人笔试历年参考题库附带答案详解
- 教育局培训学校退费制度
- 人工智能高考历年试题及答案
评论
0/150
提交评论