抽样与参数估计课件_第1页
抽样与参数估计课件_第2页
抽样与参数估计课件_第3页
抽样与参数估计课件_第4页
抽样与参数估计课件_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学李春红lichunhong0214@126.com1统计学李春红11内容简介(51+17)第1章统计与统计数据第2章数据的图表展示第3章数据的概括性度量第4章抽样与参数估计第6章相关与回归分析第7章时间序列分析和预测第8章指数复习答疑2内容简介(51+17)第1章统计与统计数据223分析数据方式参数估计假设检验统计方法描述统计推断统计3分析数据方式参数估计假设检验统计方法描述统计推断统计34平均数标准差比例参数统计量xsp总体样本4参数统计量总体样本4根据样本数据提供的信息来推断总体的参数5样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差参数估计的过程根据样本数据提供的信息来推断总体的参数5样本总体样本统计量总6第4章抽样与参数估计6主要内容:4.1抽样与抽样分布4.2参数估计的基本原理4.3总体均值的区间估计4.4总体比例的区间估计4.5样本量的确定7主要内容:4.1抽样与抽样分布774.1抽样与抽样分布4.1.1概率抽样方法4.1.2抽样分布84.1抽样与抽样分布88抽样方法概率抽样方法非概率抽样方法一般的抽样推断都是建立在概率抽样的基础上9抽样方法概率抽样方法99概率抽样10指遵循随机原则进行的抽样,总体中的每个个体都有被抽到的可能,完全排除人的主观因素的影响。简单随机抽样分层抽样整群抽样系统抽样概率抽样10指遵循随机原则进行的抽样,总体中的每个个体都有被1011总体随机样本简单随机抽样:从总体N个元素中随机地抽取n个元素作为样本,每个元素入抽样本的概率是相等的。最基本的抽样方法,是其他抽样方法的基础两种抽取元素的具体方法:重复抽样、不重复抽样11总体随机样本简单随机抽样:从总体N个元11分层抽样:抽样前先将总体的元素按不同特征划分为若干层(strata),在每一层中抽取一定的元素组成一个样本。性别、行业、年龄等优点:分层抽样的样本分布在各个层内,使样本在总体中的分布比较均匀,样本更具代表性,精度高。12分层抽样:抽样前先将总体的元素按不同特征划分为若干层(str12整群抽样:将总体划分为若干群,以群为单位随机抽取几个群,再对抽中的各个群中所包含的所有元素进行观察。自然(行政)区域优点:由于群内各单位比较集中,对样本进行调查比较方便,节约费用。13整群抽样:将总体划分为若干群,以群为单位随机抽取几个群,再对13系统抽样(等距抽样):先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个单位,直至抽取n个形成一个样本。14············优点:具有简单随机抽样的特征,能比较均匀地抽到总体中各个部分的单位,简单易行。系统抽样(等距抽样):先将总体各单位按某种顺序排列,并按某种14非概率抽样15根据研究人员的主观判断来抽取样本,研究人员有意识地选取样本单位,样本单位的抽取不是随机的。方便抽样判断抽样自愿抽样滚雪球抽样非概率抽样15根据研究人员的主观判断来抽取样本,研究人员有意15方便抽样:根据调查人员最方便的途径来选定样本。节省经费,实施方便,速度快;抽样误差大,结果可靠性差。适用于预备性调查研究。16方便抽样:根据调查人员最方便的途径来选定样本。1616

判断抽样:根据专家的经验和判断,或调查人员的主观决定选取样本的方法。典型调查和重点调查适合特殊需要,调查回收率高,过程简单,但容易因研究人员主观判断偏差而导致误差。17判断抽样:根据专家的经验和判断,或调查人员的主观决定选取样17自愿抽样有偏,反映某类群体的一般看法。滚雪球抽样特定群体的研究。18自愿抽样1818概率抽样与非概率抽样的比较概率抽样依据随机原则抽取样本,可用于对总体给出很准确的估计情况非概率抽样得到的统计量的分布是不确定的,因而不能用于总体参数的推断,可用于探索性的研究19概率抽样与非概率抽样的比较概率抽样依据随机原则抽取样本,可用194.1抽样与抽样分布4.1.1概率抽样方法4.1.2抽样分布204.1抽样与抽样分布2020

三种不同性质的分布总体分布样本分布抽样分布:样本统计量的概率分布。结果来自容量相同的所有可能样本。21频数分布表、图等

三种不同性质的分布总体分布21频数分布表、图等2111712212412913910711713012212510813112511712213312612211810811011812312613313412712311811211213412712311911312012312713513711412012812411513912812412122某生产车间50名工人日加工零件数如下(单位:个)11712212412913910722按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140合计某车间50名工人日加工零件数分组表35814106461016282012850100按零件数分组频数(人)频率(%)105~110合计某车间5023百分比(%)24为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”

1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。广告类型人数(人)

商品广告服务广告金融广告房地产广告招生招聘广告其他广告11251916102合计200某城市居民关注广告类型的频数分布

56.05.01.0100.0百分比(%)24为研究广告市场的状况,一家广告公司在某城市随24某百货公司连续四十天的商品销售额如下(单位:万元)2541252947383430384240463645373736454433443528463330234426384442363737493942323635以此推断一年365天的销售额情况?分组频数分组频数20-25135-401425-30440-45930-35645-506某百货公司连续四十天的商品销售额如下(单位:万元)2541225抽样分布样本统计量的概率分布例如:样本均值、比例、方差的分布结果来自容量相同的所有可能样本 一种理论分布26抽样分布样本统计量的概率分布262627【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差?均值和方差2.51.2527【例】设一个总体,含有4个元素(个体),即总体单位数N=2728

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,所有样本的均值如何分布?所有可能的n=2的样本(共16个)第一个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,4共有42=16个样本:28现从总体中抽取n=2的简单随机样本,在重复抽样条件下2829

计算出各样本的均值,如下表16个样本均值()第一个观察值第二个观察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.029计算出各样本的均值,如下表16个样本均值(2930给出样本均值的抽样分布样本均值的抽样分布1.0P(x)1.53.04.03.52.02.5x个数概率P()1.011/161.522/162.033/162.544/163.033/163.522/164.011/1630给出样本均值的抽样分布样本均值的抽样分布1.0P(3031式中:M为样本数目,n为样本容量比较及结论:1.样本均值的均值(数学期望)等于总体均值

2.样本均值的方差等于总体方差的1/n所有均值的均值和方差31式中:M为样本数目,n为样本容量所有均值的均值和方差31样本均值的抽样分布

不重复抽样:样本均值的方差则需要用修正系数(N-n/N-1)去修正样本均值的方差;对于无限总体或有限总体当N很大时,不重复抽样可以按照重复抽样来处理;32样本均值的抽样分布不重复抽样:样本均值的方差则需要32如果原有总体是正态分布,那么无论样本容量大小,样本均值的抽样分布均服从正态分布;如果原有总体是非正态分布,则要看样本容量的大小而定。33如果原有总体是正态分布,那么无论样本容量大小,样本均值的抽样33抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值非正态分布小样本大样本样本均值正态分布样本均值正态分布抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样中心极限定理

(CentralLimitTheorem)35

从均值为,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。中心极限定理

(CentralLimitTheorem)3536Exercises1.从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值估计总体均值。(1)样本均值的数学期望是多少?(2)样本均值的标准差是多少?(3)样本均值的抽样分布是什么?2.假定总体共有1000个单位,均值为32,标准差为5。从中抽取一个容量为30的简单随机样本用于获得总体信息。(1)样本均值的数学期望是多少?(2)样本均值的标准差是多少?36Exercises1.从均值为200、标准差为50的总体36正态分布函数的性质图形是关于x=对称钟形曲线,且峰值在x=处均值和标准差一旦确定,分布的具体形式也唯一确定正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1

正态分布函数的性质图形是关于x=对称钟形曲线,且峰值在x=正态分布的概率概率是曲线下的面积!abxf(x)正态分布的概率概率是曲线下的面积!abxf(x)Xms

一般正态分布

=1Z标准正态分布一般正态分布X~N(μ,σ2

)标准正态分布)1,0(~NXzsm-=Xms一般正态分布=1Z标准正态分布一般正态标准化的例子

P(2.9

X

7.1)

5s

=102.97.1X一般正态分布标准正态分布0

s=1-.21Z.21.1664.0832.0832标准化的例子

P(2.9X7.1)5s=一般正态分布X~

N(μ,σ2)标准正态分布41)1,0(~NXzsm-=58.2,96.1,645.1005.0025.005.0===zzz0α/2α/21-aa1.64590%0.101.9695%0.052.5899%0.01一般正态分布X~N(μ,σ2)41)1,0(~NXz41中心极限定理42

从均值为,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。中心极限定理42从均值为,方差为σ2的4243一般正态分布X~N(μ,σ2

)标准正态分布样本统计量的分布:)1,0(~NXzsm-=43一般正态分布X~N(μ,σ2))1,0(~NX43经验法则经验法则表明:当一组数据对称分布时约有68.27%的数据在平均数加减1个标准差的范围之内约有95.45%的数据在平均数加减2个标准差的范围之内约有99.73%的数据在平均数加减3个标准差的范围之内4458.2,96.1,645.1005.0025.005.0===zzz99.73%95.45%68.27%)1,0(~NXzsm-=经验44X95%-1.96+1.9699%-2.58+2.5890%-1.65+1.65)1,0(~NXzsm-=X95%-1.96+1.9699%-245x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x58.2,96.1,645.1005.0025.005.0===zzzx95%的样本-1.96x+1.96x9946统计学李春红lichunhong0214@126.com47统计学李春红147内容简介(51+17)第1章统计与统计数据第2章数据的图表展示第3章数据的概括性度量第4章抽样与参数估计第6章相关与回归分析第7章时间序列分析和预测第8章指数复习答疑48内容简介(51+17)第1章统计与统计数据24849分析数据方式参数估计假设检验统计方法描述统计推断统计3分析数据方式参数估计假设检验统计方法描述统计推断统计4950平均数标准差比例参数统计量xsp总体样本4参数统计量总体样本50根据样本数据提供的信息来推断总体的参数51样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差参数估计的过程根据样本数据提供的信息来推断总体的参数5样本总体样本统计量总52第4章抽样与参数估计6主要内容:4.1抽样与抽样分布4.2参数估计的基本原理4.3总体均值的区间估计4.4总体比例的区间估计4.5样本量的确定53主要内容:4.1抽样与抽样分布7534.1抽样与抽样分布4.1.1概率抽样方法4.1.2抽样分布544.1抽样与抽样分布854抽样方法概率抽样方法非概率抽样方法一般的抽样推断都是建立在概率抽样的基础上55抽样方法概率抽样方法955概率抽样56指遵循随机原则进行的抽样,总体中的每个个体都有被抽到的可能,完全排除人的主观因素的影响。简单随机抽样分层抽样整群抽样系统抽样概率抽样10指遵循随机原则进行的抽样,总体中的每个个体都有被5657总体随机样本简单随机抽样:从总体N个元素中随机地抽取n个元素作为样本,每个元素入抽样本的概率是相等的。最基本的抽样方法,是其他抽样方法的基础两种抽取元素的具体方法:重复抽样、不重复抽样11总体随机样本简单随机抽样:从总体N个元57分层抽样:抽样前先将总体的元素按不同特征划分为若干层(strata),在每一层中抽取一定的元素组成一个样本。性别、行业、年龄等优点:分层抽样的样本分布在各个层内,使样本在总体中的分布比较均匀,样本更具代表性,精度高。58分层抽样:抽样前先将总体的元素按不同特征划分为若干层(str58整群抽样:将总体划分为若干群,以群为单位随机抽取几个群,再对抽中的各个群中所包含的所有元素进行观察。自然(行政)区域优点:由于群内各单位比较集中,对样本进行调查比较方便,节约费用。59整群抽样:将总体划分为若干群,以群为单位随机抽取几个群,再对59系统抽样(等距抽样):先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个单位,直至抽取n个形成一个样本。60············优点:具有简单随机抽样的特征,能比较均匀地抽到总体中各个部分的单位,简单易行。系统抽样(等距抽样):先将总体各单位按某种顺序排列,并按某种60非概率抽样61根据研究人员的主观判断来抽取样本,研究人员有意识地选取样本单位,样本单位的抽取不是随机的。方便抽样判断抽样自愿抽样滚雪球抽样非概率抽样15根据研究人员的主观判断来抽取样本,研究人员有意61方便抽样:根据调查人员最方便的途径来选定样本。节省经费,实施方便,速度快;抽样误差大,结果可靠性差。适用于预备性调查研究。62方便抽样:根据调查人员最方便的途径来选定样本。1662

判断抽样:根据专家的经验和判断,或调查人员的主观决定选取样本的方法。典型调查和重点调查适合特殊需要,调查回收率高,过程简单,但容易因研究人员主观判断偏差而导致误差。63判断抽样:根据专家的经验和判断,或调查人员的主观决定选取样63自愿抽样有偏,反映某类群体的一般看法。滚雪球抽样特定群体的研究。64自愿抽样1864概率抽样与非概率抽样的比较概率抽样依据随机原则抽取样本,可用于对总体给出很准确的估计情况非概率抽样得到的统计量的分布是不确定的,因而不能用于总体参数的推断,可用于探索性的研究65概率抽样与非概率抽样的比较概率抽样依据随机原则抽取样本,可用654.1抽样与抽样分布4.1.1概率抽样方法4.1.2抽样分布664.1抽样与抽样分布2066

三种不同性质的分布总体分布样本分布抽样分布:样本统计量的概率分布。结果来自容量相同的所有可能样本。67频数分布表、图等

三种不同性质的分布总体分布21频数分布表、图等6711712212412913910711713012212510813112511712213312612211810811011812312613313412712311811211213412712311911312012312713513711412012812411513912812412168某生产车间50名工人日加工零件数如下(单位:个)11712212412913910768按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140合计某车间50名工人日加工零件数分组表35814106461016282012850100按零件数分组频数(人)频率(%)105~110合计某车间5069百分比(%)70为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”

1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。广告类型人数(人)

商品广告服务广告金融广告房地产广告招生招聘广告其他广告11251916102合计200某城市居民关注广告类型的频数分布

56.05.01.0100.0百分比(%)24为研究广告市场的状况,一家广告公司在某城市随70某百货公司连续四十天的商品销售额如下(单位:万元)7141252947383430384240463645373736454433443528463330234426384442363737493942323635以此推断一年365天的销售额情况?分组频数分组频数20-25135-401425-30440-45930-35645-506某百货公司连续四十天的商品销售额如下(单位:万元)2541271抽样分布样本统计量的概率分布例如:样本均值、比例、方差的分布结果来自容量相同的所有可能样本 一种理论分布72抽样分布样本统计量的概率分布267273【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差?均值和方差2.51.2527【例】设一个总体,含有4个元素(个体),即总体单位数N=7374

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,所有样本的均值如何分布?所有可能的n=2的样本(共16个)第一个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,4共有42=16个样本:28现从总体中抽取n=2的简单随机样本,在重复抽样条件下7475

计算出各样本的均值,如下表16个样本均值()第一个观察值第二个观察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.029计算出各样本的均值,如下表16个样本均值(7576给出样本均值的抽样分布样本均值的抽样分布1.0P(x)1.53.04.03.52.02.5x个数概率P()1.011/161.522/162.033/162.544/163.033/163.522/164.011/1630给出样本均值的抽样分布样本均值的抽样分布1.0P(7677式中:M为样本数目,n为样本容量比较及结论:1.样本均值的均值(数学期望)等于总体均值

2.样本均值的方差等于总体方差的1/n所有均值的均值和方差31式中:M为样本数目,n为样本容量所有均值的均值和方差77样本均值的抽样分布

不重复抽样:样本均值的方差则需要用修正系数(N-n/N-1)去修正样本均值的方差;对于无限总体或有限总体当N很大时,不重复抽样可以按照重复抽样来处理;78样本均值的抽样分布不重复抽样:样本均值的方差则需要78如果原有总体是正态分布,那么无论样本容量大小,样本均值的抽样分布均服从正态分布;如果原有总体是非正态分布,则要看样本容量的大小而定。79如果原有总体是正态分布,那么无论样本容量大小,样本均值的抽样79抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值非正态分布小样本大样本样本均值正态分布样本均值正态分布抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样中心极限定理

(CentralLimitTheorem)81

从均值为,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。中心极限定理

(CentralLimitTheorem)8182Exercises1.从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值估计总体均值。(1)样本均值的数学期望是多少?(2)样本均值的标准差是多少?(3)样本均值的抽样分布是什么?2.假定总体共有1000个单位,均值为32,标准差为5。从中抽取一个容量为30的简单随机样本用于获得总体信息。(1)样本均值的数学期望是多少?(2)样本均值的标准差是多少?36Exercises1.从均值为200、标准差为50的总体82正态分布函数的性质图形是关于x=对称钟形曲线,且峰值在x=处均值和标准差一旦确定,分布的具体形式也唯一确定正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1

正态分布函数的性质图形是关于x=对称钟形曲线,且峰值在x=正态分布的概率概率是曲线下的面积!abxf(x)正态分布的概率概率是曲线下的面积!abxf(x)Xms

一般正态分布

=1Z标准正态分布一般正态分布X~N(μ,σ2

)标准正态分布)1,0(~NXzsm-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论