论与数理统计chapter08 interval estimation_第1页
论与数理统计chapter08 interval estimation_第2页
论与数理统计chapter08 interval estimation_第3页
论与数理统计chapter08 interval estimation_第4页
论与数理统计chapter08 interval estimation_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026/5/14Tsinghua-CUHKFinanceMBA20081Chapter8IntervalEstimation

第八章区间估计钱小军清华大学经济管理学院伟伦楼456B电话:62789934电子邮箱:qianxj@2026/5/14Tsinghua-CUHKFinanceMBA20082Agenda主要内容IntervalEstimationofaPopulationMeanWith

Known

总体均值的区间估计——

已知的情形IntervalEstimationofaPopulationMeanWith

Unknown

总体均值的区间估计——

未知的情形DeterminingtheSampleSize

样本容量的确定IntervalEstimationofaPopulationProportion

总体比率的区间估计2026/5/14Tsinghua-CUHKFinanceMBA20083IntervalEstimationofaPopulationMeanWith

Known

总体均值的区间估计—

已知的情形SamplingError

抽样误差ProbabilityStatementsabouttheSamplingError

抽样误差的概率解释ConstructinganIntervalEstimatewith

Known

计算区间估计——

已知的情形2026/5/14Tsinghua-CUHKFinanceMBA20084CJW有限公司

(中p190,Englishp286)CJW有限公司是一家专营体育设备和器材的邮购公司。为了跟踪服务质量,它每个月选取顾客的邮购订单组成简单随机样本,公司与样本中的每一个顾客联系并询问顾客对服务水平等一系列问题的评价。顾客的回答用于计算样本中每一顾客的满意得分,得分取值从0(最差等级)到100(最好等级),然后计算样本满意得分的均值(样本均值),并作为CJW所有顾客组成的总体满意得分的点估计。2026/5/14Tsinghua-CUHKFinanceMBA20085CJW有限公司

(中p190,Englishp286)最近一次调查结果是:调查提供了100名顾客的满意得分数据,满意得分的样本均值为82。这个数据到底代表性如何?我们能否回答这样的问题:我们有多大的把握可以认为真正的顾客满意得分在80到84分之间?过去各月的调查显示,虽然每个月顾客满意得分的样本均值都在改变,但是满意得分的样本标准差一般稳定在数值20附近,于是,我们假定总体标准差

=20。有了总体标准差,能否回答以上的问题?为此,我们需要先讨论抽样误差(samplingerror)这个概念。2026/5/14Tsinghua-CUHKFinanceMBA20086Theabsolutevalueofthedifferencebetweenanunbiasedpointestimateandthepopulationparameteritestimatesiscalledthesamplingerror.

无论何时,在用样本均值的任一观测值估计总体均值

时,总有可能出现误差。这个误差可以表示为点估计值与总体参数之差的绝对值,我们称它为抽样误差。SamplingError

抽样误差2026/5/14Tsinghua-CUHKFinanceMBA20087Forthecaseofasamplemeanestimatingapopulationmean,thesamplingerroris SamplingError=

当我们用样本均值估计总体均值时,抽样误差为: 抽样误差=Generallyspeaking,samplingerrorisalsoarandomvariable,wecangettheprobabilitystatementsaccordingtothesamplingdistributionofthesamplemean.

一般来讲,抽样误差也是一个随机变量,我们可以根据样本均值的抽样分布,对抽样误差的大小进行概率解释。SamplingError

抽样误差2026/5/14Tsinghua-CUHKFinanceMBA20088ProbabilityStatementsAbouttheSamplingError

抽样误差的概率解释对于服从正态分布的随机变量有99.72%的值发生在均值附近

3个标准差之内;有95.44%的值发生在均值附近

2个标准差之内;有68.26%的值发生在均值附近

1个标准差之内;有95%的值发生在均值附近

1.96个标准差之内。2026/5/14Tsinghua-CUHKFinanceMBA20089ProbabilityStatementsAbouttheSamplingError

抽样误差的概率解释抽样分布的知识使我们能对抽样误差进行概率解释。以CJW公司为例,我们可以利用上面的结论,得到:的值发生在1.96个标准差之内的可能性为95%。上面的结论说明什么?在总体服从正态分布的假设下2026/5/14Tsinghua-CUHKFinanceMBA200810ProbabilityStatementsAbouttheSamplingError

抽样误差的概率解释

的定义:

/2

/21-

标准正态分布2026/5/14Tsinghua-CUHKFinanceMBA200811PrecisionStatement精度解释

Thereisa1-

probabilitythatthevalueofasamplemeanwillprovideasamplingerroroforless.

样本均值的观测值的抽样误差小于等于

的概率为

。ProbabilityStatementsAbouttheSamplingError

抽样误差的概率解释

/2

/21-

/2

/21-

2026/5/14Tsinghua-CUHKFinanceMBA200812ProbabilityStatementsAbouttheSamplingError

抽样误差的概率解释Foraspecificsample:Samplemeaniswithinneighborhoodofpopulationmeanwithprobability样本均值落在总体均值附近

区域内的概率为

Populationmeaniswithinneighborhoodofsamplemeanwithprobability总体均值在样本均值(观测值)附近区域内的把握为2026/5/14Tsinghua-CUHKFinanceMBA200813SomeConcepts

概念归纳1-

称为置信度,其中01。常用的

值为0.1,0.05或者0.01。如果总体服从正态分布,则区间

称为总体均值的置信度为1-

的双侧置信区间。如果总体不服从正态分布,或者我们不知道总体服从什么分布呢?2026/5/14Tsinghua-CUHKFinanceMBA200814With

Known

已知的情形:根据中心极限定理,我们有 置信度为1-

的(双侧)置信区间为

——samplemean样本均值

1-

——confidencecoefficient置信系数

z

/2——

zvalueprovidinganareaof

/2intheuppertail ofthestandardnormalprobabilitydistribution

标准正态分布概率分布上侧面积为

的z值

s

——populationstandarddeviation总体标准差

n——samplesize抽样容量IntervalEstimationofaPopulationMeanWith

Known

总体均值的区间估计——

已知的情形2026/5/14Tsinghua-CUHKFinanceMBA200815对于公式:我们称上述区间为置信区间

(confidenceinterval)

为此区间的置信水平或置信度

(confidencelevel)数值为置信系数

(confidencecoefficient)称为边际误差

(MarginofError)Terminology术语2026/5/14Tsinghua-CUHKFinanceMBA200816应用中的建议如果总体服从正态分布,上式给出的置信区间就是精确的。如果总体不服从正态分布,那么上式给出的置信区间就是近似的。近似的程度依赖于总体的分布和样本数量。在大部分应用中,当样本容量>30的时候,就可以应用上式进行区间估计。如果总体的分布不是正态分布但大致对称,则样本容量至少为15时才能得到一个较好的置信区间的近似。只有当我们认为或者愿意假设总体的分布很接近正态分布时,才可以在更小的样本容量下使用该公式。2026/5/14Tsinghua-CUHKFinanceMBA200817已知求顾客总体满意得分的置信水平为95%的置信区间。解:因为样本容量为100,大于30,所以有95%的把握平均顾客满意得分在78.08和85.92之间。CJW公司2026/5/14Tsinghua-CUHKFinanceMBA200818置信度含义置信度为95%代表什么含义?如果用同样的样本容量抽样100次,并用同样的置信水平构造置信区间,则在这100个置信区间中,大约有5个不包含总体均值。Concept972026/5/14Tsinghua-CUHKFinanceMBA200819置信度的作用在给定的样本容量条件下,置信水平越高,置信区间越大。置信度99%置信度95%2026/5/14Tsinghua-CUHKFinanceMBA200820Exercises练习第193页第2题(Englishp2932)已知总体均值的90%的置信区间为总体均值的95%的置信区间为总体均值的99%的置信区间为2026/5/14Tsinghua-CUHKFinanceMBA200821中文194页第9题本科毕业进入最好的商学院就读研究生的平均积分GPA为3.37。假设这一估计是根据120名最好商学院学生所组成的样本得到的。根据历年数据可以假设总体的标准差为

=0.28。求进入最好商学院的大学毕业生平均积分GPA平均值的95%的置信区间估计。解:可以采用标准正态分布计算置信区间(大样本)。答:有95%的把握进入最好商学院学生的平均积分均值在3.32到3.42之间。2026/5/14Tsinghua-CUHKFinanceMBA200822One-sidedIntervalEstimation

单侧置信区间估计本科毕业进入最好的商学院就读研究生的平均积分GPA为3.37。假设这一估计是根据120名最好商学院学生所组成的样本得到的。根据历年数据可以假设总体的标准差为

=0.28。问题:有95%的把握认为进入最好商学院的大学毕业生平均积分GPA平均值不低于什么值?对于电子元件的寿命,我们一般不关心它们寿命的上限,我们更关心的是有多大把握这种电子元件的平均寿命不低于1000小时。对于病人的住院天数,可能我们不关心他们的住院天数下限(自然下限是0),更关心的是他们的平均住院天数的上限,即我们有多大把握病人的平均住院天数不高于10天?2026/5/14Tsinghua-CUHKFinanceMBA200823One-sidedEstimation

单侧置信区间Two-sidedestimation双测置信区间One-sidedestimation单侧置信上限:单侧置信下限:2026/5/14Tsinghua-CUHKFinanceMBA200824One-sidedEstimation

单侧置信区间One-sidedestimation单侧置信下限:含义:有(1-)×100%的把握

1-

2026/5/14Tsinghua-CUHKFinanceMBA200825One-sidedIntervalEstimation

单侧置信区间估计本科毕业进入最好的商学院就读研究生的平均积分GPA为3.37。假设这一估计是根据120名最好商学院学生所组成的样本得到的。根据历年数据可以假设总体的标准差为

=0.28。问题:有95%的把握认为进入最好商学院的大学毕业生平均积分GPA平均值不低于什么值?解:这是一个大样本问题,可以使用正态分布进行估计。答:我们有95%的把握可以认为进入最好商学院的大学毕业生平均积分GDP平均值不低于3.33。2026/5/14Tsinghua-CUHKFinanceMBA200826Two-Sidedvs.One-Sided

双侧与单侧估计比较0双侧置信区间单侧置信区间(下限)2026/5/14Tsinghua-CUHKFinanceMBA200827IntervalEstimationofaPopulationMeanWith

Unknown

总体均值的区间估计——

未知的情形Wehavealreadyknownthat我们已经知道:If

isknown,wecanmakeintervalestimationforpopulationmeanbasedonnormaldistributions.如果

已知,我们可以利用正态分布进行总体均值的区间估计。Butif

isunknown,howcanwemakeintervalestimationforpopulationmean?–t-distributions但是:如果

未知,我们如何对总体均值进行区间估计?——

t分布2026/5/14Tsinghua-CUHKFinanceMBA200828介绍t分布以及自由度的影响自由度n=12026/5/14Tsinghua-CUHKFinanceMBA200829tDistributiont分布Thetdistributionisafamilyofsimilarprobabilitydistributions. t分布是一族概率分布。Aspecifictdistributiondependsonaparameterknownasthedegreesoffreedom. t分布依赖于它的参数——自由度。Asthenumberofdegreesoffreedomincreases,thedifferencebetweenthetdistributionandthestandardnormalprobabilitydistributionbecomessmallerandsmaller.

随着自由度的增大,t分布与标准正态分布之间的差别越来越小。Atdistributionwithmoredegreesoffreedomhaslessdispersion.

随着自由度的增大,t分布的变异程度减小。tdistributionissymmetricalandthemeanoftheitiszero. t分布是对称分布,它的均值为0

concept972026/5/14Tsinghua-CUHKFinanceMBA200830Exercises查表练习第199页第11题(Similarto

Englishp30013)对于自由度为16的t分布,求下列区域内的概率或面积:2.120右侧1.337左侧-1.746左侧2.583右侧-2.120到2.120之间-1.746到1.746之间-4.00-3.00-2.00-1.000.001.002.003.004.00StandardNormaltDistribution2026/5/14Tsinghua-CUHKFinanceMBA200831Probabilityoft-distribution

求t-分布的概率(使用计算机)求:当n=6时,P(|t|<2.3)=当n=10时,P(t<2.3)=当n=10时,P(t>2.3)=当n=10时,P(t>-2.3)=求:当n=10时,P(|t|>?)=0.05(记为

或) P(|t|>?)=0.01即或 P(t>?)=0.05,P(t<?)=0.052026/5/14Tsinghua-CUHKFinanceMBA200832

2026/5/14Tsinghua-CUHKFinanceMBA200833with

Unknown

未知1-

--theconfidencecoefficient置信度;

t

/2(n-1)--

thetvalueprovidinganareaof

/2intheupper tailofatdistributionwithn-1degreesoffreedom

自由度为n-1时,使t分布的上侧面积为

/

2的值;

s--thesamplestandarddeviation样本标准差IntervalEstimationofaPopulationMeanWith

Unknown

总体均值的区间估计——

未知的情形2026/5/14Tsinghua-CUHKFinanceMBA200834应用中的建议如果总体服从正态分布,上式给出的置信区间就是精确的并且适用于任何样本容量。如果总体不服从正态分布,那么上式给出的置信区间就是近似的。近似的程度依赖于总体的分布和样本数量。在大部分应用中,当样本容量>30的时候,就可以应用上式进行区间估计。如果总体的分布严重不对称或者包含异常点时,大部分统计学家建议将样本容量增加到50或者更大。如果总体的分布不是正态分布但大致对称,则样本容量至少为15时就能得到一个较好的置信区间的近似。只有认为或者愿意假设总体的分布至少是正态分布时,才可以在更小的样本容量下使用该公式。2026/5/14Tsinghua-CUHKFinanceMBA200835Exercises练习从《华尔街日报》金融与投资部分纽约股票交易所版面抽出10只股票组成一个样本,得到这10只股票的价格收益比数据为

5,7,9,10,14,23,20,15,3,26求纽约股票交易所版面上所列示的所有股票的平均价格收益比的点估计;求纽约股票交易所版面上所列示的所有股票的价格收益比标准差的点估计;求纽约股票交易所版面上所列示的所有股票的平均价格收益比的95%置信区间。讨论估计的精度。2026/5/14Tsinghua-CUHKFinanceMBA200836Solution解答可以认为纽约股票交易所版面上所列示的所有股票的价格(总体)近似服从正态分布,因此我们可以采用t-分布来做区间估计。纽约股票交易所版面上所列示的所有股票的平均价格收益比的点估计为(样本均值)13.2纽约股票交易所版面上所列示的所有股票的价格收益比标准差的点估计为(样本标准差)7.8纽约股票交易所版面上所列示的所有股票的平均价格收益比的95%置信区间为(7.62,18.78)上述估计的抽样误差不大于18.78-13.2=5.582026/5/14Tsinghua-CUHKFinanceMBA200837DeterminingtheSampleSize

样本容量的确定对于给定的置信水平,因为随着样本容量的增大(保证大样本),样本均值的标准差将减小,从而使区间估计的抽样误差小到我们所希望的范围。用E代表我们所希望的边际误差的上限(估计区间半长度)。我们得到 由此得到2026/5/14Tsinghua-CUHKFinanceMBA200838Continued(续)在上述公式中,E值是使用公式的人在给定的置信水平下可以接受的边际误差。虽然不同的使用人可能有不同的倾向爱好,但

95%是比较常用的置信水平(因此)。在总体标准差未知的情况下,可以用从历史数据中获得的标准差或样本标准差来代替。用试验样本的样本标准差作为总体标准差的临时估计值。用对总体标准差的最优估计代替总体标准差,比如全距的四分之一可以作为总体标准差的估计值。在上述估计中,我们总是使用对样本容量进行估计。2026/5/14Tsinghua-CUHKFinanceMBA200839Exercises练习Statewide保险公司使用36名投保人组成的简单随机样本来估计所有投保人的平均年龄。在95%的置信度下,边际误差为2.35年,该结果的样本标准差为7.2年。为将边际误差减少到2年,应该选用多大样本容量的简单随机样本?当边际误差分别为1.5年和1年时,样本容量应该多大?在边际误差为1年时,你建议Statewide对其投保人的平均年龄进行估计吗?为什么?2026/5/14Tsinghua-CUHKFinanceMBA200840如果想将边际误差减少到2年,应该选用的样本容量不小于当边际误差分别为1.5年和1年时,样本容量应该多大?当边际误差为1年时,你建议Statewise公司对平均年龄进行估计吗?2026/5/14Tsinghua-CUHKFinanceMBA200841IntervalEstimation

ofaPopulationProportion

总体比率的区间估计总体比率的区间估计

1-

confidencecoefficient置信系数

z

/2

zvalueprovidinganareaof

/2inthe uppertailofthestandardnormal probabilitydistribution

标准正态分布上侧面积为

/2时的z值

sampleproportion

样本比率

或2026/5/14Tsinghua-CUHKFinanceMBA200842BasicRequirementforSampleSize

总体比例估计的样本容量基本要求Inorderfortheformulatowork,thereisabasicrequirementforthesamplesize.

前述公式成立对样本容量有基本的要求。Weneedtoverifyif

需要检验是否2026/5/14Tsinghua-CUHKFinanceMBA200843Example例题谢尔工业公司希望了解参加一项培训计划后通过考试的职员比例。公司对随机选取的45名职员进行调查得到他们通过考试的人数是36人。在置信系数为95%的条件下,估计全公司参加该培训并通过考试的比例。解:已知:样本比例,,且全公司参加该培训并通过考试的比例p的置信水平为95%的置信区间估计为答:有95%把握认为公司通过考试的比例在68%到92%之间2026/5/14Tsinghua-CUHKFinanceMBA200844SampleSizeforanIntervalEstimate

ofaPopulationProportion

总体比率区间估计的样本容量LetE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论