版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章
从样本统量估计整体数学习要点第一节第二节第三节
总体均数的估计第四节其总体参数的估计本章小结学习要点掌握推断统计的内容和前提条件理解统计估计的原理,掌握统计估计的方法能够运用总体均数估计的方法解决实际问题第一节
点估计当总休平均数或比例未知时们可以直接把样本平均数或比例用作它的估计值于样本统计量为数轴上的一个点,所以称“估计”。科学研究不仅需要对事物特征作出一般性的描述更根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。一、
什么是推断统计一般情况下本计量是不会相应的总体参数完全相同的者少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0具有这一特征的统计量就无偏估计值。例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数在一些样中它又可能会小于总体平均数且于不同的样本估计误差的大小也是不同的无限多个样本平均数的平均估计误差为句话说,样本平均数的平均数将会等于总体平均数。推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,/
22N2r由已知推未知的过程。推断统计根据推测的性质不同而分为参数估计和假设检验两方面数parameter)就是用样本去估计相应总体的状况,其体方法有点估计和区间估计。假设检(hypothesistest的要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验又统计检(statistical验中又根据是否需要依赖于对总体分布态和总体参数检验的假设而分为参数检验和非参数检验检验法在检验时对总体分布和总体参数(,)所要求,而非参检验法在检验时则不依赖于总体的分布形态和总体参数的情况。参数检验法主要有Z检验、t检、F检和q检等,非数检验test主要有验、符检验法、符号等级检验法、秩和检验、中位数检验等。二、统计推断的基本问题没有系统学过统计学的人往往有一种误解为只要搜集了数据资料可用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此在统计推断之前必须考你所获得的资料是否能够用统计的方法来分析常行统计推断时应首先考虑以下三个方面的问题。一是关于统计推断的基本前提计断的前提是随机抽样此我们利用样本统计量进行总体推断时首要了解样的方式即解样本是如何得来的,是随机抽取的,还是人为抽取的随抽样的均等和独立性免了入样个体只来自总体的某一部分而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。二是样本的规模与样本的代表性样究需要有一定的样本规模样要具有代表性也需要有一定的样本规模来保证少抽样误差般来说其条件相同的情况下,样本越小抽的误差越大;样越大样误差就越小当样本增至包括总体的全部个体(即),抽样的误差为0因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。三是统计推断的错误要有一定限度计推断是在特定的时间间和条件下得出的结论加抽样误差的影响在用本推测总体时总会犯一定的错误种误在统计推断中是不可避免的也允许的不这种错误要有一定的限度过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。第二节
区间估计一、参数估计的定义所谓参数估计就是根据样本统计量去估计相应总体的参数我们可以根据样本均数(
X
)去估计总体的均数(据样本方差()估计总体方差(
据样本的相关系数()去估计总体相系数()等等。/
XX二、参数估计的方法参数估计有点估计和区间估计两种如学区期末时抽取所管辖的小学四年级的数学测验成绩求得平均分分标差10分于一个管理者认为全区四年级的学平均分可能是70分另一个管理者则认为全区四年数学平均分可能性在65~75之间因前者是用数轴上的一点做估计为估计者是用数轴上的一段距离做估计区间估计。(一)点估计点估计(pointestimation)是在参数估计中直接以样本的统计量(数轴上的一个点)作为总体参数的估计值。譬如用样本统计量:X,、r等作为总体参数、、的估计值。但是作为良好点估计的统计量必须具备一定的前提条件。1.无偏性用统计量估计总体参数必然会存在一定的误差,而恰好相等的情形是极少见的。当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值时,其偏差为0,即
这时的统计量被称为无偏估计量(
estimator譬如,根据中心极限定二有
,即样本均数的均数是总体均数的无偏估计量即我们可以用样本均数的均数作为总体均数的点估计值设我们从某市四个区的六岁男童中随机抽取四个样本每样本测量其身高的平均数,再求得四个样本均数的均数为公分,并此值作为该市所有X六岁男孩的平均身高就是一个点估计。如果,大于0或于0,那么这时的统计量就为有偏估计量。作为总体参数的良好估计值是应当具备无偏性的。当样本容量足够大的时候本均数或样本标准差作为总体相应参数的估计量都可视S为无偏估计量。正因为如此,在大样本统计分析中,常用样本标准差(
n
)去代替总体标准差(总分布呈正态,中数也是总体均数的偏估计量。然而由于抽样误差的普遍存在们能期待一次样就能对总体参数作出精确的估计之估计不能给出估计误差及其可靠性有关信息,因此采用点估计时应特别注意样本统计量所具有的特性。2.一致性总体参数的估计量随样本容量的无限增大当能越来越接近它所估计的总体参数如正态总体的总体均数为
准为果X是从总体中随机抽取样本获得的平均数,其容量为当N→时,X→
样本统计量的均数X就总体参数
的一个估计值,或者说与
是一致的。3.有效性当总体参数的无偏估计量不止一个统计量,则分析无偏估计量的变异大小的情况。无偏估计量变异性小,有效性高;无偏估计量变异性大的,则有效性较低。例如作为总体均数
的估计值来说样均数中数和数等是无偏估计量这时选谁/
XMoXMo作为估计值最恰当则要看谁的变异性最小。在,和中有X的变异性最小,即的差最小。所以用统计—样本均数作为总体参数同时说明为什么在统计推断中不常使用中数和众数。
的估计值是最佳选择。这也4.充分性充分性是指一个容量为样本统计量是否充分地反映了全部个所反映的总体信息。从,Mdn和的比中我们已知,只有在求均数时个据全部参与计算,它充分地反映所有数据所要反映的总体信息,而在计算和时有部分数据参与计算,是用部分数据反映的总体信息。因此平均数的充分性最高,中数和众数的充分性较低。同理,在差异量数中方差S和准差S要比平均差AD、分位差
更具有充分性。一个好的点估计应当具备以上四个条件是无论如何抽样误差总是存在加上点估计不能提供正确估计的概率所应用时受到局限例如们只能大体上知道样本容量比较大时,多数的X靠
,但是样本容量究竟大到什么程度多”、靠到什么程度,“多数到是多少等等都是很模糊的计的这些不足以及缺陷可以用区间估计的方法来弥补。第三节
总体均数的计一、均数估计的标准误均数估计就是用样本均数去估计总体均数。在用样本均数()总体均数(进行区间估计时,样本均数的标准误(
SE
)是衡量抽样误差大小的重要指标,而样本均数的抽样分布则是进行这种估计的理论依据。(一)标准误的定义式——已知当总体已时,根据中心极限定理三有
SEX
X
n
因为标准误与总体标准差成正比样本容量的平方根成反比所以总体标准差越小标准误越小;样本容量越大,标准误也越小。对于一个指定的总体来说,其总体标准差是个确定的数。因此,在实际工作中,增大样本容量可以减小均数的标准误,这是提高估计精度的重要手段。对于总体均数进行估计时果已么需从总体中抽取一个容量为的随机样本可求出而对其区间作出估计,其区间估计公式为XX
SE
(二)标准误的近似式——未知在实际工作中体方差及总体标准差往往是未知的时们只能根据样本的标准差/
XXXXXXX去估计总体的标准差。用样本标准差去估计总体标准差时必须考虑其无偏估计量的问题。数理统计学已证明样本标准差
n
不是总体标准差无偏估计量因此,以n作为的点估计是不恰当的。但是样本的无偏标准差
S
n
却是总体标准差
的无偏估计量,即统计量
S
n
抽样分布的平均数恰好等于
。因此,这里的样本无偏标准差定义为S
n
2
由于
S
n
是
的无偏估计量,且当n一时,
S
n
抽样分布的标准误小于
SE
,所以当n足够大且一定时,
n
的近似程度高于。是有了样本平均数标准误的近似公式SE
Snn
∴
nnSEX
nn当总体未知时,即可采用这一公式计算均数的标准误。二、总体均数的估计方法总体均数的估计方法大致有三种以态分布理论为依据的估计法态估计法。一种是以t分理论为依据的估计方法,称t分估计法。三是以渐近正态分布为依据的估计方法,称近似正态估计法。三种方法适用于不同的资料形式。(一)正态估计法正态估计法适用于总体方2已的数据资料。其具体应用情形有二,一是总体呈正态时,不论样本容量的大小,样本均数的分布都呈正态分布。因为,中心极限定理一指出,总体正态时体取的容量为一可能样本的均数呈正态分布总体呈非正态时,只要样本容量大于样均数的分布呈近似正态分布为中心极限定理一指出足够大时,无论总体分布形态如何,样本均数的分布服从或接近正态分布。
第四节
其他总体参的估计参数估计除总体均数的估计外有体方差和标准差的估计体关系数的估计和总体比例的估计等等。这种参数估计过程大致相同,主要区别在于标准误的计算不同。/
≤≤ZZrrr≤≤ZZrrrrr一、总体方差和总体标准差的估计(一)总体方差的估计由于样本方差与总体方差比值的分布呈分布,所以有n2n2
≤≤
n2
2n
,或
n2
≤≤
2
2n例8-5校三学生中随机抽10份理成绩得平均分为71.2,标
n
)为14.46。估计物理成绩的方差在什么范围之内。1)选择显著性水平。设本例选
0.052)计算自由度。本例,
n3)查
2
显著性临界值表,确定
2
2
和
2
2
,本例有
2.7
,
19.04)代入公式,作出估计14.46
2
14.46
2
19.02.72≤≤,≤≤
9.95)结果解释该校初三学生物理成绩的方差有98%的可能会落在~901.20之或标准差会落在9.32~之,超出这一范围的可能只有2。从这一结果看,物理成绩标准差的区间较大,若增加样本容量可缩小区间差距。(二)总体标准差的估计标准差的估计既可以采用上述总体方差估计区间的平方根以直接利用样本标准差进行估计。样本标准差抽样分布的标准差称标准差的标准误,其公式为SE
S
(或
S
)
S
nn因其近似正态分布,所以总体标准差的置信区间为
1.96nnS用此法对例进总体标准的估计,则有14.46SE
14.464.47
14.461.963.238.13~20.79二、总体相关系数的估计由样本相关系数
r
形成的分布形式较多,因此计算样本相关系数标准误的及置信限的方法也较为复杂。这里只介绍常用方法—Fisher的Z函分布法Fisher的Z函分布法是通过将样本相关系数转换为值(因的样本分布近似正态分布以值行估计,然后再将值原为值的做。这种既无需考虑样本容量大小,也无需顾忌总体相关系数。/
rrtrrt例8-6:某教师经研究发现,所教班级学生55人)的学成绩与物理成绩的相关系数为。试以95%置信度估计全年级数学和物理的相关系数。)将
r
转换为r函。查函转换表,当
r0.66
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 男外套教学设计中职专业课-服装结构制图-服装设计与工艺-轻工纺织大类
- 沪教牛津版(六三制一起)四年级下册Module 3 My colourful lifeUnit9 A friend in Australia教案及反思
- 三班两倒两休工作制度
- 上门残疾检查工作制度
- 专科营养门诊工作制度
- 两地人才交流工作制度
- 严格执行后勤工作制度
- 严格遵守政法工作制度
- 中医外科门诊工作制度
- 中学健康管理工作制度
- T/CHES 69-2022抗旱需水分析技术导则
- 《VSM教学课件》课件
- 性能确认(PQ)方案模板
- 洗涤车间管理制度
- T-BMCA 028-2024 国军标咨询服务规范
- 多模态话语分析视角下的外宣纪录片字幕翻译研究
- 登高安全操作规程(3篇)
- 2024年中国硝苯地平原料药市场调查研究报告
- 家用电子产品维修工(中级)职业技能鉴定考试题库(含答案)
- 2023雷电灾害风险区划技术规范
- 【直播带货的模式研究国内外文献综述4300字(论文)】
评论
0/150
提交评论