版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学预备知识:回顾 1 概率 2 概率分布(正态分布等) 3 两类错误 4 假设检验 5 置信区间、置信水平和显著性水平 6 统计检验的功效1事件的概率(probability)定义:事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A出现可能性大小的数值(介于0和1之间)事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和概率2暨南大学经济学院统计系陈古典概率 (先验概率)如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m与样本空间中所包含的基本事件个数 n的比值,记为)3暨南大学经济学院统计系陈(
2、事件A所包含的基本事件个数样本空间所包含的基本事件个数 mn古典概率特点 样本空间的基本事件只有有限个; 每个基本事件发生的可能性相等。例:一批产品共100件,其中有6件不合格品,随机抽取一件不合格品的概率是:) m 6 0.06(n1004暨南大学经济学院统计系陈概率的统计定义在相同条件下重复进行n次随机试验,事件 A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为事件A的概率,记为5暨南大学经济学院统计系P( A) 事件A发生的次数 m p重复试验次数n陈优点:不受古典概率的两个特点的限制,
3、容易理解。缺点:试验不能的进行下去。概率1.概率:是指对一些无法重复的试验,确定其结果的概率只能根据以往的经验,人为确定这个事件的概率。概率是一个决策者对某个事件是否发生,根据个人掌握的信息对该事件发生可能性的判断例如,企业投资新项目的成功和失败的概率。例如天下雨的可能性多大?一种新产品畅销的可能性多大?2.3.由于仅仅是经验的判断,因此可靠性就值得怀疑,不宜。6概率的性质非负性对任意事件A,有 0 P (A) 12.规范性必然事件的概率为1;不可能事件的概率为0。即P ( ) = 1; P ( ) = 0可加性3.若A与B互斥,则P ( AB ) = P ( A ) + P ( B )推广到
4、多个两两互斥事件A1,A2,An,有P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )7参数估计的方法矩估计法顺序统计量法最大似然法最小二乘法8暨南大学经济学院统计系陈区间估计点 估 计估 计 方 法点估计estimate)(po1.用样本的估计量的某个取值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计;2.无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无
5、法给出估计的可靠性的度量9点估计estimate)(po点估计10暨南大学经济学院统计系陈总体均值总体比例总体方差 2样本均值x样本比例p样本方差s2点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。区间估计的提出11但是由于抽样的随机性产生了抽样误差,某个具体样本得到的估计值很可能不同于真值。因此, 不能完全信赖一个点估计值,而是围绕点估计值来构造一个区间,于是提出了区间估计。在重复抽样条件下,点估计的均值可能会等于总体的真值:E(x ) .区间估计erval estimate)(1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到根据样本统计
6、量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量2.比如,某班级平均分数在7585之间,置信水平是95%置信区间样本统计量(点估计)置信下限置信上限12暨大学经济学院统计系陈回顾:中心极限定理(central limit theorem)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布样本均值的分布:均值为: ,任一分布:均值为,方差为 2 2方差为:n n标准误差为:13暨南大学经济学院统计系陈当样本容量n充分大时3 准则实际上,可以求出样本均值x落在总体均值的两侧任何一个标准差范围内
7、的概率。 2样本均值的分布为:xN (,)时,有:nP( x ) 0.6826 P( x 2 ) 0.9545 P( x 3 ) 0.9973即样本均值x值几乎落在区间(-3, +3)内。超出这个范围的可能不到0.3%。样本均值x落在总体均值的两侧各为一个抽样标准差范围内的概率为68.26%进一步解释约有95%的样本均值所构造的约95个区间包含总体均值两个标准差的区间会包括总体均值计系陈构造出100个区间(xi 2)约有95%的样本均值会落在总体均值的两个标准差范围之内。总体均值就被包括在以x为中心左右两个标准差范围之内。计算出100个样本均值(xi:i 1, 2,100)样本均值x落在总体均
8、值的两个标准差范围之内随机抽取100个样本(n 100)置信区间(confidenceerval)16注:统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间置信区间的最小值称为置信下限置信区间的最大值称为置信上限在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间置信区间(confidenceerval)置信区间(x ,x )包含的概率为 1。可以表示为P(x x ) 1其中:0 1注:在实际应用中,和1常用百分数表示。若 0.05,则表示为5%和95%的形式。17置信系数: 1 显著性水平: 置信下限:x 置信上限:x P(x x ) 11 xx x 1
9、8暨南大学经济学院统计系陈 2 24、 只要 )就是随机的。但是一旦样本确定, 就可以获得 )就固定了。这时候,就不能说一个给定了的固定区间包含真值的概率为1 。在固定区间的情形下,可能落在这个固定的区间之内,或者落在这个区间之外,从而概率只能是1或0。3、 该方程表明:在重复抽样中,每次抽样即可获得一个样本,进而构造多个区间,这些随机区间中将有100%(1)次包含着总体参数的真值。2、 该方程中的这个区间是一个随机区间。这是由于样本统计量是样本的函数,样本抽样是随机的,因而样本均值是随机的,则用样本均值构造的区间也是随机的。1、 该方程并没有说落入给定区间(x ,x )内的概率为1。应该理解
10、为:构造的这一个区间包含真值的概率为1。实际上,真值可能会落在这个区间内,也可能会落在这个区间外。P(x x ) 1的几点说明置信水平1.置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平置信水平表示为 (1 - , 为是总体参数未在区间内的比例 ,称为显著性水平。常用的置信水平值有 99%, 95%, 90%相应的 为0.01,0.05,0.10显著性水平越小越好2.3.20总体真值的一个置信水平为1的置信区间: x z,x zn 2n 2 P z x z 1x 2 2 nn设XN (, 2 ), 则有:x P n z2 1 设XN (0,1),
11、若z 满足条件 P( X z ) ,0 1则称点z 为标准正态分布的上分位点。置信区间与置信水平均值的抽样分布 x /21 /2xx zxn 2x z 2n(1 - ) 区间包含了 的区间未包含对置信区间的几点理解1、如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,则称该方法构造的区间为置信水平为95%的置信区间。总体参数的真值是固定的、未知的,而用样本构造的区间则是不固定 的。不同的样本,得到不同的区间,因此置信区间是一个随机区间。 实际应用中,进行估计时往往只抽取一个样本,此时构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。这
12、个区间可能包含也可能不包含总体的真值。2、3、特别说明:用概率说明了在多次抽样得到的区间中大概有多少个区间包含了总体参数的真值。总体均值的区间估计对总体均值进行区间估计时,需要考虑几种情形:1、总体是否为正态分布?2、总体方差是否已知?3、用于构造估计量的样本是大样本(n30)?还是小样本(n30)呢?情形1:正态总体、方差已知,或非正态总体、大样本假定总体从正态样本均值标准化后服从标准正态分布:x z N (0,1)n25暨南大学经济学院统计系陈分布,但为大样本时xN(, 2n)样本均值的抽样分布服从正态分布假定总体服从正态分布,且方差 2已知:总体均值在置信水平为1下的置信区间为 x z,
13、x zn 2n 2 26设XN (0,1), 若z 满足条件 P( X z ) ,0 1则称点z 为标准正态分布的上分位点。P z x z 1x 2 2 nn根据xN (, 2n)和上分位点的定义: x P n z 2 1 :称为显著性水平,是事先所给定的一个概率值,也被称为风险值,它是总体均值不被包括在置信区间中的概率1-:称为置信水平,置信区间包含总体参数的概率z 2: 是标准正态分布上侧面积为 2时的z值: 样本均值的标准差n nz:是估计总体均值时的边际误差,也称为 2估计误差或误差范围,描述估计量精度。注:总体均值的置信区间由两部分:点估计值(x) 边际误差置信区间 x z,x z的
14、几点说明n 2n 2 1 x:总体均值在置信水平为1下的置信区间为 x z,x zn 2n 2 28x zn 2x zn 2 2 2P z x z 1x 2 2 nn: x sz,x szn 2n 2 总体均值在置信水平为1下的置信区间为 x zs 2n 用样本方差(s2)代替总体方差( 2)在大样本条件下若总体服从正态分布,但方差 2未知时或总体从正态分布,方差 2未知时总体均值的区间估计(大样本)1.假定条件总体服从正态分布,且方差() 已知如果不是正态分布,可由正态分布来近似 (n 30)2.使用正态分布统计量 zx z N0,1)n总体均值 在1- 置信水平下的置信区间为3. ns 未
15、知或 2 2n30暨南大学经济学院统计系陈情形2:正态总体、方差未知,小样本样本均值x的抽样分布都服从正态分布总体服从正态分布总体方差 2已知无论样本量大小如何样本方差s 来代替总体方差 22:因此,采用t分布来建立总体均值的置信区间31样本均值经过标准化后服从度为(n 1)的t分布,即t x t(n 1)sn总体方差 2未知小样本情形下总体均值在1-置信水平下的置信区间为:x z 2n大样本且方差未知总体均值的区间估计(小样本)1.假定条件总体服从正态分布,但方差() 未知小样本 (n 临界值 ,H0统计量 临界值 ,接受H0左侧检验:统计量 临界值,H0 H055显著性水平和(双侧检验 )
16、域抽样分布置信水平H0H0 /2 /21 - 0样本统计量临界值临界值 接受H0若 ZZ562显著性水平和(双侧检验 )域抽样分布置信水平H0H0 /2 /1 - 0样本统计量临界值临界值H057暨南大学经济学院统计系陈若ZZ 2显著性水平和(双侧检验 )域抽样分布置信水平H0H0 /2 /1 - 0样本统计量临界值临界值H0 暨南大学经济学院统计系58陈若ZZ 2利用 P 值 进行决策P 值?(P-value)1.2.P 值是一个概率值, 0p1在原假设为真的条件下,检验统计量大于、小于或等于其计算值的概率双侧检验为抽样分布中两侧面积的总和3.反映实际观测到的数据与原假设H0之间不一致的程度
17、,被称为观察到的(或实测的)精确的显著性水平,而是事先选定的显著性水平决策规则:若p值”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)2.备择假设的方向为“”,称为右侧检验68暨南大学经济学院统计系陈双侧检验与单侧检验(假设的形式)69假设双侧检验单侧检验左侧(下限)检验右侧(上限)检验原假设H0 = H0 H0 备择假设H1 H1 双侧检验:假设的建立 所关心的是检验样本均值与总体均值有没有明显差异,而不管差异的方向是正还是负,应该侧检验。H0 : 0原假设备择假设H1 : 070左侧检验:假设的建立 所关心的是总体均值是否低于某个标准,则应该用左侧检验H0 : 0原假设备择假设 H1 : 071右侧检验:假设的建立 所关心的是总体均值是否高于或超过某个标准,则应该用右侧检验H0 : 0原假设备择假设 H1 : 072单侧检验(原假设与备择假设的确定)1.予以支持的假设作为备择假设H1将研究者想收集一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致2.3.证明其不正确的假设作为原假设H0将研究者想收集先确立备择假设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年麻醉科医师全身麻醉操作流程考核模拟试题及答案解析
- 2026重庆沙坪坝区总商会公开招聘秘书处1人建设考试参考试题及答案解析
- 小学课外阅读活动方案与组织指南
- 企业员工健康体检管理方案模板
- 2026湖南长沙岳麓区云西府幼儿园招聘建设考试参考试题及答案解析
- 2026中天合创能源有限责任公司煤炭分公司招聘22人建设笔试模拟试题及答案解析
- 2026中国地质调查局局属单位招聘(第二批182人)建设笔试备考题库及答案解析
- 2026新疆兵团第七师高级中学义教部(一三一团中学)教师招聘4人建设笔试模拟试题及答案解析
- 2026黑龙江省龙江化工有限公司招聘1人建设笔试模拟试题及答案解析
- 2026湖南航仪计量检测中心有限公司招聘1人建设笔试参考题库及答案解析
- 肥料厂原料采购制度
- 江苏省九校2026届高三下学期3月联考 政治+答案
- 水源保护区生态环境建设示范工程项目建议书
- 2026年西安医学院第一附属医院招聘(62人)笔试备考试题及答案解析
- 2026年江西省公安厅招聘警务辅助人员笔试试题(含答案)
- 花式色纺纱课件
- 深度解析(2026)《SYT 7776-2024 石油天然气风险勘探目标评价规范》
- 中纪委二十届五次全会测试题及答案解析
- 2026年1月浙江省高考首考英语试卷真题完整版(含答案+听力)
- 食品企业PDCA质量培训课件
- 大专院校介绍
评论
0/150
提交评论