版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计量经济学的统计学基础计量经济学的统计学基础简要复习数理统计学简要复习数理统计学1主要内容主要内容第一节第一节 基本概念基本概念第二节第二节 随机变量的数字特征随机变量的数字特征第三节第三节 随机变量的分布随机变量的分布第四节第四节 估计量及其衡量标准估计量及其衡量标准第五节第五节 区间估计区间估计第六节第六节 假设检验假设检验 2第一节第一节 基本概念基本概念总体和个体总体和个体样本和样本容量样本和样本容量随机变量和概率随机变量和概率统计量统计量随机变量的分布函数随机变量的分布函数条件概率条件概率3总体和个体总体和个体总体 研究对象的全体称为总体或母体(集合);试验全部的可能观察值 例如某厂
2、显像管的寿命个体 组成总体的各个元素称为个体(构成集合的元素);是对总体的一次观察 例如,某个显像管的寿命 每个显像管的寿命可能是不同的,是一个随机变量本质上说,总体就是所研究的随机变量或者随机变量的分布。4样本和样本容量样本和样本容量样本 总体中抽出若干个个体组成的集体称为样本。 例如,抽出20个显像管检查样本容量 样本中包含的个体的数量称为样本的容量,又称为样本的大小。(通常记做n) 例如,抽出20个显像管检查,样本容量为20注意:从总体中抽样通常满足两个原则 随机原则,即总体中每个个体有同样的机会被选入样本。 独立原则,即每次抽样不受其他抽样的影响,也不影响其他抽样结果。5随机变量和概率
3、 随机性和随机变量随机性:事物的结果不能完全事先确定,即可能发生也可能不发生,既可以是这个水平,也可以是那个水平。 如:商店一天的销售量,通过降低利率刺激投资的效果 随机性是计量经济模型的根本特征,计量模型都有随机误差项随机变量:表示随机现象各种结果的函数(样本空间-实数空间)。 设S=e是试验的样本空间,如果量X是定义在S上的一个单值实值函数即对于每一个eS,有一实数X=X(e)与之对应,则称X为随机变量。6随机变量和概率 概率 事件A的概率是描绘事件A发生的可能性的大小 概率的定义:频率定义(古典定义,公理化定义) 频率:事件A在n次重复试验中出现nA次,则比值nA/n称为事件A在n次重复
4、使用中出现的频率。 当实验次数n增大时,频率逐渐趋向一个稳定值,记为事件A的概率 ProbabilityP10 p7总体、样本间的联系 总体是给定的,但一般是未知的 样本是总体的一部分,可以通过抽样获得,样本是一个随机变量 一般要通过样本才能部分地推知总体的情况(数字特征) 例如:总体的均值 VS 样本均值8统计量 设 为一组样本观察值,若函数 不含有未知参数,则称为统计量。(比如X表示身高) 由于样本是随机变量,因而它的函数Y也是随机变量,所以,统计量也是随机变量。 统计量一般用它来提取由样本带来的总体信息。 常用统计量:2211niinxxs样 本 方 差11XniiXn样 本 均 值 1
5、2(,)nXXX12(,)nYf XXX9随机变量的分布函数 概率密度函数概率密度函数离散型随机变量的概率函数为: 满足条件:连续型随机变量的概率函数为:描述随机变量的输出值在某个确定的取值点附近的可能性函数。 满足条件: ()iP XxniiixXPxXP11)(;0)(XdxxfbXaPba,)()(1)(; 0)(dxxfxf10随机变量的分布函数累积分布函数:就是随机变量取值不大于给定水平的概率构成的函数。 离散型随机变量的分布函数为: 连续型随机变量的分布函数为:1( )()niiFxPxp( )()( )xFxPxf t dt11密度函数和分布函数的关系:密度函数和分布函数的关系:
6、 概率密度函数的大小能够反映X在x附近取值的概率的大小,从而比累积分布函数更直观。 但累积分布函数为单调函数,更易处理。12举例:正态分布的密度函数和分布函数举例:正态分布的密度函数和分布函数22()21x2 Fxxx uxfefdx密度密度:( )分布函数:( )( )x2x2f(x)F(x)x1x1XX2( ,)XN 13条件概率 条件概率 在已知与事件A相关的另一事件B已经发生的情况下,考虑事件A发生的概率。记作P(A|B) 条件分布 有时需要关注部分随机变量给定情况下,其他随机变量的概率分布。 条件期望 在给定条件下,考察随机变量的概率均值。 对离散型随机变量:( | )(| )F x
7、 BPx B( |)(|)kkkEBx PxB14第二节第二节 随机变量的数字特征随机变量的数字特征数学期望数学期望方差方差协方差和相关系数协方差和相关系数15数学期望数学期望数学期望的定义:描述变量取值的平均特征。反映了随机变量的平均水平或集中趋势随机变量的可能值以相应概率为权数的算术平均数通常以E(*)表示期望运算,以表示期望值数学期望简称期望,又称均值16离散型随机变量数学期望的定义:连续型随机变量数学期望的定义(略) 的数学期望。称为绝对收敛,则,若积分有分布密度函数若连续型随机变量XdxxxxEdxxxxX niiinnxppxpxpxxE12211变量X的取值x1x2xn相应概率P
8、p1p2pn17数学期望的性质(1)如果a、b为常数,则 E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y) 18方差方差定义定义方差是衡量随机变量取值分散程度(波动程度)的数字特征。如果取值比较集中,方差较小;若取值比较分散,则方差较大。随机变量与其数学期望偏差平方的概率加权和 (EX-E(X)2 )通常记为2(),( ),xVar XD x19 离均差 如果随机变量X的数学期
9、望E(X)存在,称X-E(X)为随机变量X的离均差。显然,随机变量离均差的数学期望是0,即 E X-E(X) = 0 方差 随机变量离均差平方的数学期望 : D(X)=EX-E(X)2 标准差方差的算术平方根叫标准差。连续型情形离散型情形,)()(,)()(212dxxfXExxXPXExXDkkk20方差的性质方差的性质(1)Var(c )=0(2)Var(c+x)=Var(x )(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则 Var(x+y)=Var(x )+Var(y )=Var(x-y)(5)Var(x)=E(x2)-(E(x)221数学期望与方差 数学期望
10、描述随机变量的集中程度,方差描述随机变量的数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。分散程度。1. 方差相同、期望不同方差相同、期望不同 2. 期望相同、方差不同期望相同、方差不同5105522协方差(协方差(Covariance)和)和相关系数相关系数(correlation coefficient)协方差的定义协方差的定义 两个随机变量与各自数学期望离差之积的期两个随机变量与各自数学期望离差之积的期望值。望值。度量两个随机变量之间相关关系的密切程度度量两个随机变量之间相关关系的密切程度( , )( )( )CovEEE 23,( , )Cov 相关系数的定义,相关系数的定
11、义,协方差与相关系数协方差与相关系数协方差是有量纲的;相关系数无量纲,取值协方差是有量纲的;相关系数无量纲,取值-1,1241 cov( , )( )(2)cov( , )cov( , )(3)cov(,)cov( , )(4)cov( 12, )cov( 1, )cov( 2, )(5)cov( , )0,x xD xx yy xax byabx yxxyxyxyc xc协方差的性质()其中 为常数25第三节第三节 随机变量的分布随机变量的分布 几种常见分布几种常见分布 分位数(点)和临界值分位数(点)和临界值 样本统计量及其分布样本统计量及其分布26(1)几种常见分布)几种常见分布 正态分
12、布 卡方分布 t分布 F分布27正态分布正态分布 正态分布的密度函数正态分布的密度函数 正态分布完全由期望和方差决定正态分布完全由期望和方差决定2221022,XXXXXNe若连续型随机变量 的概率密度为、 为常数,则称 服从正态分布,简记为。2,EXVarX数学期望方差28 正态分布是最常见的概率分布 中心极限定理保证了由众多微小扰动因素决定的连续型随机变量都可以用正态分布描述 特征:钟形,对称(关于期望值) 是卡方分布, t分布,F分布的基础29正态分布的标准化正态分布的标准化 定义定义 标准正态分布标准正态分布 如何将正态分布进行标准化如何将正态分布进行标准化2, 0,1XXNN如果令,
13、那么。根据以上定理,可以将任何一个正态分布,化为标准正态分布,即将其标准化。 220110,1 2xXNxe2当,的正态分布,称为标准正态分布,记作。密度函数为30关于正态分布的和关于正态分布的和 独立的n个正态分布随机变量的线性组合仍旧服从正态分布.31 2 分布分布 22122221,0,1 1,2, 11ininiXXXXXNinnn 设设随随机机变变量量相相互互独独立立, 则 则称称 服 服从从自自由由度度为为 的的, 指 指式式右右端端包包分分布布记记为为含含的的独独立立自自由由变变义义度度定定:量量的的个个数数32 t分布分布 t分布的定义分布的定义2(0,1),( ),( )/N
14、(XNYnXYXTntt nY n若连续型随机变量与 相互独立,则称 服从自由度为 的 分布,记作。图形与0,1)相似33F-分布分布x概率概率密度密度 221211212212, , /,/且独立, 则随机变量服从自由度的 分布,记做 其中 称为第一自由度(分子自由度),称为第定二自由度(分母自由度)义:UnVnX YU nFn nFFF n nV nnn34(2)分位数(点)和临界值)分位数(点)和临界值 设X为一随机变量,F为其分布函数,我们知道对于给定的实数x,F(x)=PXx给出了事件Xx的概率。 在统计中,我们常常需要考虑上述问题的逆问题:就是若已给定分布函数F(x)的值,亦即已给
15、定事件Xx的概率,要确定x取什么值。 易知,对通常连续型随机变量,实际上就是求反函数。35分位数分位数( (点)点) 当随机变量当随机变量X的分布函数为的分布函数为 F(x),实数,实数满足满足0 1 时,时,分位数是使分位数是使PXX )= 1-F(X )= ,则数,则数X 称为称为X所服所服从的概率分布的上从的概率分布的上分位点。分位点。 37双侧双侧分位数(点)分位数(点) 双侧双侧分位数是使分位数是使 PX2=1-F(2)=0.5的数的数2。 38临界值临界值 假设检验时,在给定的显著水平下,判定假设检验时,在给定的显著水平下,判定拒绝和接受时的数拒绝和接受时的数 其实是一个(对)分位
16、数其实是一个(对)分位数 临界值之内为接受域,临界值之外为拒绝临界值之内为接受域,临界值之外为拒绝域域392( )tn2( )tnt-t-分布的分位点分布的分位点40F F分布的分位点分布的分位点),(21nnF41统计量:设 是总体X的样本,则函数 如果不包含任何未知参数则称为样本 的一个统计量 (3)样本统计量及其分布)样本统计量及其分布12,nXXX12,nfXXX12, ,nX XX简言之,样本的不含任何未知参数的函数。42常见的样本统计量常见的样本统计量212,1,;0,1/niNXXNxxNNnnxx 样本均值:设是取自正态总体的样本,样本均值为:并且满足:43212222(1)2
17、,1(-) 11/(1)niNNSXXNXTt nsnXsNSxx 关于样本方差(略):设是取自正态总体的样本,样本方差为:可以证明:。(证明略)、 分别是样本的平均数和标准差,由于:44第四节第四节 估计量及其衡量标准估计量及其衡量标准总体算术平均数算术平均数x统计量统计量用来推断总体参数的统计量称为用来推断总体参数的统计量称为估计量估计量(estimator), 其取值称其取值称为为估计值估计值。 同一个参数可以有多个不同的估计量。参数是唯一同一个参数可以有多个不同的估计量。参数是唯一的,但的,但估计量(统计量)是随机变量估计量(统计量)是随机变量,取值是不确定的。,取值是不确定的。 ?参
18、数参数45点估计点估计假设在总体假设在总体X中,中, 为未知参数(均值、方差为未知参数(均值、方差等)。由样本(等)。由样本(X1、X2Xn )构造统计量)构造统计量 来估计未知参数来估计未知参数 ,称,称 为为 的的点估计量点估计量。 将某次抽样的样本观测值,代入将某次抽样的样本观测值,代入即得该估计量的一个即得该估计量的一个点估计值点估计值 。),(21nXXX),(21nxxx46点估计量的优良性标准点估计量的优良性标准设为待估计的总体参数,设为待估计的总体参数, 为样本统计量,为样本统计量,衡量统计量衡量统计量 好坏的标准有:好坏的标准有:(1)线性性)线性性(2)无偏性)无偏性(3)
19、有效性)有效性(4)一致性)一致性47线性性:线性性:参数估计量是随机变量观测值的线性组合参数估计量是随机变量观测值的线性组合具有线性性的参数估计量称为具有线性性的参数估计量称为“线性估计线性估计”意义:意义:参数估计量可以表示为随机变量观测值的线性组合,参数估计量可以表示为随机变量观测值的线性组合,通常意味着与随机变量有相同类型的概率分布。通常意味着与随机变量有相同类型的概率分布。(前提是,随机变量是正态分布,而这个假定一般前提是,随机变量是正态分布,而这个假定一般线性回归模型中都满足)线性回归模型中都满足)48无偏性:无偏性:参数估计量的概率均值(数学期望)等于参数的真实值。参数估计量的概
20、率均值(数学期望)等于参数的真实值。意义:意义:意味着利用不同样本反复估计,得到的估计值会以参数真实意味着利用不同样本反复估计,得到的估计值会以参数真实值为中心分布。值为中心分布。即即 ,则称为的无偏估计量,则称为的无偏估计量)(E有偏有偏49有效性:有效性:仅仅满足有效性是无意义的。实际上要求估计量是方差最仅仅满足有效性是无意义的。实际上要求估计量是方差最小的线性无偏估计量小的线性无偏估计量设设 和和 是总体指标是总体指标 的两个无偏估计量,的两个无偏估计量,若若 ,则称为比更有效的估计量,则称为比更有效的估计量2112var( )var()12 的抽样分布的抽样分布 的抽样分布的抽样分布5
21、0 设是 的估计量,若则称 是 的一致性估计量。1 1n nP P ( (X X , , , ,X X ) ) , 一致性:一致性:指随着样本容量的增大,估计量越来越接近被估指随着样本容量的增大,估计量越来越接近被估计的总体参数值。计的总体参数值。较小的样本容量较小的样本容量较大的样本容量较大的样本容量P(X )51形象感觉无偏性和有效性:形象感觉无偏性和有效性:4支比赛用枪的抽样结果支比赛用枪的抽样结果准而不精准而不精又精又准又精又准精而不准精而不准不精不准不精不准52第五节第五节 区间估计区间估计 点估计得到的估计值与真实值肯定有偏差,但是点估计本身不能反映估计量与真实值之间的近似程度。
22、点估计的基础上,利用其分布信息,构造参数真实值的置信区间53 所谓区间估计就是:根据事先确定的置信度1 - 给出总体参数的一个估计范围。 具体作法是找出两个统计量 1(x1,xn)与2 (x1,xn),使 P(1 2 )=1- (1 , 2)称为置信度为1-的置信区间 置信度1 - 反映了估计的可靠程度。在同样的方法得到的所有置信区间中,有100(1- % 的区间包含总体参数。 置信下限置信下限置信上限置信上限置信区间置信区间估计值估计值(点估计点估计)54对区间估计的形象比喻 我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计。(某甲的成绩为被估计的参数) P(1 2 )=大概的准
23、确程度( 1-) 如:P(75 (3.162.2622)H0.01, |t| 3.163.2492TT时,拒绝原假设,接受。(),不拒绝原假设84例(利用样本方差):某机器制造出的肥皂厚度为例(利用样本方差):某机器制造出的肥皂厚度为5公分。今公分。今欲了解机器性能是否良好,随机抽取欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得块肥皂为样本,测得平均厚度为平均厚度为5.3公分,样本标准差为公分,样本标准差为0.3公分。试分别以公分。试分别以0.05和和0.01的显著性水平检验机器性能良好的假设。的显著性水平检验机器性能良好的假设。得到不同结论是否矛盾?利用得到不同结论是否矛盾?利用P值
24、判断值判断2492. 3,01. 02622. 2,05. 022TTtT0.05/2=2.263.16T0.01/2=3.25P(3.16)=0.0115585例(利用样本方差):某机器制造出的肥皂厚度为例(利用样本方差):某机器制造出的肥皂厚度为5公分。今公分。今欲了解机器性能是否良好,随机抽取欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得块肥皂为样本,测得平均厚度为平均厚度为5.3公分,样本标准差为公分,样本标准差为0.3公分。试分别以公分。试分别以0.05和和0.01的显著性水平检验机器性能良好的假设。的显著性水平检验机器性能良好的假设。区间估计区间估计2( ,) (0,1)(
25、1)S(1)iXXXNUNnnnxtt nsnxtt nsn因为:标准化:未知,用s代替,所以利用:本题,已知样本标准差 ,所以选择86 这时可用这时可用 t 分布去建立参数估计的置信区间。选定分布去建立参数估计的置信区间。选定,查,查 t 分分布表得显著性水平为布表得显著性水平为 ,自由度为,自由度为n-1的的t分布表:分布表:则有临界值则有临界值 即即置信度为置信度为1-的置信区间为:的置信区间为: 2(1)tn221xsttnP 221ssP xxnttn 222ssxxntnt87 选定选定=0.05,查,查 t 分布表得显著性水平为,自由度为分布表得显著性水平为,自由度为9的的t分布
26、表:分布表:则有临界值则有临界值 置信度为置信度为1-的置信区间为:的置信区间为: 20.025(1)(9)2.262tnt122 0.30.35.3-2.2625.3+2.2621010(5.08,5.51)H ,Htssxxntn0即:(, )得: =5在置信区间外,所以拒绝接受88区间估计与假设检验的联系1.区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。2.对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换
27、成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。89例例2.某厂采用自动包装机分装产品,假定每包产品的重量服从某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为正态分布,每包标准重量为1000克。某日随机抽查克。某日随机抽查9包,测包,测得样本平均重量为得样本平均重量为986克,样本标准差为克,样本标准差为24克。试问在克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?的显著性水平上,能否认为这天自动包装机工作正常?01:1000,:1000HH合乎规定要求第一步:提出假设第一步:提出假设第二步:构造统计量第二步:构造统计量(1)xtt nsn利用:2( ,)XN u重量: 90第三步:计算统计量的值第三步:计算统计量的值986 10001.75249xtsn 第四步:在给定的显著性水平下查临界值:第四步:在给定的显著性水平下查临界值: =0.05双侧检验双侧检验 /2 /2=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026中国中煤能源集团有限公司春季招聘备考题库含答案详解
- 中信期货佛山分公司2026届校园招聘备考题库附参考答案详解(培优b卷)
- 2026广西柳州融安县长安镇卫生院乡村医生招聘2人备考题库附参考答案详解(综合题)
- 2026广东惠州市博罗县榕盛城市建设投资有限公司下属全资子公司招聘4人备考题库带答案详解(模拟题)
- 2026春季山东济宁市鱼台邮政校园招聘备考题库及参考答案详解(满分必刷)
- 2026重庆大学输变电装备技术全国重点实验室劳务派遣科研助理招聘2人备考题库及完整答案详解1套
- 2026四川泸州龙马潭区人民医院招聘3人备考题库带答案详解(巩固)
- 雨课堂学堂在线学堂云《食品营养与配餐(顺德职业技术学院)》单元测试考核答案
- 金属制品厂设备操作制度
- 婴幼儿托育服务合同
- 《胡萝卜先生的长胡子(第二课时)》课件
- 《中华人民共和国危险化学品安全法》解读课件
- 外贸企业内部控制制度
- 产科护理中的患者隐私保护
- 2026年襄阳职业技术学院单招职业技能考试题库及答案解析
- 受限空间作业审批制度
- 外贸扫盲培训资料
- 2025年经开区学校财务笔试及答案
- 2026年短视频内容创作B站长视频拆条技巧调研
- 光伏区防火安全培训课件
- 工程招投标与合同管理全套课件
评论
0/150
提交评论