计量经济学基础知识梳理(超全).ppt

上传人：x*** IP属地：四川上传时间：2020-02-14 格式：PPT 页数：175 大小：1.17MB 积分：15 举报 版权申诉

已阅读5页，还剩170页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第一章计量经济学基础知识如果表示n个数的一个序列那么我们就把这n个数的总和写为第一节高数知识一求和二算术平均算术平均 arithmeticmean 就是我们日常生活中使用的普通的平均数其定义如下式三加权算术平均加权平均是将各数据先乘以反映其重要性的权数 w 再求平均的方法其定义如下式四变化率变化率的定义如下式五几何平均几何平均是n个数据连乘积的n次方根其定义如下式六线性函数如果两个变量x和y的关系是我们便说y是x的线性函数而和是描述这一关系的两个参数为截距 Intercept 为斜率一个线性函数的定义特征在于 y的改变量总是x的改变量的倍其中表示改变量换句话说 x对y的边际效应是一个等于的常数例线性住房支出函数假定每月住房支出和每月收入的关系式是Housing 164 0 27income那么每增加1元收入就有0 27元用于住房支出如果家庭收入增加200元那么住房支出就增加0 27 200 54元机械解释上述方程即时一个没有收入的家庭也有164元的住房支出这当然是不真实的对低收入水平家庭这个线性函数不能很好的描述housing和income之间的关系这就是为什么我们最终还得用其他函数形式来描述这种关系多于两个变量的线性函数假定y与两个变量和有一般形式的关系由于这个函数的图形是三维的所以相当难以想象不过仍然是截距即 0和 0时y的取值且和都是特定斜率的度量由方程 A 12 可知给定和的改变量 y的改变量是若不改变即则有因此是关系式在坐标上的斜率因为它度量了保持固定时 y如何随而变所以常把叫做对y的偏效应由于偏效应涉及保持其他因素不变所以它与其他条件不变 CeterisParibus 的概念有密切联系参数可作类似解释即若则因此是对y的偏效应线性函数的性质假定大学生每月对CD的需求量与CD的价格和每个月的零花钱有如下关系式中 price为每张碟的价格 income以元计算需求曲线表示在保持收入和其他因素不变的情况下 quantity和price的关系例对CD的需求线性函数的基本性质不管x的初始值是什么 x每变化一个单位都导致y同样的变化 x对y的边际效应是常数这对许多经济关系来说多少有点不真实例如边际报酬递减这个重要的经济概念就不符合线性关系为了建立各种经济现象的模型我们需要研究一些非线性函数非线性函数的特点是给定x的变化 y的变化依赖于x的初始值七若干特殊函数 1 二次函数刻画报酬递减规律的一个简单方法就是在线性关系中添加一个二次项考虑方程式式中和为参数当时 y和x之间的关系呈抛物线状并且可以证明函数的最大值出现在 1 二次函数例如若y 6 8x 2x2 从而 8且 2 则y的最大值出现在x 8 4 2处并且这个最大值是6 8 2 2 2 2 14 对方程式意味着x对y的边际效应递减这从图中清晰可见应用微积分知识也可以通过求这个二次函数的一阶导数得出斜率方程右端是此二次函数对x的导数同样则意味着x对y的边际效应递增二次函数的图形就呈U行函数的最小值出现在点处 1 二次函数在计量经济分析中起着最重要作用的非线性函数是自然对数或简称为对数函数记为还有几种不同符号可以表示自然对数最常用的是或当对数使用几个不同的底数时这些不同的符号是有作用的目前只有自然对数最重要因此我们都用表示自然对数 2 自然对数 2 自然对数图2 1 4y log x 的图形 2 自然对数有如下性质 1 log x 可正可负 log x 0 x 12 一些有用的性质牢记 log x1 x2 log x1 log x2 x1 x2 0log x1 x2 log x1 log x2 x1 x2 0log xc c log x x 0 c为任意实数 2 自然对数对数可用于计量经济学应用中的各种近似计算 1 对于x 0 有log 1 x x 这个近似计算随着x变大而越来越不精确 2 两对数之差可用作比例变化的近似值令x0和x1为两个正数可以证明利用微积分对x的微小变化有如果我们用100乘以上述方程并记那么对x的微小变化便有微小的含义取决于具体情况 2 自然对数近似计算的作用定义y对x的弹性 elasticity 为换言之 y对x的弹性就是当x增加1 时y的百分数变化若y是x的线性函数则这个弹性是它明显取决于x的取值弹性并非沿着需求曲线保持不变 2 自然对数不仅在需求理论中在许多应用经济学领域弹性都是非常重要的在许多情况下使用一个常弹性模型都很方便而对数函数能帮助我们设定这样的模型如果我们对x和y都使用对数近似计算弹性就近似等于因此一个常弹性模型可近似描述为方程式中为y对x的弹性假定x y 0 这类模型在经验经济学中扮演着重要角色目前式中的只是接近于弹性这一事实并不重要可以忽略例常弹性需求函数若q代表需求量而p代表价格并且二者关系为则需求的价格弹性是 1 25 初略地说价格每增加1 将导致需求量下降1 25 2 自然对数在经验研究工作中还经常出现使用对数函数的其他可能性假定y 0 且则从而由此可知当y和x有上述方程所示关系时例对数工资方程假设小时工资与受教育年数有如下关系根据前面所述方程有由此可知多受一年教育将使小时工资增加约9 4 通常把 y x称为y对x的半弹性半弹性表示当x增加一个单位时y的百分数变化在上述模型中半弹性是个常数并且等于在上述例子中我们可以方便的把工资和教育的关系概括为多受一年教育无论所受教育的起点如何都将使工资提高约9 4 这说明了这类模型在经济学中的重要作用 2 自然对数另一种关系式在应用经济学中也是有意义的其中 x 0 若取y的变化则有这又可以写为利用近似计算可得当x增加1 时 y变化个单位例劳动供给函数假定一个工人的劳动供给可描述为式中 wage为小时工资而hours为每周工作小时数于是由方程可得换言之工资每增加1 将使每周工作小时增加约0 45或略小于半个小时若工资增加10 则或约四个半小时注意不宜对更大的工资百分数变化应用这个近似计算考虑方程此处log y 是x的线性函数但是怎样写出y本身作为x的一个函数呢指数函数给出了答案我们把指数函数写为y exp x 有时也写为但在我们课程中这个符号不常用指数函数的两个重要的数值是exp 0 1和exp 1 2 7183 取4位小数 3 指数函数 3 指数函数图2 1 4y exp x 的图形从上图可以看出 exp x 对任何x值都有定义而且总大于零指数函数在如下意义上是对数函数的反函数对所有x 都有log exp x x 而对x 0 有exp log x x 换言之对数解除了指数反之亦然对数函数和指数函数互为反函数指数函数的两个有用性质是exp x1 x2 exp x1 exp x2 和exp c log x xc 3 指数函数记忆经济学中常用的一些函数及其导数有 4 微分学当y是多元函数时偏导数的概念便很重要假定y f x1 x2 此时便有两个偏导数一个关于x1 另一个关于x2 y对x1的偏导数记为就是把x2看做常数时方程对x1的普通导数类似的就是固定x1时方程对x2的导数若则这些偏导数可被视为经济学所定义的偏效应 4 微分学把工资与受教育年数和工作经验以年计相联系的一个函数是exper对wage的偏效应就是上式对exper的偏导数这是增加一年工作经验所导致工资的近似变化注意这个偏效应与exper和educ的初始水平都有关系例如一个从educ 12和exper 5开始的工人再增加一年工作经验将使工资增加约0 19 0 08 5 0 007 12 0 234元准确的变化通过计算结果是0 23 和近似计算结果非常接近例含交互项的工资方程一随机变量及其概率分布假设我们掷一枚钱币10次并计算出现正面的次数这就是一个实验的例子一般地说一个实验是指至少在理论上能够无限重复下去的任何一种程序并且它有一个定义完好的结果集一个随机变量是指一个具有数值特征并由一个实验来决定其结果的变量第二节概率论基础按照概率和统计学的惯例我们一律用大写字母如常见的W X Y和Z表示随机变量而用相应的小写字母w x y和z表示随机变量的特定结果例如在掷币实验中令X为一枚钱币投掷10次出现正面的次数所以X并不是任何具体数值但我们知道X将在集合中取一个值比方说一个特殊的结果是x 6 我们用下标表示一系列随机变量例如我们记录随机选择的20个家庭去年的收入可以用X1 X2 X20表示这些随机变量并用x1 x2 x20表示其特殊结果一随机变量及其概率分布如定义所言即使随机变量描述的是一些定性事件我们也总定义它的结果是数值例如考虑只掷一枚钱币其两个结果是正面和反面我们可以定义一个随机变量如下如果出现正面则X 1 如果出现反面则X 0 一个只能取0和1两个值的随机变量叫做贝努利随机变量 X Bernoulli 读作 X服从一个成功概率为的贝努利分布 P X 1 P X 0 1 一随机变量及其概率分布 1 离散随机变量离散随机变量是指一个只取有限个或可数的无限个数值的随机变量可数的无限个虽然随机变量可取无限个值但这些值可以和正整数一一对应贝努力随机变量是离散随机变量的最简单的例子一随机变量及其概率分布一个离散随机变量要由它的全部可能值和取每个值的相应概率来完整描述如果X取k个可能值其概率p1 p2 pk被定义为pj P X xj j 1 2 k 读作 X取值xj的概率等于pj 其中每个pj都在0 1之间并且p1 p2 pk 1 1 离散随机变量 X的概率密度函数 probabilitydensityfunction pdf 概括了X的可能结果及其相应概率的信息而且对某个j 凡是不等于xj的x都有f x 0 换言之对任何实数x f x 都是随机变量X取该特定值x的概率当我们设计多于一个随机变量时有时需要给所考虑的pdf加一个下标例如fx是X的pdf fY是Y的pdf等等 1 离散随机变量给定任一离散随机变量的pdf 就不难计算关于该随机变量的任何事件的概率例如设X为一名篮球运动员在两次罚球中的命中次数因此X的三个可能值是 0 1 2 假定X的pdf是f 0 0 20 f 1 0 44和f 2 0 36这三个概率之和必然为1 利用这个pdf 我们能算出该运动员至少投中一球的概率 P X 1 P X 1 P X 2 0 44 0 36 0 80 X的pdf如下图示 1 离散随机变量 2 连续随机变量连续随机变量是指一个取任何实数的概率都为零的变量这个定义有点违背直觉因为在任何应用中我们最终都会观测到一个随机变量取得的某种结果这里的思想是一个连续随机变量X的可能取值如此之多以致我们无法用正整数去计算因而逻辑上的一致性就要求X必须以零概率取每一个值一随机变量及其概率分布在计算连续随机变量的概率时讨论一个连续随机变量取某特定值的概率是没有意义的最方便的是使用累积分布函数 cumulativedistributionfunction cdf 设X为任意随机变量它对任何实数x的cdf被定义为F x P X x 对于一个连续随机变量 F x 就是概率密度函数f之下点x以左的面积因为F x 就是一个概率所以它总是介于0 1之间此外若x1 x2 则P X x1 P X x2 即F x1 F x2 这意味着cdf是x的一个增至少非减函数 2 连续随机变量 cdf有如下两个对计算概率颇为有用的重要性质 1 对任何数c P X c 1 F c 2 对任何两个数ac 和P a X b P a X b P a X b P a X b 对于概率和统计学中所有重要的连续分布其累积分布函数已被制成表格其中最为人们熟知的是正态分布 2 连续随机变量 1 联合分布与独立性令X和Y为离散随机变量那么 X Y 的联合分布由它们的联合概率密度函数充分描述上式右端是X x和Y y的概率若我们知道X和Y的pdf 就容易得到它们的联合pdf 具体而言我们说X和Y相互独立的充要条件是对所有x和y 都有式中 fX为X的pdf而fY为Y的pdf 二联合分布条件分布与独立性在多个随机变量的背景中 fX和fY这两个pdf常被称为边缘概率密度函数以区别于联合pdf 即fX Y 上述独立性定义适用于离散和连续随机变量如果X和Y都是离散的那么上式就等同于P X x Y y P X x P Y y 因为仅需要知道P X x 与P Y y 所以计算联合概率相当容易若两随机变量不独立则称它们是相依的 1 联合分布与独立性考虑篮球运动员的两次罚球令X为贝努利随机变量如果第一次命中它等于1 否则等于0 再令Y为贝努利随机变量如果第二次命中它等于1 否则等于0 假设该运动员每次罚球的命中率都是80 即P X 1 P Y 1 0 8 问两罚两中的概率是多少例罚球命中率若X和Y独立则很容易回答这个问题 P X 1 Y 1 P X 1 P Y 1 0 8 0 8 0 64 因此有64 的机会两罚两中若第二次命中的机会依赖于第一次是否命中即X和Y不独立这种简单计算便不再正确随机变量的独立性是一个十分重要的概念若X和Y独立则知道X的结果并不改变Y出现的各种可能结果的概率反之亦然关于独立性的一个有用结论是若X和Y独立而我们对任意函数g和h定义两个新的随机变量g X 和h Y 则这些新的随机变量也是独立的 1 联合分布与独立性在计量经济学中我们通常也对一个随机变量称之为Y 与另外一个或多个随机变量的联系感兴趣暂且假设我们只对一个变量的影响感兴趣并称之为X 关于X如何影响Y 我们所能知道的都包含在给定X时Y的条件分布中由条件概率密度函数概括的这一信息被定义为对所有满足的x值都有 2 条件分布当X和Y都是离散变量时上式可解释为其中上式右端读作给定X x时Y y的概率当Y是连续变量时由于前述理由不能直接解释为概率但可以通过计算条件概率密度函数之下的面积来求出条件概率条件分布的一个重要性质是若X和Y是独立随机变量知道X取什么值无助于确定Y取各值的概率反之亦然这就是说且 2 条件分布再次考虑篮球员两次投篮的例子假定条件密度是这意味着球员第二次罚球命中的概率依赖于第一次罚球是否命中如果第一次命中则第二次命中的概率是0 85 如果第一次失误则第二次命中的概率是0 70 这就是说 X和Y不是独立的而是相关的我们若知道P X 1 便可以计算P X 1 Y 1 假定第一次命中的概率是0 8 即P X 1 0 8 那么我们得到两罚两中的概率为P X 1 Y 1 P Y 1 X 1 P X 1 0 85 0 8 0 68 例罚球命中率多数情况下我们只对随机变量分布的少数几个性质感兴趣这些特征可分成三类集中趋势的度量变异或分散程度的度量以及两个随机变量之间关联性的度量 1 集中趋势的一种度量期望值期望值是我们在计量经济学学习中遇到的最重要的概率性概念之一设X为一随机变量它的期望值记做E X 就是对X的所有可能值的一个加权平均权数由概率密度函数决定有时期望值又被称为总体均值特别是在我们强调X代表了总体中的某个变量时三概率分布的特征当X是取有限个值比方说的离散随机变量时期望值的准确定义最为简单令f x 表示X的概率密度函数则X的期望值为加权平均给定pdf在X的每个可能结果处的取值这很容易计算 1 集中趋势的一种度量期望值假定X分别以概率1 8 1 2和3 8取值 1 0和2 则E X 1 1 8 0 1 2 2 3 8 5 8 例计算一个期望值例假定X分别以概率1 8 1 2和3 8取值 1 0和2 则 E X 1 1 8 0 1 2 2 3 8 5 8对于例2 2 3中的随机变量令g X X2 便有E X2 1 2 1 8 0 2 1 2 2 2 3 8 13 8 例 X2期望值性质1 对任意常数c E c c 性质2 对任意常数a和b E aX b aE X b 性质3 如果是常数而是随机变量则或者利用求和符号作为一个特例取每个aj 1 我们有因此和的期望值就是期望值之和在数理统计的推导中常常用到这个性质 2 期望值的性质令X1 X2和X3分别为比萨店在某日出售的小中大比萨个数这些随机变量的期望值是E X1 25 E X2 57和E X3 40 小中大比萨的价格分别是5 50 7 60和9 15美元因此该日出售比萨的期望收入是E 5 5X1 7 60X2 9 15X3 5 50E X1 7 60E X2 9 15E X3 5 5 25 7 60 57 9 15 40 936 70即936 70美元这不过是期望收入具体某一天的实际收入一般都会有所差异例求期望收入度量集中趋势的另一种方法是用中位数若X是连续的则X的中位数比方说m 就是这样一个数 pdf之下的一半面积在m之左另一半面积在m之右当X是离散的且取有奇数个值时中位数就是按大小排序后居中的一个数若X可能取偶数个值则实际上有两个中位数有时取这两个数的平均便得到唯一的一个中位数一般而言中位数有时记为Med X 和期望值E X 是不相同的作为集中趋势的度量不能说哪一个比另一个更好两者都是度量X分布中心的有效方法 2 集中趋势的另一种度量中位数对一个随机变量X 令 E X 为了度量X离其期望值多远有许多种方法而最简单的一种代数方法就是用差异的平方 X 2 平方是为了消除距离度量的符号由此得到的正值符合我们对距离的直观认识因这一距离随X的每一结果而变故本身就是一个随机变量正如我们需要用一个数来总结X的集中趋势那样我们也需要用一个数来告诉我们X平均而言离有多远一个这样的数就是方差 variance 它告诉我们X对其均值的期望距离方差有时记为由方程知方差必定非负 3 方差方差S2的定义如下式样本 1 Var c 0 2 Var c x Var x 3 Var cx c2Var x 4 x y为相互独立的随机变量则Var x y Var x Var y Var x y 5 Var x E x2 E x 2 方差的重要性质一个随机变量的标准差记为sd X 就是它的方差的正的平方根 sd X 标准差有时又记做标准差有两个重要性质可从方差的两个性质中直接推出性质1 对任意常数c sd c 0性质2 对任意常数a和b sd aX b a sd X 特别是若a 0 则sd aX a sd X 4 标准差标准差S的的定义分别如下式作为方差和标准差性质的一个应用而且本身也是有实际意义的一个问题假如给定随机变量X 我们将它减去其均值并除以其标准差便定义了一个新的随机变量Z 这又可写为Z aX b 其中a 1 而b 可得 E Z aE X b 0Var Z a2Var X 2 2 1因此随机变量Z的均值为零方差或者标准差为1 这一过程有时被称为将随机变量X标准化而Z则叫做标准化随机变量 5 标准化一个随机变量 1 关联度协方差与相关虽然两个随机变量的联合pdf完整地描述了它们之间的关系但对于它们大致如何互相变动仍需要一个扼要的度量手段正如期望值和方差一样这类似于用一个数字来概括整个分布的某一方面现在要概括的便是两个随机变量的联合pdf 四联合与条件分布的特征两个随机变量X和Y之间的协方差有时也叫做总体协方差以强调它考虑的是描述一个总体的两个随机变量之间的关系被定义为乘积 X X Y Y 的期望值有时又记为若则平均而言当X超过其均值时 Y也超过其均值若则平均而言当X超过其均值时 Y低于其均值 2 协方差计算的几个有用表达式如下协方差度量两个随机变量之间的线性相依性一个正的协方差表示两随机变量同向移动而一个负的协方差则表示两随机变量反向移动 2 协方差性质Cov 1 若X和Y相互独立则注意此性质的反命题并不成立 X和Y之间的协方差为零并不意味着X和Y相互独立性质Cov 2 对任意常数a1 b1 a2和b2 都有此性质的重要含义在于两个随机变量之间的协方差会因为将两者或者两者之一乘以一个常数倍而改变这在经济学中之所以重要是因为诸如货币变量和通货膨胀率等都可使用不同的度量单位进行定义而不改变其实质协方差的性质取决于度量单位是协方差的一个缺陷为克服这一缺陷现引进X和Y的相关系数 correlationcoefficient X和Y的相关系数有时记做而且有时称总体相关所谓相关系数是用来测量诸如收入与消费气温和啤酒的消费量汇率与牛肉的进口价格等两个变量X Y之间的相互关系的大小和方向正或负的系数通过计算相关系数可以知道X与Y之间具有多大程度的线性 linear 关系相关系数R的定义如下式 3 相关系数性质Corr 1 1 Corr X Y 1若Corr X Y 0 或等价地Cov X Y 0 则X和Y之间就不存在线性关系并称X和Y为不相关随机变量否则X和Y就是相关的 Corr X Y 1意味着一个完全的正线性关系意思是说我们对某常数a和某常数b 0可以写Y a bX Corr X Y 1则意味着一个完全的负线性关系使得对某个b 0有Y a bX 1和 1两个极端情形很少出现接近1或 1的值便意味着较强的线性关系 3 相关系数性质Corr 2对于常数a1 b1 a2和b2 若a1a2 0 则Corr a1X b1 a2Y b2 Corr X Y 若a1a2 0 则Corr a1X b1 a2Y b2 Corr X Y 作为一个例子假定薪水和教育的总体相关系数是0 15 这一度量将与用美元千美元或任何其他单位计算薪水都无关与用年季月或其他单位来衡量受教育时间也无关 3 相关系数一旦定义了协方差和相关系数就可以把方差的主要性质完整地列出来性质VAR 3对于常数a和b 有由此可知若X和Y不相关从而Cov X Y 0 则和在后一情形中要注意为什么差的方差是两个方差之和而不是方差之差 4 随机变量之和的方差例令X为星期五夜晚某酒店赚到的利润而Y为接下来星期六夜晚赚到的利润因此 Z X Y就是这两个夜晚赚的利润假定X和Y都有一个300美元的期望值和一个15美元的标准差因而方差为225 两夜晚的期望利润将是E Z E X E Y 2 300 600美元若X和Y独立从而它们也不相关则总利润的方差便是两个方差之和 Var Z Var X Var Y 2 225 450 于是总利润的标准差是约为21 21美元 4 随机变量之和的方差从两个变量推广到多于两个变量的情形若随机变量中的每一个变量与集合中其他任何一个变量都不相关我们便称其为两两不相关的随机变量也就是说对所有的都有 4 随机变量之和的方差性质VAR 4若是两两不相关的随机变量且是常数则用求和符号便可写为此性质的一个特殊情形就是对所有i都取ai 1 这时对两两不相关的随机变量来说和的方差就是方差之和 4 随机变量之和的方差协方差和相关系数都是对两个随机变量之间线性关系的度量并且对称地处理两者在社会科学中更多的情况是我们想用一个变量X去解释另一个变量Y 而且若Y和X有非线性形式的关系则我们还希望知道这个形式把Y叫做被解释变量而X叫做解释变量例如Y代表小时工资而X代表受过正式教育的年数可以通过给定X下Y的条件期望有时又称条件均值来概括Y和X之间的关系即一旦我们知道X取了某个特定值x 就能根据X的这个结果算出Y的期望值记作E Y X x 或简记E Y x 一般情形是随着x的改变 E Y x 也会改变 5 条件期望当Y是取值为的离散随机变量时则有当Y连续时 E Y x 便由对的y的所有可能值求积分来定义好比无条件期望那样条件期望也是对Y所有可能值的一个加权平均只不过这时的权数反映了X已取了某个特殊值的情形因此 E Y x 是x的某个函数这个函数告诉我们Y的期望值如何随x而变化 5 条件期望例令 X Y 代表一个工人总体其中X为受教育年数 Y为小时工资那么 E Y x 12 便是总体中所有受了12年教育相当于读完高中的工人的平均小时工资 E Y x 16 则是所有受过16年教育的工人的平均小时工资跟踪各种教育水平的期望值便为工资和教育之间的关系提供了重要信息 5 条件期望原则上可以在每个教育水平上求出小时工资的期望值然后将这些期望值列表由于教育的变化范围很大且可度量为一年的某个分数所以用这种方法显示平均工资和受教育程度之间的关系很烦琐计量经济学中的典型方法是设定一些足以刻画这种关系的简单函数作为一个例子假设WAGE在给定EDUC时的期望值是如下线性函数 E WAGE EDUC 1 05 0 45EDUC假定这一关系对工人总体成立则受8年和16年教育者的平均工资分别是多少 EDUC的系数如何解释 5 条件期望条件期望的一些基本性质对计量经济分析中的推导颇为有用性质CE 1对任意函数c X 都有E c X X c X 这意味着当我们计算以X为条件的期望值时 X的函数可视为常数例如E X2 X X2 直观上这无非就是说若知道了X 也就知道了X2 6 条件期望的性质性质CE 2对任意函数a X 和b X 有例如我们能很容易地计算像XY 2X2这种函数的条件期望 6 条件期望的性质性质CE 3若X和Y相互独立则E Y X E Y 这个性质意味着若X和Y相互独立则Y在给定X时的期望值与X无关这是E Y X 必定等于Y的无条件期望在工资与教育一例中假设工资独立于教育则高中毕业生和大学毕业生的平均工资便相同这几乎无疑是错误的所以我们不能假定工资与教育是独立的 6 条件期望的性质性质CE 4E E Y X E Y 这个性质意味着如果我们先把E Y X 看做X的函数再求这个函数的期望值那么结果就是E Y 例令Y WAGE和X EDUC 其中WAGE为小时工资而EDUC为受教育年数假定给定EDUC下WAGE的期望值是E WAGE EDUC 4 0 6EDUC 且E EDUC 11 5 则有E WAGE E 4 0 6EDUC 4 0 6E EDUC 10 90美元小时 6 条件期望的性质性质CE 5若E Y X E Y 则Cov X Y 0 因而Corr X Y 0 事实上X的每个函数都与Y不相关该性质的含义是若对X的了解不能改变Y的期望值则X和Y必然不相关注意此性质的逆命题不成立若X和Y不相关 E Y X 仍然可能取决于X 6 条件期望的性质 1 正态分布正态分布和由它衍生出来的分布是统计学和计量经济学中最广泛使用的分布假定在总体上定义的随机变量是正态分布将使概率计算得以简化五正态及其有关分布图正态概率密度函数的一般形状当连续的随机变量的概率密度函数形式为时称X的分布为正态分布记为X 密度函数中和是X的数学期望和方差当和时称X服从标准正态分布记为X 表正态分布与标准正态分布图标准正态分布的分布函数卡方分布分布是一种连续型随机变量的概率分布这个分布是由别奈梅 Benayme 赫尔默特 Helmert 皮尔逊分别于1858年 1876年 1900年所发现它是由正态分布派生出来的主要用于列联表检验 1 卡方分布的数学形式设随机变量X1 X2 Xk 相互独立且都服从同一的正态分布N 2 那么我们可以先把它们变为标准正态变量Z1 Z2 Zk k个独立标准正态变量的平方和被定义为卡方分布分布的随机变量读作卡方六卡方分布 X即所谓具有n个自由度 degreesoffreedom df 的分布自由度概念在我们计量经济学中扮演着重要角色 1 卡方分布的数学形式 t分布在经典统计学和多元回归分析中广为应用它可以从一个标准正态和一个分布得到设Z服从标准正态分布而X服从自由度为n的分布于是随机变量便服从自由度为n的t分布记为T tn t分布的自由度得子分母中的随机变量 t分布的特点是左右对称当n很大时非常接近正态分布七 t分布如果随机变量X服从标准正态分布N 0 1 随机变量服从自由度为n 方差为2n的分布并且X和相互独立则统计量服从t分布注可以将分子理解为符合正态分布的参数分母看作其标准差对于从标准正态分布中的总体中抽的容量为n的简单随机样本其样本均值与样本标准差S构成如下统计量服从自由度为n 1的t分布记为t t n 1 注意这里的分母是子样标准差除以自由度实际上是子样均值的标准差只有这样才与分子保持一致性分子被平均了分母当然也要平均 t分布在小样本 n 30 统计推断中占有重要的地位 T分布图形正态分布相当于标准差为1的t分布而t分布的标准差多小于1 因而出现这种尾部肥大的现象正态分布 T分布统计学和计量经济学中的另一重要分布是F分布特别是在多元回归分析中要用F分布去检验假设为了定义F随机变量令和并假定X1和X2独立则随机变量服从一个自由度为 k1 k2 的F分布记为 F分布即是两个消去自由度的分布变量的比值八 F分布如果随机变量Xi i 1 2 3 n Yi i 1 2 3 n 是相互独立的而且服从相同的正态分布令则统计量服从第一自由度第二自由度的F分布记为F F 注 F分布在方差分析中有着重要的作用例如判断两个正态分布总体的方差是否有显著差异需要利用F分布其分子与分母其实是两个方差在进行回归检验时正是利用F函数这个特点九分位点 1 标准正态分布双侧分位点 1 标准正态分布单侧分位点 2 双侧分位点 2 单侧分位点 3 T分布的双侧分位点图2 9T分布的双侧分位点 3 T分布的单侧分位点 4 F分布的双侧分位点 4 F分布的单侧分位点表随机变量分布的比较一总体参数与随机抽样统计推断指利用来自总体的一个样本而获知该总体的某些情况所谓总体指任何定义完好的一组对象这些对象可以是个人企业城市或其他诸多可能性所谓获知可以有很多含义但大致归类为估计和假设检验两个范畴第三节数理统计基础 1 点估计用某一数值作为参数的近似值2 区间估计在要求的精度范围内指出参数可能的取值范围例1 劳动经济学家想了解中国全体就业成人的教育回报问再多受一年教育工作平均增加的百分数是多少要获得中国全体就业人口的工资和教育信息既不现实又不经济但我们可以获得总体中的一个子集的数据利用收集到的这些数据一位劳动经济学家也许能报告他对再受一年教育的回报的最好估计为7 5 这就是点估计的一个例子或者他想报告一个范围比方说教育的回报在5 6 9 4 之间这是区间估计的一个例子一总体参数与随机抽样例2 城市经济学家想知道邻里犯罪计划是否与低犯罪率有关经过在取自总体的一个样本中比较了安排和不安排监控计划的邻里犯罪率他可以得到两结论之一邻里犯罪监控计划对犯罪率确实有影响或者没有影响这个例子就属于假设检验的范畴一总体参数与随机抽样统计推断的第一步就是要明确所关注的总体而且一定要使之非常具体一旦明确了总体是什么就可对所关注的总体关系建立或设定一个模型这个模型将涉及一些概率分布或概率分布的特征而这又取决于一些未知参数所谓参数就是决定变量关系之方向和强度的一些常数如劳动经济学的例子中所关注的参数是总体中的教育回报率一总体参数与随机抽样令Y为一个随机变量代表着概率密度函数为f y 的一个总体其中f y 依赖于单个参数假定除了值未知外 Y的概率密度函数pdf是已知的不同的值将意味着不同的概率分布因此我们对值感兴趣如果我们能得到该总体的某种样本就能了解的某些情况最容易处理的抽样方案是随机抽样抽样若Y1 Y2 Yn是具有同一概率密度函数f y 的独立随机变量我们称为来自f y 的随机样本或者说来自由所代表的总体的一个随机样本当是来自密度f y 的一个随机样本时我们又称Yi是取自f y 的独立同分布样本抽样有限样本一词来自如下事实无论样本容量如何所讨论的性质对任何样本容量都成立有时把这些性质叫做小样本性质 1 估计量与估计值给定一个随机样本它来自一个取决于某未知参数的总体分布的一个估计量就是赋予样本每个可能结果一个值的法则这个法则在进行抽样之前就已经确立具体而言无论实际得到什么样的数据这个法则都不会改变二估计量的有限样本性质作为估计量的一个例子令为取自均值为的总体的一个随机样本的一个估计量就是这个随机样本的均值我们把叫做样本均值但是它不同于我们在代数知识中作为一个描述统计量而定义的一个数集的样本均值这里是一个估计量给定随机变量Y1 Y2 Yn的任何一种结果我们都用同样的法则去估计取其平均对于实际结果估计值就是该样本的均值 1 估计量与估计值假设我们得到美国10个城市的如下失业率样本例城市失业率我们对美国平均城市失业率的估计值是一般地说每个样本都有一个不同的估计值但是求估计值的法则是一样的不管在样本中出现的是哪些城市也不管样本中有多少个城市一个估计量的第一个重要性质就是关于它的期望值无偏估计量若的估计量W对一切可能的值都有E W 则W是一个无偏估计量 unbiasedestimator 2 无偏性一个估计量若是无偏的则其概率分布的期望值就等于它所估计的参数无偏性并不是说我们用任何一个特定样本得到的估计值等于或者很接近而是说如果我们能够从总体中抽取关于Y的无限多个样本并且每次都计算一个估计值那么将所有随机样本的这些估计值平均起来我们便得到由于在大多数应用中我们仅使用一个随机样本所以这个思维实验有点抽象 2 无偏性一个估计量的无偏性和可能偏误的大小取决于Y的分布和函数h 通常 Y的分布不是我们所能控制的虽然我们常常为这个分布选择一个模型它由自然规律或社会力量来决定但法则h的选择则操纵在我们手中我们若想要一个无偏估计量就必须对h作相应的选择可以证明有些估计量在一般情形下是无偏的 2 无偏性现在我们来证明样本均值是总体均值的一个无偏估计量不管其背后的总体如何分布 2 无偏性令Wn为基于容量为n的一个样本Y1 Y2 Yn的一个估计量那么若随着对任一 0 都有Wn便是的一个一致估计量若Wn不是的一致估计量则说它是非一致性的当Wn是一致的我们也说是Wn的概率极限记作plim Wn 3 一致性和无偏性不一样无偏性是估计量在给定样本容量下的一个特征一致性描述了估计量的抽样分布在样本容量变大时的形态为了强调这一点我们在陈述上述定义时就已对估计量加上了样本容量n这个下标并将在本节中始终保持这个惯常做法前述方程意味着 Wn的分布越来越集中于粗略地讲对于越来越大的样本容量 Wn离开很远的可能性越来越小 3 一致性无偏估计量不一定是一致的但那些随着样本容量增大而方差缩减至零的无偏估计量是一致的这个结果可规范陈述如下若Wn是的无偏估计量且随着有Var Wn 0 则plim Wn 利用全部数据样本的无偏估计量通常其方差都随着样本容量的扩大而缩减至零因而是一致的一致估计量的一个很好的例子是取自均值为和方差为的总体的一个随机样本的均值该样本均值对是无偏的对于任何一个样本容量n 我们都推导出因此随着n 有所以除了无偏外还是的一致估计量 3 一致性是的一致估计量即使不存在Var 这一结论也是成立的这个经典的结论被称为大数定律大数定律令Y1 Y2 Yn是均值为的独立同分布随机变量于是plim 大数定律意味着如果我们对估计总体均值感兴趣通过选取一个足够大的样本便能得到一个任意接近的数这个基本结论和概率极限的基本性质相结合便可以证明一些相当复杂的估计量时一致的 3 一致性中心极限定理是概率与统计学中最强有力的结论之一它表明任何具有有限方差的总体的一个随机样本的均值经过标准化后都服从一个渐近标准正态分布中心极限定理令为一个均值为和方差为 2的随机样本于是服从一个渐近标准正态分布 4 渐近正态性上式中的变量Zn就是的标准化形式我们从中减去了然后除以这样无论Y的总体分布是什么 Zn都有和标准正态分布一样的零均值和单位方差令人惊奇的是随着n变大 Zn的整个分布便任意接近于标准正态分布我们可以把方程中的标准化变量写它向我们表明为了得到有用的极限分布我们必须将样本均值与总体均值之差乘以样本容量的平方根若不乘我们只能得到依概率收敛于零的换言之随着n 的分布仅向一个点靠拢对于合理样本容量这不可能是一个很好的近似 4 渐近正态性乘以便可确保Zn的方差保持不变实践中我们经常把视为均值为均值为和方差为 2 n的近似正态分布这就为我们给出了正确的统计程序因为它得到方程中的标准化变量统计学和计量经济学中遇到的大多数估计量都可写为样本均值的函数这是我们就能应用大数定律和中心极限定理当两个一致估计量都服从渐近正态分布时我们便选择渐近方差最小的那个估计量 4 渐近正态性四参数估计的一般方法点估计的基本思想 1 矩估计根据大数定律样本矩依概率收敛于相应的总体矩而样本矩的连续函数依概率收敛于总体矩的连续函数通常以样本均值作为总体均值的点估计以样本方差作为总体方差的点估计令为来自总体分布f y 的一个随机样本因为假定了随机抽样所以的联合分布无非就是各个密度之积 f y1 f y2 f y3 在离散情形中这就是现在定义似然函数为这是一个随机变量因为它取决于随机样本的结果的极大似然估计量且称之为W 是使似然函数最大化的值显然这个值取决于随机样本极大似然原理是说在所有可能的值中应选取使观测数据有极大似然性的值直觉上这是估计的一种合理方法 2 极大似然估计法通常使用对数函数更加方便将似然函数取自然对数便得到对数似然函数极大似然估计 MLE 通常是一致性的而且有时候是无偏的然而许多其他的估计量也是这样 MLE之所以广受欢迎是因为如果总体模型f y 设定正确则它一般都是最渐近有效的估计量其次 MLE有时是最小方差无偏估计量 minimumvarianceunbiasedestimator 即在的所有无偏估计量中它的方差最小 2 极大似然估计法区间估计基本思想区间估计求解步骤图正态总体区间估计的分类 1 区间估计的性质从一个特定样本得到的点估计值本身还不足以对检验经济理论或进行政策探讨提供足够的信息一个点估计值也许是研究者对总体值的最好猜测但根据其性质并不能告诉我们估计值到底离总体参数有多么接近例如假定某研究者根据公认的一个随机样本报告说工作培训津贴使小时工资增加了6 4 我们怎能知道一旦整个工人总体都接受了培训其效果是否会接近这个数字呢由于我们不知道总体值所以无法知道某一特定估计值究竟离它有多近然而我们能作出概率方面的陈述并由此诞生区间估计我们已经知道评价一个估计量不确定性的一个方法求出它的抽样标准差连同点估计值一起报告估计量的标准差提供了估计值的某些精确度信息然而这个标准差依赖于未知的总体参数就算这个问题可以忽略连同点估计值一起报告标准差也并没有直接陈述总体值很可能坐在相对于估计值的什么地方通过构造置信区间 confidenceinterval 便克服了这一局限 1 区间估计的性质假定总体服从Normal 1 分布并令是来自这个总体的一个随机样本为了便于说明我们假定总方差已知且等于1 然后我们再说明怎样处理方差未知的更现实的情形样本均值服从一个均值为和方差为1 n的正态分布现在将标准化因为标准化的服从一个标准正态分布所以有即有方程表明随机区间包含总体均值的概率是0 95或95 这一信息使我们能构造的区间估计值为简记为 1 区间估计的性质一旦观测到样本数据方程中的置信区间便容易计算是依赖于数据的唯一因素例如假定n 16 并且16个数据点的均值是7 3 则这个95 置信区间是7 3 1 96 4 7 3 0 49 即 6 81 7 79 根据构造可知 7 3是此区间的中心置信区间虽然容易计算但较难理解当我们说方程是的一个95 置信区间时意味着随机区间包含的概率是0 95 换言之在抽取随机样本之前方程便有95 的机会包含方程是区间估计量的一个例子它是一个随机区间因为端点随不同的样本而变 1 区间估计的性质有人常这样解释置信区间落在区间上的概率是0 95 这种解释是错误的一旦样本被观测到且也已计算出来则置信区间的上下限只是两个数字在上述例子中就是6 81和7 79 而已总体参数虽然未知也仅是个常数因此只有两种可能或者落入或者不落入区间我们永远也无法确切知道是哪一种情形一旦利用现有数据把置信区间计算出来就不再有概率的问题概率解释来自如下事实利用所有随机样本构造这样的置信区间有95 的可能包含 1 区间估计的性质前面推导置信区间有假定总体服从Normal 1 分布实践中该总体的方差不一定为1 设方差为假定为已知则95 置信区间是当已知时的置信区间便已构造出来为了考虑未知的情形我们必须用一个估计值令表示样本标准差于是用的估计值s代替置信区间表达式中的我们就能求出一个完全依赖于观测数据的置信区间但是 s取决于特定样本这就不能保持95 的置信水平换言之因为常数已被随机变量s代替随机区间包含的概率不再是0 95 2 正态分布总体均值的置信区间我们该怎样做下去呢我们必须依靠t分布而不是使用标准正态分布 t分布得自式中为样本均值 S为随机样本的样本标准差为了构造一个95 的置信区间令c表示tn 1分布中的第97 5分位数换言之 c是这样一个值使得tn 1中的面积有95 落在 c与c之间 P c tn 1 c 0 95 c值依赖于自由度n 1 一旦适当选定了c 随机区间包含的概率就是0 95 对于一个特定的样本这个95 置信区间将计算为 2 正态分布总体均值的置信区间 2 正态分布总体均值的置信区间图2 3 3t分布中的第97 5百分位数c 对于各个不同自由度的c值可从t分布表中查到例如当n 20 自由度是n 1 19 因而c 2 093 于是 95 置信区间是其中和s都是从样本计算出来的值例工作培训津贴对工人生产力的影响霍

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计量经济学基础知识梳理(超全).ppt

文档简介

温馨提示

最新文档

评论

计量经济学基础知识梳理(超全).ppt

文档简介

温馨提示

最新文档

评论

相关文档