




免费预览已结束,剩余34页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章回归分析和模型设定、generalregressionalysisandmodelspecification、RegressionAnalysis):最常见的统计分析工具分析某个变量对其他变量的依赖性。 x和y的回归关系可以用于研究x对y的影响,也可以用x预测y。 一、整体平均和样品平均howtofdindtherelationshipbetweenxandy? 理论上,总回归函数(PRF ),也就是说,当给定x时,应查找引入y的条件平均函数:Y|x=E(Y|X)=F(X ),2.1回归分析:问题的扩展分析: introduction,但不限于此。 因此,使用样本平均来估计整体平均,样本回归函数(SRF):mY|x=f(X ),PRF,SRF,x,y,wehopethersrisagoodestimateoftheprf . table 2.1 jointfrequencydistributionfx=income Andy=saving rate,asimplaceustration : howtofdindthemsamplemean, 表2.1是1960年美国1027户的收入和储蓄率的联合频率分布. p (Xi yj )=theproportionoftth 1027 famillieswhoreportedtoombination (x=xiaody=yj ); 类似于thecontitionmaleanofygivenx=xiis,mY|X,contitionmaleanfunctionofyonx,Fig2.1,如果得到总体数据,则给出x的值时y的总体条件的平均值(populat yi )=连接frequencysofthepopulation (Xi )=j (Xi yi )=marginlfrequeciencysofx (yj|Xi )=(Xi yi )/(Xi )=contingalfrequerequentionsofthiv=populationmeanofxy|x=jyi (yj|Xi )=computioncontingaleanofygivenx,Y|x=E(Y|X)=F(X ),mY|x=f(X ),question : how to g 虽然经济理论显示了:y|x=x,但表2.1显示了mY|X不是直线-我们还是保持mY|X吗? 还是说,如果使用用直线平滑样品mY|X的:m*Y|X=a bX,-平滑线,如何查找直线? 使用平滑线估计整体平均值比样本平均值更有效吗? 如果经济理论显示:y|x=x如何查找曲线? 平滑的样品曲线m*Y|X能告诉我关于y|x的信息吗? 二、设条件分布(x,y )的联合概率密度函数(pdf )为f(x,y ),则x的极限密度函数(margininalpdf):fx(x)=f(x,y)dyY :fy|x(y|x)=f(x,y)/fX(x ),条件pdffY|X(y|x )完全描述了y对x的依赖关系。 是否可以计算已知条件pdf、条件期待、条件方差、条件偏差、条件峰度、2.2回归分析regression和whatstatisticalpropertiesoese (y|x ) process? 1、定义回归函数及其性质,其中,条件期待E(Y|X )被称为与y的x相关的回归函数。 lemma lawditeatedexpectation : e e (y|x ) =e (y ),例如:为Y=工资,X=1(女性) andX=0(男性),则E(Y|X=1)=女性员工平均工资e (y|x=0 p(x=0)e(y|x=0)=总体平均工资=E(Y ),question : whyiise (y|x ) importanttfromaticalperspective? 我们想用x的函数g(X )来预测y,并且想用平均误差(MeanSquareError,MSE )的标准来评价g(X )接近y的程度。 平均误差标准下的最佳预测是条件期待E(Y|X )。 定义 MSE :如果themeansquareerroroffunctiong (x ) useddtopridictyisdefinedasms (g )=e y-g (x ) 2g0(x )=e (y|x ),则MSE (g )=e y-y 2=e y-G0 (x )-g (x ) 2e y-G0 (x ) G0 (x )-g (x ) =e y-G0 (x ) 2e G0 (x )-g (x ) 2=色散偏差误差2色散测量了y的期待真误差(真错误)。 因为偏置为20,在g(X)=g0(X )的情况下等号成立,所以选择g(X)=E(Y|X )时,MSE(g )变得极小。:使用方差和偏差的平方分解技术,其中theoremregressidentity:给定E(Y|X ),且Y=E(Y|X) =Y-E(Y|X ),其中被称为回归扰动项并且满足E(|X)=0的证明:被定义为=。 (a )回归函数e(y|x )可用于根据x信息预测y的平均值,(b)E(|X)=0)意味着回归误差不包含可以预测x的y的信息。 也就是说,能够预测y期望值的所有信息完全包含在E(Y|X )中。 条件E(|X)=0对模型参数的经济意义的解释很重要。(c ) e (|x )=0表示E()=EE(|X)=0且e (x )=e e (x|x ) =e xe (|x ) =e x0 =0,可能存在(c ) e (|x )=0且Var(|X )为x的函数。 如果Var(|X)=20,则称为条件方差。 否则,如果Var(|X)=2(X ),则称为条件方差。 请注意,测量经济的方法经常根据是否存在条件方差而不同。 假设Example:为y=0(12)x,并且x彼此独立,E()=0,Var()=2。 求出E(Y|X )和var (y|x )=0e (1) x|x e (|x )=0x2x0=0x var (y|x )=e y-e (y|x ) 2| x = e 0(1) x-(0x ) 2 e (2| x )=(12x ) 22,本例说明了y的条件方差可能依赖于x的理由。 实际上,上述过程可以写为y=01x。 在此可以写为=(1x2x )易懂的e (y|x )=0x (1x ) e (|x )=0x var (y|x )=(1x2x )2var (|x )=(1x2x ) 22,2.3线性回归模型linearregexpressionmodeling question : how to模型(y|x )? 另一方面,建立条件期待E(Y|X )的模型,一般有两种最基本的方法: (a )非参数法(b )参数法。 在经典的计量经济学中,我们特别关注参数法,byrestrictingclassoffunctionsf wesolvetomse-minimization problem,特别是我们通常关注线性函数(linear funct 可以以类似的方式构建g0(X )的非线性回归模型:对于该集群函数,未知的函数形式是线性的是(k 1)1向量.注意:(1)其中,函数集群a的主要特征是g (x )=x。 对于x,可以是非线性的,如g(x)=01x2x2或g(X)=0 1lnX(2)。 证明:根据解决最小化问题的一次偏导零的条件,*满足上述一次条件时,成为e x (y-x* )=0e (xy ) * )=e (xx* *= e (xx) -1e (xy ),注意:(a )条件e(y2 )保证E(Y|X )的存在(c )一般来说,最佳线性最小二乘预测值g * (x )=x* e (y|x ),question : whatistheinterpretatitionfor *? 一阶线性回归g (x )=x,其中=(0,1 ),X=(1,x1 )。 Slope:Intercept:为什么?验证,为了:用求解mine(y-(0x1)2的方法*0,*1, definition linearregexpressionmodel : the specific tiony=xur k1 iscalledalinearregexpressionmodel, whererureshishedeorrgerestreationdisturbanceorregressionerror .注意:线性回归模型是人为定义的。因此,真回归函数:g0(x)=e(y|x )、二、Theorem:对线性回归模型y=xu表示*的最佳线性最小二乘法,其中E(Xu)=0、Proof:表示*的最佳线性最小二乘法。=e (xy )-e (xx) *=e (xy )-e (xx) -1e (xy )=0e (Xu )=0,则e (Xu )=e (xy )-e (xx)=0,所以= e (xx) -1e (xy )=*,注意:(E(Y|X )是否是线性的(2)在x中包含切片项的情况下(X1=1),E(Xu)=0表示E(u)=0。 为什么? (3)E(Xu)=0和E(u|X)=0不相等。 如果有E(u|X)=0,则有E(Xu)=0,但是相反地不成立。 例如,假设u=1,x和依照标准正态分布n (0,1 )的两个随机变量彼此独立,则当e (u|x )=1e (Xu )=e (x ) e (x )=e (x ) e (x ) e ()=0(4) e (u )=0时,E(Xu)=Cov(X ) 2.4模型的正确设定CorrectModelSpecification是关于要解释的变量y的最佳代表是其条件期待E(Y|X ),因此线性模型中模型的正确设定是关于条件期待的正确设定。 winstisheharctiveringforcorrectmodelspecificationinment? definition correctmodelspectioninment :线性回归模型y=xu, rk1被称为对E(Y|X )正确地设定,如果存在0rk1以使E(Y|X )=x0,则注意: (1)对于所有rk1存在e (y|x ) x,则对于e (y|x )没有正确地设定线性模型参数0被称为“真参数”(true parameter ) (3)经济理论不能保证E(Y|X )的函数形式相对于x是线性的。 因此,在说明参数的经济意义时要慎重。 请注意,如果对于E(Y|X )正确设置了Theorem:线性模型y=xu,则存在(a )为y=x0的0,其中e (|x )=0(b ) e (x )=0(c ) *=0: (1)结论(a )为E(Y|X) 意味着正交性条件下最佳线性最小二乘近似解*等于参数的真值0.0.0。(b )通过从(a )知道e (|x )=0,容易算出E(X)=0,(c )从(b )知道对于模型y=x0正交性条件成立,因此0=*,Proof:(a )是通过线性模型正确设定的定义把这两者结合起来,(a )得到证明
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字科学课件
- 统编版2025-2026学年五年级上册语文期末专项复习-句子(有答案)
- 江西省赣州市南康区第一中学2024-2025学年高一下学期期中模拟物理试卷(含解析)
- 第二章有理数 单元检测卷提优含解析 2025-2026学年数学苏科版七年级上册
- 汉字学识字课件
- 3D打印技术与应用 知到智慧树见面课答案-1
- 《人体系统解剖学》知到智慧树答案
- 建筑施工协议书集合15篇
- 银行渠道数字化转型的研究报告
- 软件开发行业软件开发平台
- 大学生开学第一课主题班会PPT
- 2023年山东水发集团有限公司招聘笔试题库及答案解析
- SB/T 10941-2012自动制冰机试验方法
- GB/T 6804-2008烧结金属衬套径向压溃强度的测定
- 沙盘游戏治疗(2017)课件
- SY∕T 5280-2018 原油破乳剂通用技术条件
- 苏教版五年级数学下册【全册课件完整版】
- 班组施工任务单
- 职业健康检查结果告知书模板
- 2022年小型发电站设备缺陷管理制度
- 慢性肾衰竭(慢性肾脏病)诊疗指南(内容清晰)
评论
0/150
提交评论