版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一元线性回归(二),例题4-1,某城镇1988-1998年人均可支配收入X(元,1980年不变价),人均鲜蛋需求量Y(公斤),建立模型 Y=a+bX,估计收入对需求的影响。 1。利用Excel完成 2。利用stata完成 先画散点图,然后估计方程。,Y=10.766+0.005X+u,测试成绩和学生/教师比关系的OLS估计值及其分析。 打开数据文件:score.dta reg testscr str,testscr=698.93 - 2.28str + u,回归结果的分析,1。截距项和斜率的含义是什么? 本题的截距表示:学生教师比为0(没有学生时)的测试成绩的最高值,因此没有实际意义。可以理解
2、为确定回归线的系数。,斜率:表示弹性 -2.28的斜率表示当每个教师对应的学生人数增加1个时,学区测试成绩将平均下降2.28分。 而当每个教师对应的学生人数减少2个时,测试成绩平均提高: (-2)(-2.28)= 4. 56分, 负的斜率表明每个教师对应的学生人数越多(较大规模的班),则相应的测试成绩越差。,2。方程的经济预测能力: 得到回归结果后,可以进行简单的预测,只要给定学生/教师比(X)取值后就能预测全学区的测试成绩了。 testscr=698.93 - 2.28str + u 如每个教师对应20个学生的学区,其测试成绩预测值为698. 93-2.2820=653.30。当然,由于其他
3、决定学区成绩的因素(u)的影响,预测不会是绝对正确的。预测的准确程度取决于模型的优劣。,3。方程的斜率的大小评估: 观察选取的420个样本的总体分布(分位数),一个例子: 假设某个学区处于加利福尼亚学区的中位数,对应的学生/教师比为19. 7,现在想减少到17.7。 一方面:她的学区学生/教师比从50%分位数移到接近10%分位数。这是一个相当大的变动。 另一方面:带入方程,测试成绩预计从654.5提高到659.1,从50%分位数移到将近60%分位数。,股票的beta值:证券组合的风险与报酬,(一)证券组合的风险 同时投资于多种证券的方式称为证券的投资组合,简称证券组合或投资组合。证券组合的风险
4、分为可分散风险与不可分散风险。,13,可分散风险可通过证券组合来消减,Rm是市场组合的期望收益,一般用C&P500组合收益, Rf是市场无风险收益,可以理解为各类存款收益。,我们把利用OLS方法估计出的参数b0和b1称为OLS估计量,用 表示。 用OLS方法估计出的方程:,残差的概念,残差是每个样本的拟合值和实际值之间的差。用ei或者 表示。 样本回归模型: 样本拟合线: 残差值:,基本原理: 1。确定样本个数n,给出观测值(Xi,Yi), i=1,2,3,n。由于样本容量已定,样本回归 模型可写为: 其中 称为回归系数(拟合参数), 称为 残差 (拟合误差)。,普通最小二乘法(OLS),2。
5、利用OLS法寻找残差的平方和最小的直线,估计出 的具体值。 3。此时可得到利用OLS方法测算出的Y的拟合值 ,注意, 并不是实际的Y值,有如下计算公式:,因此, 是Y的估计值或拟合值,而残差的大小决定了模型的优劣。,思考: 与ui是否是一回事? 有什么区别和联系?,直线上的点的坐标是 ,样本点的坐标是Yi 是从样本点到直线的距离。,拟合优度,拟合优度R2:描述OLS回归线对样本数据的拟合效果;描述观测值在回归线附近的离散程度;同时描述了样本数据有多大程度可以被回归方程所解释。 回归R2是指可由Xi解释(或预测)的Yi样本方差的比例。,OLS方法得到的拟合线一定是所有直线中拟合效果最好的,但由于
6、样本自身的原因,拟合效果有好有坏。 最典型的例子是错误的函数形式,这是一个典型的对数函数的例子,用线性方程,模拟效果较差。,拟合优度,对于所有样本点的平方和,均有下列结论:,记,总体平方和(Total Sum of Squares),回归平方和(Explained Sum of Squares),残差平方和(Residual Sum of Squares ),TSS=ESS+RSS(证明见附录),Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。,在给定样本中,TSS不变, 如果实际观测点离样本回归线越近
7、,则ESS在TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS,2、拟合优度R2统计量,称 R2 为(样本)拟合优度/可决系数/判定系数(coefficient of determination)。,拟合优度的取值范围:0,1 R2越接近1,说明实际观测点离样本线越近,拟合优度越高。,由于每次向回归方程中增加解释变量,R2必然只增不减。为此,可以通过调整自由度对解释变量过多进行“惩罚”,因此,可以定义 “校正的拟合优度”,察看上述例题的拟合优度 注意: 1。拟合优度一定程度上反映了选取变量的对被解释变量的“解释能力”。 2。拟合优度低一般说明方程忽略了某些重要的解释因素。
8、 3。在大样本下,拟合优度一般不会太高。,回归标准误差(SER),回归标准误差(standard error of the regression. SER)是回归误差u的标准差估计量,是用因变量单位度量的观测值在回归线附近的离散程度。 对于误差项ui,我们更关心它在回归线附近的离散程度,即标准差。希望标准差越小越好。 由于ui本身是不可知的,因此,实际上sui是无法获得的,为了模拟其数值大小,我们用 的标准差作为ui的标准差的估计值,称为回归的标准误差。,为什么要除以n-2?n-2是自由度。,模型中样本值可以自由变动的个数,称为自由度。 自由度 = 样本个数 样本数据受约束条件(方程)的个数。
9、 例如,样本数据个数为n,它们受k个方程的约束(系数矩阵秩为k),那么,自由度df = n-k。,其中n-2为自由度。由于随机变量 必须满足k+1个正规方程(一元线形回归模型中有2个方程),故只有n-k-1个是相互独立的。经过这样校正后,才是无偏估计。,如果 无任何特征和规律可言,整个计量模型的建立将无法开展,因此,我们需要人为地为它设定一些假定条件。 如果下列假定条件满足,我们就可以用最小二乘法对模型进行回归估计。 本书中的经典假设是对于大样本数据而言,根据中心极限定理,大样本数据有很好的分布特征。,假设1:给定Xi时ui的条件分布均值为零,(1)随机误差项ui的数学期望为0。 E(ui|X
10、i) = 0。 同时: E(Yi|Xi)=E( )=E( )= 理论上,随机误差项被假定为没有被纳入到模型 中的微小影响,因此,没有理由相信这样一些影响 会以一种系统的方式使被解释变量变大或者变小, 可以假定其均值为0。,例如对某一给定的班级规模Xi,如每班20个学生,其他因素ui有时使成绩高于预测值(ui0),有时使成绩低于预测值(ui0) ,但就总体平均而言,ui的分布的均值为零。 同时,给定班级规模Xi,由于ui的干扰,某些Yi的值大于Yi,某些Yi的值小于Yi,但就总体平均而言,Yi的分布的均值为E(Yi|Xi)=B0+B1Xi,即总体均值在回归线上。,推论,E(ui|Xi) = 0意
11、味着ui和Xi不相关,即: Corr(ui , Xi)=0 这是最小二乘法最基本的假设,如果 Corr(ui , Xi)0,模型是有偏的。,假设2:(Xi,Yi)满足独立同分布,每次从总体中的抽样都包含相同的分布;同时,每次抽样均是独立进行的。 可以证明: (Xi,Yi)满足独立同分布,则Xi也满足独立同分布。,假设3:不太可能出现大异常值,有限峰度假设,当出现大异常值时,X和Y分布的峰度会变得很大。,包含四阶距,要求其有限。即: 0E(Xi4) 0E(Yi4),出现大异常值的一种可能是数据登录错误,如印刷错误或对不同观测错误地采用了不同的单位:如设想一下收集以米为单位的学生身高数据,但不小心
12、把其中一个学生的身高记成了以厘米为单位。 发现异常值的一种方法是画出数据图。如果你确定是由于数据登录错误造成了异常值,则你可以改正这个错误,如果不能改正就把它从数据集中删除。,最小二乘假设的作用,主要作用:大样本下,抽样分布服从正态分布。同时,假设样本数据没有错误。,OLS估计量的抽样分布,OLS估计量的抽样分布,在ui满足高斯假定条件时,通过OLS方法,我们可以得到回归系数的估计量 成为 的拟合值。 注意: 是不是两个常数?,计量回归模型中,对于要研究的问题,可以建立方程: 这是总体的方程描述。 应该能够确定。 但事实上我们没有能力获得整体信息,只能通过部分数据模拟整体分布,即抽样。,我们是在总体中进行抽样。 每抽取一组样本就会有一组相应的回归系数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河南事业单位招聘(职测)笔试题及答案
- 企业利润分析改进方案
- 2025吉林长春市榆树市城市发展集团有限公司社会招聘7人笔试历年难易错考点试卷带答案解析
- 2025吉林新程国有资本发展控股有限公司招聘17人笔试历年常考点试题专练附带答案详解
- 2025南海农商银行九江支行网点业务人员社会招聘笔试历年典型考题及考点剖析附带答案详解
- 2025华能核电开发有限公司所属基层企业福建宁德社会招聘40人笔试历年备考题库附带答案详解
- 竣工验收工程组织方案
- 2025农业银行攀枝花分行春招职位笔试历年典型考题及考点剖析附带答案详解2套
- 2025内蒙古鄂尔多斯农商银行资源型人才招聘10人笔试历年典型考题及考点剖析附带答案详解
- 2025内蒙古建元能源集团招聘150人笔试历年常考点试题专练附带答案详解
- 思辨与创新智慧树知到期末考试答案章节答案2024年复旦大学
- 婴儿被动操操作考核评价标准
- XX城投(集团)有限公司内部审计管理办法
- (正式版)JBT 9229-2024 剪叉式升降工作平台
- 纤维肌痛综合征学习课件
- 学堂在线西南科技大学人工智能基础(2022秋)期末考试题答案
- 首件检验报告(装配)
- 初级电工技能培训一-电工常用工具
- 卢龙县鑫兴矿业有限公司采矿权出让收益评估报告
- 煤矿班组长培训课件
- LB/T 081-2020温泉旅游水质卫生要求及管理规范
评论
0/150
提交评论