版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验四异方差性的检验及处理(2学时)一、实验目的、掌握异方差检验的基本方法、掌握异方差的处理方法。二、实验学时:2学时三、实验要求(1)掌握用MATLAB软件实现异方差的检验和处理;(2)掌握异方差的检验和处理的基本步骤。四、实验原理1、异方差检验的常用方法(1)用X-Y的散点图进行判断(e2,x)或(e2,y)的图形(e,y咸(e,乂的图形)iiii等级相关系数法(又称Spearman检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。检验的三个步骤e=y-yitt向将e取绝对值,并把i|eI和x按递增或递减次序排序,ii计算Spearman系数rs,其中:r=1-s6n(n2l)寸
2、d2ii=1做等级相关系数的显着性检验。n8时,反之,社t(n-2),说明eI与X之间存在系统关系,、辛日”升/2ii异万差问题存在帕克(Park)检验帕克检验常用的函数形式:若?在统计上是显着的,表明存在异方差性。2、异方差性的处理方法:加权最小二乘法Vaj(u)=E(u)2=q2=f(x)c2如果在检验过程中已经知道:iiijiu则将原模型变形为:111-y=-B+二Bx+TOC o 1-5 h z HYPERLINK l bookmark27 :f(x)i:f(x)1:f(x)2li-X+uPPi该模型中:B,B,B即满足同方差性。于是可以用OLS估计其参数,得到关于参数H1川p的无偏、
3、有效估计量。五、实验举例Noxynoxy1108162519.12108.2172523.53108.3182522.44108.1192523.15108.7202515.161512.3213024.27159.4223016.781511.62330279151224302610158.9253022.1112015263530.5122016273528.7132012283531.1142013293520152019.1303529.9例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:若用线性模型.=化+Rx+u,研究不同收入家庭的消费情况,试问原数据有无异
4、i01ii方差性?如果存在异方差性,应如何处理?解:(一)编写程序如下:(1)等级相关系数法(详见test4_1.m文件)%用等级相关系数法来检验异方差性%data,head=xlsread(test4.xlsx);x=data(:,1);%提取第一列数据,即可支配收入xy=data(:,2);提取第二列数据,即居民消费支出yplot(x,y,k.);%画x和y的散点图xlabel(可支配收入x(千元)%对x轴加标签ylabel(居民消费支出y(千元)%对y轴加标签%调用regres函数进行一元线性回归%xdata=ones(size(x,1),1),x;%在区矩阵最左边加一列1,为线性回归做
5、准备b,bint,r,rint,s=regress(y,xdata);yhat=xdata*b;计算估计值y%定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1=系数的估计值,估计值的95%置信下限,估计值的95%置信上限;head1;num2cell(b,bint)%定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2=y的真实值,y的估计值,残差,残差的95%置信下限,残差的95%置信上限;head2;num2cell(y,yhat,r,rint)%定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误
6、差方差的估计值head3=判定系数,F统计量的观测值,检验的P值,误差方差的估计值;head3;num2cell(s)%残差分析%figure;rcoplot(r,rint)%按顺序画出各组观测值对应的残差和残差的置信区间%画估计值yhat与残差r的散点图figure;plot(yhat,r,k.)%画散点图xlabel(估计值yhat)%对x轴加标签ylabel(残差r)对y轴加标签%调用corr函数计算皮尔曼等级相关系数res=abs(r);%对残差r取绝对值rs,p=corr(x,res,type,spearman)disp(其中rs为皮尔曼等级相关系数,p为p值);(2)帕克(park
7、)检验法(详见test4_2.m文件)%用帕克(park)检验法来检验异方差性%data,head=xlsread(test4.xlsx);%导入数据x=data(:,1);y=data(:,2);%调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,linear,yhat,r,standres);scatter(x,(ST.r).A2)%画x与残差平方的散点图xlabel(可支配收入(x)%对x轴加标签ylabel(残差的平方)对y轴加标签%对原数据x和残差平方rA2取对数,并对log(x)和log(rA2)进行一元线性回归S
8、Ti=regstats(log(ST.r).八2),log(x),linear,r,beta,tstat,fstat)%输出参数的估计值输出回归系数t检验的P值输出回归模型显着性检验的P值加权最小二乘法(详见test4_3.m文件)%调用robustfit函数作稳健回归%data,head=xlsread(test4.xlsx);%导入数据x=data(:,1);y=data(:,2);%调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量statsb,stats=robustfit(x,y)%调用函数作稳健回归stats.p输出模型检验的P值%绘制残差和权重的散点图%plot
9、(stats.resid,stats.w,o)%绘制残差和权重的散点图xlabel(残差)ylabel(权重(二)实验结果与分析:第一步:用OLS方法估计参数,并保留残差(1)散点图图4.1可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。(2)回归模型参数估计值与显着性检验表1系数的估计值估计值的95%置信下限估计值的95%置信上限-0.5390-3.72412.64600.80910.67680.9415判定系数F统计量的观测值检验的P值误差方差的估计值0.8485156.83875.4040e-139.1316由输出
10、结果看,常数项和回归系数的估计值分别为-0.539和0.8091,从而可以写出线性回归方程为回归系数的估计值的95%置信区间为0.6768,0.9415。对回归直线进行显着性检验,原假设和对立假设分别为检验的P值为,可知在显着性水平下应拒绝原假设,可认为y(居民消费收入)与x(可支配收入)的线性关系是显着的。(3)方差分析图4.2原始数据对应残差图从残差图可以看到有2条线段(红色虚线)与水平线y=0没有交点,它对应的观测号为22和29,也就是说这两组观测对应的残差的置信区间不包含0点,可认为这两组观测数据为异常数据。它们分别是(30,16.7),(35,20)。第二步:异方差性检验(1)图示法
11、图4.3(2)等级相关系数法在y与x的OLS回归的基础上计算出残差的绝对值,并记为res,并计算出皮尔曼等级相关系数rs=0.4860与对应的p值为0.00650.05(*),说明残差r与x存在系统关系,即存在异方差问题。(3)帕克(Park)检验法1)散点图图4.4可支配收入与残差平方的散点图从图4.4可知,可考虑拟合指数曲线。现将其取对数,即可进行一元线性拟合。2)回归系数与模型检验做In(M2)对ln(x)回归,得到回归系数回归系数t检验的P值显着性检验P值=-8.49730.02950.0207=2.96790.0207表2从上表可以看出,得到的回归模型为In,常数项和线性项的t检验的
12、P值均小于0.05,说明回归方程中常数项和线性项均是显着的。并且,检验的P值为0.0207小于0.05,说明整个回归方程是显着的,表明存在异方差性。综上所述,通过以上3种方法的检验,我们得到原数据存在异方差性。第三步:用加权最小二乘法处理异方差性表3回归系数回归系数t检验的P值=-1.60910.2375=0.88700.0000由表3得:回归方程为,由p值可知x的回归系数是显着的,常数项未显着,说明其无实际意义。图4.5残差和权重的散点图由图4.5知:权重集中在最上方的1附近的点比较多,说明稳健性比较好六、实验内容下表是我国各地区2003年FDI和GDP的数据,项目2003年FDI(万美元)
13、2003GDP(亿元)项目2003年FDI(万美元)2003GDPC亿元)北京2191263663.10河南539037048.59天津1534732447.66湖北1568865401.71河北964057098.56湖南1018354638.73山西213612456.59广东78229413625.87内蒙88542150.41广西418562735.13辽宁2824106002.54海南42125670.93吉林190592522.62重庆260832250.56黑龙江321804430.00四川412315456.32上海5468496250.81贵州45211356.11江苏105636512460.83云南83842465.29浙江4980559395.00陕西331902398.58安徽367203972.38甘肃23421304.60福建2599035232.17青海2522390.21江西1612022830.46宁夏1743385.34山东60161712435.93新疆15341877.61若用线性模型GDP=卩+PFDI+u,研究不同地区FDI和GDP的关系,试问原数据i01ii有无异方差性?如果存在异方差性,应如何处理?七、思考练习某地区家庭年收入(X)和每年生活必需品综
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025电子产品分期买卖合同书
- 2025培训机构劳动合同模板示例
- 2025江西省农产品买卖合同
- 2025年短视频内容创作合作协议(原创版权)
- 2025年短视频联合运营合同协议(分成风险共担)
- 2025年短视频带货合作协议(物流配送条款)
- 2025集资房买卖合同精简版
- 2025房屋租赁权转让合同示例
- 2025年医疗服务与保障能力提升理论试卷及答案
- 《基孔肯雅热防控技术指南(2025年版)》培训试题含答案
- 狂犬病规范门诊培训要点
- 2025年及未来5年中国量子测量行业市场全景评估及发展战略规划报告
- 资产报废申请书
- 口腔护士长急救知识培训课件
- 液晶显示器件模组制造工晋升考核试卷及答案
- 电子科学与技术
- 信息安全与保密意识培训
- 2025年公安部大数据中心第二批公开招聘笔试备考题库带答案详解
- 数据安全法培训课件
- 2025年普通话十五套真题及答案
- 运动处方案例解析
评论
0/150
提交评论