




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、中央财经大学实 验 报 告实验项目名称方差分析、回归分析、时间序列分析所属课程名称统计学实 验 类 型设计型、综合型实验实 验 日 期2011 年 5 月班级任课教师王会娟学号姓名学号姓名学号姓名成绩实验报告1、方差分析。( 1)使用单因素方差分析的方法检验: 能否认为不同学科的上月平均工资相等。如果不能认为全相等,请做多重比较。不同学科上月工资的描述统计上月工资n均值标准差标准误均值的95% 置信区极小值极大值间下限上限1462326.09511.83175.4652174.092478.08130035002422304.76514.64079.4112144.392465.1411003
2、3003552274.55476.18064.2082145.822403.2714003400总数1432300.00496.18341.4932217.982382.0211003500表1-1 不同学科上月工资的描述统计学科与工资研究的方差分析表上月工资平方和df均方f显著性组间67893.092233946.546.136.873组内34892106.90140249229.3358总数34960000.001420表1-2学科与工资研究的方差分析表方差齐性检验上月工资levene 统计量df1df2显著性.0972140.908表 1-3 学科与工资研究的方差齐性检验1图 1-1 学
3、科与工资研究方差分析基本假设的检验1、关于正态性的分析。使用 spss 软件得出的分组直方图如图1-1 所示,该图表明,在各个水平下上月工资都呈对称分布,没有极端值出现,因此可以认为不违背正态性假设。根2据表 1-3 的 levene 检验的结果,由于表中的p 值等于 0.908 ,是个非常大的值,因此也不能拒绝等方差的原假设。2、方差齐性检验。表 1-1 表明,各组标准差差异不大,最大值与最小值之比等于1.081 ,明显小于 2,因此可以认为是等方差的。3、方差分析的结果分析。检验中零假设和备择假设为:h0:1=2= 3h1: 1、 2、3 不全相等表 1-2 中给出的 p 值等于 0.87
4、3 ,大于我们通常要求的 =0.05 ,因此我们不能拒绝原假设, 不能得出学科对上月工资有显著影响的结论, 也就是说我们可能认为三个学科的上月工资相等。( 2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。34图 1-2 学科和性别与工资研究方差分析基本假设的检验5学科、性别与工资的无交互作用的双因素方差分析表因变量 : 上月工资源iii 型平方df均方fsig.和校正模型6540680.489 a32180226.83010.664.000截距7.434e817.434e83635.933.000性别6472787.39616472787.396
5、31.659.000学科244202.9942122101.497.597.552误差28419319.51139204455.5361总计7.914e8143校正的总34960000.00142计0a. r方 = .187(调整 r方 = .170)表 1-4 学科、性别与工资的无交互作用的双因素方差分析表学科、性别与工资的 有交互作用的双因素方差分析表因变量 : 上月工资源iii 型平方和df均方fsig.校正模型6775774.725a1355154.9456.587.0005截距7.277e817.277e83537.387.000性别6185326.72316185326.72330
6、.066.000学科228658.8652114329.433.556.575性别 *学科235094.2372117547.118.571.566误差28184225.275137205724.272总计7.914e8143校正的总计34960000.000142a. r方 = .194(调整 r方 = .164)表 1-5 学科、性别与工资的有交互作用的双因素方差分析表1、关于正态性的分析。使用 spss软件得出的分组直方图如图1-2 所示,该图表明,在各个水平各个性别下上月工资都呈对称分布,没有极端值出现, 因此可以认为不违背正态性假设。2、方差分析的结果分析检验中零假设和备择假设为:h
7、0: 1= 2= 3=0(学科)6h0: 1= 2=0h1: 1、2、 3 不全为零h1: 1、2 不全为零由表 1-4 学科一栏的 p 值等于 0.552,说明在考虑了性别因素后,我们仍然不能拒绝原假设、 认为不同学科之间的工资差异是显著的。 从性别对上月工资的影响来看,该变量对应的 p 值等于 0.000,小于通常使用的 值,说明性别对于月工资的影响是显著的。又由表 1-5,我们发现其交互作用的p 值等于 0.566,大于通常的 ,因此我们认为其交互作用对于工资的影响是显著的。2、非参数检验。( 1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。wilcoxon 秩和检验中秩
8、和的计算结果性别n秩均值秩和上月工07388.516461.00资17054.793835.00总数143表2-1wilcoxon秩和检验中秩和的计算结果wilcoxon 秩和检验的检验统计量和 p值上月工资mann-whitney u1350.000wilcoxon w3835.000z-4.877渐近显著性 ( 双侧 ).000精确显著性(双侧).000精确显著性(单侧).000点概率.000a. 分组变量 : 性别表 2-2wilcoxon 秩和检验的检验统计量和p 值1、我们用 wilcoxon 秩和检验来比较中位数。 检验的零假设和备择假设如下所示:零假设:女生上月工资和男生上月工资
9、的中位数相等。备择假设:女生上月工资和男生上月工资的中位数不相等。2、两个独立样本秩和检验结果分析根据表 2-1,男生工资的平均秩为88.51,女生工资的平均秩为54.79,说明从样本看男生的收入中位数要高于女生的收入中位数。7从表 2-2 看, wilcoxon w 统计量为 3835,用正态分布近似计算时的z 值为-4.877。表中显示用正态分布计算时的p 值(双侧检验)为 0.000,与精确计算的p 值 0.000 没有显著差异。我们应该拒绝原假设,结论为男生和女生的工资中位数并不相等。( 2)用非参数检验方法检验学生上月工资和去年同月工资的中位数是否有显著变化。wilcoxon 符号秩
10、检验的 p值去年同月工资 -上月工资z-1.336 a渐近显著性 ( 双侧 ).181精确显著性(双侧).183精确显著性(单侧).092点概率.001a. 基于正秩。b. wilcoxon 带符号秩检验表 2-3 wilcoxon 符号秩检验的 p值差值序列中的正数和负数的个数汇总表n去年同月工资-上月工负差分 a69资正差分 b54结 c20总数143a.去年同月工资 上月工资c.去年同月工资= 上月工资表2-4 差值序列中的正数和负数的个数汇总表匹配样本符号检验的检验结果去年同月工资 -上月工资z-1.262渐近显著性 ( 双侧 ).207精确显著性(双侧).207精确显著性(单侧).1
11、03点概率.029a. 符号检验表 2-5 匹配样本符号检验的检验结果1、根据题目,我们采取wilcoxon 符号秩检验的方法进行分析,确定原假设和备择假设为:8h0:差值总体的中位数 =0h1:差值总体的中位数02、分析 wilcoxon 符号秩检验的结果如下:由表 2-3 可知,精确检验的 p 值等于 0.183,远大于我们通常采用的 =0.05,故不能拒绝原假设, 也就是说没有明显证据表明去年同月工资和今年工资有显著性的差异。表 2-4 和表 2-5 是符号检验的结果。 表 2-4 表明差值序列中有69 个负数, 54个正数,表 2-5 表明采用精确检验(二项分布)计算的双侧检验值为0.
12、207,也不能够拒绝原假设。( 3)用非参数检验方法不同学科学生平均学分绩点的中位数是否相等。kruskal-wallis检验中计算的各组平均秩学科n秩均值平均学分绩14676.96点24267.6035571.22总数143表 2-6 kruskal-wallis 检验中计算的各组平均秩kruskal-wallis检验的检验统计量和p值 a,b,c平均学分绩点卡方1.153df2渐近显著性.562a. kruskal wallis检验b. 分组变量 :学科c. 由于没有足够内存,无法计算某些或所有精确显著性。表 2-7 kruskal-wallis 检验的检验统计量和 p 值1、选择多个独立
13、样本的kruskal-wallis 检验进行分析。 根据题目我们的原假设和备择假设为:h0: m1=m2=m3h1: m1 、m2 、m3 不完全相等2、由表 2-6,各组的平均秩处于67.6-76.96 之间。表2-7 表明, kruskal-wallis检验中使用卡方分布进行近似计算时的卡方统计量为1.153,自由度为2,相应的 p 值为 0.562。由于 p 值远大于 ,所以没有足够证据证明原假设不成立,因9此我们可能认为几个学科的平均绩点的中位数是相等的。( 4)检验学生的上月工资是否服从正态分布。单样本 kolmogorov-smirnov检验上月工资n143正态参数 a,b均值23
14、00.00标准差496.183最极端差别绝对值.083正.083负-.045kolmogorov-smirnov z.997渐近显著性 ( 双侧 ).273精确显著性(双侧).259点概率.000a. 检验分布为正态分布。b. 根据数据计算得到。表 2-8单样本 k-s 检验的计算结果和相应的p 值1、我们采取单样本k-s 检验进行分析, 根据题目,我们的原假设和备择假设为:h0:学生的上月工资服从正态分布h1:学生的上月工资不服从正态分布2、由表 2-8,计算出的 dmax 统计量的值为 0.997,相对应的 p 值为 0.273,远大于我们通常选取的 值,因此我们没有足够理由拒绝原假设,也
15、就是说根据样本数据我们不能认为总体是非正态的。( 5)检验学生对专业的满意程度是否为离散的均匀分布。对专业的满意度观察数期望数残差14101.2-97.2232101.2-69.23138101.236.84212101.2110.85120101.218.8总数506表 2-9各组的频数和期望频数10检验统计量对专业的满意度卡方278.862 adf4渐近显著性.000精确显著性.000点概率.000a. 0个单元 (.0%)具有小于 5的期望频率。单元最小期望频率为101.2 。表 2-10统计量计算结果和相应的p值1、根据题意,我们采取卡方拟合优度检验进行分析;我们的原假设和备择假设是:
16、h0:学生对专业的满意程度是离散的均匀分布h1:学生对专业的满意程度不是离散的均匀分布2、表 2-9中是各组的频数和期望频数,表 2-10是统计量的计算结果和相应的 p值。根据表 2-10,卡方等于 278.962,自由度为 4,对应的 p值为 0.000,远小于我们通常采用的 值,因此我们可以拒绝原假设, 即认为学生对专业的满意程度不是离散的均匀分布。3、回归分析。( 1)计算上月工资与平均学分绩点的相关系数并作假设检验。相关性上月工资平均学分绩点上月工资pearson 相关1.762 *性显著性(双侧).000n506506平均学分绩pearson 相关.762 *1点性显著性(双侧).0
17、00n506506*. 在 .01水平(双侧)上显著相关。表 3-1相关系数的输出结果如表 3-1所示,上月工资和平均学分绩点的相关系数为 0.762,与此同时,其p值为0.000,远小于我们通常选用的 值,通过了显著性检验。11( 2)以上月工资为因变量,平均学分绩点为自变量做回归分析,分析模型的拟合效果和假设检验的结果。系数 a非标准化系数标准系数模型b标准 误差试用版tsig.1( 常量 )-1034.007126.581-8.169.000平均学分绩点1075.26040.706.76226.415.000a. 因变量 : 上月工资表 3-2 输出的回归系数anovab模型平方和df均
18、方fsig.1回归78519984.58178519984.58697.759.000 a44残差56715924.50504112531.5967总计1.352e8505a. 预测变量 : ( 常量 ), 平均学分绩点。 b. 因变量 : 上月工资表 3-3方差分析表模型汇总模型rr 方调整 r标准 估计的误差方1.762 a.581.580335.457表 3-4输出的拟合优度原假设 h0:两个变量之间的相关性并不显著备择假设 h1:两个变量之间的相关性显著1、spss输出的回归系数及t 统计量值,有表3-2 中的数据可知一元线性回归方程: yt=-1034.007+1075.26xt t
19、 统计量为 26.415,如果显著性水平为 0.05,自由度为 504,相应的 t /2 临界值在 1.96-1.972 之间。由于 t 的绝对值大于 t /2,则能够拒绝原假设,表明自变量 x 对因变量 y 的影响是显著的,二者之间存在显著的线性关系。 sig.即为双侧检验的 p 值,其 0.000 的取值同样说明有相当大的把握拒绝原假设,表明自变量对因变量的影响是显著的。2、f 检验结果,如表3-3得到的 f 统计量为 697.759,如果显著性水平 =0.05,分子自由度为1,分母12自由度为 504 时,f 的临界值在 3.84-3.92 之间。由于 f 大于 f ,可以拒绝原假设 f
20、 检验的边际概率为0.000,同样表明方程整体线性关系显著。3、拟合优度检验,由表3-4 可知表中 r 为 r 的平方的正根,由于r 的绝对值等于0.762,所以工资 y 和绩点 x的相关系数为 0.762判定系数 r 的平方为 0.581,其统计含义为:在工资的离差中,有58.1%可以由工资与绩点之间的线性关系解释。拟合程度一般。估计标准误等于335.475,其统计含义:根据绩点对工资进行估计时,平均的估计误差为 335.475 元。( 3)以上月工资为因变量,平均学分绩点和性别为自变量做回归分析,分析模型的拟合效果和假设检验的结果。13系数 a非标准化系数标准系数模型b标准 误差试用版ts
21、ig.1( 常量 )-977.68681.945-11.931.000平均学分绩点1138.77326.452.80743.050.000性别-513.00919.384-.496-26.465.000a. 因变量 : 上月工资表 3-5 回归系数及 t 统计量anovab模型平方和df均方fsig.1回归1.115e8255764862.6331183.224.000 a残差23706183.82550347129.590总计1.352e8505a. 预测变量 : ( 常量 ), 性别 , 平均学分绩点。b. 因变量 : 上月工资表 3-6方差分析表拟合优度数据模型rr 方调整 r标准 估计
22、的误差方1.908 a.825.824217.094表 3-7输出的拟合优度原假设 h0:学分绩点与工资之间的相关性并不显著备择假设 h1:学分绩点与工资之间的相关性显著原假设 h0:性别与工资之间的相关性并不显著备择假设 h1:性别与工资之间的相关性显著1、spss输出的回归系数及t 统计量值,有表3-5 中的数据可知二元线性回归方程: yt=-977.686+1138.773x-513.009s变量 x 的回归系数为1138.773,其统计含义为在性别一致的情况下,绩点每高 1,月均工资升高 1138.773:变量 s 的回归系数为 513.009,其统计含义为在绩点一致的情况下,女生工资
23、会比男生低 513.009变量 x 的 t 统计量为 43.050,必然大于相应的t 临界值,可拒绝原假设,认为自变量 x 与因变量 y 显著相关。变量s 的 t 统计量的绝对值为26.465,必然大于相应的 t 临界值,可拒绝原假设,认为自变量s 与因变量 y 显著相关。2、f 检验结果,如表3-314得到的 f 统计量为 1183.224,如果显著性水平 =0.05,分子自由度为 2,分母自由度为 503 时,f 的临界值在 3.84-3.92 之间。由于 f 大于 f ,可以拒绝原假设 f 检验的边际概率为0.000,同样表明方程整体线性关系显著。3、拟合优度检验,由表3-4 可知表中
24、r 为 r 的平方的正根,由于 r 的绝对值等于 0.908,所以工资 y 和绩点 x 以及性别 s 有着很强的相关性。判定系数 r 的平方为 0.825,其统计含义为:在工资的离差中,有 82.5%可以由绩点和性别的二元线性回归方程所解释。拟合程度较好。估计标准误等于 217.094,其统计含义:根据绩点和性别对工资进行估计时,平均的估计误差为 217.094 元。( 4)、(2)和( 3)中的模型你会选择哪一个模型用于预测?为什么?假设一名男生的平均学分绩点为 3.5,试预测他的上月工资的点估计值和区间估计。 【 * 区间估计为选做】答:我会选择 3 的模型进行预测,因为 3 的拟合程度要
25、好于 2。点估计: y=3008.0195区 间 估 计 : 取 置 信 度 为95% , 样 本 容 量 为143 , 区 间 估 计 结 果 为( 2972.4395,3043.5995)4、时间序列分析。使用 1998 年 -2007 年我国的月度社会商品零售额(sale.xls)。要求使用前 9 年的数据建立模型预测2007 年的月度数值,并根据 2007 年的实际值和预测值分析预测效果。要求:5、时间序列分析( 1)该时间序列的季节指数表 5-1期间季节性因素(%)1108.82101.0394.9492.3594.515694.4792.3892.4999.510104.311105.212120.5( 2)使用时间序列的分解模型进行预测在 spss中,对季节性分解后得到的 stc项的数据对 t建立合适的趋势模型。表 5-2模型汇总方程r 方fdf1df2sig.线性.91411
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 收养家庭育儿心理健康服务体系建设路径探索与实践考核试卷
- 纤维原料对企业创新与创新能力的影响考核试卷
- 茶叶市场趋势分析考核试卷
- 发射设备在广播信号传输中的信号同步技术考核试卷
- 信托业务合同法律风险与防范考核试卷
- 私募互联网金融服务考核试卷
- 核子仪表在核设施辐射防护性能评估中的应用考核试卷
- 火力发电厂能源管理与服务创新技术应用考核与实践卷考核试卷
- 综合型公司股权分割方式优化协议
- 网络平台内容审核算法租赁及智能优化服务合同
- 北京2025年中国环境监测总站招聘(第二批)笔试历年参考题库附带答案详解
- 美国加征关税从多个角度全方位解读关税课件
- “皖南八校”2024-2025学年高一第二学期期中考试-英语(译林版)及答案
- 防洪防汛安全教育知识培训
- 2021年妊娠期血压管理中国专家共识
- 一种基于STM32的智能门锁系统的设计-毕业论文
- 预应力张拉记录四张表
- 丰田通商简介r
- 六氟丙烯安全技术说明书MSDS
- 人体穴位与天体对应解密
- 机械行业六个典型事故案例分享
评论
0/150
提交评论