




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析方法与软件应用期末大作业第1题:基本统计分析1分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据选择个案随机个案样本大约(A)80 所有个案的%。1、基本思路:(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,5002000元,20003500元,35005000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。(2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。操作步骤:(1)数据分组:【转换重新编码为不同变量】,然后选择存取款金额到【数字变量输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。存取款金额1频率百分比有效百分比累积百分比有效1.008234.634.634.62.007632.132.166.73.00104.24.270.94.00229.39.380.25.004719.819.8100.0合计237100.0100.0(2)【分析描述统计频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。(3)【数据拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析描述统计频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】继续确定。统计量存(取)款金额20岁以下N有效1缺失0百分位数2550.005050.007550.002035岁N有效131缺失0百分位数25500.00501000.00755000.003550岁N有效73缺失0百分位数25500.00501000.00754500.0050岁以上N有效32缺失0百分位数25525.00501000.00752000.00结果及结果描述:频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0(50-50)元,年龄在2035岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在3550岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。可见,2035,3550两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。2、基本思路:本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。操作步骤:(1)【分析描述统计交叉表】,选择“户口”到【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式条形图】(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框继续;(3)单击【统计量】,选中【卡方】框继续;结果及其结果分析:户口* 物价趋势 交叉制表物价趋势合计上升稳定下降户口城镇户口计数2113118170期望的计数20.1122.727.3170.0户口 中的 %12.4%77.1%10.6%100.0%物价趋势 中的 %75.0%76.6%47.4%71.7%总数的 %8.9%55.3%7.6%71.7%农村户口计数7402067期望的计数7.948.310.767.0户口 中的 %10.4%59.7%29.9%100.0%物价趋势 中的 %25.0%23.4%52.6%28.3%总数的 %3.0%16.9%8.4%28.3%合计计数2817138237期望的计数28.0171.038.0237.0户口 中的 %11.8%72.2%16.0%100.0%物价趋势 中的 %100.0%100.0%100.0%100.0%总数的 %11.8%72.2%16.0%100.0%卡方检验值df渐进 Sig. (双侧)Pearson 卡方13.276a2.001似然比12.1592.002线性和线性组合7.7501.005有效案例中的 N237a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 7.92。上面交叉列联表表明,I 共有237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,28.3%;认为物价趋势为上升、稳定、下降的人数分别为28、171、38,各占总数的11.8%,72.2%,16.0%。II 对不同户口的人群进行分析:城镇户口的人数总共有170人,对物价稳定趋势为上升、稳定、下降的比例分别为12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认为物价趋势下降的人数少于总比例;农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;III 对物价趋势不同态度的人群分析:认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例略高于总比例;认为物价稳定的人数总共有171人,其中城镇户口和农村户口所占比例分别为76.6%,23.4%,有城镇户口的比例略高于总比例;认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为47.4%,52.6%,有城镇户口的比例明显低于总比例; 总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。从所得卡方检验结果来看,概率p值为0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。3 、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏度。3、基本思路本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一次存款金额的均值、中位数、方差和偏度。操作步骤:【数据 拆分文件】,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析描述统计频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【中位数】、【方差】、【偏度】继续确定。结果及其分析:统计量存(取)款金额300元以下N有效41缺失0均值2043.17中值300.00方差30740437.195偏度4.066偏度的标准误.369300800元N有效137缺失0均值4314.15中值1000.00方差134185788.508偏度6.490偏度的标准误.2078001500元N有效46缺失0均值5687.67中值1750.00方差116385836.002偏度4.415偏度的标准误.3501500元以上N有效13缺失0均值11026.92中值7000.00方差197942756.410偏度2.193偏度的标准误.616第2题:基本统计分析2用随机抽样中的近似抽样方法选取85%的样本,数据选择个案随机样本大约(A)85所有个案的%。第一问基本思路:由于存款金额是定距型变量,考虑先进行数据分组再编制频数分布表。进行数据拆分,分别计算“300以下”、“300-800”、“800-1500”、“1500以上”收入的四分位数,并通过四分位数比较上述四者分布上的差异。操作步骤:【转换重新编码为不同变量(R)】;选择“存款金额”到【数字变量输出变量(V)】框中;在【名称(N)】中输入“存款金额分组”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。存款金额分组频率百分比有效百分比累积百分比有效1.008534.334.334.32.007731.031.065.33.00166.56.571.84.002510.110.181.95.004518.118.1100.0合计248100.0100.0【分析描述统计频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。【数据拆分文件】,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析描述统计频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】继续确定。统计量存(取)款金额300元以下N有效43缺失0百分位数25200.0050300.00751000.00300800元N有效148缺失0百分位数25500.00501000.00754475.008001500元N有效41缺失0百分位数25710.00502000.00756000.001500元以上N有效16缺失0百分位数253000.00504450.00759750.00第二问基本思路:该问题中设计到两个变量,应采用交叉分组下的频数分析,行变量为“年龄”,列变量为“未来收入状况的变化趋势”,在列联表中输出观测频数、期望频数、各种百分比,显示各交叉分组下频数分布柱形图,并利用卡方检验,针对各年龄段对“未来收入状况的变化趋势”的态度是否一致进行分析。操作步骤:【分析描述统计交叉表】,选择“年龄”到【行】框中,选择“未来收入情况”到【列】框中;单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框继续;单击【统计量】,选中【卡方】框继续;选中【显示复式条形图】确定。年龄* 未来收入情况 交叉制表未来收入情况合计增加基本不变减少年龄20岁以下计数0213期望的计数.71.8.53.0年龄 中的 %0.0%66.7%33.3%100.0%未来收入情况 中的 %0.0%1.3%2.4%1.2%总数的 %0.0%0.8%0.4%1.2%2035岁计数356527127期望的计数28.277.321.5127.0年龄 中的 %27.6%51.2%21.3%100.0%未来收入情况 中的 %63.6%43.0%64.3%51.2%总数的 %14.1%26.2%10.9%51.2%3550岁计数16551081期望的计数18.049.313.781.0年龄 中的 %19.8%67.9%12.3%100.0%未来收入情况 中的 %29.1%36.4%23.8%32.7%总数的 %6.5%22.2%4.0%32.7%50岁以上计数429437期望的计数8.222.56.337.0年龄 中的 %10.8%78.4%10.8%100.0%未来收入情况 中的 %7.3%19.2%9.5%14.9%总数的 %1.6%11.7%1.6%14.9%合计计数5515142248期望的计数55.0151.042.0248.0年龄 中的 %22.2%60.9%16.9%100.0%未来收入情况 中的 %100.0%100.0%100.0%100.0%总数的 %22.2%60.9%16.9%100.0%卡方检验值df渐进 Sig. (双侧)Pearson 卡方12.895a6.045似然比13.9056.031线性和线性组合.0171.895有效案例中的 N248a. 3 单元格(25.0%) 的期望计数少于 5。最小期望计数为 .51。第三问基本思路:首先按照户口对数据进行拆分,然后计算存款金额的统计量:均值、四分位数和标准差。操作步骤:【数据 拆分文件】,选择“户口”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析描述统计频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【四分位数】、【标准差】继续确定。统计量存(取)款金额城镇户口N有效178缺失0均值4476.84标准差8813.369百分位数25500.00501000.00755000.00农村户口N有效70缺失0均值2856.47标准差8317.295百分位数25300.0050775.00752000.00第3题:基本统计分析3利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:1. 分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;2.分析不同年龄的储户对什么合算的认同是否一致。3.检验城镇储户的一次存款金额的均值为5000元, 是否可信?利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标: 基本思路:首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。操作步骤:选择菜单数据选择个案随机个案样本,样本尺寸填大约所有个案85%分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较; 基本思路:(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。(2)进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。操作步骤:转换重新编码为不同变量选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。再分析描述统计频率变量:存款金额分组,图表选择直方图,选择显示正态曲线。步骤:数据拆分文件分组方式:户口确定。分析描述统计频率统计量四分位数前打勾确定。存款金额分组频率百分比有效百分比累积百分比有效1.008735.435.435.42.007630.930.966.33.00145.75.772.04.00208.18.180.15.004919.919.9100.0合计246100.0100.0统计量存款金额分组城镇户口N有效177缺失0百分位数252.0000503.0000755.0000农村户口N有效69缺失0百分位数251.5000503.0000753.0000存款在500以下所占百分比最大,有35.4%,其次是500-1000的人数。而存款在5000以上的也有19.9%,说明存款数额悬殊较大。从输出图表中看出城镇储户较农村储户有两倍之多,可能是因为城镇居民比较富裕而且存款意识比较强。农村户口的居民可能更愿意把钱藏在家里而不是拿到银行去存。分析不同年龄的储户对什么合算的认同是否一致。 基本思路:该问题列联表的行变量为年龄,列变量为什么合算,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对不同年龄的储户对什么合算的认同是否一致进行分析.操作步骤:分析描述统计交叉表,显示复式条形图前打勾,行选择年龄,列选择什么合算,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。 卡方检验值df渐进 Sig. (双侧)Pearson 卡方3.997a3.262似然比3.9863.263线性和线性组合3.3371.068有效案例中的 N246a. 2 单元格(25.0%) 的期望计数少于 5。最小期望计数为 .77。分析:因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,年龄对什么合算的认同有影响,说明不同年龄的储户对什么合算的认同不一致.3.检验城镇储户的一次存款金额的均值为5000元, 是否可信? 单个样本统计量户口N均值标准差均值的标准误城镇户口存(取)款金额1774871.119643.647724.861农村户口存(取)款金额694517.4514528.3401749.007单个样本检验户口检验值 = 5000tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限城镇户口存(取)款金额-.178176.859-128.887-1559.421301.65农村户口存(取)款金额-.27668.783-482.551-3972.643007.54由上表可知, 城镇储户的一次存款金额的均值为5000元, 不可信.第4题:方差分析解题思路问题(2)是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。建立原假设为:不同浓度没有对收率产生显著影响,对原假设进行检验。问题(3)首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。建立原假设为:H01不同浓度没有对收率产生显著影响;H02不同温度没有对收率产生显著影响;H03浓度和温度对化工厂的收率没有产生显著性的交互影响。操作步骤问题(2):选择菜单【分析比较均值单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,则SPSS会将结果显示到输出窗口中。问题(3):选择菜单【分析一般线性模型单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,则SPSS会将结果显示到输出窗口。输出结果解释与结论问题(1):问题(2):单因素方差分析收率平方和df均方F显著性组间39.083219.5425.074.016组内80.875213.851总数119.95823单因素方差分析结果解释:可以看到观测变量收率的总离差平方和为119.958,如果仅考虑浓度单个因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,他们的方差分别为19.542和3.851,相除所得的F统计量的观测值为5.074,对应的概率p值近似为0.016。由于显著性水平=0.05,概率p值小于显著性水平,则应拒绝原假设,认为不同浓度对收率产生了显著影响。问题(3):主体间效应的检验因变量: 收率源III 型平方和df均方FSig.校正模型70.458a116.4051.553.230截距2667.04212667.042646.556.000浓度39.083219.5424.737.030温度13.79234.5971.114.382浓度 * 温度17.58362.931.710.648误差49.500124.125总计2787.00024校正的总计119.95823a. R 方 = .587(调整 R 方 = .209)多因素方差分析结果解释:输出结果中,第一列是对观测变量总变差分解的说明,第二列是观测变量变差分解的结果,第三列是自由度,第四列是均方,第五列是F检验统计量的观测值,第六列是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,温度和浓度*温度的概率p值分别为0.030,0.382和0.648。浓度的概率p值小于显著性水平=0.05,则应拒绝原假设,认为不同浓度给收率带来了显著影响;同时温度的概率p值和浓度*温度的概率p值均大于显著性水平,因此不应拒绝原假设,可以认为不同温度没有对收率产生显著影响,不同浓度和温度没有对收率产生显著的交互作用。第5题:方差分析2某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:(1)给出SPSS数据集的格式(列举前4个样本即可);(2)销售方式对销售量的影响;(3)销售方式和销售地点以及它们的交互作用对销售量的影响。某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验: (1)给出SPSS数据集的格式(列举前4个样本即可); (2)销售方式对销售量的影响;(3)销售方式和销售地点以及它们的交互作用对销售量的影响。基本思路:本道题重点考察我们对于在SPSS 应用过程中对于方差分析的应用情况。先将这组数据输入SPSS,然后进行两个方面的计算:单因素方差分析和多因素方差分析。利用SPSS的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。(1)操作步骤:分别定义分组变量A(方式)、X(销售量)、B(地区),在变量视图与数据视图中输入表格数据 (2)销售方式对销售量无显著性影响操作步骤:分析-比较均值-单因素ANOVA-因变量列表:收率,因子列表单因素方差分析X平方和df均方F显著性组间1221.3003407.10013.244.000组内 1106.6003630.739总数2327.90039结果分析:显著性0.05,0.1190.05,0.3000.05,0.2470.05,故他们不能通过方程的显著性检验。课题总数=0.571*投入人年数把回归方程写出来第6题:回归分析1基本思路:(1)建立多元线性回归模型,分析汽车特征与销售量之间的关系,并利用回归结果给出改进汽车设计方案的建议,以促进销售量的提高。(2)做多重共线性、方差齐性和残差的自相关检验。操作步骤&结果分析I(强制进入策略):(1)分析回归线性,把“销售量”选入【因变量(D)】框中,把“车型”、“价格”、“发动机规格”、“马力”、“轴距”、“宽度”、“长度”、“净重”、“燃料箱容量”和“燃料效率”这十个变量选进【自变量(I)】框中,采用进入筛选策略;(2)单击【统计量(S)】,选中【估计(E)】、【模型拟合度(M)】、【共线性诊断(L)】和【Durbin-Watson(U)】框,继续,确定;表6-1 模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.697a.486.449.989601.481a. 预测变量: (常量), 燃料效率, 长度, 价格, 车型, 宽度, 发动机规格, 燃料箱容量, 轴距, 净重, 马力。b. 因变量: 销售量分析:依据该表可尽心回归方程拟合优度检验,由于该方程中有多个解释变量,因此应参考调整的判定系数,调整的判定系数为0.449,离1较远,所以拟合优度较低,被解释变量可以被模型解释的部分较少,未能别解释的部分较多。表6-2 Anovaa模型平方和df均方FSig.1回归130.3001013.03013.305.000b残差138.082141.979总计268.383151a. 因变量: 销售量b. 预测变量: (常量), 燃料效率, 长度, 价格, 车型, 宽度, 发动机规格, 燃料箱容量, 轴距, 净重, 马力。分析:被解释标量的总离差平方和为268.38,由回归平方和130.30和剩余平方和138.082组成;回归平方和的均方为13.030,剩余平方和的均方为0.979;F检验统计量的观测值为13.305,对应的概率P值近似为0。依据该表可进行回归方程的显著性检验。若显著性水平为0.05,由于概率P小于0.05,拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。表6-3 系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)-3.0172.741-1.101.273车型.883.331.2932.670.008.3043.293价格-.046.013-.502-3.596.000.1875.337发动机规格.356.190.2811.871.063.1626.159马力-.002.004-.092-.509.611.1128.896轴距.042.023.2411.785.076.2004.997宽度-.028.042-.073-.676.500.3133.193长度.015.014.1481.032.304.1785.605净重.156.350.075.447.655.1317.644燃料箱容量-.057.047-.167-1.203.231.1895.303燃料效率.081.040.2622.023.045.2174.604a. 因变量: 销售量分析:由表6-3可进行回归系数显著性检测,写出回归方程和检测多重共线性。如果显著性水平为0.05,除了车型、价格,燃料效率外,其他变量的回归系数显著性t检验的概率P值都大于显著性水平,因此不应该拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。由于该模型保留了一些不应被保留的变量,因此该模型目前是不可用的,应该重新建模。从膨胀因子看,VIF都小于10,各解释变量都不存在严重的多重共线性,从容忍度看,容忍度接近于0,但却没有小于0.1, 不存在严重的多重共线性。表6-4 共线性诊断a模型维数特征值条件索引方差比例(常量)车型价格发动机规格马力轴距宽度长度净重燃料箱容量燃料效率119.9201.000.00.00.00.00.00.00.00.00.00.00.002.7333.678.00.28.00.00.00.00.00.00.00.00.003.2596.193.00.00.07.01.00.00.00.00.00.00.014.05014.051.00.12.30.14.00.00.00.00.00.00.025.01922.589.00.27.01.10.07.00.00.00.03.18.056.00835.942.00.00.26.62.73.00.00.00.01.01.057.00544.275.00.00.00.05.00.01.00.01.29.78.138.00358.480.01.00.24.03.17.07.01.03.59.02.429.00276.175.18.07.03.00.01.11.11.07.00.00.2510.001130.747.06.10.03.00.01.67.08.80.02.01.0111.000148.267.75.16.07.05.00.15.80.08.05.00.08a. 因变量: 销售量分析:由表6-4,从方差比例看,并没有哪个特征值对应的解释变量的方差比例有同时存在0.7以上的,由此认为,不存在严重的多重共线性。由表6-4,从条件指数看,第3,4,5,6,7,8条件指数都大于10,说明变量之间确实存在多重共线型,第9,10条件指数大于100,说明变量之间存在严重的多重共线性。综合以上三个关于多重共线性的检验,认为变量间存在多重共线性。通过以上分析可知,上面的方程存在一些问题,应重新建立回归方程,采用向前筛选策略让SPSS自动完成解释变量的选择。操作步骤&结果分析II(向前筛选策略):(1)点击绘制,Y:ZRESID,X:ZPRED,标准化残差图:正态概率图、直方图,点击保存,预测值:标准化,残差:标准化。最后点击确定。(2)分析相关双变量,变量选择:Standardized Predicted Value,Standardized Residual,相关系数中,spearman打勾。确定。表6-5 模型汇总c模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.552a.304.3001.115532.655b.430.4221.013571.371a. 预测变量: (常量), 价格。b. 预测变量: (常量), 价格, 轴距。c. 因变量: 销售量分析:由表6-5可知,最终保留的变量有价格和轴距,调整R方较接近于0,认为方程的拟合优度较低。由表6-5中的DW值,DW=1.371,表明残差存在一定程度正自相关。表6-6 Anovaa模型平方和df均方FSig.1回归81.720181.72065.670.000b残差186.6621501.244总计268.3831512回归115.311257.65656.122.000c残差153.0721491.027总计268.383151a. 因变量: 销售量b. 预测变量: (常量), 价格。c. 预测变量: (常量), 价格, 轴距。分析:由表6-6可进行回归方程的显著性检验,如果显著性水平为0.05,概率P值小于0.05,认为被解释变量与解释变量的线性关系是显著的,可建立线性回归方程。表6-7 系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)4.684.19424.090.000价格-.051.006-.552-8.104.0001.0001.0002(常量)-1.8221.151-1.583.116价格-.055.006-.590-9.487.000.9881.012轴距.061.011.3565.718.000.9881.012a. 因变量: 销售量分析:由表6-7得到最终的回归方程,汽车销售量=-1.822-0.55价格+0.61轴距,可通过提高轴距,降低价格提高汽车销售量。表6-8 已排除的变量a模型Beta IntSig.偏相关共线性统计量容差VIF最小容差1车型.251b3.854.000.301.9981.002.998发动机规格.342b4.128.000.320.6111.636.611马力.257b2.062.041.167.2933.417.293轴距.356b5.718.000.424.9881.012.988宽度.244b3.517.001.277.8921.121.892长度.308b4.790.000.365.9761.025.976净重.346b4.600.000.353.7221.385.722燃料箱容量.266b3.687.000.289.8201.219.820燃料效率-.198b-2.584.011-.207.7581.319.7582车型.129c1.928.056.157.8351.197.827发动机规格.145c1.576.117.128.4452.246.445马力.028c.229.819.019.2563.910.256宽度-.025c-.275.784-.023.4702.126.470长度.027c.237.813.020.2903.448.290净重.105c1.028.306.084.3652.741.365燃料箱容量.002c.024.981.002.4432.259.443燃料效率.014c.164.870.014.5591.790.559a. 因变量: 销售量b. 模型中的预测变量: (常量), 价格。c. 模型中的预测变量: (常量), 价格, 轴距。表6-9 共线性诊断a模型维数特征值条件索引方差比例(常量)价格轴距111.8851.000.06.062.1154.051.94.94212.8471.000.00.02.002.1504.351.01.97.013.00333.412.99.00.99a. 因变量: 销售量图6-1分析:由图6-1可知残差近似服从标准正态分布。图6-2分析:由图6-2,随着标准化预测值的变化,残差点在0线周围随机分布,大部分都落在(-3,3)范围内,无异常点。表6-10 相关系数Standardized Predicted ValueStandardized ResidualSpearman 的 rhoStandardized Predicted Value相关系数1.000.071Sig.(双侧).382N155155Standardized Residual相关系数.0711.000Sig.(双侧).382.N155155分析:由表6-10相关系数,计算标准化残差和标准化预测值的spearman等级相关系数为0.071,认为异方差现象不明显。第9题:回归分析4解题思路建立多元线性回归模型,解释变量采用向前筛选策略,根据输出结果进行模型拟合优度,回归方程显著性检验,回归系数显著性检验,多重共线性,方差齐性和残差的自相关等检验。操作步骤分析模型并作方差齐性和残差的自相关性检验:选择菜单【分析回归线性】,选择被解释变量X5进入【因变量(D)】框,选择解释变量X2、X4、X7、X8进入【自变量(I)框】。在【方法(M)】框
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑亮化拍摄方案设计
- 单轨吊司机上岗考核试卷及答案
- 沈阳建筑桩基检测方案设计
- 2025版司法局《民事起诉状(姓名权、肖像权纠纷)》民事类法律文书(空白模板)
- 面食餐厅人才发展策略分析
- 银矿开采效率提升策略报告
- 成套的管理咨询方案
- 建筑方案设计时间进度
- 联合教堂建筑分析方案设计
- 班组开年趣味活动方案策划
- 社区治理志愿服务课件
- 养老服务机构客户服务管理制度及流程体系
- 脑梗死的中医护理查房
- 河南省人民防空工程维护管理技术规程2025
- 认知行为疗法-第1篇-洞察及研究
- 护理事业十五五发展规划(2026-2030)
- 2025-2030中国汽车电源管理集成电路行业市场发展趋势与前景展望战略研究报告
- 2023年中国工商银行秋季招聘考试真题及答案
- 2025年学宪法、讲宪法知识竞赛题库及答案
- 医用物理学考试题及答案
- DB31/T 968.2-2016全过程信用管理要求第2部分:行为清单编制指南
评论
0/150
提交评论