




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计软件及应用期末作业完成作业:3、5、11、12题第3题:基本统计分析3利用居民储蓄调查数据,从中随机选取85%的样本,进行分析,实现以下目标:1、分析不同职业储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格;2、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度;4.3.53.分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。基本思路:首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。操作步骤:选择菜单数据选择个案随机个案样本,样本尺寸填大约所有个案85%。1、 题目:分析不同职业储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格。基本思路:首先进行多选项分析,定义名为X的多选项变量集,其中包括a7_1、a7_2、a7_3三个变量,然后对多选项变量集进行频数分析;对不同职业储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。操作步骤:分析:从折线图看出,储户中商业服务业的人数最多,总体上所有职业储户的正常生活零用所占的百分比最大,买证券及单位集资的人较少,说明大部分人群还没有这方面的意识。2、 分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度。基本思路:该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。操作步骤:分析描述统计交叉表,显示复式条形图前打勾,行选择户口,列选择未来收入情况,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。输出以下表格和图形:户口* 未来收入情况 交叉制表未来收入情况合计增加基本不变减少户口城镇户口计数3811120169期望的计数37.6103.328.2169.0户口 中的 %22.5%65.7%11.8%100.0%未来收入情况 中的 %73.1%77.6%51.3%72.2%总数的 %16.2%47.4%8.5%72.2%农村户口计数14321965期望的计数14.439.710.865.0户口 中的 %21.5%49.2%29.2%100.0%未来收入情况 中的 %26.9%22.4%48.7%27.8%总数的 %6.0%13.7%8.1%27.8%合计计数5214339234期望的计数52.0143.039.0234.0户口 中的 %22.2%61.1%16.7%100.0%未来收入情况 中的 %100.0%100.0%100.0%100.0%总数的 %22.2%61.1%16.7%100.0%卡方检验值df渐进 Sig. (双侧)Pearson 卡方10.622a2.005似然比9.8442.007线性和线性组合4.0771.043有效案例中的 N234a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 10.83。分析:因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势”持不同的态度。3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。基本思路:由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。操作步骤:转换重新编码为不同变量选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。再分析描述统计频率变量:存款金额分组,图表选择直方图,选择显示正态曲线。最后输出下列图表:存款金额分组频率百分比有效百分比累积百分比有效1.008534.634.634.62.007731.331.365.93.00124.94.970.74.00239.39.380.15.004919.919.9100.0合计246100.0100.0基本思路:进行数据拆分,并计算不同年龄段储户的一次存款金额的四分位数,并通过四分位数比较分布上的差异。步骤:数据拆分文件分组方式:年龄确定。分析描述统计频率统计量四分位数前打勾确定。输出如下图表:统计量存款金额分组20岁以下N有效2缺失0百分位数251.0000503.000075.2035岁N有效133缺失0百分位数251.0000502.0000754.00003550岁N有效78缺失0百分位数251.0000502.0000754.000050岁以上N有效33缺失0百分位数251.5000502.0000752.0000分析:分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。存款在500以下所占百分比最大,有34.6%,其次是500-1000的人数。而存款在5000以上的也有19.9%,说明存款数额悬殊较大。从输出图表中看出20-35年龄段的储户最多,其次是35-50岁年龄段,这两部分的人群存款意识比较强,20岁以下的储户只有2人,人数特别少,因为这一年龄段的人群大部分是学生,而50岁以上的老人可能更愿意把钱藏在家里而不是拿到银行去存。第5题:方差分析2在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列(数据均已减去75)。试在=0.05显著性水平下分析:(1)给出SPSS数据集的格式(列举前4个样本即可);(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标) ;(3)浓度、温度以及它们间的交互作用对收率有无显著影响。基本思路:本道题重点考察我们对于在SPSS 应用过程中对于方差分析的应用情况。先将这组数据输入SPSS,然后进行两个方面的计算:单因素方差分析和多因素方差分析。利用SPSS的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。多重比较检验的方法: LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。(1)给出SPSS数据集的格式(列举前4个样本即可);操作步骤:分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标) ;操作步骤:分析-比较均值-单因素ANOVA-因变量列表:收率,因子列表:浓度-确定。输出如下图表:单因素方差分析收率平方和df均方F显著性组间35.083217.5423.726.041组内98.875214.708总数133.95823显著性=0.41小于0.05说明拒绝原假设(浓度对收益无显著影响),证明浓度对收益有显著影响。操作步骤:分析-比较均值-单因素ANOVA-两两比较:LSD-选项:描述性-确定输出:描述收率N均值标准差标准误均值的 95% 置信区间极小值极大值下限上限1811.25001.48805.5261010.006012.49409.0013.00288.75001.83225.647807.218210.28186.0011.003811.37502.924651.034028.929913.82015.0014.00总数2410.45832.41335.492629.439311.47745.0014.00多重比较因变量: 收率 LSD(I) 浓度(J) 浓度均值差 (I-J)标准误显著性95% 置信区间下限上限122.50000*1.08493.032.24384.75623-.125001.08493.909-2.38122.131221-2.50000*1.08493.032-4.7562-.24383-2.62500*1.08493.025-4.8812-.368831.125001.08493.909-2.13122.381222.62500*1.08493.025.36884.8812*. 均值差的显著性水平为 0.05。上面有星号的说明有显著差异,即根据LCD算法,浓度1与浓度2 具有显著差异,浓度3与浓度2有显著性差异,浓度1与浓度3差异性较小。(3)浓度、温度以及它们间的交互作用对收率有无显著影响。操作步骤:分析-一般线性模型-单变量-因变量:收率,固定因子:浓度、温度,-模型选择全因子-确定。输出:主体间因子N浓度182838温度16263646主体间效应的检验因变量: 收率源III 型平方和df均方FSig.校正模型69.458a116.3141.175.391截距2625.04212625.042488.380.000A35.083217.5423.264.074B14.79234.931.917.462A * B19.58363.264.607.721误差64.500125.375总计2759.00024校正的总计133.95823a. R 方 = .519(调整 R 方 = .077)分析:结果表明,只有因子A(浓度)是显著的,即浓度不同将对收率产生显著影响,而温度及交互作用的影响都不显著,这说明要提高收率必须把浓度控制好。方差分析可以很好的去辨别两个事物之间存在联系的紧密性。通过数据,我们可以分辨出浓度的影响更加显著,从而做出调整。第11题:曲线回归3根据收集的1981年至2000年的数据,分析教育支出受年人均可支配收入的影响。 (提示:首先绘制两者的散点图。再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。)思路:本题主要考察曲线回归的内容,先绘制两者散点图,再用二次、立方、复合、幂函数模型,进行分析。操作步骤:图形旧对话框散点/点状简单分布Y轴:教育支出,X轴:年人均可支配收入确定。得到散点图如下:步骤:分析回归曲线估计因变量:教育支出,自变量:年人均可支配收入,个案标签:年份,模型二次项、立方、幂、复合前打勾确定。得到以下图表:模型汇总和参数估计值因变量: 教育支出方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1b2b3二次.963104.02728.000116.057-.0539.784E-006三次.96462.55537.000190.569-.1021.831E-005-4.370E-010复合.985611.31519.00021.6591.000幂.946156.43619.000.0001.633自变量为 年人均可支配收入。分析:在二次、三次、复合、幂函数的模型中复合函数的R方是最大、最接近1的。所以应用复合函数来表示年人均可支配收入与教育支出的函数关系。根据函数图象看出,教育支出是随年人均可支配收入增长而增长的,说明随着人们可支配收入增加,对教育的关注更多,投入更多。第12题:聚类分析19个学生的数学、物理、化学、语文、历史、英语的成绩如下表。 要求做K-Means聚类分析,分成3类,初始类中心点由SPSS自行确定。思路:本题考察K聚类(快速聚类)的内容,根据题目只要指定聚类数目K和确定K个初始类中心即可。操作步骤:先把表格数据输入数据编辑器中。分析分类K-均值聚类变量中把数学、物理、化学、语文、历史、英语选进,聚类数为3选项初始聚类中心和ANOVA表前打勾确定。初始聚类中心聚类123数学658367物理6110063化学727949语文844165历史816767英语795057迭代历史记录a迭代聚类中心内的更改123114.51315.41117.6102.000.000.000a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 39.724。最终聚类中心聚类123数学748170物理689270化学717764语文795260历史816967英语725756ANOVA聚类误差FSig.均方df均方df数学66.194235.41761.8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 协议到期如何续签协议书
- 仲裁期间不给离婚协议书
- 企业如何写借款合同范本
- 压模板原料销售合同范本
- 12333语音合同范本
- 企业对农村路灯合同范本
- 劳动合同变更公司协议书
- 前妻找前夫要离婚协议书
- 修理厂转让协议合同模板
- 医院合同质量保证协议书
- 2025-2026学年北师大版(2024)初中生物七年级上册教学计划及进度表
- 浪浪山携志奔赴新学期-2025年秋季开学第一课主题教育班会-2025-2026学年初中主题班会
- 2025版集团内部无息借款资金调度与管理合同范本
- 管道吊装方案范本
- 黑龙江省五大连池市2025年上半年事业单位公开招聘试题含答案分析
- 拍摄与剪辑基础知识培训课件
- 小学英语课堂教学规范操作手册
- 人事经理工作汇报
- 项目实施进程汇报
- 2025年时事政治考试100题(附答案)
- 2025学宪法讲宪法知识竞赛题库及答案(小学组)
评论
0/150
提交评论