




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、红河学院2016-2017学年春季学期数据分析课程期末考查试卷院一系:数学学院专业:信息与计算科学年级:2014 级学生姓名:王继禹学 号:上授课教师:赵金娥2017年6月1、(33分)现有两个SPSS数据文件,分别名为“学生成绩一 .sav”和“学生 成绩二.sav,存放了关于学生学号、性别和若干门课程成绩的数据。(1)将所给的两个SPSS数据文件“学生成绩一 .sav”和“学生成绩二.sav” 进行合并,形成一个完整的数据文件并保存为“学生成绩.sav”。学号性别语文数学L拗理讹学英语1921012.0070 0087.5093.0085.5092 502921021.0097.0093.
2、0093.0064 0095.003921032 0085 6081.5098.0079.00B1.004921042.0097.Q076.0033.0062 0094.005921051.0085.0079.5088.00EG .009S.D06921062.0069.0076.0090.0074.5091.507921082.0085.0069.5080.0060.0094.5CS921101 0094.0071JDD73.0062.0007.009921111.00S6.0074.0074.0061.0091.00J0921122.0075.5077.0078.0003.0091.001
3、1921131 0Q65 0000 mB6 0065 00R4Q012921151.0091.0072.5070.0050.0002.50139211Aq mB7 nnR7 5n日2 00EQ DO71 QD14921171.0091.0087.D0S9.0056.0067 5015921201.00日J.W55. 口。32.00印0001.0016922181 0060.007O.D072.0057.5066.0017922202.00at .60000E4.0073.0018922212.0077.0082. D 口70.0062.0093.0019922231.00gr.no45 507
4、7.0039.00B3.0020922242.0072.0066.5070.0043m69.0021922251.00S3.00&3.5Doo.no40.00B0.00922261.008t. 口口52.5001.0044 0073.D023922271.0067.004B.D067.5044.00BG.0024922231 0082.0069.0062.0055.0077.0025922292.0072.0044.5050 0065.0096.002E922312.0084.0051.0076.0046.0049.0027922322.0065.5051.50B7.0069 00阳00209
5、22341.0079.0055.5052.0057.0065.5029922361.0076.00J4,DU83.0038 052.0030922392 口口63.0057.0054.0032.5056.00(2)对所建立的数据文件“学生成绩.sav”进行以下处理: 计算男生和女生语文成绩的基本描述统计量,并比较男女生语文成绩的 差异;置据柒工二口 : LU六二eUGuis tx M仝山曰让七可51+|-据万加领明定试等L落一毯,岸生印绣.5 iv顺找词里帜小值/太值tfdfi行ff吃,殂M甘里,十+生啮讯里Iriir*fti+论4国魂X生i*女考立1616芯0Q97JQQ95.75001.4
6、44925 了啦,J2O湖-5(111.W11414filJXl57 DD77。2口囱2皿W9 M32E.371597-口皿1.154答:由上表可知,男女生语文成绩有较大差异。首先,男女生语文成绩均值 分别为77.43分和85.75分,女生高于男生;其次,男生成绩呈右偏平峰分布,女生成绩也呈右偏平峰分布;另外,标准差表明,男生成绩的离散程度大于女生按照性别对平均成绩排秩;学号住别唔出飘字物理化学英谙平均成易1922361 oc咕m34 00G3.003 0052 0052 202呢亚1 QC79 no55 5n52 nn57 0065bi ao3922231.DC51.0D孤尔77.0030.
7、00Giro63.f04922Q61.00B1,U0Situ44.0073.00E6 30692227IX67. UD珏m67.60WE86. OQ56 50G92228IX82 OD69 0062.00S6.0QT7.CD69.00r92218I.DCeo.oo70.(1072.0057.6060.OO65. SOg922251 DO83 00iS3 5080 口口4a mearnTOTOg921201 S4 PD55 0002.00BOOT01 007Z4010921151.T91.0D725070 0050.0002.5073.2011921111.008B.0D74 0074.00E1
8、.0C91 0077.2012921VI DC91. OD87 0039.0056.0067.6078. TOId92110I.DCy4.OD71 UU7B UU62 DOB/.UU而如1W921131.0065.00我硬36 WE5.0084.00次).0015921051 DOfi5 OD7q*i8R nn不ca9P0033 Ti16921021 T97.CDMIKS3 tn64.0095 mEMM1792Z3S20c63.0057 005Z.OO32.5055352.3010922312.XMOO51 W76.00明.卬49.OQ61 20l922M2.00720044.60modE6.
9、0096.00S3.9J20922242.Xrzco66.60ZULU43.DO60.0054 W2192232ZDC65.5051 5037.00h.oqT9.0Qro jo22922207 DCB1.6D59 50R? DOBflOOT2 0071 8023921162DD67 CID67 5092.00E0 0071.0073 507A922212D0V.0D02 0070.0052.0093.0074 9025921 ao2XLG5.0DGO 50CCI.00eo.oa94.3077.0026921 OH之UL6.0076 UU9U.UUM.5091.50HU.HU2792112己OC
10、T&5077 0070.0063,0091.0030 9029921QJ工工97. OD76 0003.00ea.oa孰OQ82.2029921032.DC65.60Bl 50geon79 0081 0095MBO921Q1?D070(007 sn93 on王T92.3035 7C 选择平均成绩为 75 分及以上的学生样本, 并按性别的降序及平均成绩的升序进行排序; 计算每位女生课程成绩80分的课程数;把英语成绩划分为优、良、中、不合格四个等级,划分规则为“英语90”为“优”、“750英语90”为“良”、“600英语75”为“中”、“英语60为“不合格; 按照等级输出频数分布表,并绘制不同等级
11、语文平均成绩的条形图统计量语文等级N有效缺失300语文等级频率百分比有效百分比累积百分比有效良1860.060.060.0优620.020.080.0中620.020.0100.0合计30100.0100.0语文等级(3)对所建立的数据文件“学生成绩.sav”进行以下分析: 分析数学平均成绩与60.00是否存在显著差异;分析:设原假设为数学平均成绩与 60.00是无显著差异的,备择假设为数学 平均成绩与60.00是有显著差异的,由图1-1可知,被调查者共计30人,数学平 均值为66.6000分,标准差为14.64723;由图1-2可知,t检验的概率p-值为0.020,小于a =0.05拒绝原假
12、设,接受备择假设,即数学平均成绩与60.00有明显差异 男生和女生的语文平均课程是否存在显著差异;分析:设原假设为男生和女生的语文平均课程存在显著差异,备择假设为男生和女生的语文平均课程不存在显著差异。由组统计量表可以看出男女生语文样本均值有一定的差异,从独立样本检验表可以看出:该检验的F统计量的观测值 为4.794,对应的P值为0.037,如果显著性水平a为0.05,由于概率p值小于 0.05,可以认为两总体方差存在显著差异,故拒接原假设,即男生和女生的语文 平均课程不存在显著差异。该班级的物理成绩与化学成绩是否存在显著差异成对拜本统H更山(1N标奉掉为m的联有谆对1 期理 化学76 916
13、76607303012.164J1 3,0379C222QQ62 38口的或网样本相关系赦MEIq.朗生金化学20617noo成茜帕本恰脸dfSia.fiyUiFf殴IR在诺M的站咬走桔国面TB3卜强期1 悟19 ?印ni11 H5B872C1f 70151213023 3780g百时?qonn分析:设立原假设为物理成绩与化学成绩没有存在显著差异,备择假设为物理成绩与化学成绩存在显著差异。 从成对样本统计量表中可以看出, 物理与化学成绩的平均值由较大的差异;成对样本相关系数表表明在显著水平为民=0.05寸,对应的概率p-值为0.000接近于0,小于%所以拒绝原假设,即物理成绩与化 学成绩存在显
14、著差异。2、 (15分) “居民储蓄调查数据.xls ”是一份关于居民储蓄调查的模拟数据,该数据的第一行是变量名,该份数据的具体含义见 Excel 文件的后半部分。(1)将该份数据转换成SPSS数据文件,并在SPSS中定义数据结构(包括变量名、 变量类型、 变量名标签、 变量值标签等) , 并保存为 “居民储蓄调查数据.sav” ;(2) 该问卷中的多选项问题是按照哪种方式分解的?答:该问卷中的多选项问题是按照多选项分类法分解的,因为其中的选项不 止只有两个,存在多个(3)有多大比例的居民认为今年的收入比去年增加了?有多大比例的居民 认为今年的收入比去年减少了?并给出理由。收入比去年增加了还是
15、减少了频率百分比有效百分比累积百分比有效基本不变4817.017.017.0减少18063.863.880.9增加5419.119.1100.0合计282100.0100.0答:通过分析可知,该表中有282个被调查者,并无缺失值,认为今年收入比去 年增加的有54人,占总数的19.1%。而认为今年收入比去年减少的有180人,占总 数的63.8%,可知今年收入比去年减少了。(4)居民存款的最主要目的是什么?并给出理由个案睢要十案有效的缺失总计口咽比H百汗比N$存默目的279g9g%31.1%2321D0 0%3,更$存效目的频率响府个案百分比N百分比CKMD3 正常生客零用647.0%2之g寓结婚
16、用510.1%18.3%买房或建房17921.3%6 3.6%做生意505.0%1 ?%买证券及单位集资1619%5.7%购买炭业生产资料244里1工2 %头高档消菸品8810,5%3L5多防止意外事故7S9 1%27.2%舞老金556.6%13.7支付孩子救育费10012.7%3&Q%潺利息11914.2%4 2.7%的计B37100.0%300X%a组答:通过两表分析可知,共有282人参与调查,缺失3人,存款目的应答次 数837次,可以看出这一选项是多选。其中,买房或建房的选择有 178人选择, 占总选项数的21.3%;其次是得利息,有119人选择,占14.2%,由此可知居民 存款的最主要
17、目的是为了买房或建房,其次是得利息。3、(13分)为了解文化程度对职称的影响, 对20名职工进行了调查并进行了 列联分析,结果如下表所示:职称*文化程度交叉制表文化程度合计1.002.003.004.00职称1计数20226期望的计数1.51.22.11.26.0职称中的33.3%033.3%33.3%100%文化程度中的40.0%028.6%50.0%30.0%总数的10.0%010.0%10.0%30.0%2计数22217期望的计数1.751.42.451.47.0职称中的28.6%28.6%28.6%14.3%100.0%文化程度中的40.0%50.0%28.6%25.0%35.0%总数
18、的10.0%10.0%10.0%5.0%35.0%3计数12317期望的计数1.751.42.451.47.0职称中的14.3%28.6%42.9%14.3%100.0%文化程度中的20.0%50.0%42.9%25.0%35.0%总数的5.0%10.0%15.0%5.0%35.0%合计计数547420期望的计数5.04.07.04.020.0职称中的25.0%20.0%35.0%20.0%100.0%文化程度中的100.0%100.0%100.0%100.0%100.0%总数的25.0%20.0%35.0%20.0%100.0%卡方检验值df渐进Sig.(双侧)Pearson 卡方3.211
19、6.782似然比4.3256.633线性和线性组合.0161.900有效案例中的N20(1)补充表中空缺的计算结果(结果保留1位小数);(2)分析文化程度对职称是否有影响。答:通过分析表一和表二,我们可以先建立原假设:文化程度对职称没有影响;再建立备择假设:文化程度对职称有影响。从卡方检验表中可以看出,设 显著水平a =0.05由于卡方检验的概率 p-值都大于0.05,所以接受原假设,即 文化程度对职称没有影响。从交叉制表中也可以看出,文化程度为4而职称为3的占总数的14.3%,而文化程度为1职称为3的同样占总数的14.3%,可知文化 程度对职称没有影响。4、(29分)数据文件“广告地区与销售
20、额.sav”,是某企业在制订某商品的广告策略时,收集的该商品在不同地区采用不同广告形式促销后的销售额数据。请完成以下问题:主体间因子(表4-1)值标签N广告形式1.00报纸362.00广播363.00宣传品364.00体验36地区1.00122.00123.00124.00125.00126.00127.00128.00129.001210.001211.001212.0012主体间效应的检验(饱和模型)(表4-2)因变量:销售额源III型平方和df均方FSig.校正模型(12064.639)(47)(256.695)1.764.010截距647756.6941(647756.694)4451
21、.724.000x15189.361(3)(1729.787)(11.888).000x22660.306(11)(241.846)(1.662).094x1 * x24214.972(33)(127.726)(0.878).657误差(13968.667)96(145.507)总计(673790)(144)校正的总计26033.306(143)主体间效应的检验(非饱和)(表4-3)因变量:销售额源III型平方和df均方FSig.校正模型(7849.667)(14)(560.691)3.978.000截距(647756.694)(1)(647756.694)4595.374.000x1(518
22、9.361)(3)(1729.787)(12.272).000x2(2660.306)(11)(241.846)(1.716).077误差(18183.639)(129)(140.959)总计(673790)(144)校正的总计(26033.306)(143)误差方差等同性的Levene检验(表4-4)因变量:销售额Fdf1df2Sig.8844796.675对比结果(K矩阵)(表4-5)广告形式简单对比a因变量销售额级别1和级别4对比估算值-13.861假设值0差分(估计-假设)-13.861标准误差2.798Sig.000差分的95%置信区间下限-19.398上限-8.324级别2和级别4
23、对比估算值-4.417假设值0差分(估计-假设)-4.417标准误差2.798Sig.117差分的95%置信区间下限-9.953上限1.120级别3和级别4对比估算值1.556假设值0差分(估计-假设)1.556标准误差2.798.579-3.9817.092Sig.差分的95%置信区间 下限上限a.参考类别=4多个比较(表4-6)销售额LSD(I)广告形式(J)广告形式均值差值(I-J)标准误差Sig.95%置信区间下限上限报纸广播*-9.44442.79840.001-14.9811-3.9077宣传品-15.4167*2.79840.000-20.9534-9.8800体验-13.861
24、1*2.79840.000-19.3978-8.3244广播报纸*9.44442.79840.0013.907714.9811宣传品-5.9722*2.79840.035-11.5089-.4355体验-4.41672.79840.117-9.95341.1200宣传品报纸*15.41672.79840.0009.880020.9534广播5.9722*2.79840.035.435511.5089体验1.55562.79840.579-3.98117.0923体验报纸*13.86112.79840.0008.324419.3978广播4.41672.79840.117-1.12009.953
25、4宣传品-1.55562.79840.579-7.09233.9811*均值差的显著性水平为0.05(1)请填写表4-2和表4-3中空缺部分的数据结果(结果保留3位小数);(2)请根据表格数据说明以上分析是否满足方差分析的前提,并说明理由; 答:通过课本知识,我们可知方差分析是通过推断控制变量各水平下观测变量的总体分布是否有显著差异来实现分析目标的。故我们可以设立原假设原假 设:不同地区的销售的总体方差没有显著差异;再设立备择假设:不同地区的销 售的总体方差有显著差异。从 4-4Levene检验表中可以看出,不同广告形式下销 售额的方差齐性检验的检验统计量的观测值为0.884,概率P-值为0.
26、675。如果显著性水平a为0.05,小于概率P-值,因此不拒绝原假设,认为不同地区的销售 额的总体方差没有显著差异,满足方差分析的前提。(3) 分析广告形式、地区以及广告形式和地区的交互作用是否对商品销售额产生影响;答:本题以多因素方差分析进行研究,其中以广告形式,地区为控制变量,销售额为观测变量。 我们可以设立原假设为: 不同广告形式没有对销售额产生显著影响; 不同地区的销售额没有显著影响; 广告形式和地区对销售额没有产生显著的交互影响。 (x1 :广告形式; x2 :地区; x1*x2 :广告形式和地区 )从表 4-2 中可以看出:第一列是对观测变量总方差分析说明,第二列是观测变量变差分析
27、结果, 第三列是自由度, 第四列是方差, 第五列是 F 检验统计量的观测值,第六列是检验统计量的概率p-值。x1, x2, x1*x2的F检验统计量的值分别为11.888, 1.662, 0.878,对应白概率p值分别为0, 0.094, 0.657。如果 显著性水平a为0.05,而x1的概率p-值小于%所以拒绝原假设,认为不同广 告形式对销售额有影响;而x2, x1*x2分别对应的概率p-值大于%不应拒绝原 假设, 认为不同地区对销售额没有显著影响, 广告形式和地区对销售额没有产生交互作用。(4) 分析表 4-5(对比结果 );答:表 4-5 分别显示了广告形式前三个水平下销售额的均值检验结果。第一种广告形式下的销售额的均值与检验值得差为 -13.86
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初级档案职称考试(档案工作实务)自测试题及答案(2025贵州)
- 2025年污水运维综合考试试题(附答案)
- 财政财经及财政业务知识考试题库(附含答案)
- 餐饮服务食品安全知识考试试题及答案-食品安全知识考试题库
- 2025年生态农业示范园区环保设施建设合同与排放标准协议
- 2025年超高压绿色能源储油罐制造与安装一体化服务合同
- 2025年度酒店式公寓租赁及物业管理服务合同
- 2025年标准厂房买卖居间服务协议范本下载
- 2025年度大气污染防治技术研发中心研究员合作服务合同
- 2025年金融衍生品市场风险监测与风险评估合同
- 商用中小型冷库知识培训课件
- 2025年黑龙江省水利水电集团有限公司招聘考试笔试试题(含答案)
- 抗战胜利八十周年纪念-2025-2026学年高二上学期爱国主义教育主题班会
- 银行理财规划配置方案(3篇)
- 2025年安徽省综合评标评审专家库考试历年参考题库含答案详解(5卷)
- 天津市河西区2024-2025学年八年级下学期期末物理试题(含答案)
- 2025-2030中国城市更新政策演变与实施路径专项调研报告
- 儿科川崎病课件
- 2025年书记员考试题库(附答案)
- 中成药合理使用培训课件
- 建筑材料绿色采购实施方案
评论
0/150
提交评论