spss-统计分析习题解析_第1页
spss-统计分析习题解析_第2页
spss-统计分析习题解析_第3页
spss-统计分析习题解析_第4页
spss-统计分析习题解析_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS统计分析习题1搜集数据,用spss建立一个数据文件记录你所在班级学生下列情况:学号、 姓名、年龄、籍贯、民族、家庭电话号码、出生年月日、综合测评成绩,以及评 定成绩等级(优、良、中、可、差)等,给出正确的变量名、变量类型、标签及 值标签、测度水平。2下面的表,分别为某企业1991年1995年5年中各季度计划完成和实际完成 的产量(单位:万吨)数据资料,试建立一个 SPSS数据文件保存这两个表中的 数据。年份一季度二季度三季度四季度计划数实际数计划数实际数计划数实际数计划数实际数19911412.51821.41818.52020.419921717.21819.81719.22022.

2、519931616.52016.81817.72119.619941818.42019.22020.52220.819952020.52125.82522.52524.5然后对建立的数据文件调用分类汇总(Aggregate)命令分别按季度、年汇总各 季度和各年度的计划产量和实际完成的产量、 平均产量。最好能用统计图表显示。3某地20家企业的情况如下:编号部门所有制类型年产值(万元)职工人数(人)年工资总额(万 元)1工业国有2805.581235812.632父通国有1265.40605435.603商业集体256.5010568.584父通个体26.882014.005工业集体560.002

3、23156.076工业国有800.50568256.747邮电通国有2580.98890854.408讯个体125.456565.169商业个体590.60148130.2410父通国有950.00325268.1311工业集体1556.00485394.2012工业个体950.00354257.9013父通国有335.0010582.4314工业集体2455.08680639.2015工业股份制1780.58646471.2516商业国有2500.00485486.9817邮电通国有775.00354272.5818讯股份制3305.001015912.0019工业国有498.0820213

4、9.2020工业 商业 父通国有965.58246159.95根据上述资料建立数据文件,并完成下列统计整理工作,并回答有关问题:(1)调用排序个案Sort Cases命令分别对年产值、职工人数和年工资总额进行 排序。许多SPSS文件中都定义一个表示观测量序号的id变量,按照自己的体会 指出这个id变量的作用。(2)调用Aggregate命令分别按部门和所有制类型作分类汇总。(3)首先调用Sort Cases命令分别按部门:按所有制类型;按部门和所有制类 型进行排序。再执行 Analyze f Descriptives Statistics f Descriptives,对年产 值、职工人数和年

5、工资总额进行描述。(4) 首先调用Split File命令分别按部门和所有制类型将文件分组,再重复(3) 的操作,比较二者的差异。4如下图(局部)所示的文件中记录了某公司职工 workage (工龄)、wage (月 基本工资)、dutyday (出勤天数)、w_e_fee (应扣水电费)等项数据的资料,公 司财务规定,工资按照下列原则发放:idn amesexbranchworkagewagedutydayw e fee11陆玲女办公室25585.002230.6022张玉林男计划处28697.451947.4033r孙兰平男财务处12429.651934.0044郭东立男总务处22526.

6、502135.09(1)出满勤22天或以上者,按照“日基本工资X出勤天数 +工龄X 1.8-应扣水 电费”计算;(2)出勤15天或以上,20天以下者,按照“日基本工资X出勤天数+工龄X 1.2 -应扣水电费”计算;(3)出勤15天以下者,按照“日基本工资X出勤天数 +工龄一应扣水电费”计 算。其中“日基本工资=月基本工资/ 22.5”,试编写一个计算输出职工当月实发 工资的SPSS语法程序。5 下列表中列出某地区2004年2013年粮食产量、人口、工业总产值、国民 生产总值的环比发展速度,试选用 OLAP Cubs或者Case Summaries过程,分两 个5年计划分别输出该地区上述各项指标

7、的平均发展速度,以及全期的平均发展速度。(提示:建立数据文件后,定义一个按5年计划分类的分类变量,在概述统计 量对话框中选用Geomitric Mean。参考时间序列相关内容)粮食产量人口发展工业总产值国民生产总值年份环比速度(%)环比速度(%)环比速度(%)环比速度(%)yearfood cirpopu cirindu cirGDP cir2004104.20102.40110.00104.80200591.34111.50114.00104.302006114.50103.40110.8099.90200799.43104.00101.60100.402008104.50100.60107

8、.10103.702009103.80113.30101.40101.502010100.40102.20101.20103.802011104.50103.30101.20101.402012100.50103.10103.50100.302013101.1097.94101.00100.00执行丁 Transform Compute命令,分别计算期间各项指标的平均发展速度,以 及全期的平均发展速度。6下表所列的是某市2000年竣工的21幢商品楼所处地段(district)、标定价格(price)和最终出售价格(sale(单位:元/平方米)资料districtpricesaledistric

9、tpricesaledistrictpricesale城中心33003540远郊区18801750城中心30503200城中心36003500卫星城19501950远郊区16701650卫星城24002350卫星缄19001950远郊区16801650城中心35003650近郊区18501780近郊区17801680近郊区22502300近郊区17801650近郊区18501900远郊区18501780近郊区18401700卫星城20502000远郊区17601800城中心28002800卫星城20202100试建立相应的数据文件调用 OLAP Cube过程、按行概述报告过程、按列概 述报告过

10、程分别输出统计报告,概述各地段楼房价格的平均(标定、实际)价格、 价格标准差、最低价格、最高价格等。7为了建立白炽灯泡的质量管理,从生产线上连续抽出32只灯泡依次贴上序号, 然后作寿命试验,得到每只灯泡寿命的数据(千小时)如下:序号寿命序号寿命序号寿命序号寿命11.1191.63171.21251.3021.28102.10181.60261.5031.46111.21191.56271.2741.35121.76200.73281.5651.06132.41211.26291.1561.25142.08221.51301.9471.44151.50231.77310.8481.23161.5

11、5241.16321.14经计算这32只灯泡的平均寿命为1.435千小时,执行Transform f Recode f Into Different Variables命令将比平均寿命大的用“ +”标记,比平均寿命小的 用“”标记,使用游程检验法检验,“”号序列是否可以认为是随机的。8甲乙两分析员同时分析某浆料中硼砂的含量,测得如下数据(%):甲13.5 12.115.4 10.8乙14.4 13.8 16.4 9.9 11.5 12.212.8 14.715.2建立合适的数据文件,选用秩和检验法检验二人分析的结果有无显著差异9调查100名健康女大学生的血清总蛋白含量 (g %)如下表,试作频

12、数表分析7.437.886.887.807.048.056.977.127.276.887.207.437.127.207.507.357.887.437.037.957.206.437.588.036.977.437.357.357.507.727.046.807.047.207.657.437.657.767.046.736.507.658.167.547.277.276.727.657.437.047.587.357.507.277.357.357.278.167.656.737.358.057.957.567.507.887.207.207.727.657.586.507.437.12

13、6.976.807.357.507.356.737.587.586.887.657.047.128.127.507.047.276.737.207.507.437.357.957.357.477.278.4310.考虑下列25 个人的年龄:21, 23,23,24,25,25,30,30,32,35,37,37, 40, 40, 41, 41, 42, 42, 45, 75,完成下列茎叶图。AGE Stem-a nd-Leaf PlotFreque ncyStem234ExtremesStem width:&LeafEach leaf: 1 case( s)11下图为从某厂全部职工中随机抽出的

14、31名职工的年工资(元)分布的茎叶图:WAGE Stem-a nd-Leaf PlotFreque ncy Stem & Leaf4.005.006.008.004.00 .003.0041 . 556642 . 2334443 . 55666844 . 0245568845 . 145846 .47 . 3561.00 Extremes (=8850)Stem width: 100.00Each leaf:1 case(s)(1) 根据茎叶图列出这31个人的年工资额,定义变量建立数据文件,使用 Compute对话框,计算年工资的Z得分;(2) 建立记录工资的数据文件,输出该公司职工工资的描述

15、性统计表。指出全 厂职工年工资的均值、标准差、95%置信区间等。12试根据某个班级会计、统计、管理 3门功课考试成绩的箱图(下图)回答下 列问题:110N =505050会计成绩统计成绩管理成绩(1) 估计该班各科考试成绩的中位数。(2) 估计管理成绩的内四分位数界。(3) 从会计成绩的奇异值的位置估计该学生的会计成绩。(4) 哪一门功课成绩的变异程度最大?哪一门成绩的变异程度最小?13下表是从住房和社区服务问题调查中抽出的容量为 18的样本,调查住户的住 房购还是租用(1= “自购” ,2= “租用”)以及对社区服务的满意程度(仁“不满意” ,2= “满意” ,3= “很满意”)pers o

16、nownerapprovepers onownerapprove11192122210233111121411122152213l361214l271115218111613填写如下交叉表,并调用SPSS的交叉表过程,进一步分析人们对城市服务的满 意程度。13OWNER*APPROVE CrosstabulationAPPROVE123Total14从某化工厂生产的两批瓶装无水酒精中,分别抽出12瓶和14瓶进行检查,据以往经验,假定两批产品中杂质含量均服从正态分布,且两批产品杂质含量相互独立,调用SPSS的独立样本T检验过程,检验两批产品杂质含量的差异,得 到如下分析表,试填写表中的空格,并对

17、结果作出解释。Group Statisticsfor Equality of Varia ncesFSigt-test fordfSig. (2-tailed)Mea nEquality ofDiffere neeMeansStd. ErrorDiffere nee95%LowerCon fide nee In terval of the Differe neeUpperLeve nes Test0.0050.946-1.081-1.09023.8970.2900.2870.19540.1939-0.6146-0.61160.19200.1890BATCH 批Std.Std. Error号N

18、Mea n DeviationMea nALCOHL1122.62080.4707酒精中杂质含量2142.83210.1383In depe ndent Samples TestALCOHL酒精中杂质含量Equal varia ncesEqual varia nces notassumedassumed15教学研究人员想要检验3种不同教学方法的效果,随机地抽取16名水平相当 的学生,分成3组,每组用一种方法教学。一段时间后进行测验,根据测验结果作单因素差分析,得到如下方差分析表。试填写表中所缺数值,并判断3种教学 方法的效果有无显著差异?(a = 0.05)SCORE成绩Sum Squares

19、of df Mean SquareFSig.Betwee n Groups一20.025Within Groups817.63314Total1382.2351616为了评比某种型号的电池质量,分别从 A、B、C三个工厂生产的同种型号 电池中各随机地抽取5只电池为样本,经试验得到其寿命(小时)如下:AiA2A3A4A40483842B45C36343028323940435050品 工厂A5假设电池寿命服从正态分布,试在显著性水平a = 0.05下,检验电池的平均寿命有无显著差异?4种不同土质的17将4个不同的水稻品种Ai、A2、A3、A4安排在面积相同的品种地块Bi、B2、B3、B4中试种,

20、测得各地块的产量(kg)如下:A1135120147A2132A3154129125A4125125129120133115124119123地块BiB4B2B3假设水稻品种与地块之间无交互作用,建立适当的数据文件,试用SPSS的Univariate命令,在显著性水平 a = 0.05,检验:(1)不同的品种对水稻的产量有无显著的影响?(2)不同的土质对水稻的产量 有无显著的影响?18下表给出某种化工产品生产过程在 3种浓度、4种温度下得率的数据: 浓度温度 ( C)(%)10243852214,1011,1113,910,1249, 710,87,116,1065,1113,1412,131

21、4,10建立适当的数据文件,试用 SPSS的Uni variate命令,在显著性水平a = 0.05 下,检验各因子的主效应与交互作用对得率的影响。19在一个考察纤维弹性(spring)受收缩率(fac_a)和拉伸倍数(fac_b)的试 验中,两因素各取4种水平,因素的各种搭配下分另别作两次试验, 根据试验结果 的数据文件,执行SPSS的Univariate命令得到如下的方差分析表:Tests of Betwee Subjects EffectsDependent Variable SPRING 纤维弹性SourceType 川 sum ofSquaresdfMea n SquareFSig.

22、Corrected Modela157.7191510.5187.8740.000In tercept174492.7811174492.781129855.0930.000FAC_A (收缩70.594323.53117.5120.000率)FAC_B (拉伸倍7.59432.8652.1320.136数)FAC_A*FAC_B79.53197.8376.5760.001Error21.500161.344Total174673.00032Corrected Total180.21931a R Squared=.881 ( Adjusted R Squared =.769根据表中的输出结果指

23、出:收缩率和拉伸倍数对纤维弹性有无显著影响, 两因 素的交互作用对纤维弹性有无显著影响,写出简单的检验报告。(检验的显著性水平 a = 0.05)20下表中记录的是3名工人分别在4台不同的机器上工作3天的日产量。机器工人-A1A2A3A4甲15,15,1717,17,1715,17,1618, 20, 22乙19, 19, 1615,15,1518,17,1615,16,17丙16, 18, 2119, 22, 2218,18,1817,17,17假定各工人的日产量服从正态分布,建立适当的数据文件,使用SPSS的Univariate命令,在显著性水平 a = 0.05下,检验:(1)工人的操作

24、水平之间有无显著差异?(2)不同的机器之间有无显著差异?(3) 不同工人的操作水平与不同的机器之间的交互作用是否显著?21用3种栽培技术和4种施肥方案相互搭配组成12种育苗方案作杨树育苗试 验,在每一种方案下培育3株杨树苗,测得苗高的数据资料如下表所示:7一一.施肥(B)栽培技术(A)B1B2B3B4A152, 43, 3948, 37, 2934, 42, 3858,45,42A253, 47, 4150, 41, 3044, 36, 3960,46,44A338, 42, 4948, 47, 3640, 32, 3743,56,41设苗高服从等方差的正态分布,建立适当的数据文件,试用SPS

25、S的Univariate命令在显著性水平a = 0.05下,检验:(1)不同栽培技术对苗咼有无显著影响?(2)不同施肥方案对苗高有无显著影响?(3)二者的交互作用对苗高的影响是否显著?22下表中列出某地区九个市县社会商品零售总额(亿元)、城市居民年平均收入(元)、农民年平均收入(万元)的数据,分别记为变量retail、townsman farmers市县编号123456789retail58.7518.2915.2912.5811.2415.6015.0914.3615.14tow nsma n0.4680.3750.4100.3700.4300.3790.3500.3600.370farme

26、rs0.1660.1350.1510.1490.1540.1250.1040.1190.159执行Bivariate (二元相关)命令,分析变量之间的相关关系23某医院研究某种代乳粉的营养价值时,用大白鼠作试验,得大白鼠进食量(克)和增加体重(克)之间的关系的原始数据如下表,用 x表示大白鼠进食量 和用y表示大鼠增加体重,试作x与y之间的相关分析。进食量x (克)820780720867690787934679639820增加体重y(克)16515813018013416718614512015824下表中列出某班10名学生高一(x)和高二(y)数学期末考试的成绩id12345678910x7

27、4717568767367757074y76727170767965797772执行Bivariate (二元相关)命令,分析变量之间的相关关系254位教师对6名学生的作文竞赛评定的名次如下表。学生评定教师1234134212431332134465655124265656执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关 关系。26 两位评酒师对20种酒的等级(110)进行评定,评定结果如下表所示。drinkABdrinkAB1681169245128537413424871433523156867416910799179887818469251943104320

28、55建立数据文件,回答下列问题:(1) 执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的 相关关系。(2) 执行Distances命令,分析评定结果之间的相似关系。(3) 执行Distances命令,计算观测量之间的欧几里得距离,分析观测量之间的 亲疏关系。27现测得变量x与y的数据如下表:i12345678910xr 49.250.049.349.049.049.549.849.950.250.2y16.717.026.816.616.716.816.917.017.017.1(1) 建立数据文件,执行二元相关命令,判断变量 x与y之间是否有线性相关 关系;(2)

29、若线性相关,执行 AnalyzeRegressionLinear命令分别求出y关于x和 x关于y的回归方程;比较二者的不同。28某研究所每年的净收益(in come)的主要影响因素为该所每年实际研究费用(fee)和研究人员数量(in vest),收集近九年来的数据资料如下:fee (万元)123.5123.8125.6126.4127.1127.3128.9130.4131.8invest (人)254257275290295296311326341in come (万元)160016301660169017201750178018401870建立数据文件,求因变量in come对自变量fee

30、和in vest的线性回归方程,给出分析结果报告。如设自变量fee和in vest取下列各对数值时,求出in come的预 测值。fee :135、140、160、18 &200invest :360、380、400、400、41029锡克试验阴性(%)随着年龄的增长而增高,某地区医院调查得到儿童年龄(岁) Y与锡克试验阴性率Y的资料如下:年龄X (岁)1234567锡克试验阴性率丫57.176.090.993.096.795.696.2(%)建立数据文件,试执行Regressi on Curve Estimati on(曲线估计过程)命令,选用二次、三次和对数曲线模型拟合此组数据30研究某地

31、区土壤中所含植物可给磷的情况,得到下列表中的数据:土壤子样序 号X1X2X3y土壤子样序 号X1X2X3y10.453158641010.9371117620.423163601112.6581125130.634157611211.6291739341.765123771323.1461149651.936143541423.1501347769.44446811521.644739373.11937711623.1561689584.72459541726.858202168910.131117931829.95112499其中:xi为土壤中含无机磷浓度;X2为土壤中溶于K2C03溶液并受

32、溴化物水解的无机磷浓度;X3为土壤中溶于K2C03溶液但不受溴化物水解的无机磷浓度; y为种植在20 C 土壤内的玉米中的可给态磷。建立数据文件,执行 An alyze Regression Lin ear命令并选择逐步回 归,求y关于X1、X2、X3、的线性回归方程,并给出分析报告。31维尼纶厂生产牵切纱的工艺流程由牵切、粗纺、细纺三道工序组成,根据经 验粗纱的重量不匀率 Z与牵切条干不匀率x及牵切重量不匀率y有关,试验测 定20个样品得到下表中的数据:序 号x(%)y(%)Z(%)序 号x(%)y(%)Z(%)序 号x(%)y(%)Z(%)115.581.951.341112.741.35

33、0.872110.811.321.35210.681.371.271211.731.331.532217.261.311.57315.622.391.561314.841.091.252314.921.421.64415.781.141.481413.731.272.472418.142.131.64513.221.851.401515.121.781.832518.151.202.34616.441.321.821617.882.522.412610.310.980.65711.402.050.851713.381.431.692711.401.271.19816.171.111.40181

34、4.212.271.502812.570.872.06914.031.471.151916.801.411.192917.611.211.571015.671.381.892010.811.782.44建立数据文件,求出Z关于x和y的回归方程,根据方程的检验结果,再选用逐步回归法求解32 测得云杉平均树高h (米)和平均树径d (厘米)之间下列数据:d1520253035404550226065h13.917.120.022.124.025.627.028.329.430.231.4建立数据文件并调用Curve Estimation (曲线估计过程)求平均树高 h (米) 和平均树径d (厘米

35、)之间的下列曲线拟合模型:(1 )二次函数 h=a b d cd2 ;(2)幂函数h = a db ;(3)指数函数h =a bd ;(4)对数函数 h =a b ln(d);并分析哪种曲线拟合较好?33今搜集到20名糖尿病人的血糖(丫, mmol/ L)、胰岛素(X1 , mU/L )及 生长素(X2,卩g/ L )的测量数据列于下表:序 号丫X1X2序 号丫X1X2序 号丫X1X2112.2115.209.51813.3210.3018.89158.4923.203.42214.5416.7011.43919.595.9013.14167.7125.007.34312.2711.907.53109.0518.709.631711.3816.8012.75412.0414.0012.71116.4425.105.101810.8211.2010.8857.8819.802.33129.4516.404.531912.4913.7011.06611.1016.2013.521310.1622.002.16209.2124.409.16710.4317.0010.07148.3823.104.26试建立数据文件,试进行多元线性回归分析,求变量丫

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论