




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS应用练习 1、根据下面表中提供的2002年全国31个省、市、自治区的GDP数据,求出GDP的平均值、人均GDP的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份,并作出茎叶图、检验人均GDP的95%的置信区间。 答:A、GDP的平均值为3547.10,描述统计量N均值GDP值(亿)313547.10有效的 N (列表状态)31B、人均GDP的平均值、中位数、标准差、峰度、偏度分别为如下黑体字,前五位省份为上海、北京、天津、浙江和江苏,后五位省份为江西、广西、甘肃、内蒙古和贵州。统计量人均CDP省份N有效3131缺失00均值.9116中值.6482标准差.62147偏度2.270偏度的标准误.421峰度5.871峰度的标准误.821 C、人均GDP的95%的置信区间为【0.6836,1.1396】描述统计量标准误人均CDP均值.9116.11162均值的 95% 置信区间下限.6836上限1.13965% 修整均值.8335中值.6482方差.386标准差.62147极小值.31极大值3.23范围2.91四分位距.58偏度2.270.421峰度5.871.821D、人均CDP Stem-and-Leaf Plot Frequency Stem & Leaf 2.00 0 . 33 12.00 0 . 445555555555 5.00 0 . 66677 3.00 0 . 888 3.00 1 . 011 2.00 1 . 23 1.00 1 . 5 .00 1 . 1.00 1 . 8 2.00 Extremes (=2.3) Stem width: 1.00 Each leaf: 1 case(s)2、下面表中给出的是一组周岁儿童的身高,性别数据,1代表男,0 代表女。试根据表中的数据建立数据文件,对数据进行基本统计描述,给出身高的平均值、标准差、四分位点、频数分布直方图、箱图,并检验这组数据是否服从正态分布、男女儿童的身高是否存在显著差异。(=0.05)答:A、数据基本统计描述见下图统计量身高N有效60缺失0均值75.0500标准差3.72997百分位数2573.25005076.00007577.7500 B、数据分布特征的判断:近似服从正态分布。一方面,从箱图中看,女生身高分布较为集中(不包括奇异值),男生身高较为分散,而且男、女生中位数都偏向上四分位数,因此分布特征呈现负偏态。另一方面,从“正态性检验”得,K-S值中p=0.0030.05,故拒绝原假设,身高分布不服从数据分布。因为样本容量60相对较大,可以认为,近似服从正态分布正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.身高.14560.003.94460.008a. Lilliefors 显著水平修正 C、男女儿童身高的参数检验,因为男女身高相互独立,且两总体近似服从正态分布,故属于两独立样本t检验 第一步,判断两总体的方差是否相等,方差齐性检验,由于F检验统计量的概率P值为0.474,大于显著性水平0.05,则不应拒绝原假设,认为两总体方差无显著差异。第二步,由于t 检验的概率P值0.659大于显著性水平0.05,则不应拒绝原假设,认为男女儿童身高无显著差异。独立样本检验方差方程的 Levene 检验均值方程的 t 检验差分的 95% 置信区间FSig.tdfSig.(双侧)均值差值标准误差值下限上限身高假设方差相等.520.474-.44458.659-.43048.97024-2.372621.51166假设方差不相等-.44557.956.658-.43048.96711-2.366391.505433、调查339名50岁吸烟习惯与慢性支气管炎病的关系,得下表。试问吸烟者与不吸烟者的慢性气管炎患病率是否有所不同?(=0.05)答:吸烟与否影响慢性支气管炎患病率。在卡方检验中,卡方的概率P值0.006小于显著性水平0.05,因此应拒绝原假设,认为行变量是否吸烟与列变量并不是独立的,前者影响后者。即在患病的56个个案中,其中有43个人吸烟,吸烟占据较大比例。是否吸烟* 是否患病 交叉制表是否患病合计未患病患病是否吸烟不吸烟计数12113134期望的计数111.922.1134.0吸烟计数16243205期望的计数171.133.9205.0合计计数28356339期望的计数283.056.0339.0卡方检验值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方7.469a1.006连续校正b6.6741.010似然比7.9251.005Fisher 的精确检验.007.004线性和线性组合7.4471.006有效案例中的 N339a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 22.14。b. 仅对 2x2 表计算4、下表中给出了某种化工过程在三种浓度、四种温度水平下的得率,假设在诸水平的搭配下的总体服从正态分布且方差相等,试在0.05水平下检验不同的浓度、不同的温度下的得率的差异是否显著?交互作用的效应是否显著?答:因为假设总体服从正态分布而且方差相等,因此可以进行方差分析A、单变量多因素方差分析 浓度、温度以及二者交互作用的F统计量概率值分别为0.044、0.566和0.568,在显著性水平0.05的前提下,认为浓度对于得率有显著影响,而温度以及浓度与温度交互作用不显著。主体间效应的检验因变量:得率源III 型平方和df均方FSig.校正模型82.833a117.5301.390.290截距2604.16712604.167480.769.000浓度44.333222.1674.092.044温度11.50033.833.708.566浓度 * 温度27.00064.500.831.568误差65.000125.417总计2752.00024校正的总计147.83323a. R 方 = .560(调整 R 方 = .157)B、进一步分析控制变量(浓度)的不同水平是否有显著差异,以及控制变量交互作用的图形分析: 由多重比较的均值检验得,浓度2%与6%无显著差异,浓度4%与二者有显著差异。多个比较因变量:得率(I) 浓度(J) 浓度均值差值 (I-J)标准 误差Sig.95% 置信区间下限上限Tukey HSD2%4%2.75001.16369.085-.35465.85466%-.25001.16369.975-3.35462.85464%2%-2.75001.16369.085-5.8546.35466%-3.00001.16369.059-6.1046.10466%2%.25001.16369.975-2.85463.35464%3.00001.16369.059-.10466.1046LSD2%4%2.7500*1.16369.036.21455.28556%-.25001.16369.834-2.78552.28554%2%-2.7500*1.16369.036-5.2855-.21456%-3.0000*1.16369.024-5.5355-.46456%2%.25001.16369.834-2.28552.78554%3.0000*1.16369.024.46455.5355 由交互作用图知,在温度1024摄氏度之间,两者交互作用明显。5、铝合金化学铣切工艺中,为了便于生产操作,需要对腐蚀速度进行控制,因此要考察腐蚀温度x1(),碱浓度x2,(g/L),腐蚀液含铝量x3(g/L) 对腐蚀速度y(mm2/min)的影响,一共做了44次试验,所得数据表如下,(1) 建立线性回归模型;(2) 对回归模型进行检验(3) 若回归模型通过检验,试求:当x1=80,x2=35g/L, x3= 200g/L时,腐蚀速度y的点预测与95的区间预测。答:(1)采用逐步回归的方法,得出“经验回归方程”及“标准化回归方程”为: Y=-0.09767+0.00146*X1-0.00021*X2+0.00008*X3 Y=0.0001*X1-0.00003*X2+0.00003*X3系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)-699.34886.945-8.044.000腐蚀温度12.4571.066.87511.691.0001.0001.0002(常量)-792.22269.088-11.467.000腐蚀温度14.388.8941.01016.101.000.8431.186碱浓度-2.107.386-.343-5.460.000.8431.1863(常量)-976.71755.206-17.692.000腐蚀温度XI14.648.6211.02823.591.000.8401.190碱浓度X2-2.058.268-.335-7.686.000.8431.187腐蚀液含铝量X3.814.121.2706.727.000.9931.007a. 因变量: 10000Y 根据上述方程可知,三个字变量中,腐蚀温度对于腐蚀速度影响最大。 (2) 方程通过了F检验和对系数的t检验,三个方程的F统计量分别为136、130和195。对应的概率值p分别为0,取显著性水平a=0.05,所有的p值都小于0.05,表明自变量与因变量之间线性关系显著,可以设计线性模型。Anovad模型平方和df均方FSig.1回归156251.8521156251.852136.669.000a残差48018.034421143.287总计204269.886432回归176466.546288233.273130.113.000b残差27803.34041678.130总计204269.886433回归191224.856363741.619195.451.000c残差13045.03040326.126总计204269.88643a. 预测变量: (常量), 腐蚀温度。b. 预测变量: (常量), 腐蚀温度, 碱浓度。c. 预测变量: (常量), 腐蚀温度, 碱浓度, 腐蚀液含铝量。d. 因变量: 10000Y方程3的决定系数为0.936,可以解释总变异的93.6%,说明方程三的拟合度好。模型汇总d模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.875a.765.759.00338.765136.669142.0002.929b.864.857.00260.09929.809141.0003.968c.936.931.00181.07245.253140.000a. 预测变量: (常量), 腐蚀温度。b. 预测变量: (常量), 腐蚀温度, 碱浓度。c. 预测变量: (常量), 腐蚀温度, 碱浓度, 腐蚀液含铝量。d. 因变量: 腐蚀速度由于X1、X2、X3容忍度分别为0.840.、0.843、0.993,较接近于1,表示多重共线性较弱,因此上述三个解释变量之间不存在线性相关关系。(如第一题表)(3) 将x1=80,x2=35g/L,x3=200g/L带入经验回归方程 Y=-0.09767+0.00146*X1-0.00021*X2+0.00008*X3,得Y=0.03 进一步分析得,点预测值为0.02863, 95%置信空间为(0.02494,0.03231)6、下表是山东省2003年统计年鉴的统计数据,试根据表中数据,将山东省的交通运输客运量对人均国内生产总值的关系拟合一条合适的曲线。7.SPSS自带数据文件plastic.sav中记录了20种塑料样品的有关特征,根据有关知识,认为它们可以被分为三类,请根据拉扯强度(tear_res) 、光泽(gloss)、 不透明度(opacity) 三个变量的取值将其分为三类,并描述每类的基本特征。答:本题中的标识变量设定为样本中自动生成的“序列号”。(1)一些基本的数据表格最终聚类中心聚类123抗扯强度7.157.066.85光泽9.459.178.85不透明度7.651.964.32上表格说明了最终凝聚点的各变量对应值最终聚类中心间的距离聚类12315.7003.39725.7002.39133.3972.391以上表格,给出了聚类结束时各凝聚点相互之间的距离ANOVA聚类误差FSig.均方df均方df抗扯强度.1302.14817.881.432光泽.4152.275171.514.248不透明度28.1792.6211745.371.000F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。以上表格为方差分析表,可看出各变量中存在的情况是不同的。“抗扯强度”和“光泽”方面存在“类间误差和类内误差的差异性不太明显”的状况,而且最后一栏的Sig值都要大于0.05,也验证了这两个分析变量并不能很好地区分类间的差异。在“不透明度”方面,类间误差和类内误差的差异性非常明显,最后的Sig值为0.000,所以可以看出,它所起的分类作用是最强的。(2)关于每类特征的一些描述:由于“抗扯强度”和“光泽”在“类间误差和类内误差的差异性”的衡量上不明显,所以不同类别产品的特征主要体现在“不透明”程度的大小上,第一类产品“不透明度”值非常高,第二类产品“不透明度”的值最小,第三类产品则是居于两者之间。附下表以作参考。上表中也可以看到另外一个现象,那就是第一类全部位于“挤压”和“附加”赋值均为2的情形中,第三类多数分布于“挤压”赋值为1的情形中,第二类在这个方面没有明显的特征。8. 对20名大学生进行的有关价值观的测验,包括9个项目,测试结果如下页所示。要求根据这9项内容进行因子分析,得到维度较少的几个因子,并对因子命名。首先是考察一下原有变量是否适合进行因子分析,见下表:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.585Bartlett 的球形度检验近似卡方74.733df36Sig.000由上表得知Bartlett 的球形度检验统计量观测值为74.733,相应的概率P值接近0,小于显著性水平0.05,认为相关系数矩阵与单位矩阵有显著差异,但是,KOM值不是十分理想,接近0.6,表示不太适合。而且从以下原有变量的相关系数矩阵可以得出进行因子分析的适合度不太让人满意。相关矩阵合作性分配出发点工作投入发展机会社会地位权力距离职位升迁领导风格相关合作性1.000.731.411-.264.078.000.136.261.106分配.7311.000.514-.355.170-.301.264.321.196出发点.411.5141.000-.229.546.022.664.420.450工作投入-.264-.355-.2291.000.035.067.087-.075-.131发展机会.078.170.546.0351.000.379.599.817.461社会地位.000-.301.022.067.3791.000.034.169.096权力距离.136.264.664.087.599.0341.000.511.521职位升迁.261.321.420-.075.817.169.5111.000.425领导风格.106.196.450-.131.461.096.521.4251.000其次,需要提取因子,其实在预先不指定因子数的状况下,得出因子提取的总体效果很不理想,所以这里直接只是指定了3个因子,首先看一下碎石图:其实从上图中也可以看到自第三个以后趋势很平坦了,所以这里提取三个因子是适合的。解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %13.57639.73039.7303.57639.73039.7303.19635.51335.51321.88620.95260.6821.88620.95260.6822.02922.54058.05331.02211.35072.0321.02211.35072.0321.25813.97972.0324.8459.38581.4175.6387.08588.5026.5185.75394.2557.2502.77497.0308.1862.06999.0999.081.901100.000提
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 演出经纪人之《演出经纪实务》考试模拟试卷附答案详解【能力提升】
- 解析卷-北师大版9年级数学上册期末测试卷附答案详解【完整版】
- 2025年教师招聘之《幼儿教师招聘》押题练习试卷及答案详解【新】
- 2025年教师招聘之《小学教师招聘》题库综合试卷(突破训练)附答案详解
- 2025年教师招聘之《幼儿教师招聘》考前冲刺测试卷包附答案详解【a卷】
- 2025年教师招聘之《幼儿教师招聘》题库必刷100题及参考答案详解【考试直接用】
- 教师招聘之《小学教师招聘》高分题库及答案详解(易错题)
- 2024年长沙市公安局招聘警务辅助人员真题
- 2025年学历类自考刑法学-马克思主义基本原理参考题库含答案解析(5卷)
- 教师招聘之《小学教师招聘》预测复习及参考答案详解(达标题)
- 动物无害化处理场建设项目可行性研究报告建议书
- 2025-2030年中国中高端猪肉市场发展现状及营销策略分析报告
- 全国林业碳汇计量监测技术指南(试行)
- DBJ33T 1289-2022 住宅厨房混合排气道系统应用技术规程
- 低温杜瓦瓶安全操作规程(4篇)
- 水库白蚁防治施工方案设计
- 《套餐销售技巧培训》课件
- 第一单元 分数乘法(单元测试)(含答案)-2024-2025学年六年级上册人教版数学
- 次氯酸钠培训
- 《射频通信全链路系统设计》 课件 第5、6章 射频通信发射机设计、射频通信时钟系统设计
- DBJ46-070-2024 海南省民用建筑外门窗工程技术标准
评论
0/150
提交评论