《统计软件应用》实验实践项目指导书.doc_第1页
《统计软件应用》实验实践项目指导书.doc_第2页
《统计软件应用》实验实践项目指导书.doc_第3页
《统计软件应用》实验实践项目指导书.doc_第4页
《统计软件应用》实验实践项目指导书.doc_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计软件应用实验实践项目指导书( 2013 年 12 月) 编写人: 陈章波 目 录项目1:SPSS统计软件简介与数据的录入41.1 实验实践课时41.1 实验实践目的41.3 实验实践条件51.4 实验实践背景知识51.5 实验实践内容51.6 实验实践步骤51.7 思考题11项目2:数据整理122.1 实验实践课时122.1 实验实践目的122.3 实验实践条件122.4 实验实践背景知识122.5 实验实践内容122.6 实验实践步骤122.7 思考题17项目3:重新分组&制表183.1 实验实践课时183.1 实验实践目的183.3 实验实践条件183.4 实验实践背景知识183.5 实验实践内容183.6 实验实践步骤183.7 思考题22项目4:描述性统计分析234.1 实验实践课时234.2 实验实践目的234.3 实验实践条件234.4 实验实践背景知识234.5 实验实践内容234.6 实验实践步骤234.7 思考题26项目5:均值比较与假设检验275.1 实验实践课时275.2 实验实践目的275.3 实验实践条件275.4 实验实践背景知识275.5 实验实践内容275.6 实验实践步骤275.7 思考题29项目6:相关分析306.1 实验实践课时306.2 实验实践目的306.3 实验实践条件306.4 实验实践背景知识306.5 实验实践内容306.6 实验实践步骤306.7 思考题33项目7:单因素方差分析347.1 实验实践课时347.2 实验实践目的347.3 实验实践条件347.4 实验实践背景知识347.5 实验实践内容347.6 实验实践步骤347.7 思考题37项目1:SPSS统计软件简介与数据的录入1.1 实验实践课时2学时1.1 实验实践目的学习更改变量的属性、建立数据文件、读取外部数据、Excle文件和对spss数据的编辑和保存。1.3 实验实践条件学生单机操作,SPSS20.1.4 实验实践背景知识基本的软件操作页面知识和excel等软件的操作经验。1.5 实验实践内容把大学教师基本情况调查表中的12个变量在SPSS的变量窗口进行设置。把大学教师基本情况表中的数据在SPSS的数据窗口进行输入。1.6 实验实践步骤1.打开spss18,弹出的提示框点击取消,进入主页面。图01-1主页面如上。2.按文件打开数据的顺序使用菜单命令调出打开文件对话框,在文件类型中选择“Excle(*.xls)”。图01-2选择大学教师基本情况表,按ok键,导入数据。图01-3在弹出的打开excel数据源窗口按确定。图01-43.切换到变量视图,有3种方式可以进入变量视图。进入变量视图页面,首先,按照步骤一步一步检查类型,宽度,小数,列,对齐方式的设置是否有错误,确认无误后进入下一步。6在“变量视图”变量框中的“标签”下填入变量的中文全称,并把“名称”中中文改为拼音缩写。5.在“值”下点击相应变量框,在“值标签”对话框中设置变量值标签,输入大学教师基本情况调查表中的问题的选项代表变量。每写完1个按添加。最后按确定。需要设置值标签的变量有性别(1.男2 女),文化程度,职称,课时,数据库和科研要求,满意度。接着修改度量标准,按照变量的不同类型分别设置标准。正确答案为下。6.切换回数据视图,打开“视图”中选择“值标签”,看改变后的效果。7.通过文件-保存菜单保存数据文件。1.7 思考题1 度量标准分为几种类型?那些变量属于度量,那些变量属于序号和名义?尝试举例说明。2 导入数据时除了xls文件还可以导入那些类型的文档?试了解一下。项目2:数据整理2.1 实验实践课时2课时2.1 实验实践目的掌握spss13.0建立数据文件的基本操作。(其中包括数据整理:数据菜单、转换菜单)2.3 实验实践条件单人电脑操作,2.4 实验实践背景知识有过excel的操作经验2.5 实验实践内容案例操作:某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。根据该校所制定的录取原则,将文化课成绩和加分总和构成综合分,录取出综合分排名前七名的学生。2.6 实验实践步骤1.打开本次实验需要的SAV数据文件,在实验二文件夹中。2.在变量视图窗口中修改变量名称,标签和度量标准。(名称使用拼音首字母,标签为中文,以后相同),结果如下3.计算数据a 计算文化课成绩。点击转换计算变量目标变量设置为whkcj,数学表达式为sx+yw+yy+zh,最后设置类型和标签,如图所示,按继续后按确定,就会生成新的变量。结果如下。b 计算加分。同理。(括号为判断条件)c 计算综合分,同理。4.淘汰没用的数据。因为这一步需要选择400分以上的,排名前7的同学。A 淘汰400分以下的。并且不良记录为0的.按下图一步一步进行。B 排序C 选择前7名,依旧是选择个案,但这次是第3个选项,基于时间或者个案。输出选择删除没选中的变量实验结果如下。2.7 思考题1.排序变量有没有更方便的方法?2 输出是干什么的?项目3:重新分组&制表3.1 实验实践课时2课时3.1 实验实践目的掌握spss建立数据文件的基本操作(其中包括数据整理:转换菜单)以及运用分析菜单中的设定表来定制表格。3.3 实验实践条件单人单机,SPSS183.4 实验实践背景知识简单的软件操作经验,二维表格的坐标3.5 实验实践内容1用数据data3,将受教育程度重新分段编码:小于等于8年的编码为1;9-12年的编码为2;13-16年的编码为3;17年以上的编码为4。2制表,表明不同受教育年限的各种职务的人数;不同受教育年限的各种职务的平均初始工资。性别做层变量。3.6 实验实践步骤1 变量重新编码单击转换菜单下的重新编码为不同变量设定输出变量名称为edufz,点击更改,然后点击旧值和新值点击 范围,从最低到值(G):8,然后新值那里填写1,然后点添加同理,范围从9 -12为新值2,点添加(如图所示)最终结果如下图,点继续,然后按确定,重新编码完成。接着修改变量属性,标准为序号,小数点默认2位去掉2 制表,根据要求,我们需要制2个表。点击 分析 设定表第一个表,在压缩视图里(因为要截屏所以我在压缩视图内),edufz为横坐标,jobcat为纵坐标,表明不同受教育年限的各种职务的人数第二个表,在原先的edufz后面加上salbegin.输出窗口双击表格可以查看层变量,负责这些表格到实验报告,本实验完成。3.7 思考题1 定义那里的摘要统计量和分类与总计是什么? 2制表时该如何选择横纵坐标才能使表格达到要求又美观?项目4:描述性统计分析4.1 实验实践课时2课时4.2 实验实践目的掌握利用频数表进行数据分析4.3 实验实践条件SPSSv184.4 实验实践背景知识统计学知识基础4.5 实验实践内容使用data4数据,利用频数表简单说明家庭收入(income)数据的分布情况。4.6 实验实践步骤由于本实验位考察题,考验同学们队数据的分组能力和分析能力,因此该教程只有指引没有具体教程。Step1:对数据进行分析,这里我们使用频率表。操作如下:1.分析描述统计频率在弹出的窗口选择统计量选择以下数值-单击确定完成。结果如下。统计量家庭收入(千)N有效6400缺失0均值69.4748均值的标准误.98398中值45.0000众数25.00标准差78.71856方差6196.612偏度4.513偏度的标准误.031峰度33.877峰度的标准误.061全距1107.00极小值9.00极大值1116.00和444639.00百分位数2528.00005045.00007579.0000Step2:对频率表进行分析,确定分组条件,进行重新编组(参照实验2),最后建立图表,分析结论。下面给出一种参考方式。因为操作简单所以不复制实验操作了。1. jtsrfz的数值分组为, 1=“=401”。2.频数分析(1)点击“统计量”按钮,弹出“统计量”子对话框选择输出的描述性统计量,包括“百分位值”选项栏中的四分位数;和“集中趋势”的全部选项,以及“离散”和“分布”的全部选项,点击“继续”确认。(2)在“频率”主对话框,点击“图表”按钮弹出“图表”子对话框,在“图表类型”选项框中选择“饼图”,点击“继续”确认。3.结论:由以下图表可以看出收入中等的中产阶层人数最多,说明社会群体收入大体相当,没有明显的贫富悬殊。4.7 思考题1.你的分组依据是什么?2.这个图表显示的是弄个国家的收入情况?项目5:均值比较与假设检验5.1 实验实践课时2课时5.2 实验实践目的掌握运用SPSS软件进行假设检验和参数估计的方法。5.3 实验实践条件Spss185.4 实验实践背景知识统计学假设检验相关章节5.5 实验实践内容评价两个培训中心的教学质量,对两个培训中心的学员进行了一次标准化考试,考试成绩如表中数据所示,分析两个培训中心的教学质量是否有所差异,得出统计分析结果,并推断结论。5.6 实验实践步骤Step 1.:打开本次实验的sav。Step 2.:点击变量视图把center中的度量标准改成名义Step 3.:点击分析比较均值独立样本T检验把学员成绩为检验变量把培训中心为分组变量定义组使用指定值组1为“1”,组2为“2”。 继续确定Step 4.:复制输出表格组统计量培训中心N均值标准差均值的标准误学员成绩培训中心A3082.508.0031.461培训中心B3877.6610.0361.628独立样本检验学员成绩假设方差相等假设方差不相等方差方程的 Levene 检验F1.350Sig.249均值方程的 t 检验t2.1552.213df6665.988Sig.(双侧).035.030均值差值4.8424.842标准误差值2.2462.188差分的 95% 置信区间下限.357.474上限9.3279.210Step5、实验结论1方差方程的 Levene 检验中的Sig=p=02490.05,表明接受原假设h0,即方差齐次。我们需要使用方差相等时的数据。2T检验sig=p=0.035培训中心B,且标准差培训中心A培训中心B,据此我们可以认为培训中心A教学质量优于培训中心B5.7 思考题1.本实验用到了那些统计学知识?2.为什么要把center的度量标准改为名义,不改为名义会出现什么后果?项目6:相关分析6.1 实验实践课时2课时6.2 实验实践目的掌握连续变量相关分析的操作方法。6.3 实验实践条件Spss186.4 实验实践背景知识连续变量,参数分析相关知识6.5 实验实践内容在数据data6中是474名职工的职务等级jobcat、起始工资salary、现工资salary、受教育程度educ、本单位工作经历jobtime、以前工作经历prevexp、职工编号id。分析该公司起始工资的确定与什么因素有关以及当前工资与什么因素有关。6.6 实验实践步骤Step1:打开data6,进入变量视图,将变量名id的度量尺度改为名义,jobcat的度量尺度改为序号,其他变量名salbegin、salary、educ、jobtime、prevexp的度量尺度改为Scale,其余不变。Step2: 选择菜单分析相关双变量,在弹出的对话框中,将待分析的7个变量(jobcat、salbegin、salary、educ、jobtime、prevexp、id)移入右边的变量列表框中。在相关系数选项栏中选择Kendall秩相关系数和Spearman秩相关系数,在显著性检验选项栏中选择双侧检验双侧检验,再选中标记显著性相关复选框,单击确定。Step3: 单击Paste按钮,在语法对话框中的id后面加上“with salary salbegin”点击运行。Step4:复制图表说明:Current Salary为当前工资,Beginning Salary为起始工资相关系数Current SalaryBeginning SalaryKendall 的 tau_bEmployment Category相关系数.530*.519*Sig.(双侧).000.000N474474Current Salary相关系数1.000.656*Sig.(双侧).000N474474Months since Hire相关系数.071*-.046Sig.(双侧).022.146N474474Beginning Salary相关系数.656*1.000Sig.(双侧).000.N474474Previous Experience (months)相关系数-.013.133*Sig.(双侧).677.000N474474Educational Level (years)相关系数.554*.568*Sig.(双侧).000.000N474474Employee Code相关系数-.077*.039Sig.(双侧).012.218N473473Spearman 的 rhoEmployment Category相关系数.645*.625*Sig.(双侧).000.000N474474Current Salary相关系数1.000.826*Sig.(双侧).000N474474Months since Hire相关系数.105*-.063Sig.(双侧).023.168N474474Beginning Salary相关系数.826*1.000Sig.(双侧).000.N474474Previous Experience (months)相关系数-.023.186*Sig.(双侧).625.000N474474Educational Level (years)相关系数.688*.688*Sig.(双侧).000.000N474474Employee Code相关系数-.114*.054Sig.(双侧).013.245N473473*. 在置信度(双测)为 0.01 时,相关性是显著的。*. 在置信度(双测)为 0.05 时,相关性是显著的。Step5:得出结论:(以下为参考)上表给出了Kendall秩相关系数和Spearman秩相关系数两种非参数相关分析结果。从表中可以看出:1.职务等级、当前工资和受教育程度3个指标与起始工资之间的相关系数都在0.5以上,对应的P值都接近于0,表示这3个指标具有较强的正相关关系;而本单位工作经历、以前工作经历、职工编号与起始工资之间的相关性较弱。2.职务等级、起始工资和受教育程度3个指标与当前工资之间的相关系数都在0.5以上,对应的P值都接近于0,表示这3个指标具有较强的正相关关系;而本单位工作经历、以前工作经历、职工编号与当前工资之间的相关性较弱。因此,该公司的起始工资与职务等级、当前工资和受教育程度这3个因素有关,其中当前工资的影响力最大;而当前工资与职务等级、起始工资和受教育程度这3个因素有关,其中起始工资的影响力最大。6.7 思考题这章不会写项目7:单因素方差分析7.1 实验实践课时2课时7.2 实验实践目的掌握运用SPSS软件进行假设检验和参数估计的方法。7.3 实验实践条件Spss187.4 实验实践背景知识统计学假设检验和参数估计相关知识7.5 实验实践内容在显著水平=0.05下,检验4种行业服务质量等级的总体均值是否差异显著,得出结论7.6 实验实践步骤Step1.:打开data7.sav,进入变量视图把trade中的度量标准改成名义Step2.:点击分析比较均值单因素anova把score为因变量把trade为因子;选项方差同质性检验,勾选;两两比较,勾选LSD,tamhanes t2,置信度为0.05.,分别按继续,最后确定输出表格。Step 3.:复制输出表格方差齐性检验scoresLevene 统计量df1df2显著性1.493319.249单因素方差分析scores平方和df均方F显著性组间731.1793243.72611.644.000组内397.6901920.931总数1128.87022多重比较因变量: scores(I) trade(J) trade均值差 (I-J)标准误显著性95% 置信区间下限上限LSDarewaysretailing-4.023812.54532.130-9.35121.3036hotel-13.45714*2.67887.000-19.0641-7.8502auto1.942862.67887.477-3.66417.5498retailingareways4.023812.54532.130-1.30369.3512hotel-9.43333*2.77033.003-15.2317-3.6350auto5.96667*2.77033.044.168311.7650hotelareways13.45714*2.67887.0007.850219.0641retailing9.43333*2.77033.0033.635015.2317auto1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论