《数据整理》PPT课件.ppt_第1页
《数据整理》PPT课件.ppt_第2页
《数据整理》PPT课件.ppt_第3页
《数据整理》PPT课件.ppt_第4页
《数据整理》PPT课件.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/6/10,第二章 资料的整理,2019/6/10,次数分布表的编制 完全随机分组 常用统计图,2019/6/10,一、次数分布表的编制,打开SPSS,调入数据:程序盘spss下car.sav数据,对accel标签下的数据进行编制分组。如例,2019/6/10,选中变量“Time to Accelerate”点弯箭头选入变量框中,再按Options按钮出现如下图。,求accel变量的平均数、标准差、最大值、最小值、全距(极差): Analyze(分析)Descriptive Statistics(描述性统计)Descriptives(描述统计分析)。弹出对话框,2019/6/10,选中Mean(平均数)、Std.deviation(标准差)、Maximum(最大值)、Minimum(最小值)和Range(全距)。 Continue OK,2019/6/10,406个样本的平均数15.50,标准差2.821,全距R17,最大值25,最小值8,结果输出框,2019/6/10,根据样本含量初步确定分为10组。 组距=全距/组数=17/10=1.7=2 第一组下限=最小值-1/2组距=8-(1/2)*2=7 即分组的组限依次是:7、9、11、13、15、17、19、21、23、25。,分组,2019/6/10,计算各组段中的次数: Transform(转换)Compute Variable(计算),弹出计算变量的对话框,2019/6/10,选中“Time to Accelerate”变量将其置入条件表达框内,依次输入“=7& Time to Accelerate9”,“继续”,“确定”。,在Target Variable(目标变量)栏键入变量名“次数”(用于表示观察值所属的组段),在Numeric Expression(数式)表达框内输入第一组代码“1”。 按左下方“If”钮出现,弹出对话框。选中Include if case satisfies condition(包括、如果观测量满足),意为对符合下列条件的观察值进行操作。,2019/6/10,此时数据编辑窗口中最后产生一个名为“次数”的新变量名。凡Time to Accelerate在79(不包括9)的记录,其相应“次数”列的值为1,如图。,2019/6/10,重复上述转换的操作,不同的是这次代码改为2,输入时应为“=9& Time to Accelerate11”。依此类推,完成10个组段的操作。,2019/6/10,注意: 在进行第二组的分组操作过程中,将会产生一个对话框,其意是是否改变现有的变量?(Change exsting variable?),此时可按“确定”按钮以取代进行第一组分组过程中所产生的缺省值。,2019/6/10,此时次数变量中产生110个相应的代码。 对新产生的次数变量在Variable View(变量窗口)中进行变量定义方便以后识别。在此我们定义的是各个代码,所以选Value(数值标签),点击编辑。,2019/6/10,在Value(值)这一栏输入代码“1”, Lable(数值标签)”这一栏输入“7”,点“Add”按钮,该标签进入框中。“Change(修改)”和“Remove(移除)”按钮可对输入的内容进行修改或删除。 依次定义十个代码,点击OK。,2019/6/10,将“次数”变量选中置入变量框中;OK。,Analyze(分析)Descriptive Statistics(描述性统计)Frequencies(频数)。弹出:,求各组段次数(频数),2019/6/10,2019/6/10,三、动物完全随机分组,试验动物进行分组时必须使用随机分组的方法。利用SPSS统计软件根据动物初始条件(初始重)对实验动物进行随机分组既方便又迅速,并且各处理组间的均衡性也较好。,2019/6/10,现有同品种、同性别、体重相近的健康断奶仔猪18头,试用完全随机的方法,把它们等分成甲、乙、丙3组,每组6头。仔猪分别称重(kg)、编号,数据如下表,2019/6/10,1、数据输入 在SPSS数据工作表建立两个变量名:体重和编号。将18只仔猪体重和编号输入到各自变量的单元格内。,2019/6/10,随机第二章 数据整理完全随机分组.sav分组案例,2019/6/10,选中Random sample of cases(观测量的随机样本),按Sample (样本) 按钮,弹出对话框,2、单击Data(数据)Select Cases(观测量选择) 弹出如下对话框,2019/6/10,选中Exactly(精确):在Exactly后小方框内输入6,在 from the first后的小方框内输入18(意思是从18例中随机选取6例); Continue; OK 在SPSS工作表中产生一个变量名为“filter_$”的变量;可以发现被选中的动物号码单元格中的数为1,未被选中的为0.,2019/6/10,Filter_$Sort by(按排序)框内,OK 此时所选动物号码及体重便排列于SPSS工作表的最下方,3、单击Data(数据)Sort Cases(观测量排序)命令,2019/6/10,2019/6/10,4、用鼠标选中位于SPSS数据工作表下方的动物号码及体重,单击右键,选中cut命令,用剪贴板的功能将所选动物的号码及体重粘贴到Excel工作表中。 可将此次选中的6只动物归入第一组 5、重复上述13步操作,每次操作应将“Exactly”中“from the first”后的小方框内的数改变一下,如在选择第二组时,可改为12,直至剩最后一组为止。,2019/6/10,分组结果如下表,各组动物体重经方差分析,组间无统计学差异(F0.026,P0.9740.05),各组间体重差异不显著,说明均衡性较好。,2019/6/10,条形图: 单式条形图 复式条形图 圆形图 线 图 : 单式线图 复式线图 直方图,SPSS软件提供了许多产生统计图形的方法:,三、常用统计图,2019/6/10,某水稻杂种第二代植株米粒性状如下,请绘制性状分离条形图。,条形图:一般用于(归类)资料,主要使用于彼此独立的资料相互比较。,条形图单式条形图,2019/6/10,1、数据输入 在SPSS定义变量(Variable View)工作表中,分别用Name命令设置两个变量“米粒性状”“次数”。这里因为米粒性状是文字,我们要将它的变量类型进行修改,选中“String(字符串)”,变量“次数”的小数位数定义为0。 在Data View(数据视图)工作表中输入数据,2019/6/10,选中“Summaries for groups of cases(观测量组的摘要)”。 “Define(定义)”按钮,出现如下对话框,2、GraphsLegacy DialogsBar Simple,2019/6/10,选中“Other statistic(其他统计量)”,在Variable(变量框)中选入“次数” Category Axis(分类作标轴)选入“米粒性状”,OK。,2019/6/10,显示各米粒性状的条形图,2019/6/10,例:下表为几种动物性食品的营养成分,试绘制复式条形图。,2019/6/10,1、数据输入 在SPSS定义变量(Variable View)工作表中,分别用Name命令设置七个变量:品别、蛋白质、脂肪、糖类、无机盐、水分、其他。其中“品别”Type列中选中String(字符串)。其他变量(Decimals)小数位都定义为1,如图所示:,2019/6/10,上例的资料的变量命名 在Data View(数据视图)工作表中输入数据,2019/6/10,在Data View(数据视图)工作表中输入数据,如图所示 数据输入格式,2019/6/10,在Bars Represent(条形表示框)下选入“蛋白质”、“脂肪”、“糖类”等,“品名”选入变量框; OK。,条形图复式条形图,GraphBarClustered(聚类),选中“Values of individual cases(单个观测量的数值)”Define定义:,2019/6/10,几种动物性食品的营养成分(条形图),2019/6/10,圆形图(饼图),圆形图一般用于表示计数资料、质量性状资料等的构成比。圆形图是以圆的半径将圆面分割成多个大小不等的扇形来表达构成比,例:牛肉的蛋白质含量为19.2%,脂肪含量为9.2%,其他成分为71.6%,请用圆形图比较牛肉不同营养成分的构成比(%)。,2019/6/10,1.数据输入 变量命名方法参见上述例子,数据输入格式如下,2019/6/10,Slices Represent(切片表示):Sum of variable(变量总和)-选入变量”百分比“ 变量“营养成分”选入“Define Slices by(按定义切片)”中。 OK,2.Graph(图表)Pie(饼图)Summaries for groups of cases(观测量组的摘要)Define(定义):,2019/6/10,牛肉的不同营养成分构成比,2019/6/10,线图,线图适用于连续性计量资料,表示事物或现象因时间、条件的变化而变迁的趋势。 常用的线图有单式线图和复式线图,2019/6/10,单式线图:表示某一事物或现象的动态,例:某猪场长白猪从出生到6月龄出栏平均体重的变化如下表所示,根据该资料绘制单式线图,以表示该猪场长白猪体重(kg)随月龄变化的情况。,2019/6/10,1、数据输入 在SPSS定义变量(Variable View)工作表中,分别用Name命令设置两个变量:月龄、体重。Decimals(小数位)依题意分别定义为0和1。 在Data View(数据视图)工作表中输入数据。,2019/6/10,2019/6/10,2019/6/10,长白猪体重的变化,Graph(图表)Line(线图)Simple(简单线图)选中 “Summaries for groups of cases(观测量组的摘要)” Define(定义):Other statistic(其他统计量):变量“体重” Category Axis分类坐标轴:月龄 OK。,2019/6/10,复式线图:在同一图上以两条或两条以上曲线表示不同性质或对象的某变量随时间条件变化而发生变化的趋势。,例:长白猪、大约克、大白猪三个品种,从出生到6月龄出栏平均体重(kg)的变化如下表所示,根据资料绘制复式线图,2019/6/10,1、数据输入 SPSS定义变量(Variable View)工作表中,分别用Name命令设置四个变量:月龄、长白猪、大约克、大白猪。变量“月龄”小数位(Decimals)定义为0,其他变量小数位依题意都定义为1. 在Data View(数据视图)工作表中输入数据,2019/6/10,2019/6/10,Graph(图表)Line(线图)Multiple(多重线图),选中“Values of individual cases(单个观测量的数值)” Define(定义):Lines Represent(线形表示框):选入变量三种猪的名称 Category Labels类型标签: 选入变量“月龄” OK。,3个品种猪体重的变化,2019/6/10,直方图,直方图适于表示连续性资料的次数(即频数)分布。,横轴表示被观察的指标,纵轴表示频数或频率,以直条的面积代表各组段的频率或频数。 这里的组段是由spss系统根据原始数值的最大、最小值自动对变量分组,画出直方图。,2019/6/10,操作: 调入数据(分组数据Time to Accelerate )。 Graph(图表)Histogram(直方图): 变量框中置入“次数” OK。,2019/6/10,右下方显示的是平均值mean 、标准差std.dev、样本含量N。 可以看出变量Time to Accelerate分组后第5组和第6组所占频数最多。,2019/6/10,图中的组距和组数都是系统自动生成的。如果要修改组数等,可以在图形编辑窗口中改变。直接双击直方图的横轴,则开启如下所示Properties对话框,2019/6/10,系统默认 Histogram Option 选项,其主要说明如下,(1)Display normal curve 选中此项,在输出直方图时,同时显示正态曲线。 (2)Anchor First Bin栏 Automatic 系统根据变量的最大、最小值自动选择直方图第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论