生物统计第2章课件_第1页
生物统计第2章课件_第2页
生物统计第2章课件_第3页
生物统计第2章课件_第4页
生物统计第2章课件_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章 复习什么是生物统计?它在食品科学研究中有何作用?总体(population)与样本(sample)变量(Variable)与观测值(case)数值变量(numerical variable)分类变量(classified variable)参数(parameter)与统计量(statistic)准确性(accuracy)与精确性(precision)统计分析的两个特点是什么?如何提高试验的准确性与精确性?如何控制、降低随机误差,避免系统误差?总体样本样本结论选择性误差测量性误差混杂性误差 抽样分组测量 统计生物统计概况: 严密的研究设计; 避免可能的误差; 适当的统计计算;得出专业和统

2、计结论.第1章 复习SPSS软件的基本功能 SPSS软件的特点数据编辑窗口功能 数据窗口的组成结果输出窗口组成数据统计的基本过程及对应的SPSS菜单项 数据搜集和录入 变量视图(Variable view) 数据视图(Data view) 编辑(Edit) 数据整理 数据(Data),转换( Transform) 统计描述 报告 (Reports) 描述统计(Descriptive Statistics) 基础推断统计 比较均数(Compare Means) 相关分析( Correlation) 回归分析(Regression) 非参数统计(Non-parameter) 第2章 资料的描述性统

3、计分析教学要求掌握资料的分类及特点;统计表及统计图的基本类型、适用条件及制作原则;集中趋势及离散趋势的度量指标的特点及适用条件;描述统计的基本操作方法及应用。熟悉数据文件建立的方法及常用数据编辑整理方法;资料描述性统计分析的主要内容试验资料的搜集调查(普查、抽样调查)观测数据实验研究 试验数据原始数据审核、分组、汇总、描述和归纳异常数据的判断与处理核对数据,发现错误或极端值( 数据本身有无错误, 取样是否有差错, 不合理数据的订正)四分位数检验格拉布斯检验数据的分组与汇总以显示研究对象内部结构、类型和特征。资料的基本特征集中趋势和离散趋势特征列统计表、绘出统计图显示资料的基本特征和内在规律性

4、2.2资料的分类连续性资料(continuous data)离散性资料(discrete data) 统计分析的对象是统计资料,正确识别统计资料 的类型是合理选用统计分析方法的首要前提2.2.1连续性资料(continuous data)定义是在一定范围内可取任何实数值的数据资料。由测量或度量所得的数据,也称计量资料 (measurement/quantitative data)常用长度、重量、体积等单位表示。如身高(cm)、体重(kg/g)、Hb(g/L)、总铁结合力(mol/L)等定比/比率尺度(Scale)2.2.2离散性资料(discrete data)定义是在一定范围内只取有限种可能

5、值的数据资料。计数资料(counting data):同质性个体(单位)的某属性差异的整数计数所得的数据资料,用整数表示。脉搏数、红细胞数、中毒人数、动物死亡数、病人治疗有效数数据的相互转化定量数据的离散化年龄儿童、青年、中年、老年有序分类数据的数量化将有序分类数据(-、+、+、+)赋予一个合适的数量(0、1、2、3)2.3 数据的频数(率)分布频数(率)分布反映一组数据中不同观测值的出现频率。频率(数)表用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。2.3.2 连续性资料的频率分布连续性资料的频率分布要先将资料进行分组,然后将各个观测值分别归入相应的组内,计算各组中观测值

6、的频数和频率。根据资料中观测值的多少确定是否分组。当观测值不多(n30)时,不必分组,直接进行统计分析。当观测值较多(n30)时,宜将观测值分成若干组,以便统计分析。 (1)数据分组(表2-4)将观测值的值域划分为若干个两两不相交的长度相同的区间,每个区间为一组。分组步骤求全距:样本数据资料中最大观测值与最小观测数的差值。它是整个样本的变异幅度。19.3-8.5=10.8确定组数:取决于样本容量样本容量在30以下小样本不必分组;样本容量在30以上须将数据分成若干组。 N=200, K=12样本容量与组数的关系样本容量分组数306058601007101002009122005001018500

7、以上1530确定组距:每组的最大值与最小值之差为组距。组距=全距/组数 i=10.8/12=0.91确定组限和组中值:组限是指每个组变量的起至界限。有上、下限。下限包括最小值。8.5末组上限包括最大值。19.3组中值=(组下限+组上限)/2 k1 组中值=8.5组下限=组中值-0.5组距 k1 组下限=8下一组组中值=上一组组中值+组距 k2 组中值=8.5+1=9.5开口式分组(2) 计算频数(率)分布编制频数分布表:按原始资料中各观测数的次序把各个数值归于各组,可求出各组中观测值的频数及频率频数/率分布表频数/率分布图: 条图/直方图频数表的应用频数表可用于揭示资料的分布特征和分布类型 2

8、.3.3 百分位数又叫百分位点,将一组n个数据由小到大排序,如果小于某数值的数据个数为全体数据个数的x%, 则称该数为第x百分位数,或x%分位数25%分位数下四分位数50%分位数中位数75%分位数上四分位数统计表的基本要求线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可用横线将合计分隔开来。数字:按小数位对齐。备注项:在表中以*表示,在表下方说明。回头表(表2-5)统计表基本格式总横标目(或空白)纵列标题合 计横行标题表体(数字资料) 合 计表号 XXXXXXX(标题) 统计表-例2(简单表)统计表例3(复合表)

9、表3. 非石棉肺组与石棉肺组的一般情况调查 分组非石棉肺组患石棉肺组P值性别男44(32.6%)20(37.0%)0.05女91(67.4%)34(63.0%)吸烟吸烟31(23.0%)12(22.2%)0.05不吸烟104(77.0%)42(77.8%)饮酒饮酒23(17.0%)4(7.4%)0.05 不饮酒112(83.0%)50(92.6%)Table 4. Effect of XRCC1 polymorphisms on DNA damage in workers-exposed asbestosGroups XRCC1Comet scores(mean S.D.)GenotypeN(

10、%)DNA damageH202-inducedAfter repairasbestosisGln /Gln23(45.1)40.2618.94*162.3623.03*65.4525.94*Arg /Arg16(31.4)32.0111.65129.7933.1547.2612.04Gln/Arg12(23.5)38.0328.22140.5427.7253.2215.44Non-asbestosisGln /Gln12(22.6)25.5811.08118.5746.2346.5818.27Arg /Arg22(41.5)29.3810.15123.2839.3044.0414.58Gln

11、/Arg19(35.8)37.0814.74127.4036.2743.1714.62note: *compared with Non-asbestosis, P0.05; *compared with Non-asbestosis, P0.01StatisticsExample4(multiple table)2.5统计图统计图概念是根据统计资料所绘制的图形。它借助点的位置、线段升降,直条的长短或面积大小来表现事物的数量关系。它可以把统计资料所反映的基本特征、变化趋势、数量多少、分布状态和相互关系等情况形象直观地表现出来。统计图特点简单、直观:使用统计图代替冗长的文字叙述,可提升统计报告的可

12、读性将数据形象化,易领会统计资料的核心内容,便于理解、 分析、比较和记忆。2.5.1 常用统计图的类型条形图(Bar Chart)直方图(Histogram)饼图/圆图(Pie Chart)线形图(Dynamic curve graph/Line charts)面积图(Area)散点图(Scatter Plot) 质量控制图(Control Chart)箱图(Boxplot)(1)条图(Bar chart)利用宽度相同的条形的长短来表示绝对数或相对数大小或变动情况的统计图。适用于分类资料和离散性数量资料的频率分布条形间留有一定的空间,以示非连续性。多个组或多个类别的统计量(如例数、相对数、均数

13、等)宜选用直条图。单式条形图只涉及一个测定指标的分类资料和离散性数据资料复式条形图涉及2个或2个以上指标的分类资料和离散性资料某地1952年与1972的三种疾病的死亡率图2-2 某地150名正常成年男子红细胞数(1012L)频数分布图(2)直方图(Histogram)是用矩形的面积来表示各组中数据出现的频数(率)适用于连续资料的频数(率)分布。矩形面积间不留空隙以示数据连续性(3)饼图(Pie chart)对于类别不多的分类资料的频率分布,可用饼图表示。多用以描述百分构成比资料。圆的总面积为所有类别频率之和,其值为100%各扇形面积表示不同类别的频率可用不同颜色区分石棉作业工人基因多态的分析图

14、1. 石棉工人基因型分布构成 图2. 文献中基因型分布构成 (4)动态变化趋势图或线形图(Dynamic curve graph/ Line Charts)趋势图主要用于表示数据的动态变化趋势主要用于表示现象在时间上的变化趋势和现象间的依存关系等。/用以描述某一(些)变量随时间变量变化的关系。一般取时间变量为横轴(X轴),并定义为分类变量。简单线图只涉及一个指标图1 某地伤寒死亡率动态趋势复合线图一张图上反映多个指标,可用来现线型或不同颜色区分各指标复合线图 图3 沙尘暴颗粒物PM2.5、PM10 对巨噬细胞的细胞毒性(5)散点图(scatter plot/ diagram /graph)对于

15、n对成对数据测定的两个变量样本,如果直角坐标的纵轴和横轴分别代表两个变量,则这n对数据就可作n个点,这个n个点构成的图表明两个变量的关系凝血酶浓度(单位/毫升) 凝血时间(min)图 15例健康成人凝血时间与凝血酶浓度间的关系2.5.2 统计图绘制的基本要求根据资料性质和分析目的正确选用适当的统计图。标题简明扼要(概括统计图资料的时间、地点和主要内容),位于统计图的下方。注明横轴和纵轴的标题内容及单位横标目纵标目纵横轴的比例一般以45:56用不同线条或颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。常用统计图小结直方图:用矩形的面积来表示各组中数据

16、出现的频数,适用于连续性资料的频率分布。条图: 用以描述按性质分组的各组某项指标值(均数、中位数、总和等)的大小或离散性资料的频率分布单式条图:1个分类变量复式或分段条图:2个分类变量线图: 用于描述某一(些)变量随时间/剂量变化的关系(剂量-反应/效应)变化趋势圆图: 用于描述构成比资料变量分布的基本特征集中性度量平均水平指标离散性度量变异程度指标2.6集中趋势的度量 平均数:平均数是计量资料的代表值,是表示资料中变量分布的中心位置的指标,并且可作为资料的代表与另一组资料相比较,以确定二者相关的情况。 一组性质相同的计量数据分布不同,需要用不同平均指标来表达,因此有不同种类的平均值2.6.1

17、.算术均数(arithmetic mean )定义:算术均数简称平均数或均数,其数学意义是将所有数值相加,再除以数值的个数。算术均数是最常用的一种集中趋势指标。适用于对称或近似对称的数据资料.一组性质相同的、单峰的均匀的小样本数据或近似正态分布的大样本数据。计算公式: X1, X2, ,Xn 为各个观察值,n为观测值个数(样本含量), 为求和的符号。例:2.1分组资料, 如果同一类另的个体在某个指标上都取相同的数据,则可用加权法来计算平均数K为类别数; Xi为第i类个体在该指标上的取值;fI为第i类中的频数,即Xi的权重;pi为第i类个体的相对频率,所有频率的和为1。例2.2算术均数的重要持性

18、样本中各观测数与其平均数之差(离均差)的总和等于零。样本中各观测数与其平均数之差平方的总和,较各观测数与任一数值离差的平方和为小,即离均差平方和为最小。a为不等于 的任意实数算术均数的作用指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平作为样本或资料的代表数与其他资料进行比较。2.6.2几何均数(geometric mean)定义:n个观察值,其相乘积开n次方所得根/性质相同的定量数据分别取对数变换后,按算术平均数计算,然后再求其反对数所的结果,常用G来表示。主要用于以百分率、比列表示的数据资料,如增长率、利率、药物效价、抗体滴度等。用以描述对数正态分布或数据呈倍数变化

19、资料的水平。其数学意义为n个变量的乘积开n次方的根值。计算公式 分类或已得出频数分布的计数和连续性资料,用加权法计算几何平均数例 2.3、2.4例: 求5份样品血清抗体效价分别为1:10、1: 100、1:1000、1:10000、1:100000的效价倒数的平均水平。用算术均数计算:均数=22222,偏大用几何均数计算: lgG=lg10+lg100 +lg1000+lg10000+ lg100000/5=3 G=1000 平均滴度为1:1000(合适)2.6.3中位数(median)定义:一组变量中,按数值大小排列,位于中间的一个变量的数值称为中位数(M)。是一个特定的百分位数,即P50。

20、只受居中变量波动的影响,因而不够敏感。可以应用于任何计量资料,通常用于不适合用几何平均数和调合平均数的中,尤其适用于包含不完全信息的资料中。不受个别特大值或特小值的影响,比较稳定,故常用于描述偏态资料分布数据的集中趋势。尤其适合于大样本偏态分布的资料。例题2.7计算:将n个数据从小到大排列,n为奇数时取位次居中的变量值;n为偶数时,取位次居中的两个变量的均值。n为奇数时 n为偶数时分组资料2.6.4 众数(modeM0)众数是指样本中出现次数最多的那个数值。频率分布表中出现频率最高的数值如果数据以组分类,众数为频数分布表频数最高一组的组中值。数据最多的组称为众数组。一般来说,一批同质变量的分布

21、中只有一个峰,众数只有一个。当有可能从两个不同分布总体中抽出的混合样本或样本含量过少、分组过细时可发现有两个或多个峰。众数在流行病学实际工作中较常用,如确定某一疾病暴发的高峰、某次食物中毒的潜伏期等。 在正态分布中,众数等于中位数和算术均数。有20例高血压病人的发病年龄(岁)为:58, 42, 45, 48, 51, 52, 54, 55, 55, 58, 58, 61, 58, 61, 62, 62, 58, 53, 57, 56, 试求众数。2.6.5各均值之间的关系及评价算术平均值、几何平均值都要用到每一个数据的具体值才能计算出来中位数和众数只需要知道数据的个数和相对大小就可确定,因此对

22、资料信息的利用率低,准确度不如前两个算术均数和几何均数的资料还可计算标准差与之相配,可以解释更多的问题,因此应用较广2.6.5各均值之间的关系及评价关系完全对称分布(正态分布)时: 均数中位数众数偏态分布 时: 正偏态分布时:均数 中位数 众数负偏态分布时:均数 中位数 众数2.7离散趋势的度量(Dispersion dedency)离散趋势的度量用离散指标, 用来描述观察值参差不齐的程度,即离散度或变异度。用来反映集中趋势的代表程度若样本观察值间变异程度小,则平均数的代表性就好;若观察值间变异程度较大,则平均数代表性就差。 设有甲、乙、丙三名医生,分别对相同的5份血样进行红细胞计数(万/mm

23、3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,见下图2,三名医生的计数结果得到的均数均为500,5个数值之和均为2500。甲医生得出的5个观察值间的差异(离散程度)较大,而丙医生得出的5个观察值间的差异(离散程度)较小。2.7.1方差(variance) 定义:方差也称均方差,表示一组数据的平均离散程度。离均差和=离均差平方和(SS): SS= =离均差平方和例SS甲=(60-80)2+(70-80)2+(80-80)2+(90-80)2+(100-80) 2=1000SS乙=(70-80)

24、2+(75-80)2+(80-80)2+(85-80)2+(90-80)2=250SS丙=(60-80)2+(75-80)2+(80-80)2+(85-80)2+(100-80)2=850可见SS甲SS丙SS乙,可较好区分三组变异程度.两个样本含量不同, 那么用离均差平方和就缺乏可比性, N大, 也大。方差:离均差平方和除以N,就得到了平均方差(MS),简称方差计算公式:样本方差总体方差n-1在统计学中称自由度(df)。s2是2的最好估计值由于变异程度越大,则离均差平方和越大,方差也就越大。方差越大,说明个体变异越大,则平均数的代表性就越差方差越小,说明个体变异越小,则平均数的代表性就越好方差

25、是平均水平与离散程度的综合分析。2.7.2 标准差(standard deviation)标准差是方差的平方根,也称根均方差。使得量纲(单位)与原变量值相同。计算公式: 样本标准差 总体标准差 由于标准差考虑了每个观察值与均数的差距,其反映观察值离散程度的代表性较好,故应用最广,适合于均匀分布或近似正态分布的资料.标准差的应用表示观察值变异程度(离散程度)结合均数可计算变异系数结合均数计算正常值范围。结合均数描述正态分布的特征。例2.82.7.3范围(range)定义:范围又称全距或极差,是一组变量中,数值最大的变量与数值最小变量之差。R=max(X)-min(X)用于资料的粗略分析,适合于任

26、何分布的资料,计算简便但易受个别极端值的影响,结果不稳定。只受样本中两个极端数据的影响,没有利用全部资料的观察值的信息,它不能代表各个观测数的变异程度,它只能在研究小样本的波动时使用,具有一定的局限性。 2.7.4变异系数(coefficient of variation,CV) 定义:变异系数是以均数为基数来衡量标准差大小的统计量。表示样本标准差与均数的比值,以百分数表示。计算公式: 变异系数可以消除单位 和 (或)平 均数不同对两个或多个资料变异程度比较的影响。比较均数相差悬殊的几组资料的变异程度(同类型观察指标但均数相差悬殊)比较度量衡单位不同的几组资料的变异程度(不同类型的观察值标)变

27、异系数大,表明变量的离散程度大。它没有衡量单位,因此,消除了原资料平均水平不同的影响。 例2.9例:比较20岁男子100人身高与体重的变异程度:身高CV=4.95/166.06100%=2.98% 小体重CV=4.96/53.72100%=9.23% 大(不整齐)极差、标准差及变异系数的适用范围这些指标均反映计量资料的离散程度。极差可用于任何分布标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。SPSS数据文件的建立及编辑数据文件建立的步聚选定数据文件定义变量:建立数据文件的框架结构数据录入保存数据数据文件的建立SPSS的数据文件:

28、 “*.sav”在SPSS环境下新建立数据文件从SPSS外部调用已建立的数据文件在数据编辑窗口(Data Editor)内直接输入数据,即形成数据文件数据区单元格里的具体数据,无论它表现为数字、文字、日期或符号,统称为数据。选定单元格:由黑框突出的单元格.不能同时打开多个数据文件有利于数据修改、核对和积累可以一次录入,多次反复使用定义变量-variable view变量名(Name)变量类型(Type)变量长度(Width)变量标签(Lablel)值标签( Values)单元格宽度(Columns)对齐方式(Alignment)缺失值(Missing)测度(Measure): Scale; N

29、Ominal; Ordinal变量类型(type)三种变量类型数值型(numeric)字符型(string)日期型(date)数值型: 标准数值型(Numeric)、逗号数值型(Comma)、 圆点数值型(Dot)、带美元符号$型(Dollar)、 科学记数法(Scientific notation)、自定义型(Custom currency)系统默认:变量宽度为8,小数点位数为2 标准数值型变量变量值标签(value labels)是对变量的可能取值附加的进一步说明,通常仅对分类变量的取值指定变量值标签。变量水平的赋值变量值标签Add值标签清单在输出结果的相应位置上会出现值标签变量测度(me

30、asure)按度量精度将变量分为三类:定量变量(Scale) :是测量的最高水平,数值可以是两个测量间的差距(区间测量),也可以是两个测量间的比值(比例测量)。如身高、体重、血压等测量值定序变量(Ordinal) :又称有序变量、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。定序变量的取值称定序数据或有序数据,病症转归记录死亡、无效、好转、治愈定性变量(Nominal) :又称分类变量,测量精度最低,最粗略的基于“质”因素的变量,它的取值只代表观测对象的不同类别,例如姓名、性别、血型记录(A、B、AB、O型)。数据的整理(Data)对已建

31、立的数据文件进行编辑、修正、补充或删除等的过程三组菜单数据编辑数据结构数据选择1 数据编辑 对已建立的数据文件进行编辑、修正、补充或删除等的过程。变量与观测值的插入与删除 数据(Data)插入变量/个案(Insert variable/ case) 编辑(Edit)剪切(Cut) 编辑( Edit)清除(Clear) 删除(Delete)数据的查寻按观测量序号查寻单元格的位置数据( Data)转至个案(Go To Case )(1) 数据的排序(Sort Cases ) 按某个变量值重新排列各观测量在数据文件中出现的顺序数据(Data)对个案排序(Sort Cases )打开对话框排序方式(S

32、ort by)排序顺序(Sort Order): 升序(ascending ) 降序(descending)单击确定, 返回数据窗口, 分类排序结果显示于数据窗口内当选择多个变量,系统将按变量选择的先后依次排序2 数据结构(2)数据的转置(transpose) 将原始数据的行和列进行互换数据转至个案设定转置后数据的新变量名:字符型不变,数值型则以V 开头其后为原数值字符型变量不能实现转置不选择变量移入Name Variable,系统自动转置后的新变量名为Var001、 Var0022.数据结构 (3) 数据文件的合并(Merge Files) 把外部数据与当前数据合并成一个新的工作数据表,新工

33、作数据增加时,外部数据与当前数据应是按升序排列的数据文件.数据(Data)合并文件(Merge Files) 纵向合并(增加观测量)将一个外部SPSS数据文件的内容追加到数据编辑窗口当前数据的后面。合并后新数据文件的观察单位数应为两文件之和。数据合并文件 增加观测值(Add cases)横向合并增加变量 是指将一个外部文件中的若干变量添加到当前工作文件中数据合并文件 增加变量(Add Variable ) 要求:两个数据文件必须具有一个共同的关键变量(key variable)关键变量指的是两个数据文件中变量名、变量类型、变量值、排序完全相同的变量两个文件中的关键变量具有一定数量的相等的观测量

34、数值3 数据选择(1)观察值的加权加权个案 观测值的加权功能是设定某变量为频数变量。权重是统计学里的一个重要概念。所谓权重即同一个观测量值在大量观察和试验中出现的次数,或频数。在统计计算中里常需对数据进行加权处理数据(Data)加权个案(Weight cases)(2)观察值的选择选择个案有时为了进行特定的分析,需要从所有数据资料中选择出一些数据进行统计分析。DataSelect Casesall cases(选择所有的行),该选项可用于解除先前的选择if condition is satisfied(按指定的条件选择) random sample of cases(对观察单位进行随机抽样)

35、approximately 大概抽exactly精确抽样based on time or case range顺序抽样use filter variable用指定的变量作过滤 (3) 拆分文件(Split File)观测量的分组分析 将观测量按一个或几个分组变量分成一些供统计分析的分组执行数据(Data)文件拆分(Split File)按变量分组分析所有观测量,不进行分组(系统默认)Analyze all cases, do not create groups比较分组Compare groups按分组变量组织输出结果Organize output by groups数据转换(Transform

36、)原始数据进行适当的转换简单的变量变换重新建立分类变量复杂的统计函数运算及逻辑函数运算(1)变量计算及转换根据已有的统计指标计算新的指标函数运算转换变量的类型,给变量赋予新的数值数据转换功能(1)计算产生变量(Compute)计算产生变量是指已存变量经函数计算建立新变量或替换原变量值基本运算:算术运算、关系运算及逻辑运算 表达式是指利用运算符将常量、变量、函数连接在一起而形成的式子算术表达式关系表达式(比较表达式)逻辑表达式计算产生变量(Compute)变量计算及其应用对数变换 平方根转换倒数变换(2)变量的重新赋值重新编码 在数据编辑过程中,可对观测量的数值重新赋予新值。Transformr

37、ecode这种操作只适用于数值型变量。可通过IF按钮来确定参与重新赋值的个案。变量的重新赋值不能进行运算,只能根据指定变量值作数值转换,且这种转换是单一数值的转换。重新赋值为同一变量(变量自身重新赋值) Transform Into Same Variables重新赋值为不同变量 Transform Into Different Variables(3) 变量秩的确定个案排秩在某些统计分析进程中(比如:秩合检验)需要对变量的秩次进行分析。SPSS提供了该功能。此种排序是根据某变量观测值的大小,按一定顺序排秩,生成一代表其秩次的新变量,数据本身顺序不变。转换(Transform )排轶( Ran

38、k Case)选变量调入Variable(s)Assign Rank 1 to(秩次排列方式)Rank Types(排序类型)相同值取秩方式SPSS的统计描述过程集中趋势指标(Central Tendency): 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median) 百分位数(percentile) 众数(mode)离散趋势指标(Dispersion):标准差( Std. Deviation)/标准误(S.E.mean)方差( Variance)极差( Range)Distribution 分布指标Skewness偏度:这个统计量是与正态分布相比较的

39、量.偏度的绝对值数值越大表示分布形态的偏斜越大。Kurtosis峰度:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量。主要描述统计过程(descriptive statistics)频数分布分析(Frequencies)描述性统计分析(Descriptives)探索性分析(Explore)分析(Analyze) 描述统计(Descriptive Statistics) 频率/描述/探索process1 频数分布分析(Frequencies)频数分布分析主要通过频数分布表、直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征分析(Analyze) 描

40、述统计(Descriptive Statistics ) 频数分析(Frequencies)变量(Variable):统计量(Statistics): 集中趋势指标(Central Tendency) / 离散趋指标(Dispersion) / 分布指标( Distribution )图形(Charts):直方图(Histogram)在此过程可以产生算术平均数、中位数、众数、合计值、标准差、方差、最大值、最小值、极差、标准误等统计值。并可绘出分组资料的统计图。2 描述性统计分析(Descriptives)描述性统计分析主要用以计算描述集中趋势和离散趋势的各种统计量,并可对变量进行标准化处理。用于连续型变量统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论