版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第6 6章章 分类变量的统计描述与参数估计分类变量的统计描述与参数估计6.1分类变量的统计描述概述6.1.1分类变量的统计描述指标体系一、频数分布情况描述各个类别的样本数和所占比例分别称为频数(绝对频数)和百分比(构成比)。累计频数是指本类别及较低类别出现的次数之和,累计百分比则是指本类别及较低类别出现的次数之和占总次数的百分比。根据类别的有序性,分类变量可以分为有序分类变量(Ordinal Variable)和无序分类变量(Nominal Variable)。当集中趋势显著时,用众数(Mode)作为总体的代表值。二、集中趋势的描述二、集中趋势的描述所谓众数,使之出现次数最多的那个数。如果只
2、有一个众数称为单众数,多于一个的称为复众数。(1)比(Ratio):比指的是两个有关指标之比A/B,用于反映两个指标在数量/频数上的大小关系。三、使用相对数进行深入描述三、使用相对数进行深入描述(2)构成比()构成比(Proportion)总样本数某一组成部分的样本数构成比 象数该时期开始时的观察对对象数观察期内发生某事件的某事件的发生率 率是一个时间概念,或者说具有速度、强度含义的指标,用于说明某个时间发生的频率或强度。分观察对象为K部分(A1、A2、Ak),其中某一个/多个部分的例数占总例的比例为构成比,它描述某个事物内部各构成部分所占的比重。(3)率()率(Rate)6.1.2 分类变量
3、的联合描述当一共有两个分类变量时,这汇总因分类变量的各类别交叉而成的复合频数表被称为行*列表,也称列联表。当观察的现象与两个因素有关时,如某种服装的销量受价格和居民收入影响;某种产品的生产成本受原材料价格和产量的影响等等,交叉列联表分析可以比较好的反映出两个因素之间有无关联性,两因素与现象之间的相关关系。因此,数据交叉列联表分析主要包括两个基本任务:1、根据收集的样本数据,产生二维或多维交叉列联表;2、在交叉列联表的基础上,对两两变量间是否存在关联性进行检验。jjiiiijjjijinnnnnnn.,个。类的有于类又有属个个体中既有属于。,类:有,属性,类:有进行分类。属性和个个体根据两个属性
4、列联表为例。假设有以二维的ijjic21r21nBAnBBBcBAAArABAncr6.1.3 多选题的统计描述多选题的统计描述 多选题的描述指标体系在多选题分析中比较特别的描述指标有:(1)应答人数:是指选择了本项人数。(2)应答人数百分比(Percent of Cases):选择该项的人占总人数的比例。(3)应答人次:选择本选项的人次。(4)应答次数百分比(Percent of Responses):在作出的选择中,选择该项的人数占总次数的比例。6.1.4 分类变量的参数估计分类变量的参数估计1 二项分布的参数估计一、二项分布二项分布又称为贝努里(Bernoulli)分布,是一种具有广泛应
5、用的离散型随机变量的概率分布。二项分布研究的是试验仅有两种结果的分布(这种试验称为贝努里试验),如某产品质量合格与不合格等。其定义为:设有n 次试验,各次试验是相互独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是1-p,记为q,则对于某事件出现k(k=0,1,2, ,n)次的概率分布为: 二、二项分布的参数估计当n较大时,p不接近0也不接近1时(一般认为n 40, np 5和nq 5),二项分布B(n,p)近似正态分布,这样可利用正态分布中的相应结果来进行参数估计。1、Define Sets过程该过程指定变量组成一个多重响应或多重两分数集,并应用于频数表和交叉列表。2、Frequ
6、encies过程该过程对定义的多重响应或多重两分数提供一个频数表。3、Crosstabs过程该过程提供带有另一种变量的,已定义的多重或多重两分数据集交叉表。4、表格模块6.2分类变量的统计描述实例1、使用频率过程CCSS项目中的性别和学历的交叉频数分布。2、使用交叉表过程CCSS项目中的学历分布。3、多重相应过程CCSS项目中的还贷分布。CCSS项目中的婚姻和还贷的交叉分布。6.2.1使用Frequencies过程输出频数表具体操作:Analysis Descriptive Statistics Frequencies1、打开数据,单击AnalyzeDescriptive Statistics
7、 Crosstabs对话框。 2、如果是二维列联表分析,可以将行变量选择进入Row(s)中,将列变量选择进入Column(s)框中。如进行三维以上的列联表,可以将其它变量作为控制变量选到Layer框中。多控制变量可以是同层次的也可以是逐层叠加的。6.2.2 使用使用Crosstabs过程输出列联表过程输出列联表3、Display clustered bar chart选择项,可以指定绘制各变量交叉频数分布柱形图。Suppress table表示不输出列联表,只有在分析行列变量间关系时选择此项。此例中不选择这一项。4、单击Cell按纽,打开Crosstabs:Cell Display对话框,如图所示。从对话框中指定列联表单元格中的输出 内 容 。 在 C o u n t s 框 中 选 择Observed 观察值(系统默认)或E x p e c t e d 期 望 频 数 。 在Percentages框内选择Row行百分比、Column列百分比及Total总百分比。在Residuals框中选择输出残差。其中Standardize为标准化残差。 Adj. standardize 为修正的标准化残差。 1、打开数据,单击Analyze Multiple Response Define Varia
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑工程考试题库1000问(附答案)
- AI在戏曲表演中的应用
- 施工会计及基础 2
- 展馆文明参观公约
- 公关服务公司公关项目质量持续改进管理制度
- PLC技术及应用(微课版)课件 6.4项目实施模拟量调试
- 2026调研公司面试题目及答案
- 2026年安徽省大联考高考语文最后一卷(5月份)
- 教师招聘(中学)考试题库22
- 运动健身指导与康复手册
- 创业管理第五版张玉利课后习题答案
- T-CSTM 00632.3-2022 建筑涂饰工程用涂料产品技术要求 第3部分:无机建筑涂料体系
- 保育教师食品安全培训
- 2025汽轮机启动调试导则
- 供电设备运行维护管理方案
- 某市水库扩容工程施工合同三篇
- 四川省德阳市旌阳区2023-2024学年四年级下学期期末检测语文试题
- HG∕T 4214-2011 脲铵氮肥 标准
- TSGD7006-2020压力管道监督检验规则
- JC-T 474-2008砂浆混凝土防水剂
- 2023年全国统一高考英语试卷(甲卷)及答案解析
评论
0/150
提交评论