




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高级统计方法简介汇报提纲数据的分类统计方法的分类体系各种统计方法简介推荐书目1数据的分类定类变量〔名义数据〕定序变量〔等级数据〕定距变量〔间距数据〕定比变量〔比例数据〕非测量型测量型2统计方法的分类体系关系类型?因果模型因变量数?非测量型多元回归单因变量Logistic回归因变量类型?鉴别分析测量型非测量型自变量类型?测量型对数线性模型多重因果关系有有否潜变量?结构方程模型路径分析无典型相关分析因变量类型?多因变量测量型非测量型自变量类型?测量型非测量型多元方差分析虚拟变量典型相关分析相依模型变量类型?测量型关系结构类型?变量之间聚类分析因子分析类别结构对应分析非测量型案例之间A:截面数据2统计方法的分类体系事件史分析B:时间序列数据连续时间模型离散时间模型Cox比例风险模型Logit模型事件历史分析的主要目的是研究某一事件发生的方式和它的决定因素。指数模型Gompertz模型Weibull模型加速失效时间模型3.1因子分析主要功能:缩减变量数〔降维〕根本步骤:计算所有变量相关矩阵,判别是否适合因子分析〔相关矩阵大局部相关系数大于0.3适合;反映像相关矩阵很多元素值较大不适合;Bartletttestofsphericity显著;KMO0.7以上〕提取公共因子〔常用主成分分析法〕因子旋转〔便于为公共因子命名,常用Varimax〕一种重要用法:评价3.2聚类分析主要功能:对研究对象进行分类根本步骤:选择变量〔注意克服“参加尽可能多的变量”的倾向;所选变量之间不应高度相关〕计算相似性〔相关测度——pearson相关系数;距离测度——欧式距离**、绝对值距离、明科夫斯基距离、马氏距离;关联测度*——简单匹配系数、雅克比系数、果瓦系数〕聚类〔层次聚类——聚集法、分解法;迭代聚类/快速聚类〕聚类结果的解释与证实3.3对应分析主要功能:揭示定性/非测量变量之间的联系根本步骤:对定性/非测量型变量进行交叉汇总,得到对应分析要求的汇总表〔注意检查Crosstabs中是否有频数为零的单元格〕运行程序〔AnalyseDatareductioncorrespondence〕检查运行结果和各种统计图,看是否已反映变量关系;假设否,调整参数重新运行解释分析结果3.4多元线性回归主要功能:分析一个测量型因变量与多个自变量之间的线性关系本卷须知:因变量必须是测量型随机变量假设自变量为非测量型,那么需设置虚拟变量重点是回归模型的各项检验〔整体线性拟合度检验——方差分析+判定系数R^2;回归系数的检验——T检验;多重共线性的检验——容忍度和方差膨胀系数;残差项异方差检验和自相关检验〕难点:多重共线性、异方差和自相关的诊断和排除3.5Logistic回归主要功能:分析一个定性因变量与多个自变量之间的关系本卷须知:因变量是非测量型二值变量;假设自变量为非测量型,也需设置虚拟变量重点是回归模型的各项检验〔整体检验——对数似然比的卡方检验;回归系数的检验——Wald统计量的卡方检验;系数子集的联合假设检验——对数似然比的卡方检验〕难点:回归系数的解释〔以logitp方程的线性表达式来解释;以发生比的指数表达式解释√〕3.6鉴别分析主要功能:进行统计鉴别和分组〔根据一些已经分组的案例建立鉴别函数,然后根据鉴别函数对所有案例重新分组〕本卷须知:因变量是非测量型的分组变量;自变量是用以分组的特征变量称为鉴别变量重点掌握鉴别分析模型即鉴别函数的各参数指标及统计检验〔非标准化鉴别系数、标准化鉴别系数;结构系数/鉴别负载;鉴别力指数/方差百分比、剩余鉴别力——Wilk’Slambda;Fisher鉴别系数〕3.7对数线性模型主要功能:通过数学方法来描述多个分类变量的交互频数分布;可以在控制其他变量的情况下研究任意两个变量之间的关联本卷须知:对数线性模型包括三类分析程序:分层模型分析〔从饱和模型入手得到简约模型〕、一般模型分析〔检验简约模型能否准确拟合观测数据并推断总体〕和logit模型分析〔直接效劳于分类变量之间的因果关系〕运用不同的模型,变量设置、工程设置均不同,能够提供的功能类型也不同〔整体检验、分层检验、单项偏关联检验、自动筛选、参数估计、Z值、置信区间、观测频数、期望频数、残差〕3.8典型相关分析主要功能:两组变量之间的相关分析本卷须知:它描述的是两个变量组之间的整体的相关形式;要求两组变量之间为线性关系,即每对典型变量之间为线性关系;每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化〔如取对数〕;所有观测变量为定量数据,定性数据按照一定形式设为虚拟变量后也可放入典型相关模型中进行分析3.9多元方差分析主要功能:同时分析和检验不同类别在多个测量型变量上是否存在显著差异本卷须知:因变量有多个且必须是测量型变量,自变量是非测量型变量因变量应为正态分布且方差相等,而且需要存在一定程度的线性相关例:Income、EduRatio、Natinality、Rural可构建单因素二元模型、双因素二元饱和模型、双因素二元非饱和模型3.10路径分析主要功能:确定多个变量之间的因果关系是否存在或因果关系强弱程度本卷须知:实质内容就是计算路径系数〔=标准回归系数,可通过回归分析得到〕、残值项路径系数〔=根号下1-R^2,通过回归分析得到的R^2手工计算〕更重要的功用是通过对变量间的简单相关系数进行分解〔=直接效应+间接效应+虚假相关+未析局部〕,从而获得变量间相互作用的更深刻认知路径分析的检验是通过回归分析中对标准回归系数的T检验实现的3.11结构方程模型主要功能:确定多个变量之间的因果关系是否存在或因果关系强弱程度根本步骤:模型设定〔应根据理论或以往研究成果设定初始模型〕模型识别〔判定模型能否求出参数估计的唯一解:数据点的数目不能少于自由参数的数目〕模型估计〔最大似然估计、广义最小二乘估计〕模型评价〔GFI、AGFI、NFI、NNFI、IFI、CFI、RMSEA〕模型修正软件:LISRELAMOS3.12离散时间Logit模型主要功能:研究离散时间单位下的某一事件的发生与否及其决定因素本卷须知:首先要对原始数据进行预处理,建立人年〔personyear〕数据文件然后运用Logistic回归模型分析例:晋升否、进入公司时间长短、进入前有否工作经验、性别3.13Cox比例风险模型主要功能:研究连续时间单位下的某一事件的发生与否及其决定因素本卷须知:首先要对原始数据进行预处理,建立人年〔personyear〕数据文件然后利用“分析——生存——Coxregeression”进行分析例:已婚妇女初育间隔、学历、结婚年龄3.14其他一些连续时间模型指数模型
常被称为单纯模型,因为它假设事件发生的概率为常数Weibull模型b3被限制为必须大于1Gompertz模型
随机变量t服从Gompertz分布加速失效时间模型随机扰动u有四种分布:正态分布、logistic分布、极端值分布、对数伽玛分布,故T得分布也有四种如果研究者认为研究方案中的时间单位最好按离散方式描述,就采用离散时间logit模型对于连续时间模型,如果可以认为风险函数是随时间单调变化的,可以考虑选用Weibull模型或Gompertz模型;假设果认为风险函数不是单调变化的,可以考虑对数正态、对数logisti
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 兽药找回管理办法
- 内部会员管理办法
- 内部物流管理办法
- 军事运输管理办法
- 军工外协管理办法
- 军马军犬管理办法
- 农场玉米管理办法
- 农机驾校管理办法
- 农村柑橘管理办法
- 农村集市管理办法
- 2025至2030年中国连接器制造行业市场现状调查及投资方向研究报告
- 2025至2030中国市政公用工程行业项目调研及市场前景预测评估报告
- 地勤面试笔试题目及答案
- 浙江保安员考试题库及答案大全
- T/CSRA 23-2023塑料快速多因素耦合法第1部分:老化活化能的测定
- 羽毛球场馆项目可行性报告
- 《新药审批流程解析》课件
- 2025年小学语文毕业升学考试全真模拟卷(语文综合素养拓展)古诗文背诵与运用
- 诊断与评估课件 第三章 特殊儿童的评估取向与范围学习资料
- 淘宝模特合同协议模板
- 高级碳排放监测员理论考试复习题库(含答案)
评论
0/150
提交评论