




免费预览已结束,剩余78页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 Stata在社会科学研究中的高级应用 周文光 2 参考书 周文光 李尧远 梁炜 stata在社会科学研究中的高级应用 西北工业大学出版社 2011年2月出版 3 三大数据处理软件 SASSTATASPSS 4 讲授特点 以案例操作为导向 对于常见的统计案例 只介绍操作步骤 对于较复杂的统计案例 简要介绍相关统计知识 针对有些情况下研究人员很难读懂stata输出结果的现状 无论对于何种统计案例 重点详细介绍stata输出结果的具体含义 5 课程内容 一 第一章基础知识简介第二章经典回归分析第三章回归分析诊断第四章超越最小二乘法第五章时间序列分析第六章面板数据分析第七章分类因变量的回归分析第八章分类自变量的回归分析 6 课程内容 二 第九章回归分析中分类变量的编码方式第十章分类自变量的交互作用分析第十一章分类自变量与连续自变量的交互作用第十二章抽样方式与简单统计分析第十三章主成分与聚类分析第十四章生存分析第十五章stata编程简介 7 第一章基础知识简介 1 1stata的优势与功能1 2stata的界面1 3stata的基本操作1 4stata的数据管理 8 1 1stata的优势与功能 一 1 占用较少的磁盘空间 其它两大统计软件在运行过程中占用较大的磁盘空间 容易出现死机 其它程序不能正常运行等问题 stata克服了这些问题 2 软件本身较小 安装方便 其它两大统计软件本身较大 安装时间较长 在没有事先安装该软件的电脑上 就不能进行统计分析 而stata本身较小 安装时间较短 有些绿色版stata无需安装 即可直接使用 一个普通的U盘就可以把整个stata装下 可以随时拷贝到任何一台电脑上进行统计分析 3 功能齐全 尽管stata本身较小 但是stata的功能非常齐全 能够完成所有的统计分析 不仅可以完成传统的统计分析 而且近年来发展的新方法也都包括在内 4 输出结果简洁 Stata的结果出现在结果窗口中或以图形的形式出现 所给出的结果十分简洁 又包括所有必要的信息 5 结果可以被图形处理软件或字处理软件直接调用 结果窗口中的结果与图形结果可以以log文件存储起来 也可以复制到其他文件中 如word文档 9 1 1stata的优势与功能 二 1 数值变量资料的一般分析功能 参数估计 t检验 单因素和多因素的方差分析 协方差分析 交互效应模型 平衡和非平衡设计 嵌套设计 随机效应 多个均数的两两比较 缺项数据的处理 方差齐性检验 正态性检验 变量变换等 这些基础性的功能不是本书的主要内容 2 连续变量的回归分析功能 经典回归分析 回归分析诊断 超越最小二乘法的方法 时间序列分析 面板数据分析 这些功能将被作为本书第一编进行详细介绍 3 涉及分类变量的回归分析功能 分类因变量的回归分析 分类自变量的回归分析 回归分析中分类变量的编码方式 分类自变量的交互作用分析 分类自变量与连续自变量的交互作用分析 这些功能将被作为本书第二编进行详细介绍 4 其他统计分析功能 抽样方式与简单统计分析 主成分与聚类分析 生存分析 stata编程 10 第二章经典回归分析 回归分析是一种重要的统计方法 在经济学与管理学中有广泛的应用 本章按照回归分析的程序 举例介绍如何使用stata软件进行回归分析 2 1节介绍了回归分析之前如何使用stata对数据进行检查 2 2节介绍使用stata进行回归分析的过程以及如何使用stata进行模型检查 2 3节介绍当数据不满足回归分析的条件时如何使用stata进行数据变换 以使得数据满足或者尽量满足进行回归分析的条件 11 2 1回归前的数据检查2 2回归分析2 3变量变换2 4本章小结 12 使用命令predict可以产生的变量及选项 13 本章首先介绍了进行回归分析之前的数据检查过程 主要是检查数据中是否含有异常值 因为异常值可能对回归分析产生影响 使得我们的结论偏离实际情况 在此基础上 我们介绍了如何进行简单回归分析与多元回归分析以及如何对回归结果进行解释 最后 我们介绍了如何检验变量是否符合正态分布以及如何对变量进行变换使其接近正态分布 本章小结 14 15 第三章回归分析诊断 在上一章中 我们介绍了如何使用stata10进行回归分析 以及检查变量分布的相关方法与处理方法 由于没有检查数据是否符合线性回归的基本假设 回归结果可能是错误的 本章将介绍如何使用stata10检查数据是否符合线性回归的基本假设 16 3 1异常数据识别3 2残差分析3 3异方差检验3 4共线性检验3 5线性检验3 6模型检验3 7本章小结 17 3 1异常数据识别 一般而言 数据异常的方式有三种类型 偏离是指有的样本在线性回归分析中残差较大 换言之 在给定偏离点的自变量的数值时 其因变量的值发生异常 偏离点意味着特例的存在 输入错误或其他问题 杠杆是指有的样本的自变量具有极值 杠杆度量了自变量对其均值的偏离程度 杠杆点对回归分析中自变量系数的估计产生影响 影响是指若删除某些样本就会改变回归分析中自变量系数 影响被认为是杠杠与偏离的乘积 18 本章小结 本章首先介绍了如何使用stata识别回归分析中的异常数据 然后介绍了如何对残差分布的正态性进行检验 如果残差的分布不符合甚至不接近正态分布 则回归分析的F检验与t检验的有效性就值得怀疑 随后我们介绍了如何检验模型的残差是否具有异方差 除此之外 我们还介绍了如何使用stata对因变量与自变量之间的线性关系进行检验 以及如何对回归模型的设定是否正确进行检验 19 20 第四章超越最小二乘法 在本章我们将介绍如何使用stata处理一些直接使用最小二乘法无法解决的问题 通过对最小二乘法拓展的学习 能够帮助我们更好地理解最小二乘法以及更准确地处理线性模型 本章的主要内容包括健壮回归方法 受约束的线性回归 带特殊数据的回归方法 带测量误差的回归方法以及多方程回归模型 21 4 1健壮回归方法4 2受约束的回归方法4 3带特殊数据的回归方法4 3 1带被删节值的回归方法4 3 2带被截短数据的回归方法4 4带测量误差的回归方法4 5多方程回归模型5 5 1外观不相关回归分析4 5 2多变量回归分析4 6本章小结 22 4 1健壮回归方法 介绍三种健壮回归的有关方法 1 使用选项cluster进行带健壮标准误差的回归分析 2 使用重复加权最小平方法进行健壮回归 3 分位数回归 23 本章小结 本章主要介绍了一些超越最小二乘法的专题 包括健壮回归方法 带约束的回归方法 带特殊数据的回归方法 带测量误差的回归方法与多方程回归模型 这些专题介绍了如何使用stata来解决数据不满足OLS基本假设的问题以及如何处理回归分析中的一些棘手问题 24 25 第五章时间序列分析 在本章我们将介绍如何使用stata处理时间序列数据的一些问题 首先介绍时间序列数据分析中最常见的平滑分析与自相关分析 在此基础上 介绍在研究中应用较多的ARIMA模型与ARCH模型 26 5 1平滑分析5 2自相关分析5 3ARIMA模型5 4ARCH模型5 5本章小结 27 28 5 3ARIMA模型 时间序列中的自相关集成移动平均模型 autoregressiveintegratedmovingaverage 简称ARIMA 的矩阵形式为 在ARMA 1 1 的情况下 29 模型ARMA p q 的一般形式为 在stata中可以使用命令arima来处理ARIMA模型 这个命令包括了对自相关 AR 移动平均 MA 以及任意阶ARIMA模型的处理 这个命令也可以用来估计包括多个自变量与自回归误差项 移动平均误差项的模型 ARMA 1 1 模型的命令格式为 arimay arima 1 0 1 y表示因变量 因变量是自身滞后变量与干扰项的函数 括号中的第一个 1 表示第一个自变量为因变量的一期滞后变量 括号中的 0 表示因变量为因变量本身 括号中的第二个 1 表示第二个自变量为干扰项的一期滞后变量 30 只含有一个变量的ARIMA 2 1 1 的一般形式为 对该模型进行估计的命令格式为 arimay arima 2 1 1 y为变量名称 括号中的 2 表示自变量为因变量一阶差的一期滞后值与二期滞后值 括号中的第一个 1 表示模型中的因变量为变量y的一阶差 括号中的第二个 1 表示自变量为干扰项的一期滞后变量 一个混合模型的形式如 在上式中 自变量不仅有因变量的滞后变量 干扰项的滞后变量 还有其他变量的滞后变量 这是一个典型的混合模型 估计该模型的命令格式为 arimayxL xw arima 1 0 1 y为因变量 x与w为自变量 arima 1 0 1 为对因变量与干扰项的处理 31 稳定性检验 如果时间序列y的均值与方差不随着时间的变化而变化 且yt与yt u的协方差仅依赖于滞后期u与不依赖于t 那么时间序列y被称为 稳定的 ARIMA模型假定时间序列是稳定的 或者可以通过适当的变换变为稳定的 我们可以通过对单位根的检验来检验这一假设 Stata提供了三种检验单位根的方法 pperron检验 dfuller检验与dfgls检验 32 模型选择规则 模型AR p 一个p阶自相关序列的自相关关系随着滞后期增加而逐渐减小 偏自相关关系在滞后期p之后消失 模型MA q 一个q阶移动平均序列的自相关关系在滞后期q之后消失 偏自相关关系随着滞后期的增加而逐渐减小 模型ARMA p q 一个自相关移动平均混合序列的自相关关系与偏自相关关系都随着滞后期的增加而逐渐减小 33 使用ARIMA模型进行分析的步骤 第一 对变量的稳定性进行检验 若变量具有稳定性 进行第二步 否则 不能使用ARIMA模型进行分析 第二 做出变量的自相关图 第三 根据变量的自相关图 选择合适的模型 第四 使用选定的模型对变量进行分析 并检查系数是否显著 若有的系数不显著 所选择的模型可能存在问题 若所有系数都显著 进行第五步 第五 检验残差是否具有自相关性 若残差具有自相关性 则所选择的模型存在问题 若残差不具有自相关性 则所选择的模型是适合的 根据模型得出的结论可以使用 34 5 4ARCH模型 自相关条件下的异方差模型 autoregressiveconditionalheteroskedasticity 简称ARCH 最初由Engle在1982年提出 一般而言 数据的变化程度是随时间的变化而变化的 变化较大的时期与变化较小的时期交织在一起 简言之 ARCH模型就是把依赖于时间的数据变化程度作为已经观察到的前期的变化程度的函数进行估计 最初的ARCH m 模型的形式为 ARCH模型被Bollerslev在1986年一般化 generalized 了 GARCH m k 模型的形式为 35 本章小结 本章主要介绍了时间序列数据的平滑分析 自相关分析 ARIMA模型与ARCH模型 平滑分析是时间序列数据处理中最常用的方法 帮助我们了解变量的相关信息 自相关分析是时间序列数据分析的基础 在此基础上 我们才可以进行模型选择 ARIMA模型是针对时间序列平均值的模型 可以用来预测 ARCH模型是针对时间序列变化程度的模型 这两种模型都有广泛的应用 36 37 第六章面板数据分析 在本章 我们将介绍如何使用stata来分析面板数据的有关问题 首先介绍相对简单一些的FE模型与RE模型 然后介绍较为复杂的DPD模型 面板数据的logit模型与混合效应泊松模型 38 6 1FE模型6 2RE模型6 3DPD模型6 4混合效应泊松模型6 5面板数据的logit模型6 6本章小结 39 面板数据包括对同一个体的多个观察值 比如 从2000年到2010年中国各省级行政单位的GDP 就构成了一个面板数据集 在面板数据中 每个元素都有两个下标 下标表示元素的序列值 下标表示元素的时间值 对于面板数据 最一般的线性模型如下所示 其中 N为个体的数目 T为时期的数目 假定一个面板数据集中有N个个体 而且每个个体都有T个时期的观察值 变量数目为K个 那么 从理论上讲 其模型就应该有K N T个回归系数 这些系数无法通过N T个样本估计出来 因此 我们就要忽视面板数据的一些特征 假设对于各个时期的不同个体 回归系数是相同的 这个假设过于严格 可能会导致一些问题产生 比如 个体之间的异方差性 同一个体不同时期间的序列相关性 等等 40 有一类模型允许面板数据的不同个体之间存在异方差性 并把这种异方差性限制在模型的截距项上 这类模型包括FE模型与RE模型 我们将在6 1节与6 2节分别介绍 当面板数据中存在滞后的因变量时 就要使用DPD模型 我们将在6 3节中进行介绍 当面板数据具有分类因变量时 需要使用logit模型 我们将在6 4节介绍 当面板数据中的因变量为离散变量且具有混合效应时 需要使用混合效应泊松模型 我们将在6 5节进行介绍 需要说明的是 FE模型 RE模型与DPD模型都是适用于 大N小T 的面板数据 对于 小N大T 的面板数据不宜使用这三种方法 41 通过对基本模型进行限制 可以得到以下模型 其中是xit随着个体与时间变化的1 k的变量向量 zi为只随个体变化 不随时间变化的1 p的变量向量 ui为个体水平的效应 ui与xit和zi可以相关 也可以不相关 当ui与xit和zi相关时 以上模型就是FE 固定效应 fixedeffect简写为FE 模型 当ui与xit和zi不相关时 以上模型就是RE 随机效应 randomeffect简写为RE 模型 FE模型在个体的y值与x值远离平均值时解释力很强 在个体的y值与x值都为平均值时不具有解释力 这并不妨碍RE模型的应用 因为后一种情况很少出现 42 本章小结 对于面板数据的建模与分析比较困难 至今在学术界远没有达成一致 本章选择性地介绍了如何使用stata处理FE模型 RE模型 DPD模型 混合效应泊松模型与面板数据的logit模型 对于面板数据的建模与分析 要格外小心 很容易犯错误 由于面板数据的模型比较复杂 与其它章节不同 本章给出了一些模型的基本形式 并未进行太深入的分析 43 44 第七章分类因变量的回归分析 在实际研究中 有时候会碰到因变量为分类变量的问题 当因变量为分类变量时 就不能使用一般的回归模型进行分析 应该根据具体问题选择合适的专门用来分析分类因变量的模型 在本章 我们将介绍如何使用stata来计算logit模型 ologit模型 mlogit模型 ZTP模型 ZTNB模型与probit模型 45 7 1logit模型7 2ologit模型7 3mlogit模型7 4ZTP模型7 5ZTNB模型7 6probit模型7 7本章小结 46 本章小结 本章主要介绍了因变量为分类变量的回归分析的处理方法 严格来讲 logit模型 probit模型 ologit模型与mlogit模型是针对因变量为分类变量的问题的分析方法 ZTP模型与ZTNB模型并不是针对因变量为分类变量的问题的分析方法 但是 ZTP模型与ZTNB模型中的因变量不包括0值 而且因变量与自变量为离散变量 这两种模型与针对因变量为分类变量的问题的模型具有相似之处 因此 我们也把它们放在本章进行介绍 logit模型与probit模型的应用背景相同 我们只能根据个人偏好做出选择 ZTP模型与ZTNB模型的应用背景相同 但我们可以根据对离散程度的检验做出选择 ologit模型所处理的问题中的因变量具有多个取值 而且这些取值可以进行排序 mlogit模型所处理的问题中的因变量也具有多个取值 但是 这些取值不可以进行排序 47 48 第八章分类自变量的回归分析 在上一章我们介绍了因变量为分类变量时的处理方法 在这一章 我们将介绍自变量中含有分类变量时的处理方法 本章主要介绍如何使用stata来分析自变量中含有分类变量的问题 以及如何对分析结果进行解释 49 8 10 1自变量的回归分析8 21 2自变量的回归分析8 31 2 3自变量的回归分析8 4多个分类自变量的回归分析8 5分类自变量的交互作用8 6连续自变量与分类自变量的回归分析8 7连续变量与0 1变量的交互作用8 8连续变量与1 2 3变量的交互作用8 9本章小结 50 本章小结 在本章 首先介绍了模型中只有一个分类自变量的回归分析 分类变量可以有两个水平也可以有多个水平 然后介绍了模型中包括多个分类自变量的回归分析 以及对交互作用的检验 最后介绍了模型中既有连续变量又有分类变量的回归分析 以及对交互作用的检验 对分类自变量的分析包括3种技术 1 手动构造指示变量 2 使用命令xi 3 使用命令anova 这三种技术各有利弊 应该根据具体问题做出选择 51 52 第九章回归分析中分类变量的编码方式 53 9 1简单编码9 2前向区别编码9 3后向区别编码9 4Helmert编码9 5逆Helmert编码9 6偏移编码9 7正交多项式编码9 8自定义编码9 9本章小结 54 本章小结 本章主要介绍了八种分类变量的编码方式 每种编码方式能够进行一种特定的比较 我们应该根据自己的目标选择合适的编码方式 如果没有合适的编码方式 我们可以使用自定义编码来制作适合自己目标的编码方式 本章新出现的stata命令只有一个 xi3 该命令先用特定方式对分类变量进行编码 再进行分析 55 第十章分类自变量的交互作用分析 10 1双分类变量分析10 2单一效应10 3单一比较10 4部分交互作用10 5交互作用比较10 6调整平均数的计算10 7系数的意义10 8本章小结 56 本章小结 本章主要介绍了如何使用stata来分析分类自变量的交互作用 当自变量中有两个分类变量时要分析其交互作用 单一效应是分析一个分类变量在另一个分类变量的某个水平上是否显著 单一比较是分析在一个分类变量的某个水平上 另一个分类变量的各个水平之间的差异是否显著 部分交互作用能够把比较系数应用于二元交互作用中的一项 交互作用比较能够把比较系数应用于二元交互作用的所有项 在此基础上 我们介绍了如何计算调整平均数以及这类分析中系数的意义 本章新出现的stata命令只有两个 adjust 该命令对数值进行调整 tablist 查看编码方式 57 第十一章分类自变量与连续自变量的交互作用 在上一章 我们介绍了如何使用stata进行分类自变量的交互作用分析 在实际研究中 有时候模型中既有分类自变量又有连续自变量 这时 需要对分类自变量与连续自变量的交互作用进行分析 在本章 我们主要介绍如何使用stata进行分类自变量与分类自变量的交互作用分析 58 11 1不带交互作用的连续自变量与分类自变量11 2带有交互作用的连续自变量与分类自变量11 3每组斜率的计算11 4组间斜率比较11 5单一效应与单一比较 1 11 5单一效应与单一比较 2 11 6交互效应比较11 7本章小结 59 本章小结 本章主要介绍了如何使用stata分析回归分析中分类变量与连续变量的交互作用 首先介绍了含有不带交互作用的连续自变量与分类自变量的回归分析 之后介绍了含有带交互作用的连续自变量与分类自变量的回归分析 在此基础上 介绍了每组斜率的计算及组间斜率的比较 两种单一效应与单一比较的方法 最后介绍了如何进行交互作用比较 60 61 第十二章抽样方式与简单统计分析 一般的统计软件在数据处理时都假设数据是采用简单随机抽样的方式得到的 对于实验或准实验设计 这是我们所希望的 但是 在实际的调查数据中 很少有以简单随机抽样方式得到的数据 这是由于 一方面简单随机抽样是几乎不可能完成的 另一方面简单随机抽样方式与其它抽样方式相比 在经济上与统计上是无效率的 当除了简单随机抽样方式以外的其他抽样方式被使用时 我们需要使用调查数据分析软件来处理这种抽样方式与简单随机抽样方式之间的不同 这是由于 抽样方式影响估计过程中标准差的计算方式 如果我们忽视了抽样设计 也就是说 当采用另外的抽样方式时 仍然假设数据是以简单随机抽样方式得到的 标准差很可能被错误估计 进而导致错误的结果 比如 本来不显著的统计关系在结果中显著 因此 我们在进行统计分析时 有必要考虑一下抽样方式的设计 62 12 1抽样设计12 2简单随机抽样12 3分层随机抽样12 4系统抽样12 5一阶段分群抽样12 6二阶段分群抽样12 7本章小结 63 12 1抽样设计 有些学者并不进行数据调查 他们使用咨询机构或者公司的公开数据 在这种情况下 在使用数据之前 就必须查明搜集数据时的抽样方式 这是由于针对不同的抽样方式 标准差有不同的计算方式 如果错误识别了数据的抽样方式 就有可能得到错误的标准差 从而得到错误的结果 抽样设计的主要概念如下 权重 在数据调查中 有多种类型的权重 最经常使用的权重是样本权重 被称为pweight 该权重表示根据抽样设计 样本所占总体比例的倒数 PSU PSU是主样本单元 primarysamplingunit 的缩写 在中国 大部分统计书中称为 群 主样本单元是进入样本的第一个单元 分层 分层是一种用人口统计学变量 种族 性别 年龄等 把总体分成若干组的方法 一旦各个组被定义 每组的样本与其他组的样本是独立的 FPC FPC是有限总体修正 finitepopulationcorrection 的缩写 在样本部分 元素个数或占总体的比例 较大时使用FPC FPC在计算标准差的过程中被使用 64 强调三点 其一 所有带svy的命令对于所有抽样方式都可以使用 其二 对于带svy的命令所得结果的解释与其他类似命令的解释方式完全相同 比如 当我们使用svy reg来代替reg时 对所得结果的解释与对reg所得的结果的解释相同 其三 对于统一数据文件 使用同样的抽样方式 每次操作所得到的结果不会完全相同 这是由于 stata每次都按照指定的抽样方式抽取样本 但每次抽取的样本不太可能完全相同 65 本章小结 本章主要介绍了如何使用stata实施不同的抽样方法 并对样本数据进行分析 在研究过程中 要根据实际情况选择合适的抽样方式 简单随机抽样是直接在总体中进行随机抽样 分为有放回抽样与无放回抽样两种 分层随机抽样是先根据一定规则对总体进行分层 然后在每一层上进行随机抽样 在每一层上所抽取的元素构成样本 系统抽样是在已经以一种特定方式排序的系统中抽取样本 一阶段分群抽样是对群进行随机抽样 被选择的群里的所有元素都进入样本 二阶段分群抽样是首先对群进行随机抽样 然后对所选择群里的元素进行随机抽样 最终得到样本 66 67 第十三章主成分与聚类分析 13 1主成分分析13 2聚类分析13 3本章小结 68 13 1主成分分析 69 13 2聚类分析 70 本章小结 本章主要介绍了如何使用stata进行主成分分析与聚类分析 主成分分析是在多个变量中抽取若干个 少于变量个数 主成分因子 这些抽取出来的主成分因子能够解释绝大部分变量的变化 在主成分分析中 经常需要进行旋转 旋转后的结果便于应用 聚类分析是一种探索性分析 通过一定的原则对样本进行分类 在聚类分析中 应根据实际情况对数据进行处理 并选择合适的聚类方法 71 72 第十四章生存分析 14 1生存分析概述14 2单变量分析14 3初步模型的建立14 4交互作用分析14 5比例性假设的检验14 6生存函数作图及模型检验14 7本章小结 73 14 1生存分析概述 生存分析是时间 事件分析的另一个名称 生存分析这种叫法最初出现在医学领域 在该领域 研究者关注病人或实验室中的动物死亡的时间 时间 事件分析在社会科学中有广泛的应用 可以用来分析工作的变化 婚姻与婴儿出生等问题 工程学的发展对于生存分析也有所贡献 在工程学中 生存分析被称之为 可靠性分析 或者 失败时间分析 这是由于该领域主要关注机械或电子设备失效之前的时间 多个学科的发展共同促进了生存分析的发展 生存分析的数据有不少值得我们注意的地方 比如被删节数据和非正态数据 当我们使用诸如多元回归分析与方差分析等传统统计方法进行分析时 这些数据带来不少困难 非正态数据违背了正态假设 被删节数据带有不完全信息 有四种不同的删节类型 左截短 右截短 左删节与右删节 在生存分析中 我们只关注右删节数据 这是由于绝大多数数据只具有右删节值 当一个观测为右删节时 意味着对应样本在研究所涉及的范围内没有发生一个事件 生存分析点为样本经历所关注实践的时间点 经常碰到的情况为 研究没有持续足够长的时间 以观测到所有样本都发生相应事件 之所以会发生这种情况 一个可能的原因是样本离开了研究群体 比如 病人转院 74 理解日历时间与研究中的时间之间的差别非常重要 经常发生的情况为 在研究的整个过程中样本持续不断地加入到研究中来 在图1中可以看出 样本1最先进入到研究中来 但在离开研究之前并没有发生所关注的事件 有红叉表示 样本2在样本1之后进入研究 但在离开研究之前发生了所关注的事件 样本3在样本2之后进入研究 在离开研究之前发生了所关注的事件 样本4在样本3之后进入研究 但在离开研究之前并没有发生所关注的事件 有红叉表示 在图2中可以看出 四个样本同时进入研究 样本1和样本4在离开研究之前没有发生所关注的事件 有红叉表示 样本2和样本3在离开研究之前发生了所关注的事件 生存分析中的另外一个概念为风险率 通过观察带有离散时间 以月 年甚至世纪来度量时间 的数据 我们可以得到对风险率的直观理解 对于离散时间而言 风险率为个体在时间t经历一个事件的概率 因此 风险率为事件发生的概率 这种概率是不可观察的 如果风险率在时间上是连续的并且等于1 5 这意味着我们可以预期在一个单位长的时间区间内会有1 5个事件发生 进一步讲 如果第一个人在时间t具有风险率1 2 第二个人在时间t具有风险率2 4 第二个人在时间t经历一个事件的风险是第一个人的2倍 风险率是一个不可观测的变量 它控制时间的发生与否和发生时间 风险率是生存分析中的基础因变量 通常以函数的形式出现 75 76 77 78 模型拟合性检验步骤 第一步 使用带选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第24课《唐诗三首-茅屋为秋风所破歌》教学设计 统编版语文八年级下册
- 4. 放射性同位素教学设计高中物理教科版选修2-3-教科版2004
- 第七节 力学单位说课稿高中物理粤教版必修1-粤教版2005
- 2025年九年级体育 第一周《九年级体育中考-你准备好了吗?》说课稿 人教新课标版
- 2.1.1 不进位加 教学设计-二年级上册数学人教版
- 高等教育版教学设计-2025-2026学年中职中职专业课财政税务类73 财经商贸大类
- 2024-2025学年高中化学 第一章 认识有机化合物 1.1 有机化合物的分类说课稿 新人教版选修5
- 2025年土建质量员考试题库及答案
- 2025年智能制造设备操作员实操技能培训试题附答案
- 新能源项目可行性研究报告撰写模板
- 高二《复活》课文解读
- 大圆满前行考试题及答案
- 2025年国家消防设施操作员(初级)证书理论知识职业技能考试试题(含答案)
- 2025年领导力测试题及答案
- 普通话发音训练素材及练习方案
- 【衢州】2025年浙江衢州市柯城区属事业单位招聘工作人员17人笔试历年典型考题及考点剖析附带答案详解
- 钢构农业大棚建设项目可行性研究报告
- 非货币支付管理办法
- 湖北省武汉2025-2026学年度高一上学期开学分班考试-英语(解析版)
- 2025年宜昌专业技术人员公需科目培训考试题及答案
- 船舶高级消防课件
评论
0/150
提交评论