列联表对数线性模型.ppt

上传人：x*** IP属地：四川上传时间：2020-02-10 格式：PPT 页数：43 大小：1.57MB 积分：15 举报 版权申诉

已阅读5页，还剩38页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

列联表 c2检验和对数线性模型三维列联表关于某项政策调查所得结果 table7 sav 列联表前面就是一个所谓的三维列联表 contingencytable 这些变量中每个都有两个或更多的可能取值这些取值也称为水平比如收入有三个水平观点有两个水平性别有两个水平等该表为3 2 2列联表在SPSS数据中表就不和课本印的一样收入的低中高用代码1 2 3代表性别的女男用代码0 1代表观点赞成和不赞成用1 0代表有些计算机数据对于这些代码的形式不限可以是数字也可以是字符串 Table7 sav数据列联表列联表的中间各个变量不同水平的交汇处就是这种水平组合出现的频数或计数 count 二维的列联表又称为交叉表 crosstable 列联表可以有很多维维数多的叫做高维列联表注意前面这个列联表的变量都是定性变量但列联表也会带有定量变量作为协变量二维列联表的检验研究列联表的一个主要目的是看这些变量是否相关比如前面例子中的收入和观点是否相关这需要形式上的检验二维列联表的检验下面表是把该例的三维表简化成只有收入和观点的二维表这是SPSS自动转化的 Analyze DescriptiveStatistics Crosstabs 二维列联表的检验对于上面那样的二维表我们检验的零假设和备选假设为H0 观点和收入这两个变量不相关 H1 这两个变量相关这里的检验统计量在零假设下有大样本时近似的c2分布当该统计量很大时或p 值很小时就可以拒绝零假设认为两个变量相关实际上有不止一个c2检验统计量包括Pearsonc2统计量和似然比 likelihoodratio c2统计量它们都有渐近的c2分布根据计算可以得到对于这两个统计量均有 p 值小于0 001 因此可以说收入高低的确影响观点 Pearsonc2统计量似然比c2统计量 Oi代表第i个格子的计数 Ei代表按照零假设行列无关对第i格子的计数的期望值二维列联表的检验刚才说这些c2统计量是近似的那么有没有精确的统计量呢当然有这个检验称为Fisher精确检验它不是c2分布而是超几何分布对本问题计算Fisher统计量得到的p 值也小于0 001 聪明的同学必然会问既然有精确检验为什么还要用近似的c2检验呢这是因为当数目很大时超几何分布计算相当缓慢比近似计算会差很多倍的时间而且在计算机速度不快时根本无法计算因此人们多用大样本近似的c2统计量而列联表的有关检验也和c2检验联系起来了 Fisher精确检验 SPSS Weight Describ crosstab exact table7 sav 其中有变量性别 sex 观点 opinion 和收入 income 每一列相应于其代表的变量的水平每一行为一种水平的组合共有2 3 2 12种组合 12行而每种组合的数目也就是列联表中的频数在number那一列上面这就是每种组合的权重 weight 需要把这个数目考虑进去称为加权 weight 如果不加权最后结果按照所有组合只出现一次来算也就是说按照列联表每一格的频数为1 由于在后面的选项中没有加权的机会因此在一开始就要加权方法是点击图标中的小天平权就是天平的意思出现对话框之后点击Weightcases 然后把 number 选入即可二维列联表情况加权之后按照次序选Analyze DescriptiveStatistics Crosstabs 在打开的对话框中把opinion和income分别选入Row 行和Column 列至于哪个放入行或哪个放入列是没有关系的如果要Fisher精确检验则可以点Exact 另外在Statistics中选择Chi square 以得到c2检验结果最后点击OK之后就得到有关Pearsonc2统计量似然比c2统计量以及Fisher统计量的输出了这里的Sig就是p 值加权下面为SPSS对于table7 savs数据产生的下面二维列联表相关分析的输出利用crosstabs处理三维列联表问题的SPSS选项利用crosstabs处理三维列联表问题的输出利用crosstabs处理三维列联表问题的输出利用crosstabs处理三维列联表问题的输出高维列联表和多项分布对数线性模型前面例子原始数据是个三维列联表对三维列联表的检验也类似但高维列联表在计算机软件的选项可有所不同而且可以构造一个所谓多项分布对数线性模型 loglinearmodel 来进行分析利用对数线性模型的好处是不仅可以直接进行预测而且可以增加定量变量作为模型的一部分对数线性模型现在简单直观地通过二维表介绍一下对数线性模型假定不同的行代表第一个变量的不同水平而不同的列代表第二个变量的不同水平用mij代表二维列联表第i行第j列的频数人们常假定这个频数可以用下面的公式来确定这就是所谓的多项分布对数线性模型这里ai为行变量的第i个水平对ln mij 的影响而bj为列变量的第j个水平对ln mij 的影响这两个影响称为主效应 maineffect 多项分布对数线性模型这个模型看上去和回归模型很象但由于对于分布的假设不同不能简单地用线性回归的方法来套用和Logistic回归类似计算过程也很不一样当然我们把这个留给计算机去操心了只要利用数据来拟合这个模型就可以得到对于ai和bj的估计有了估计的参数就可以预测出任何i j水平组合的频数mij了通过其对数注意这里的估计之所以打引号是因为一个变量的各个水平的影响是相对的因此只有事先固定一个参数值比如a1 0 或者设定类似于Sai 0这样的约束才可能估计出各个的值没有约束则这些参数是估计不出来的多项分布对数线性模型二维列联表的更完全的对数线性模型为这里的 ab ij代表第一个变量的第i个水平和第二个变量的第j个水平对ln mij 的共同影响交叉效应即当单独作用时每个变量的一个水平对ln mij 的影响只有ai 或bj 大但如果这两个变量一同影响就不仅是ai bj 而且还多出一项这里的交叉项的诸参数的大小也是相对的也需要约束条件来得到其估计涉及的变量和水平越多约束也越多注意无论你对模型假定了多少种效应并不见得都有意义有些可能是多余的本来没有交叉影响但如果写入也没有关系在分析过程中一般可以知道哪些影响是显著的而那些是不显著的两种对数线性模型前面介绍的多项分布对数线性模型假定所有的可能格子里面的频数满足多项分布另一类为Poisson对数线性模型它假定每个格子里面的频数满足一Poisson分布后面再介绍统计软件的选项中有关于分布的选项高维表的检验统计量和二维表一样也包含了Pearsonc2统计量和似然比c2统计量用table7 sav数据拟合对数线性模型假定多项分布对数线性模型为这里ai为收入 i 1 2 3代表收入的低中高三个水平 bj为观点 j 1 2代表不赞成和赞成两个水平 gk为性别 k 1 2代表女性和男性两个水平 mijk代表三维列联表对于三个变量的第ijk水平组合的出现次数而从相应的参数估计输出结果可以得到对ai的三个值的估计为0 5173 0 2549 0 0000 对bj的两个值的估计为 0 6931 0 0000 对gk的两个值的估计为0 1139 0 0000 多项对数线性模型常数无意义输出的常数项仅仅是数学意义 SPSS输出就这里的三维列联表问题如只考虑各个变量单独的影响而不考虑变量组合的综合影响其SPSS输出的Pearsonc2统计量和似然比c2统计量得到的p 值分别为0 0029和0 0011 SPSS输出 SPSS的实现数据table7 sav 假定已经加权加权一次并存盘了既可这时的选项为Analyze Loglinear General 首先选择格子中频数的分布这里是多项分布其默认值是Poisson对数线性模型然后把三个变量 sex opinion income 选入Factors 因子再选Model 模型如果选Saturated 饱和模型那就是所有交叉效应都要放入模型但如果不想这样可以选Custom 自定义在BuildingTerms 构造模型的项选Maineffect 主效应再把三个变量一个一个地选进来如果两个或三个一同选入等于选入交叉效应如果想要知道模型参数在Options中选择Estimates 最后Continue OK即可得出结果在计算机输出的结果中可以找到我们感兴趣的结果如果SPSS的Viewer输出不完全可以选中不完全的输出利用Edit CopyObjects来复制到例如记事本那样的文件中就可以看到完整输出了 Poison对数线性模型有的时候类似的高维表并不一定满足多项分布对数线性模型下面看一个例子这是关于哮喘病人个数和空气污染程度年龄和性别的数据 asthma sav 后面表格为某地在一段时间记录的60组在不同空气污染状态的不同年龄及不同性别的人的发生哮喘的人数其中性别为定性变量S sex 1代表女性 2代表男性空气污染程度P也是定性变量 polut 1 2 3分别代表轻度中度和严重污染年龄A age 为定量变量为那一组人的平均年龄还有一列计数C count 为这一组的哮喘人数这个表格和前面的列联表的不同点在于每一格的计数并不简单是前面三个变量的组合的数目某个年龄段某种性别及某种污染下的人数而是代表了某个年龄段某种性别及某种污染下发生哮喘的人数 Poisson对数线性模型简介在某些固定的条件下人们认为某些事件出现的次数服从Poisson分布比如在某一个时间段内某种疾病的发生病数显微镜下的微生物数血球数门诊病人数投保数商店的顾客数公共汽车到达数电话接通数等等然而条件是不断变化的因此所涉及的Poisson分布的参数也随着变化 Poisson对数线性模型假定哮喘发生服从Poisson分布但是由于条件不同 Poisson分布的参数l也应该随着条件的变化而改变这里的条件就是给出的性别空气污染程度与年龄当然如何影响以及这些条件影响是否显著则是我们所关心的这个模型可以写成这里m为常数项 ai为性别 i 1 2分别代表女性和男性两个水平 bj为空气污染程度 j 1 2 3代表低中高三个污染水平 x为连续变量年龄而g为年龄前面的系数 eij为残差项 Poisson对数线性模型从对于数据 asthma sav 的Poisson对数线性模型的相应SPSS输出可以得到对m的估计为4 9820 对ai的两个值的估计为 0 0608 0 0000 对bj的三个值的估计为 0 1484 0 1223 0 0000 对g的估计为0 0126 注意这里的对主效应aI和bj的估计只有相对意义它们在一个参数为0的约束条件下得到的从模型看上去年龄和性别对哮喘影响都不那么重要轻度污染显然比中度污染和严重污染哮喘要好但是似乎严重污染时哮喘稍微比中度污染少些差别不显著通过更进一步的分析这里不进行可以发现中度和严重空气污染无论单独还是一起和轻度空气污染比较都显著增加哮喘人数而中度及严重污染时的哮喘人数并没有显著区别数据 asthma sav m read table d booktj1 data asthma txt names m c Sex Polution Age Count attach m a glm Count Sex Polution Age family poisson Sex factor Sex Polution factor Polution a glm Count Sex Polution Age family poisson summary a 数据 asthma sav m read table d booktj1 data asthma txt Call glm formula Count Sex Polution Age family poisson DevianceResiduals Min1QMedian3QMax 1 7901 0 6700 0 06510 60931 5848Coefficients EstimateStd ErrorzvaluePr z Intercept 1 7307120 14023812 341 2e 16 Sex20 0239260 0905430 2640 7916Polution20 2974650 1123532 6480 0081 Polution30 1743460 1155191 5090 1312Age0 0044070 0023331 8890 0589 Signif codes 0 0 001 0 01 0 05 0 1 1 Dispersionparameterforpoissonfamilytakentobe1 Nulldeviance 56 577on59degreesoffreedomResidualdeviance 45 772on55degreesoffreedomAIC 289 41NumberofFisherScoringiterations 4 SPSS的实现数据asthma sav 假定已经加权这时的选项为Analyze Loglinear General 首先选择格子中频数的分布这里是Poisson分布然后把两个变量 sex polut 选入Factors 因子把age选入CellCovariate s 再选Model 模型这里以选Custom 自定义在BuildingTerms 构造模型的项选Maineffect 主效应再把三个变量一个一个地选进来如果想要知道模型参数在Options中选择Estimates 最后Continue OK即可得出结果在结果中可以找到有关Pearsonc2统计量和似然比c2统计量的检验结果及参数的估计如果SPSS的Viewer输出不完全可以选中不完全的输出利用Edit CopyObjects来复制到例如记事本那样的文件中就可以看到完整输出了数据 acc2 txt acc2sas txt acc2 sav m read table d booktj1 data acc2 txt header T attach m Machine fac

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

列联表对数线性模型.ppt

文档简介

温馨提示

最新文档

评论

列联表对数线性模型.ppt

文档简介

温馨提示

最新文档

评论

相关文档