高级统计学(2).ppt_第1页
高级统计学(2).ppt_第2页
高级统计学(2).ppt_第3页
高级统计学(2).ppt_第4页
高级统计学(2).ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定性数据的建模 1 列联表及列联表分析 研究两个属性变量之间是否有联系研究步骤 通过问卷调查或统计资料获得属性变量的信息 整理问卷或统计资料获得列联表数据 通过统计假设检验两个属性变量是否具有独立性 2 女性人口学研究 教育 婚姻 合计 合计 大学 大学以下 结婚一次 结婚多次 550 61 681 144 611 825 1231 205 1436 3 频数列联表 4 事件发生的概率 A 事件与同时发生的概率 频率列联表 B 合计 合计 事件发生的概率 5 统计假设与检验 零假设 属性变量A与B相互独立检验统计量及其分布 n足够大 决策规则 对给定的显著性水平 若则拒绝零假设 6 检验统计量的计算 7 零假设 婚姻状态与教育水平没有关系检验统计量及其分布 n足够大决策规则 对给定的显著性水平0 05则拒绝零假设 即婚姻状态与教育水平有关联 8 SPSS实现 数据结构 属性变量1 属性变量2 9 10 11 12 13 对数线性模型的基本理论和方法 研究两个属性变量之间的关联方式研究方法 双因素方差分析 14 频率的分解 A B 均值 均值 频率对数表 15 频率对数分解式 属性A的效应 属性B的效应 A与B的交互效应 16 0属性A与B相互独立 17 属性间的关联度分析 某个在统计意义上是否为零需要进行假设检验 18 的估计 19 对数线性模型的SPSS实现 频数列联表 20 SPSS中的数据输入 频数 A水平 B水平 1 2 3 1 2 3 1 1 1 2 2 2 21 例题 某企业想了解顾客对其产品是否满意 同时还想了解不同收入的人群对其产品的满意程度是否相同 在随机发放的1000份问卷中收回有效问卷792份 根据收入高低和满意回答的交叉分组数据如下 22 列联表与对数线性模型的估计结果 23 数据结构 24 激活频数 25 26 对数线性模型的SPSS实现过程 27 28 29 30 31 32 Logistic回归基本理论和方法 研究某一事件发生的概率P P y 1 与若干因素之间的关系 在0和1之间 任意范围之间的数量 若干个状态的标量 33 logistic变换 logistic变换Logistic回归模型 优势比 34 概率p的预测 P与多因素之间的关系预测 35 P与单因素之间的关系图 p x 1 最可能成功范围 最不可能成功范围 36 回归系数的含义 优势比 OddsRatio 事件发生与不发生的概率比优势比与单变量系数之间的关系 37 Logistic回归系数的估计 分组数据 n组观测数据结构 序号 x 参加调查总数 事件出现次数 事件出现频率 Logistic变换 1 2 n i 38 2019 12 30 39 拟合模型其中近似服从 权 weight 回归模型具有异方差性 40 转换成经典回归模型 加权最小二乘 其中近似服从 41 例题 在一次住房展销会上 与房地产商签订初步购房意向书的共有n 325名顾客 在随后的三个月里 只有一部分顾客确实购买了房屋 以顾客的年家庭收入x 万元 为自变量 建立Logistic回归模型 42 43 44 点击 45 Logistic回归系数的估计 未分组数据 n组观测数据 与的关系 46 未分组数据结构 47 参数的极大似然估计 的分布函数的似然函数 48 似然函数的对数表达利用迭代法求解似然函数对数的最大值点就是参数的极大似然估计 记为 49 拟合的优良性 回归模型的优良性 拟合优度 回归系数的显著性 2log L Wald goodness of fitstatistics 50 Hosmer LemeshowTest 零假设 因变量实际分布与预测的分布无差异决策准则 拒绝零假设模型不显著 51 例题 估计金融机构正常运转的概率 Detectingailingfinancialandbusinessestablishmentsisanimportantfunctionofauditandcontrol Table1givessomeoftheoperatingfinancialratiosof33firmsthatwentbankruptafter2yearsand33thatremainedsolventduringthesameperiod Threefinancialratioswereavailableforeachfirm 52 IndependentsandDependent ResponseVariable 53 Logistic回归步骤以及SPSS实现 54 点击1 点击2 55 点击1 点击2 56 点击 属性变量 57 点击1 点击2 可选 可选 58 变量的选择 第二步 第三步 第一步 分别计算p个变量和p 1个变量模型的 2LL P 和 2LL p 1 计算2 LL p LL p 1 服从 如果2 LL p LL p 1 不应删除变量 59 科研教案 庞素林 Logistic回归模型在信用风险中的应用 数学的实践与认识 2006 36 9 129 137 60 判别模型建立的基本步骤 样本分组 将样本分成训练样本组和测试样本组 评价过程 利用测试样本评价模型的精度 第二步 第三步 第一步 61 摘要 通过运行SPSS 建立Logistic回归信用评价模型 creditevaluationmodel 用来对中国2000年106家上市公司进行两类模式分类 这两类模式是指按照公司的经营状况分为 差 和 正常 两个小组 对每一家上市公司 考虑其经营状况的4个主要财务指标 每股收益 每股净资产 净资产收益率和每股现金流量 62 仿真结果表明 Logistic回归信用评价模型对总体106个样本 判别准确率达到99 06 此外 本文的研究结果还发现 当利用SPSS的Discriminant给出的模型系数建立的线性判别分析模型和利用SPSS的MultinomialLogistic给出的模型参数建立的Logistic回归模型 Logistic回归模型的判别结果不如线性判别模型 但如果剔除不合格的样本 或是将样本数据规格化 则可以提高Logistic回归模型的分类准确率 63 引言中提及的一些研究结果 Martin 1977 用Logistic模型预测公司破产及违约的概率Ohlson 1980 将Logistic模型应用于信用风险分析Madalla 1983 采用Logistic模型区别违约与非违约贷款申请人 64 DavidWest 2000 利用5种神经网络和5种统计分类模型 线性判别分析 Logistic回归分析 K最近邻法 核密度分类法 分类树法 分别对德国和澳大利亚两组财务数据进行两类模式分类 研究结果表明 Logistic模型的判别准确率最高 分别为76 3 和87 25 65 一个一般结论 数据满足正态分布 Logistic回归模型与判别分析模型具有相同的判别准确率 yes No Logistic回归模型的判别准确率高于判别分析模型的判别准确率 66 本研究结论 当Logistic回归模型和判别分析模型都通过运行SPSS软件来估计模型参数并建立相应模型时 线性判别分析模型优于Logistic回归模型 67 Logistic模型 每股净收益 每股净资产 净资产收益率 每股现金流量 68 判别法则 公司i财务状况正常的概率 69 习题二 在一次关于公共交通的社会调查中 一个调查项目为 是乘坐公共汽车还是骑自行车上班 变量包括 70 Logistic回归结果 71 72 不包含月收入变量的回归结果 73 74 回答如下问题 全

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论