




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章列联分析 分类数据数据有三类 分类数据 顺序数据 数值数据 但后两类数据也都可以转化为分类数据 对于两个分类数据进行分析 可以用列联表列联表的构造两个以上的变量进行交叉分类的频数分布表 称为列联表 第一节分类数据与列联表 例 一个集团公司在四个不同的区域设有分公司 现该集团公司欲进行一项改革 从四个分公司共抽取420个样本单位 了解职工对此项改革的看法 调查结果如表所示 关于改革方案的调查结果 列联表的分布一个列联表可以看成是一个两元随机向量的分布表包含百分比的2x4列联表 检验将样本分成n类 每类实际出现的频数用表示 其理论频数为 当样本容量充分大时 则统计量为服从分布 其中n 1为自由度 第二节拟合优度与独立性检验 拟合优度检验利用随机样本资料 对总体是否服从某种理论分布进行的检验 称为拟合优度检验例如 航空业官员在理论上认为机票购买者的年龄服从某种特殊的分布 称为期望分布 为了接受或拒绝该分布 随机选取机票购买者年龄的真实样本 使用拟合优度检验比较观察值与期望值又如 在皮鞋制造业 生产商可以使用拟合优度检验确定一年当中对其商品的需求是否服从均匀分布 拟合优度检验示例例1 有四厂家生产同类产品 在过去的一年里 市场份额稳定在A公司47 B公司34 公司11 和D公司8 最近各家公司都开发了各自 新型和改进型 的产品代替原有的产品 因此 A公司市场营销部门想知道这些新产品是否改变了市场份额 于是请评估公司组织进行一个抽样调查 随机选择了该城市在各大超市购物的207个消费者 以了解他们会选择哪种产品 结果选用A B C D公司产品的消费者比例为从抽样结果判断市场份额有没有发生变化 拟合优度检验示例 续 例2 某消费者协会想确定市场上5种牌子的啤酒哪一种最受消费者欢迎 该协会随机抽取1000名啤酒饮用者作为样本进行如下的实验 每个人得到5种牌子的啤酒各一瓶 但都未标明牌子 这5瓶啤酒分别贴着标有A B C D E字母的纸片以随机确定的顺序送给每一个人 下表是根据样本资料整理得到的各种牌子啤酒爱好者的频数分布 判断消费者对这几种牌子的爱好有没有差别 拟合优度检验的步骤 1 对总体分布建立假设H0 总体服从某种理论分布H1 总体不服从该理论分布 2 抽样并对样本资料编成频数分布 f0 3 以 原假设H0为真 导出一组期望频数 fe 4 计算检验统计量 2 f0 fe 2 fe 5 对给定的 查 2表 得到临界值 6 比较值与临界值作出检验判断 注意事项 1 各组理论频数fe不得小于5 如不足5 可合并组 2 为使组数不致太少 总频数n 50 3 根据具体情况确定自由度 拟合优度检验示例分析 例 步骤一 建立如下假设 即各公司的市场份额没有发生变化至少有一个不成立 即各公司的市场份额发生了变化步骤二 确定使用的检验统计量 步骤三 取 由于拟合优度检验是单边检验 且当等于零时表明理论分布与实际分布是一致的 与零的任何偏差都是正的 这是因为是由平方和确定的 永远不会是负值 在此题中 由于n 4 所以自由度n 1 3 在的条件下 临界值为决策准则 如果计算得到的样本检验统计量的值大于7 815 则拒绝原假设 否则则不能拒绝 步骤四 计算样本检验统计量的值 分以下几步完成 1 计算期望值 理论频数 见表 表 公司份额期望频数的计算 2 计算拟合优度检验统计量的值由表知 6 25 步骤五 计算出的卡方检验统计量的值明显小于临界值 所以不拒绝原假设 即认为新产品没有改变市场份额 7 815 6 25 不拒绝原假设 拟合优度检验示例分析 例2 如果没有差别 则应预期啤酒饮用者的人数呈均匀分布 每种牌子啤酒的爱好者各占20 H0 不同牌子饮用者人数服从均匀分布H1 不同牌子饮用者人数不服从均匀分布显著性水平为0 05 df 5 1 4 拒绝域为 9 488根据原假设 每种牌子啤酒爱好者的理论频数为200由于136 4 9 488 所以拒绝原假设结论 消费者对各款啤酒的爱好有差别 独立性检验例 在对某城市家庭的社会经济特征调查中 调查者同时想确定家庭的电话拥有量与汽车拥有量是否独立 该公司对10000户家庭组成的简单随机样本进行调查 获得资料如下表 设显著性水平为0 01 列联表 观察值 列联表 理论频数的计算 检验统计量的构造 独立性检验的步骤 1 对总体的两个变量建立假设H0 两变量独立H1 两变量关联 2 将样本资料编成r k列联表 并列出实际频数Oij 3 计算理论频数 4 计算检验统计量 5 给定的 查 2表 得到临界值 6 比较 2值与临界值作出检验判断 例题分析解 H0 汽车拥有量与电话拥有量是独立的H1 汽车拥有量与电话拥有量是不独立的 将观察频数与理论频数排在一起 并将理论频数置于括号内 由表计算得到检验统计量 显著水平为0 01自由度n r 1 k 1 3 1 3 1 4查表得 所以拒绝H0结论 汽车拥有量与电话拥有量不是独立的 第三节列联表中的相关测量 品质相关如果独立性检验结果为不独立 那相关程度有多大 两个变量之间相关程度的测定 主要用相关系数表示 分类数据之间的相关称为品质相关 常用的品质相关系数有 相关系数列相关系数相关系数 相关系数它仅适用于2X2列联表对于左侧的确表格 可以表示成下列算式 列联相关系数又称列联系数它适用于一般列联表 时 两个变量相互独立 它的最大值依赖于行数和列数 优点 对总体分布无要求缺点 不同行数和列数的列联相关系数间不能比较 相关系数又称列联系数它适用于一般列联表 时 两个变量相互独立 时 两个变量完全相关 当列联表中有一维为2时 数值分析例 一种原料来自三个不同的地区 原料质量被分成三个等级 从这批原料中随机抽取500件进行检验 结果如下表所示 要求计算品质相关系数 第四节分布的期望值准则 关于的两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮商业综合体物业托管合同
- 餐厅店面租赁及特色食材供应协议
- 生态餐厅厨房承包及绿色环保餐饮服务合同
- 智能化常年法律顾问报价单制作与实施
- 智能贷款匹配车辆居间服务合同
- 企业培训中心场地无偿借用协议
- 溶血性贫血的护理措施
- 通信设备采购合同性能测试与维护跟踪服务
- 车辆安全教育培训与考核合同范本
- 矿产资源开采采矿权出让与税收优惠政策协议
- 安徽省2011年普通高校招生第一批本科院校投档分数及名次
- 时代音画学习通超星期末考试答案章节答案2024年
- GB/T 6003.2-2024试验筛技术要求和检验第2部分:金属穿孔板试验筛
- 猎聘-2024高校毕业生就业数据报告
- 产品质量鉴定程序规范 总则
- 草晶华工作计划
- DZ∕T 0388-2021 矿区地下水监测规范(正式版)
- 脑干损伤护理常规
- MOOC 数值天气预报-南京信息工程大学 中国大学慕课答案
- 跨座式单轨交通工程接触网系统技术标准
- 教师口语智慧树知到期末考试答案2024年
评论
0/150
提交评论