




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 大数据的统计学基础第11周 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 法律声明 【声明】本视频和幻灯片为炼数成金网络课程的教 学资料,所有资料只能在课程内使用,不得在课 程以外范围散播,违者将可能被追究法律和经济 责任。 课程详情访问炼数成金培训网站 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 关注炼数成金企业微信 提供全面的数据价值资讯,涵盖商业智能与数据分析、大数据、企业信息化、数字化技 术等,各种高性价比课程信息,赶紧掏出您的手机关注吧! 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 本周内容 假设检验: 假设检验与置信区间 假设检验的检验能力(power) 非参数方法(Nonparametric methods): 符号检验(sign test) Wilcoxon符号检验(Wilcoxon signed-rank test) Wilcoxon秩和检验(Wilcoxon rank Sum test) 补充内容: 正态分布近似的连续项修正(Continuity Correction) 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 复习 假设检验 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 复习 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 复习 z2 = 1.96 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 假设检验与置信区间 关于总体均值的假设检验与置信区间, 未知的情况 假设检验:0: = 0v.s 1: 0 检验统计量: = 0 ,临界值:/2,1 拒绝域: = 0 2,1 = 0 2,1 = (0 + 2,1 或0 2,1 ) 置信区间: / ( 1) 1 = 2,1 = 2,1 + 2,1 = + ,此时, = 2,1 故的1 的置信区间为:( 2,1 , + 2,1 ) 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 假设检验与置信区间 其他情况 1. 单个总体 (1)总体均值( 已知) (2)总体比例 (3)总体方差 2. 两个总体 (1)两个独立总体的均值之差(三种情况) (2)两个配对样本的均值之差 (3)两个独立总体比例之差 (4)两个独立正态总体的方差之比 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 配对样本的置信区间 d:配对数据的差值 ;:差值的总体均值 :样本差值的均值 ;:样本差值的标准差 n:配对数据的对数 = ( 1) 1 = 2,1 = 2,1 = 2,1 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 例子温度差 下表记录了某5天实际的最低温度与预测的最低温度 设=0.05。根据上述数据,构造温度差的置信区间。 = 1.0,= 3.2, = 5, 2,1= 2.776 实际与预测的最低温度(华氏度) 实际的最低温度5454556064 预测的最低温度5657595664 实际与预测的温度差d-2-3-440 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 总体比例的假设检验与置信空间 双侧置信区间 , 1 ,所以 (1) 0,1 1 2 = 1 ,故 2 1 + 2 1 = 1 由于p值的真实值不知道,一般采用 (1 ) 去代替 1 所有总体比例p的1-置信区间为 , + = 2 1 , + 2 1 其中, = 2 1 . 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 总体比例的假设检验与置信空间 0: = 0v.s 1: 0 检验统计量: = 0 00 (0,1);临界值: 2 接受域: 0 0(10) 2 = 0 2 010 = 2 010 7) =P(X7.5) 例: XB(20,0.25),求P(X=8) 正常: 8 = ( 200.25 200.2580.75 8200.25 200.2580.75) ( 8200.25 200.2580.75) 使用连续项修正: 8 = ( 7.5) = ( 200.25 200.2580.75 7.5200.25 200.2580.75) ( 7.5200.25 200.2580.75) 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 符号检验单个总体的中位数 设1,2,是来自总体X的一个样本。 设X服从一个连续分布,具体是什么分布不作要求,总体中位数为v n = 12, +的数目为9。假设检验 H0: v = 0 v:s: H1: v 0 n = 12, +的数目为9 。假设检验 H0: v = 0 v:s: H1: v 0 n = 12, +的数目为9 。假设检验 H0: v = 0 v:s: H1: v 0 0.5 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 符号检验 符号检验的不足 对比下面两组数据 A : 1,2,3,4,-10 B : 11,12,13,14,-1 做符号检验:0: = 0 v.s 1: 0 得到相同的结果 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon符号秩检验 设1,2,是来自总体X的一个样本。 要求:X服从一个连续并且对称的分布 假设检验:0: = 0 步骤: 1. 把0去掉,并重新计算n 2. 对|1|,|2|,|排序,得到其对应的秩1,2, 3. 根据1,2,的正负情况,给予其对应的秩1,2,相应的+,- 号,得到符号秩 4. 令T=sum(),得到检验统计量 5. 在零假设的条件下,查看检验统计量T的值是否为一个极端值 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon符号秩检验 例:0: = 0 v.s 1: 0 ,显著性水平0.05 符号秩: T=1+4+6+3+5=19 P(T=19)=0.047=3) = 5=8 = 0.625;P(T = 4) = 3=8 = 0.375;P(T = 5) = 2=8 = 0.25; P(T = 6) = 1=8 = 0.125 T 1236 -1235 1-234 12-33 -1-233 -12-32 1-2-31 -1-2-30 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon符号秩检验 T在零假设成立下的分布: 1. 没有ties的情况: = (+1) 4 ; = (+1)(2+1) 24 2. 有ties的情况: 精确分布比较难求,查表不再适用 = (+1) 4 ; = (+1)(2+1) 24 1 48 =1 ( 2 1) ti表示第i个结中相等数据的数目 近似:() () (0,1)(充分大时可以近似) 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon秩和检验 适用条件: 1. 两个独立的简单随机样本 2. 每个样本至少有10个样本值 设1,2,和1,2,(n=9)=4/15=0.267 = 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon秩和检验 W的近似分布 1. 没有ties 2. 有ties ti表示混合样本中第i个结中相等数据的数目 当n和m足够大时(n、m=8), 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon秩和检验 ties的情况: W=3+7.5+7.5+9+10=37 P(W=37)0.028(查表) X1216161210 Y3012243224 数据10121212161624243032 秩13335.55.57.57.5910 = 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon秩和检验 ties的情况(精确计算): 1 3 3 3 5.5 5.5 7.5 7.5 9 10 P(ranks : 3; 7:5; 7:5; 9; 10) 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 Wilcoxon秩和检验 使用正态分布近似 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 炼数成金逆向收费式网络课程 Dataguru(炼数成金)是专业数据分析网站,提供教育,媒体,内容,社区,出版, 数据分析业务等服务。我们的课程采用新兴的互联网教育形式,独创地发展了逆向收 费式网络培训课程模式。既继承传统教育重学习氛围,重竞争压力的特点,同时又发 挥互联网的威力打
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 魔术师安全知识培训课件
- 高速防滑防冻安全知识培训课件
- 高速监控业务知识培训课件
- 电芯质量培训知识课件
- 高职课件教学课件
- 第4课《观沧海》课件-2025-2026学年统编版语文七年级上册
- 第8课《世说新语二则-咏雪》课件+2025-2026学年统编版语文七年级上册
- 电网专业知识培训课件
- 电线电缆维护知识培训课件
- 电站考核知识培训内容课件
- 全脑开发教学课件
- 心脏解剖课件模板
- 运动控制考试题及答案
- 无人机培训招生宣讲
- 2025年人教版新教材数学二年级上册教学计划(含进度表)
- 第一章-马克思主义的诞生-(《马克思主义发展史》课件)
- 安全管理人员专题培训《风险分级管控与隐患排查治理培训》学习培训课件
- 2022年广东省珠海市香洲区七年级上学期期末语文试卷
- 爱的奉献小提琴谱-小提琴谱
- 地震勘探原理及方法实验指导书
- 部编版道德与法治五年级上册全册教案
评论
0/150
提交评论