




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1. R语言卡方检验皮尔森拟合优度塔防检验。假设H0:总体具有某分布 F备择假设H1:总体不具有该分布。我们将数轴分成若干个区间,所抽取的样本会分布在这些区间中。在原假设成立的条件下,我们便知道每个区间包含样本的个数的期望值。用实际值Ni与期望值Npi可以构造统计量K。皮尔森证明,n趋向于无穷时,k收敛于m-1的塔防分布。m为我们分组的个数。有了 这个分布,我们就可以做假设检验。例5,8 X消许者协会为了碎定市场上消册者対了仲品牌曲酒的宾好倩况*随机 拋取了 了0的名啤酒愛好者作为样本进行孔下试媳:每牛人得到5料苗牌的嘛酒 备一毗,但未标明肄子,这5种呻酒按余別写着A、B . J 1)、E字世
2、的 厅舉軌片随机的顺序送蛉舟一个人一札是报据样本希料玺躍痔到的各种品牌 咚酒爱好者的频数分布-试桜据这匹数攥判断消骨若对这5种品牌啤通的愛好 宵无明显差异了表种品課啤酒宣好者的频数最壽欢砖牌亍ABCDE人敦X21031217085223#如果是均匀分布,则没有明显差异 匀分布 x n - sum(x); m p K p -1-pchisq(K,m-1); p # 计算出 p 值1 0 #拒绝原假设。在R语言中chisq.test(),可以完成拟合优度检验。默认就是检验是否为均匀分布,如果是其他分布,需要自己分组,并在参数p中指出。上面题目的解法:chisq.test(x)Chi-squared
3、 test for give n probabilitiesdata: xX-squared = 136.49, df = 4, p-value x A A(0,69 (69,79 (79,89 (89,1008 5 13 5 p p chisq.test(A,p=p)Chi-squared test for given probabilities data: AX-squared = 8.334, df = 3, p-value = 0.03959 #对样本数据进行分组。获得理论分布的概率值检验结果不是正态的。例:大麦杂交后关于芒性的比例应该是 无芒:长芒:短芒 =9:3:4 。 我们的实际
4、观测值是 335: 125:160 。请问观测值是否符合预期? p x chisq.test(x,p=p)Chi-squared test for given probabilitiesdata: xX-squared = 1.362, df = 2, p-value = 0.5061在分组的时候要注意,每组的频数要大于等于 5. 如果理论分布依赖于多个未知参数,只能先由样本得到参数的估计量。然后构造统计量K,此时 K 的自由度减少位置参数的数量个。2. R 语言 ks 检验。R 语言中提供了 ks.test() 函数,理论上可以检验任何分布。他既能够做单样本检验,也能 做双样本检验。单样本
5、例:记录一台设备无故障工作时常,并从小到大排序420 500 920 1380 1510 16501760 2100 2300 2350 。问这些时间是否服从拉姆达 =1/1500 的指数分布? x ks.test(x,pexp,1/1500)One-sample Kolmogorov-Smirnov test data: xD = 0.3015, p-value = 0.2654 alternative hypothesis: two-sided双样本 例:有两个分布,分别抽样了一些数据,问他们是否服从相同的分布。 X Y ks.test(X,Y)Two-sample Kolmogorov-
6、Smirnov test #原假设为 他们的分布相同data: X and YD = 0.23, p-value = 0.5286alter native hypothesis: two-sided x x3. R语言列联表数据独立性检验。忠肺癌未患肺癌金计吸烟G03292不吸烟31114合计6343106chisq.test()同样可以做列联表数据独立性检验,只要将数据写成矩阵的形式就可以了。参数correct是逻辑变量表示带不带连续矫正。,1 ,21, 60 322,3 11 chisq.test(x)Pears ons Chi-squared test with Yates contin
7、u ity correct ion data: x拒绝假设认为有关系X-squared = 7.9327, df = 1, p-value = 0.004855 #如果一个单元格内的数据小于5那么做pearson检验是无效的。此时应该使用 Fisher精确 检验。例5.16 医师为研完乙肝免疫球第白侦馬胎丄常內感来的效果,将 八 例HlhAg I:口性孚启隧枫分为慌际注菊纽和对照组,轴農由5.7所示间两组 軒生丄的恿体感染卑有尢走别?表-V7:两组新生儿KBV感染率的比较纽别阴性感染第(%)1LS2218.18ITG1145.45合计9S43327.27 x x,1 ,21,4 182,5 6
8、 fisher.test(x)Fishers Exact Test for Count Datadata: xp-value = 0.121alter native hypothesis: true odds ratio is not equal to 195 perce nt con fide nee in terval:0.03974151 1.76726409 #p 值大与0.05 ,区间估计包含1 ,所以认为没有关系。sample estimates:odds ratio0.2791061McNemar检验。这个不是相关性检验。是配对卡方检验。也就是说,我们是对一个样本做了两次观测,本
9、身不是独立的样本而是相关的样本,而我们检验的是变化的强度。H0:频数没有发生变化。表1相依配对计数资料诸疗后具有症状A治疗后不具有症状A治疗雨不Aib治疗前耳育韭状Acd用法就不举例了。单元格内数字不得小于5.n要大于100.4. R语言符号检验。当我们以中位数将数据分为两边,一边为正,一边为负,那么样本出现在两边的概率应该都为1/2。因此,使用p=0.2的二项检验就可以做符号检验了。例:统计了 66个城市的生活花费指数,北京的生活花费指数为99。请问北京是否位于中位数以上。 x bino m.test(sum(x99),le ngth(x),alter native=less)Exact b
10、i no mial test data: sum(x 99) and len gth(x)nu mber of successes = 23, nu mber of trials = 66, p-value = 0.009329 alter native hypothesis: true probability of success is less tha n 0.595 perce nt con fide nee in terval:0.0000000 0.4563087sample estimates:probability of success0.3484848 #北京位于中位数下。符号
11、检验也可以用来检验两个总体是否存在明显差异。要是没有差异,那么两者之差为正的概率为0.5.例5.19用两评不同的轉科界猜,其增重情况知表5所比试今析两沖饲蚪表不同饲料养赭的增重情况苛编号12345G89JO11121314饲料X25302X232735:加2332293U31lb饲料Y193221253126302528312525 y x bino m.test(sum(xy),le ngth(x)Exact bi no mial test data: sum(x bin om.test(3,12,alternative=less,co nf.level=0.9)Exact bi no mi
12、al testdata: 3 and 12nu mber of successes = 3, nu mber of trials = 12, p-value = 0.073alter native hypothesis: true probability of success is less tha n 0.590 perce nt con fide nee in terval:0.0000000 0.4752663sample estimates:probability of success #p x ran k(x)1 3.5 2.0 1.0 5.0 3.5 x ran k(x)1 3 2
13、 1 5 4利用秩可以做相关性检验。cor.test( method=spearma n, ke ndell)6. R语言 wilcoxon 检验。符号检验只考虑了符号,没有考虑要差异的大小。wilcoxon解决了这个问题。假设,数据是 连续分布的,数据是关于中位数对称的。例:某电池厂商生产的电池中位数为140.现从新生产的电池中抽取20个测试。请问电池是否合格 x wilcox.test(x,mu=140,alternative=less,exact=F,correct=F,c on fi.i nt=T)Wilcox on sig ned rank testdata: xV = 34, p-
14、value = 0.007034alter native hypothesis: true locati on is less tha n 140wilcox.test()做成对样本检测。例:在农场中选择了10块农田,将每一块农田分成2小块,分别用不同的化肥种菜。请问化肥会不会提高蔬菜产量。 x y wilcox.test(x-y,alter native=greater)Wilcox on sig ned rank testdata: x - yV = 47, p-value = 0.02441alter native hypothesis: true locati on is greate
15、r tha n 0 #能够提高产量非配对双样本检测:例5.26令測殍庸非拆作證工人和7名盥作业工人的血毎伉.如表5.15示.7 Wilroxnii税彳“堆貓今拆两纽工人血锯fn勺匕農并.表“忌两组工人的血(单位:tO-6jninol/L)非轄作业俎2426293413586372871()1切作业协:8287971211642()8213 x y wilcox.test(x,y,alternative=less,exact=F,correct=F)Wilcox on rank sum test data: x and yW = 4.5, p-value = 0.001449拒绝原假设alter native hypothesis: true locati on shift is less tha n 0 #例乩28臬医忧用某聊药物治疗两型穫性支气管炎恵者共216 疗枚由农5J所示.试分折诫荷肠对西型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025电动单车充电站用户数据安全保护合同
- 2025年度矿山爆破工程劳务分包合同
- 2025版幼儿托管机构合同范本下载及服务内容
- 2025电子商务法律顾问服务合同(第3章专项)
- 2025版展览馆临时展台租赁合同范本
- 2025版商标许可及市场拓展服务合同范本
- 2025版桶装水品牌形象设计与宣传推广合同
- 2025版汽车租赁优惠活动合同范本
- 2025房地产项目建筑材料研发及采购合同
- 2025年别墅房屋建设与环保建材供应服务合同
- 消防监督员业务培训课件
- 特级建筑集团资金管理副总职责
- 2025教师暑期政治培训心得体会
- (高清版)DB34∕T 486-2025 霍山石斛
- 升降平台车培训
- 碳化硼建设项目可行性研究报告完整立项报告
- 10kV供配电系统电气设备改造 投标方案
- 肠外营养个案护理
- CJ/T 94-2005饮用净水水质标准
- 2025-2030系统级芯片(SoC)测试机产业市场深度调研及前景趋势与投资研究报告
- (2025)发展对象考试题(附答案)
评论
0/150
提交评论