




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、结12张佳佳2011010128实验12 统计推断【实验目的】1、掌握数据的参数估计、假设检验的基本原理、算法,及用matlab实现的方法。2、练习使用这些方法解决实际问题。【实验内容】第一题 学校随机抽取 100 名学生,测量他们的身高和体重,所得资料如下表。表格 1 100名学生身高体重身高体重身高体重身高体重身高体重身高体重17275169551696417165167471716216867165521696216865166621686516459170581656416055175671737417264168571555717664172691695817657173581685
2、016952167721705716655161491735717576158511706316963173611645916562167531716116670166631725317360178641635716954169661786017766170561675416958173731705816065179621725016347173671655817663162521656617259177661826917575170601706216963186771746616350172591766016676167631725717758177671697216650182631766
3、817256173591746417159175681655616965168621776418470166491717117059(1) 对这些数据给出直观的图形描述,检验分布的正态性。(2) 根据这些数据对全校学生的平均身高和体重做出估计,并给出估计的误差范围。(3) 学校10年前做过普查,学生的平均身高为167.5cm,平均体重60.2kg,根据这次抽查的数据,对学生的身高体重有无明显变化做出结论。第一问要求用直观的图形描述指的是画出以上100个样本点的直方图,并用MATLAB函数检验其正态性。代码如下:clcclearA=17275169551696417165167471716216
4、867165521696216865166621686516459170581656416055175671737417264168571555717664172691695817657173581685016952167721705716655161491735717576158511706316963173611645916562167531716116670166631725317360178641635716954169661786017766170561675416958173731705816065179621725016347173671655817663162521656617
5、259177661826917575170601706216963186771746616350172591766016676167631725717758177671697216650182631766817256173591746417159175681655616965168621776418470166491717117059;high=A(:,1:2:9);high=high(:);weight=A(:,2:2:10);weight=weight(:);subplot(1,2,1),hist(high,6),xlabel('身高/cm'),ylabel('频数
6、');subplot(1,2,2),hist(weight,6),xlabel('体重/kg'),ylabel('频数');h1=lillietest(high)h2=lillietest(weight)结果如下:h1 = 0h2 = 0学生身高体重分布的直观图形:图 1 100名学生身高体重统计图第二问通过正态性检验后,分别计算均值点估计,均值区间估计,标准差点估计和标准差区间估计。区间估计取置信水平为0.95。只需在原代码的基础上添加如下代码:mu1 s1 muci1 smaci1=normfit(high)mu2 s2 muci2 smaci2=n
7、ormfit(weight)运行结果整理得:表格 2学生身高体重的点估计和区间估计身高/cm体重/kg均值点估计170.2561.27均值区间估计(169.1782,171.3218)(59.9023, 62.6377)标准差点估计5.40186.8929标准差区间估计(4.7428,6.2751)(6.0520 ,8.0073)第三问这是一个关于总体均值的双侧检验。假设检验为:由于总体方差未知,因此:于是采用t检验,取alpha=0.05,即默认值,加入如下代码:h11=ttest(high,167.5)h22=ttest(weight,60.2)结果如下:h11 = 1h22 = 0从结果
8、可以看出,拒绝身高无显著变化的假设,认为体重无明显变化。第二题20名学生参加了某课程进行的、考察同样知识的两次测验成绩如下表。根据这些数据判断两次测验的难度是否相同。表格 3 20名学生的两次测验成绩(每列示同一名学生的两次成绩)第一次9385799078768185886892738884907069838385第二次8889868587887593887886868089857978888890方法一由于两次成绩并不是两个独立的样本,因为这两组数据是由同一个总体产生的,而且两次所考知识点相同,所以并不相互独立。于是,该模型并不能把两次成绩用两总体均值比较的方法得出的结论作为检验结果。但是,
9、对于每个个体两次成绩的差值,应该是相互独立的,所以可以对每个个体作两次成绩之差作为一个新的变量,对该变量作总体均值的假设检验。首先对所有人两次成绩之差是否服从正态分布进行检验,代码如下:clcclearx1=93 85 79 90 78 76 81 85 88 68 92 73 . 88 84 90 70 69 83 83 85; %第一次测验成绩x2=88 89 86 85 87 88 75 93 88 78 86 86 . 80 89 85 79 78 88 88 90; %第二次测验成绩y=x1-x2;h1=jbtest(y)运行结果:h1 = 0因此两次成绩之差可认为服从正态分布。改问
10、题转化为总体方差未知的情况下均值检验。添加代码:h = 1sig = 0.0428ci = -6.4818 -0.1182由结果可见,两次考试的难度不相同,由置信区间小于0可知第一次考试难度大于第二次。方法二另外还可通过对两次测验的数据进行参数估计比较测验难度,代码如下:clcclearx1=93 85 79 90 78 76 81 85 88 68 92 73 . 88 84 90 70 69 83 83 85; %第一次测验成绩x2=88 89 86 85 87 88 75 93 88 78 86 86 . 80 89 85 79 78 88 88 90; %第二次测验成绩mu1 s1 m
11、uci1 smaci1=normfit(x1)mu2 s2 muci2 smaci2=normfit(x2)对结果进行整理如下:表格 4两次考试成绩的点估计和区间估计第一次第二次均值点估计8285.3均值区间估计(78.4292,85.5708)(83.0730,87.5270)标准差点估计7.62964.7584标准差区间估计(5.8022,11.1436)(3.6187,6.9499)可以看出第一次考试的平均成绩低于第二次,而且方差也比第二次大,同样可以得出第一次考试比第二次难的结论。第三题下表给出的中国7-18 岁青少年身高资料来源于1995年全国学生体质健康调研,分层随机整群抽样自除西
12、藏、台湾外的所有省(市、自治区),年龄7-22岁,共约20万各年龄段的数据。日本7-18岁青少年身高资料以1995年日本学校保健调查为依据。表中是各个样本的均值和标准差。设法用这些数据判断中国和日本男女生身高是否有差异。(表略去)模型建立由于没有中日男女生身高的原始数据,不能直接用MATLAB命令中ttest2计算,不妨在中日男女生身高均服从正态分布,且两个未知方差相等的假设下,利用下面的t检验进行计算。以中日男(女)生的均值(xbar,ybar)、标准差(s1,s2)和容量(m,n)为输入参数,就可以编写一个名为pttest2.m的函数M文件(包含双侧和单侧检验,标识tail的用法与ztes
13、t相同,所有输入参数不可省略)。function h,sig=pttest2(xbar,ybar,s1,s2,m,n,alpha,tail)spower=(m-1)*s12+(n-1)*s22)/(m+n-2);t=(xbar-ybar)/sqrt(spower/m+ spower/n);if tail=0%mu1=mu2 a=tinv(1-alpha/2,m+n-2); sig =2*(1-tcdf(abs(t),m+n-2); if abs(t)<=a h=0; else h=1; endendif tail=1%mu1>mu2 a=tinv(1-alpha,m+n-2); s
14、ig =1-tcdf(t,m+n-2); if t<=a h=0; else h=1; endendif tail=-1%mu1<mu2 a=tinv(alpha,m+n-2); sig =tcdf(t,m+n-2); if t>=a h=0; else h=1; endend主程序如下:clcclearm1=124.5,129.4,134.6,139.3,145.1,151.2,160.0,165.1,168.3,170.1,171.0,170.8;122.5,128.1,133.4,138.9,144.9,152.0,159.6,165.1,168.5,170.0,170
15、.8,171.1;%中日男生身高均值s1=5.7,5.6,6.0,6.6,7.2,8.1,8.0,7.0,6.3,6.3,6.0,5.8;5.4,5.5,5.4,5.9,6.7,7.8,7.6,6.8,6.2,5.9,6.0,5.9;%中日男生身高标准差m2=123.4,128.4,134.3,140.0,146.7,152.5,156.3,157.7,158.9,159.3,159.3,159.1;121.8,127.6,133.5,140.2,146.7,151.9,155.1,156.7,157.4,157.9,158.1,158.2;%中日女生身高均值s2=5.4,5.5,6.2,6.
16、9,7.0,6.6,6.0,5.5,5.6,5.4,5.4,5.3; 5.4,5.7,6.3,6.6,6.7,6.2,5.4,5.2,5.0,5.3,5.0,5.1;%中日女生身高标准差For i=1:12 h1(1,i),sig1(1,i)=pttest2(m1(1,i),m1(2,i),s1(1,i),s1(2,i),5000,5000,0.05,0); h2(1,i),sig2(1,i)=pttest2(m2(1,i),m2(2,i),s2(1,i),s2(2,i),5000,5000,0.05,0);Endh1sig1h2sig2输出结果:h1 = 1 1 1 1 0 1 1 0 0
17、0 0 1sig1 =0 0 0 0.0014 0.1505 0.0000 0.0104 1.0000 0.1096 0.4127 0.0956 0.0104h2 = 1 1 1 0 0 1 1 1 1 1 1 1sig2 =0 0.0000 0.0000 0.1386 1.0000 0.0000 0 0 0 0 0 0结果整理如下:表格 5 中日学生身高是否有差异对比结果7-8-9-10-11-12-13-14-15-16-17-18-男生有有有有无有有无无无无有女生有有有无无有有有有有有有结论:可以看出中日男女身高在大部分年龄段都存在这差异,女孩的差异大于男生。另外,该模型中假设各个年龄段的样本容量均为5000,如果增大样本容量到10000,再次运行程序得到结果:表格 6 中日学生身高是否有差异对比结果(样本容量10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 晋城市人民医院硬膜外腔注射考核
- 鄂尔多斯市中医院护理操作技术标准化培训与考核管理
- 天津市人民医院弹力纤维染色考核
- 运城市人民医院急诊影像学判读能力考核
- 中国衣领净项目商业计划书
- 赤峰市中医院报告书写规范考核
- 齐齐哈尔市人民医院压疮预防管理考核
- 2025年中国石蜡抑制剂项目商业计划书
- 邢台市人民医院脊柱手术术中麻醉配合考核
- 呼和浩特市人民医院血管外科医疗质量管理考核
- 建设项目环境影响评价收费标准
- 大学生素质教育主题班会课件
- 四年级劳动教育-学做水果拼盘(课件)
- 1二年级上册小学生经典诵读校本课程教材
- 2021年吉县社区工作者招聘笔试题及答案解析
- 城市轨道交通乘客服务课件(完整版)
- 2022年公务员申论答题标准格子纸Word版A4打印版
- 农产品食品检验员理论知识竞赛题库
- 新高考英语读后续写——故事编写思路
- 中国地质大学(北京)海洋科学导论考研题库
- 学校总务后勤管理制度管理办法
评论
0/150
提交评论