版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 数学实验十二数学实验十二 统计推断统计推断 化化 21 张冶张冶 2012011863 【实验目的】 1.掌握数据的参数估计、假设检验的基本原理、算法,及用 MATLAB 实现的方法; 2.练习用这些方法解决实际问题。 【实验内容】 身高 体重 身高 体重 身高 体重 身高 体重 身高 体重 172 75 169 55 169 64 171 65 167 47 171 62 168 67 165 52 169 62 168 65 166 62 168 65 164 59 170 58 165 64 160 55 175 67 173 74 172 64 168 57 155 57 176 6
2、4 172 69 169 58 176 57 173 58 168 50 169 52 167 72 170 57 166 55 161 49 173 57 175 76 158 51 170 63 169 63 173 61 164 59 165 62 167 53 171 61 166 70 166 63 172 53 173 60 178 64 163 57 169 54 169 66 178 60 177 66 170 56 167 54 169 58 173 73 170 58 160 65 179 62 172 50 163 47 173 67 165 58 176 63 162
3、52 165 66 172 59 177 66 182 69 175 75 170 60 170 62 169 63 186 77 174 66 163 50 172 59 176 60 166 76 167 63 172 57 177 58 177 67 169 72 166 50 182 63 176 68 172 56 173 59 174 64 171 59 175 68 165 56 169 65 168 62 177 64 184 70 166 49 171 71 170 59 【第六题】学校随机抽取 100 名学生,测量他们的身体素质,测量他们的身高与 体重。 (1) 对数据给出
4、直观的图形描述,检验分布的正态性; (2) 根据这些数据对全校学生的平均身高和体重做估计, 并给出估计的平均误 差; (3) 10 年前,男生的平均身高为 167.5cm,平均体重为 60.3kg,根据这次抽查 的数据,对学生的平均身高和体重有无明显变化做出结论。 【问题解答】 (1) 首先对所给的身高体重的参数分别进行区间的划分与频数的确定,并画出频数分布 直方图, 同时用 Jarque-Bera 与 Lilliefors 两种检验方法对两组参数的正态性进行判断。 程序如下: 程序运行所得结果为: 身高 体重 区间平均身高 频 数 区间内平均体重 频 数 156.55 2 48.500 8
5、159.65 3 51.500 6 162.75 6 54.500 8 165.85 18 57.500 21 168.95 26 60.500 13 172.05 22 63.500 19 175.15 11 66.500 11 178.25 8 69.500 5 181.35 2 72.500 4 184.45 2 75.500 5 x=172 171 166 160 155 173 166 170 167 173 178 173 163 165 170 163 172 182 171 177 169 168 168 175 176 168 161 169 171 178 177 170
6、173 172 170 172 177 176 175 184 169 165 164 173 172 169 173 173 166 163 170 160 165 177 169 176 177 172 165 166 171 169 170 172 169 167 175 164 166 169 167 179 176 182 186 166 169 173 169 171 167 168 165 168 176 170 158 165 172 169 169 172 162 175 174 167 166 174 168 170 ; y=75 62 62 55 57 58 55 63
7、53 60 60 73 47 66 60 50 57 63 59 64 55 67 65 67 64 50 49 63 61 64 66 58 67 59 62 59 58 68 68 70 64 52 59 74 69 52 57 61 70 57 56 65 58 66 63 60 67 56 56 49 65 62 58 64 58 72 76 59 63 54 54 62 63 69 77 76 72 59 65 71 47 65 64 57 57 57 51 62 53 66 58 50 52 75 66 63 50 64 62 59 ; n,xout=hist(x) m,yout=
8、hist(y) hist(x) figure hist(y) h(1)=jbtest(x); h(2)=lillietest(x); h(3)=jbtest(y); 身高分布直方图: 体重分布直方图: h=0 0 0 0,表明接受原假设,即通过了正态性检验,身高、体重的分布均符合正态分布。 (2) 由上问可知体重身高均符合正态分布。 首先对身高、体重进行估计(参数已输入) : 得到: 身高的参数估计 均值的点估计 标准差的点估计 均值的区间估计 标准差的区间估计 170.25 5.4018 169.1782171.3218 4.74286.2751 体重的参数估计 均值的点估计 标准差的点估计
9、 均值的区间估计 标准差的区间估计 61.27 6.8929 59.902362.6377 6.05208.0073 mu sigma muci sigmaci=normfit(x) mu sigma muci sigmaci=normfit(y) 再分别计算样本中身高、体重的平均值与标准差: A=mean(x) std(x) mean(y) std(y) 得到: 平均值 标准差 身高 (cm) 170.25 29.1793 体重 (kg) 61.27 47.5122 可以看出, 身高体重的平均值与标准差的点估计与用样本计算出的数据相等, 且均包含 在区间估计的区间中。 (3) 假设: 身高:
10、 0: = 167.5; 1: 167.5 体重: 0: = 60.2; 1: 60.2 假设检验: 执行如下语句(参数已输入: h1=ttest(x,167.5) h2=ttest(y,60.2) 得: h1=1 h2=0 所以:对于身高,拒绝原假设,表明学生身高发生了明显的变化; 对于体重,接受原假设,表明学生体重没有发生明显变化。 【问题解决】 先用 matlab 计算两次成绩的平均数(程序略) ,第一次测验的平均成绩为 82,第二次 测验的平均成绩为 85.3.两者相差较多,直观上感觉两次测验难度并不相同,第二次测验更 简单。 由于课程相同,考查的知识相同,所以两次成绩不独立,从而采用
11、作差法做假设检验。 设第一次样本的均值为1,第二次为2,并令 = 1 2 0: = 0; 1: 0 先做正态性检验: x=93 85 79 90 78 76 81 85 88 68 92 73 88 84 90 70 69 83 83 85; y=88 89 86 85 87 88 75 93 88 78 86 86 80 89 85 79 78 88 88 90; z=x-y; h1=jbtest(z) h2=lillietest(z) 结果显示 h1=0,h2=1,即正态性通过 Jarque-Bera 检验,但不能通过 Lilliefors 检验。本题中 【第八题】20 名学生参加了某课程
12、进行的、考察同样知识的两次测验,成绩已给出,根据所给数据,判 断两次测验的难度是否相同。 第一次 93 85 79 90 78 76 81 85 88 68 92 73 88 84 90 70 69 83 83 85 第二次 88 89 86 85 87 88 75 93 88 78 86 86 80 89 85 79 78 88 88 90 为方便计算,将其视为正态分布。 假设检验: h,sigma,ci=ttest(z,0) 得: h1=1 sigma=0.0428 ci=-6.4818,-0.1182. 由 h1=1 可知,在缺省默认设置 = 0.05时,认为假设不成立,即两次考试难度系
13、数不 同。 又样因对总体均值的置信区间为-6.4818 -0.1182, 所以第二次考试成绩要好于第一次, 可见第二次考试的难度系数比第一次考试要小。 Ps.若两次分别考察,不考虑相关性,则由于方差未知,且未必相等,所以应重新编写 程序。 function y=boyandgirl(x,y,nx,ny,alpha,tail) xbar=mean(x); ybar=mean(y); sigmax=std(x); sigmay=std(y); s=(nx-1)*sigmax2+(ny-1)*sigmay2)/(nx+ny-2); t=(xbar-ybar)/(s/nx+s/ny)0.5; if t
14、ail=0 u=tinv(1-alpha/2,nx+ny-2); sig=2*(1-tcdf(abs(t),nx+ny-2); if abs(t)=u; h=0; else h=1; end end if tail=1 u=tinv(1-alpha,nx+ny-2); sig=1-tcdf(abs(t),nx+ny-2); if abs(t)=u; h=0; else h=1; end end if tail=-1 u=tinv(alpha,nx+ny-2); sig=tcdf(abs(t),nx+ny-2); if abs(t)=u; h=0; else h=1; end end 运行程序:
15、 x=93 85 79 90 78 76 81 85 88 68 92 73 88 84 90 70 69 83 83 85; y=88 89 86 85 87 88 75 93 88 78 86 86 80 89 85 79 78 88 88 90; nx=20; ny=20; alpha=0.05; tail=0; h,sig=boyandgirl(x,y,nx,ny,alpha,tail) 得到 h=0, sig=0.1090 其结果与考虑相关性所得的结果相悖,因为在本问题中,相关性的存在是必然的,所以 该结果错误, 即相关性的存在可能导致假设检验的结果出现错误, 在处理实际过程中应该考
16、 虑相关性对数据的影响。 【第十题】给出中日青少年男女生的身高数据, 。中国数据来自 1995 年全国学生体质健康 调研,分层随机调查政群筹资除西藏、台湾外的所有省没年龄 7-22 岁,共约 20 万数据。 日本数据来自 1995 年日本学校保健调查。 已给各个年龄组的均值与方差。判断中国和日本 男女生身高是否存在差异。 中国男生样本 日本男生样本 中国女生样本 日本女生样本 年龄 均值 标准 差 均值 标准 差 均值 标准 差 均值 标准 差 7 124.5 5.7 122.5 5.4 123.4 5.4 121.8 5.4 8 129.4 5.6 128.1 5.5 128.4 5.5 1
17、27.6 5.7 9 134.6 6 133.4 5.4 134.3 6.2 133.5 6.3 10 139.3 6.6 138.9 5.9 140 6.9 140.2 6.6 11 145.1 7.2 144.9 6.7 146.7 7 146.7 6.7 12 151.2 8.1 152 7.8 152.5 6.6 151.9 6.2 13 160 8 159.6 7.6 156.3 6 155.1 5.4 14 165.1 7 165.1 6.8 157.7 5.5 156.7 5.2 15 168.3 6.3 168.5 6.2 158.9 5.6 157.4 5 16 170.1
18、6.3 170 5.9 159.3 5.4 157.9 5.3 17 171 6 170.8 6 159.3 5.4 158.1 5 18 170.8 5.8 171.1 5.9 159.1 5.3 158.2 5.1 【问题解决】由于中国学生的数据很多,平均每个年龄组可以分得 10,000 人左右,而日本 学生的人数未知,当做 5,000 来考虑。 做出假设: 0:1= 2 1:1 2 此为均值的检验,但是两总体的方差未知,且未必相等,所以需要自己编写程序进行计算。 function h,sig=pttest2(xbar,ybar,sigmax,sigmay,nx,ny,alpha,tail
19、) s=(nx-1)*sigmax2+(ny-1)*sigmay2)/(nx+ny-2); t=(xbar-ybar)/(s/nx+s/ny)0.5; if tail=0 u=tinv(1-alpha/2,nx+ny-2); sig=2*(1-tcdf(abs(t),nx+ny-2); if abs(t)=u; h=0; else h=1; end end if tail=1 u=tinv(1-alpha,nx+ny-2); sig=1-tcdf(abs(t),nx+ny-2); if abs(t)=u; h=0; else h=1; end end if tail=-1 u=tinv(alp
20、ha,nx+ny-2); sig=tcdf(abs(t),nx+ny-2); if abs(t)=u; h=0; else h=1; end end 程序如下: 考察中日女生身高: 考查中日男生身高: 得到结果: 中日女生 年龄组 7 8 9 10 11 12 13 14 15 16 17 18 h 1 1 1 0 0 1 1 1 1 1 1 1 中日男生 年龄组 7 8 9 10 11 12 13 14 15 16 17 18 h 1 1 1 1 0 1 1 0 0 0 0 1 xbar=123.4 128.4 134.3 140.0 146.7 152.5 156.3 157.7 158.
21、9 159.3 159.3 159.1; ybar=121.8 127.6 133.5 140.2 146.7 151.9 155.1 156.7 157.4 157.9 158.1 158.2; sigmax=5.4 5.5 6.2 6.9 7.0 6.6 6.0 5.5 5.6 5.4 5.4 5.3; sigmay=5.4 5.7 6.3 6.6 6.7 6.2 5.4 5.2 5.0 5.3 5.0 5.1; nx=10000; ny=5000; alpha=0.05; tail=0; h=ones(12,1); sig=ones(12,1); for i=1:12; h(i),sig(i)=pttest2(xbar(i),ybar(i),sigmax(i),sigmay(i),n x,ny,alpha,tail); xbar=124.5 129.4 134.6 139.3 145.1 151.2 160.0 165.1 168.3 170.1 171.0 170
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 十一英语营销方案(3篇)
- 2026年芜湖学院博士及高层次人才招聘备考题库附答案详解(基础题)
- 学习建筑施工安全管理制度(3篇)
- 市区围挡施工方案(3篇)
- 施工方案表格大全(3篇)
- 2026甘肃阿阳农商开发有限公司招聘备考题库有完整答案详解
- 禁毒单位内部管理制度(3篇)
- 2026济南能源集团春季校园招聘11人备考题库附答案详解(模拟题)
- 2026江苏徐州市国盛控股集团有限公司招聘18人备考题库附答案详解(突破训练)
- 2026河南郑州管城回族区人民医院招聘4人备考题库完整参考答案详解
- 母狗认主协议书范本
- 2024届高考英语阅读理解说明文篇章结构课件
- 退役军人大病帮扶救助申请书
- 承重墙拆除免责协议书
- 劳务合同模板电子下载
- 个人自我批评和相互批评意见100条
- 三年级下册语文期末复习教案参阅五篇
- 固井质量测井原理
- 株洲科能新材料股份有限公司电子材料建设项目环境影响报告书
- GB/T 24191-2009钢丝绳实际弹性模量测定方法
- GB/T 1420-2015海绵钯
评论
0/150
提交评论