




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学实验 7 概率论 方差分析 假设检验 参数估计 样本描述 利用MATLAB统计工具箱 可以进行基本概论和数理统计分析 以及进行比较复杂的多元统计分析 7 1概率论 2 25 7 1 1分布率和概率密度函数 P132表7 1 以正态分布为例 用normpdf函数计算其概率密度函数 调用格式为 Y normpdf X MU SIGMA 计算数据X中各值处参数为MU和SIGMA的正态概率密度函数的值 其中参数SIGMA必须为正 例7 1 计算参数为mu和1的正态分布概率密度函数在1 5处的值 其中mu为1到2之间以0 2为间隔的小数 3 25 mu 0 0 2 2 y normpdf 1 5 mu 1 7 1 2分布函数 若X为随机变量 x为任意实数 则函数 为X的分布函数 如果知道X的分布函数 就可以知道落在任一区间 x1 x2 上的概率 y 0 12950 17140 21790 26610 31230 35210 38140 39700 39700 38140 3521 用normcdf函数计算正态分布的分布函数 调用格式为 计算参数为MU和SIGMA的正态分布分布函数在数据X中每个值处的值 其中参数SIGMA必须为正 4 25 p normcdf X MU SIGMA 例7 2 求标准正态分布的一个观察量落在区间 11 中的值 p normcdf 1 1 p 2 p 1 ans 0 6872 M V binostat N P M V expstat MU M V normstat MU SIGMA C cov X 返回X的协方差或协方差矩阵C cov X Y 返回X与Y的协方差矩阵R corrcoef X 返回源于矩阵的相关系数矩阵M moment X order 返回X的order阶中心矩 5 25 7 1 3随机变量的数字特征 返回相应分布的数学期望和方差 例7 3 生成一个6行5列的随机矩阵 然后计算每列数据的3阶中心矩 X randn 6 5 M moment X 3 返回每一列的3阶中心矩 描述样本数据集中趋势的统计量有算术平均值 中位数 众数 几何均值 调和均值和截尾均值等 7 2样本描述 6 25 7 2 1集中趋势 样本数据x1 x2 xn的 1 几何均值 m geomean X 2 调和均值 m harmmean X 7 25 3 算术平均值 m mean X 4 中值 m median X 5 截尾均值 m trimmean X percent 对样本数据进行排序后 去掉两端的部分极值 然后对剩下的数据求算术平均值 得到截尾均值 剔除测量值中最大和最小percent 的数据后 计算样本X的均值 8 25 7 2 2离中趋势 描述离散趋势的统计量包括均值绝对差 极差 方差和标准差 1 均值绝对差 y mad X 若X为矢量 则y用mead abs X mean X 计算 若X为矩阵 则y为包含X中每列数据均值绝对差的行矢量 mad X 0 与mad X 相同 使用均值 mad X 1 基于中值计算y 即 median abs X median X 2 极差 y range X 返回X中数据的最小值与最大值之间的差值 9 25 3 方差y var X 4 标准差y std X 7 3参数估计 7 3 1点估计 用单个数值作为参数的估计 1 矩法 用总体的样本矩来估计总体的同阶矩 例7 13 随机取8个活塞环 测得它们的直径为 以mm计 74 00174 00574 00374 00174 00073 99874 00674 002 设环直径的测量值服从正态分布 现估计总体的方差 解 因为样本的2阶中心矩是总体方差的矩估计量 所以可以用moment函数进行估计 X 74 00174 00574 00374 00174 00073 99874 00674 002 moment X 2 10 25 2 最大似然法 p mle dist data 使用data矢量中的样本数据 返回dist指定的分布的最大似然估计 例7 14 用最大似然估计法解例7 3 X 74 00174 00574 00374 00174 00073 99874 00674 002 p mle norm X p 2 p 2 7 3 2区间估计 区间估计不仅仅给出了参数的近似取值 还给出了取该值的误差范围 11 25 phat pci mle dist data 返回最大似然估计和95 置信区间 phat pci mle dist data alpha 返回指定分布的最大似然估计值和100 1 alpha 置信区间 phat pci mle dist data alpha p1 该形式仅用于二项分布 其中p1为试验次数 例7 15 从一批灯泡中随机地取5只作寿命试验 测得寿命 以小时计 为 10501100112012501280 设灯泡寿命服从正态分布 求灯泡寿命平均值的95 置信区间 X 10501100112012501280 p ci mle norm X 0 05 p 1 0e 003 ci 1 0e 003 1 16000 08921 08180 03391 23820 1445 12 25 7 3 3常见分布的参数估计 P142表7 4 Matlab统计工具箱还提供了具体函数的参数估计函数 如用normfit函数对正态分布总体进行参数估计 例7 16 用normfit函数求解例7 6 X 10501100112012501280 muhat sigmahat muci sigmaci normfit X 0 05 muhat 1160sigmahat 99 7497muci 1 0e 003 sigmaci 59 76331 0361289 63641 2839 muhat sigmahat muci sigmaci normfit X alpha 进行参数估计并计算100 1 alpha 置信区间 在均方差未知时 用t统计量检验样本均值的显著性函数 ttest 调用格式 ttest x m 在0 05的显著水平上检验矢量样本x的均值为m的假设 零假设 返回结果为0 表示接受零假设 为1 则拒绝零假设 h ttest x m alpha 自定义显著水平alpha 其余同上 h sig ci ttest x m alpha tail tail取0 1 1分别表示备择假设为均值不等于 大于 小于m 注意此时的零假设 sig为与t统计量有关的p值 ci为均值真值的1 alpha置信区间 7 4 1单个正态总体均值的假设检验 13 25 7 4假设检验 检验关于分布或参数未知的总体的假设是否合理 x 159280101212224379179264222362168250149260485170 例7 17 某电子元件寿命x 以小时计 服从正态分布 和 2均未知 现测得16只元件的寿命如下 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于225 小时 h p ci ttest x 225 0 05 1 h 0p 0 2570ci 198 2321Inf 14 25 返回结果h为0 接受零假设 h为1 则拒绝零假设 在0 05的显著性水平上接受 225的零假设 不能认为元件的平均寿命大于225小时 7 4 1两个正态总体均值差的检验 对两个独立同方差 方差未知 正态总体的样本均值差异进行t检验 h ttest2 x y h significance ci ttest2 x y alpha ttest2 x y alpha tail tail取0 1 1分别表示备择假设为 x y x y x y 例7 18 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率 试验是在同一个平炉上进行的 每炼一炉钢 除操作方法外其它条件都尽可能做到相同 先用标准方法炼一炉 然后 函数 ttest2 调用格式 15 25 用建议的新方法炼一炉 以后交替进行 各炼10炉 其钢的得率分别为 16 25 标准方法78 172 476 274 377 478 476 075 576 777 3新方法79 181 077 379 180 079 179 177 380 282 1 设这两个样本相互独立 且分别来自正态总体 均值和方差都未知 问建议的新操作方法是否能提高钢的得率 x 78 172 476 274 377 478 476 075 576 777 3 y 79 181 077 379 180 079 179 177 380 282 1 h sig ci ttest2 x y 0 05 1 h 0sig 0 9998ci 4 4917Inf x y 17 25 h ttest2 x y 0 05 0 h 1 综合以上得 x y 新方法得钢率比标准方法高 7 4 3基于成对数据的检验 还是用ttest函数进行t检验 具体见P145例7 19 7 4 4分布拟合检验 q q图 用qqplot函数生成两个样本的q q quan tile分位数 图 若两样本来自同一分布 图中数据点呈直线关系 否则为曲线关系 调用格式为 qqplot X 显示X的样本值与服从正态分布的理论数据之间的q q图 x y 18 25 qqplot X Y 显示X和Y两个样本的q q图 h qqplot X Y pvec 返回直线的句柄到h中 例7 18 x normrnd 0 1 100 1 y normrnd 0 5 2 50 1 z weibrnd 2 0 5 100 1 subplot 2 2 1 qqplot x holdonsubplot 2 2 2 qqplot x y holdonsubplot 2 2 3 qqplot z holdonsubplot 2 2 4 qqplot x z holdoff 生成两个不同均值 方差的正态样本 生成一个服从威布尔分布的样本 19 25 由第一个子图看出X服从正态分布 由第二个子图看出X和Y可看作同分布的 由第三个子图看出Z不服从正态分布 由第四个子图看出X和Z不是同分布的 基于数据样本的偏度和峰度 评价给定数据服从未知均值和方差正态分布的假设是否成立 函数 jbtest 调用格式为 H jbtest X 以0 05的显著水平对数据矢量X进行Jarque Bera检验 返回值H 0 接受X服从正态分布的假设 H 1 则拒绝该假设 H jbtest X alpha 指定显著水平alpha H P JBSTAT CV jbtest X alpha 返回H值 检验的p值P 检验统计量值JBSTAT和临界值CV 例 见P147例7 21注 Jarque Bera检验不能用于小样本检验 20 25 峰度 偏度检验 Jarque Bera检验 7 5方差分析 7 5 1单因子方差分析 研究不同因素及因素的不同水平对事件发生的影响程度 函数 anova1调用格式 p anova1 X group displayopt 当X为矩阵时 每一列看成一组 定义group变量 字符数组或单元数组 长度等于X的列数 做为各组标签 返回零假设 各组均值相等 成立的概率p 一般p小于0 05或0 01时 拒绝零假设 否则 接受零假设 适用于平衡数据 displayopt 参数为 on 默认设置 时 显示anova表和箱型图 为 off 时不显示 21 25 例 x 73441831 45624960 35654017 14544662 56246124 66351758 group a1 a2 a3 a4 p anova1 x group p 0 7918 22 25 认为列均值是相同的 23 25 例见P149例7 22 7 5 1双因子方差分析 函数 anova2调用格式 p anova2 X reps 样本 中不同列中的数据代表因子 的变化 不同行中数据代表因子 的变化 变量reps表示每个单元中观测值的个数 当reps 1 默认值 时 返回两个p值到p矢量中 其它调用格式 p anova2 X p anova2 X group p table anova1 p table stats anova1 24 25 当X为矢量时 通过输入变量group 字符数组或单元数组 长度与X相同 进行标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工现场人员管理与劳动力调度方案
- 阀门生产线技术改造项目环境影响报告书
- 2025滨海学院韩语考试真题及答案
- 建筑电气员考试题
- 2025年水稻栽培培训试卷及答案
- 2025年安徽建筑考试试题及答案
- 湖北审计考研真题及答案
- 产品商标考试题
- 2025北京一建b证考试真题及答案
- 儿童应用伏立康唑的安全性评估-洞察与解读
- 2025年学历提升-成人高考-专升本-成人高考专升本(法学类)历年参考题库含答案解析(5套)
- 2025年止血技术理论知识考试试题及答案
- ECMO护理进修汇报
- 2025年(完整版)(高级)政工师理论考试题库与答案
- 首钢职务职级管理办法
- 建筑施工职业健康与安全防护指南
- 2025国家保安员资格考试题库及答案
- 2025年黑龙江省齐齐哈尔市中考英语试卷
- 跨境电商股权分配协议范文
- 2025年深圳中考化学试卷真题(含答案)
- 2025至2030招投标行业产业运行态势及投资规划深度研究报告
评论
0/150
提交评论