




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
现实生活中的许多数据都是随机产生的 如考试分数 月降雨量 灯泡寿命等 从数理统计角度来看 这些数据其实都是符合某种分布的 这种规律就是统计规律 本实验主要通过对概率密度函数曲线的直观认识和数据分布的形态猜测 以及密度函数的参数估计 进行简单的正态假设检验 揭示日常生活中随机数据的一些统计规律 问题背景和实验目的 Matlab相关命令介绍 pdf概率密度函数 y pdf name x A y pdf name x A B 或y pdf name x A B C 返回由name指定的单参数分布的概率密度 x为样本数据 name用来指定分布类型 其取值可以是 beta bino chi2 exp ev f gam gev gp geo hyge logn nbin ncf nct ncx2 norm poiss rayl t unif unid wbl 返回由name指定的双参数或三参数分布的概率密度 Matlab相关命令介绍 例 x 8 0 1 8 y pdf norm x 0 1 y1 pdf norm x 1 2 plot x y x y1 注 y pdf norm x 0 1 y normpdf x 0 1 相类似地 y pdf beta x A B y betapdf x A B y pdf bino x N p y binopdf x N p Matlab相关命令介绍 normfit正态分布中的参数估计 muhat sigmahat muci sigmaci normfit x alpha 对样本数据x进行参数估计 并计算置信度为1 alpha的置信区间alpha可以省略 缺省值为0 05 即置信度为95 load从matlab数据文件中载入数据 S load 数据文件名 hist绘制给定数据的直方图 hist x m Matlab相关命令介绍 table tabulate x 绘制频数表 返回值table中 第一列为x的值 第二列为该值出现的次数 最后一列包含每个值的百分比 ttest x m alpha 假设检验函数 此函数对样本数据x进行显著性水平为alpha的t假设检验 以检验正态分布样本x 标准差未知 的均值是否为m Matlab相关命令介绍 normplot x 统计绘图函数 进行正态分布检验 研究表明 如果数据是来自一个正态分布 则该线为一直线形态 如果它是来自其他分布 则为曲线形态 wblplot x 统计绘图函数 进行Weibull分布检验 Matlab相关命令介绍 其它函数 cdf系列函数 累积分布函数inv系列函数 逆累积分布函数rnd系列函数 随机数发生函数stat系列函数 均值与方差函数 例 p normcdf 2 2 0 1 x norminv 0 0250 975 0 1 n normrnd 0 1 15 n 1 5 m v normstat n n n n 常见的概率分布 连续分布 正态分布 正态分布 连续分布 如果随机变量X的密度函数为 则称X服从正态分布 记做 标准正态分布 N 0 1 正态分布也称高斯分布 是概率论中最重要的一个分布 如果一个变量是大量微小 独立的随机因素的叠加 那么它一定满足正态分布 如测量误差 产品质量 月降雨量等 正态分布举例 x 8 0 1 8 y normpdf x 0 1 y1 normpdf x 1 2 plot x y x y1 例 标准正态分布和非标准正态分布密度函数图形 连续分布 均匀分布 均匀分布 连续分布 如果随机变量X的密度函数为 则称X服从均匀分布 记做 均匀分布在实际中经常使用 譬如一个半径为r的汽车轮胎 因为轮胎上的任一点接触地面的可能性是相同的 所以轮胎圆周接触地面的位置X是服从 0 2 r 上的均匀分布 均匀分布举例 x 10 0 01 10 r 1 y unifpdf x 0 2 pi r plot x y 连续分布 指数分布 指数分布 连续分布 如果随机变量X的密度函数为 则称X服从参数为 的指数分布 记做 在实际应用问题中 等待某特定事物发生所需要的时间往往服从指数分布 如某些元件的寿命 随机服务系统中的服务时间 动物的寿命等都常常假定服从指数分布 指数分布具有无记忆性 指数分布举例 x 0 0 1 30 y exppdf x 4 plot x y 例 4时的指数分布密度函数图 离散分布 几何分布 几何分布是一种常见的离散分布 在贝努里实验中 每次试验成功的概率为p 设试验进行到第 次才出现成功 则 的分布满足 其右端项是几何级数的一般项 于是人们称它为几何分布 x 0 30 y geopdf x 0 5 plot x y 例 p 0 5时的几何分布密度函数图 离散分布 二项式分布 二项式分布属于离散分布 如果随机变量X的分布列为 则称这种分布为二项式分布 记做 x 0 50 y binopdf x 500 0 05 plot x y 例 n 500 p 0 05时的二项式分布密度函数图 离散分布 Poisson分布 泊松分布也属于离散分布 是1837年由发个数学家Poisson首次提出 其概率分布列为 记做 泊松分布是一种常用的离散分布 它与单位时间 或单位面积 单位产品等 上的计数过程相联系 如 单位时间内 电话总机接到用户呼唤次数 1平方米内 玻璃上的气泡数等 Poisson分布举例 x 0 50 y poisspdf x 25 plot x y 例 25时的泊松分布密度函数图 离散分布 均匀分布 如果随机变量X的分布列为 则称这种分布为离散均匀分布 记做 n 20 x 1 n y unidpdf x n plot x y o 例 n 20时的离散均匀分布密度函数图 抽样分布 2分布 设随机变量X1 X2 Xn相互独立 且同服从正态分布N 0 1 则称随机变量 n2 X12 X22 Xn2服从自由度为n的 2分布 记作 亦称随机变量 n2为 2变量 x 0 0 1 20 y chi2pdf x 4 plot x y 例 n 4和n 10时的 2分布密度函数图 x 0 0 1 20 y chi2pdf x 10 plot x y 抽样分布 F分布 设随机变量 且X与Y相互独立 则称随机变量 x 0 01 0 1 8 01 y fpdf x 4 10 plot x y 例 F 4 10 的分布密度函数图 为服从自由度 m n 的F分布 记做 抽样分布 t分布 设随机变量 且X与Y相互独立 则称随机变量 x 6 0 01 6 y tpdf x 4 plot x y 例 t 4 的分布密度函数图 为服从自由度n的t分布 记做 频数直方图或频数表 对于给定的数据集 假设它们满足以上十种分布之一 如何确定属于哪种分布 x load data1 txt x x hist x 例1 某次笔试的分数见data1 txt 试画出频数直方图 绘制频数直方图 或列出频数表 从图形上看 笔试成绩较为接近正态分布 频数直方图或频数表 x load data2 txt x x hist x 例2 某次上机考试的分数见data2 txt 试画出频数直方图 从图形上看 上机考试成绩较为接近离散均匀分布 x load data3 txt x x hist x 例3 上海1998年来的月降雨量的数据见data3 txt 试画出频数直方图 从图形上看 月降雨量较为接近 2分布 频数直方图或频数表 在重复数据较多的情况下 我们也可以利用Matlab自带的tabulate函数生成频数表 并以频数表的形式来发掘数据分布的规律 x load data4 txt x x tabulate x hist x 例4 给出数据data4 txt 试画出其直方图 并生成频数表 频数直方图或频数表 x load data5 txt x x hist x fiugrehistfit x 加入较接近的正态分布密度曲线 例5 现累积有100次刀具故障记录 当故障出现时该批刀具完成的零件数见data5 txt 试画出其直方图 从图形上看 较为接近正态分布 参数估计 当我们可以基本确定数据集X符合某种分布后 我们还需要确定这个分布的参数 由于正态分布情况发生的比较多 故我们主要考虑正态分布的情形 对于未知参数的估计 可分两种情况 点估计区间估计 参数估计 点估计 构造样本X与某个统计量有关的一个函数 作为该统计量的一个估计 称为点估计 Matlab统计工具箱中 一般采用最大似然估计法给出参数的点估计 泊松分布P 的 最大似然估计是 指数分布Exp 的 最大似然估计是 点估计举例 正态分布N 2 中 最大似然估计是 2的最大似然估计是 x load data1 txt x x mu sigma normfit x 例6 已知例1中的数据服从正态分布N 2 试求其参数 和 的值 使用normfit函数 参数估计 区间估计 构造样本X与某个统计量有关的两个函数 作为该统计量的下限估计与上限估计 下限与上限构成一个区间 这个区间作为该统计量的估计 称为区间估计 Matlab统计工具箱中 一般也采用最大似然估计法给出参数的区间估计 区间估计举例 x load data1 txt x x mu sigma muci sigmaci normfit x 例7 已知例1中的数据服从正态分布N 2 试求出 和 2的置信度为95 的区间估计 x load data6 txt x x mu sigma muci sigmaci normfit x 0 01 例8 从自动机床加工的同类零件中抽取16件 测得长度值见data6 txt 已知零件长度服从正态分布N 2 试求零件长度均值 和标准差 的置信度为99 的置信区间 假设检验 对总体的分布律或分布参数作某种假设 根据抽取的样本观察值 运用数理统计的分析方法 检验这种假设是否正确 从而决定接受假设或拒绝假设 这就是假设检验问题 以正态假设检验为例 来说明假设检验的基本过程 正态假设检验 正态假设检验的一般过程 假设检验 利用Matlab统计工具箱给出的常用的假设检验方法的函数ttest 进行显著性水平为alpha的t假设检验 以检验正态分布样本x 标准差未知 的均值是否为m 运行结果中 当h 1时 表示拒绝零假设 当h 0时 表示不能拒绝零假设 对比正态分布的概率密度函数分布图 判断某统计量的分布可能服从正态分布 利用统计绘图函数normplot或wblplot进行正态分布检验 正态假设检验举例 x load data5 txt x x normplot x 例9 试说明例5中的刀具使用寿命服从正态分布 并且说明在方差未知的情况下其均值m取为597是否合理 1 对比刀具使用寿命分布图与正态分布的概率密度分布函
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 政策法规考试题库及答案
- 郑州经贸学院高数考试题及答案
- 证券期末考试题及答案
- 离婚双方共同债务分担与借款归还协议
- 整形美容医生考试题库及答案
- 征收管理法考试题及答案
- 商业街区物业管理合同签订与市容市貌提升协议
- 离婚协议书起草:债务清理与信用修复指导范本
- 股权回购协议签订前对目标公司尽职调查指南
- 石化项目建设方案
- 英语专业大学生职业生涯规划书
- 非物质文化遗产概论:第四章-非物质文化遗产的保课件
- FLUENT 15 0流场分析实战指南
- 弱电维护保养合同
- GB/T 41972-2022铸铁件铸造缺陷分类及命名
- YY/T 0471.3-2004接触性创面敷料试验方法 第3部分:阻水性
- GB/T 3871.9-2006农业拖拉机试验规程第9部分:牵引功率试验
- PEP小学英语五年级上册第四单元全国优质课赛课一等奖《思维导图在小学英语复习课的应用》精品课件
- 新闻传播中的媒介素养课件
- 超疏水材料课件
- 中医刮痧法诊疗操作评分标准
评论
0/150
提交评论