数理统计复习PPT_第1页
数理统计复习PPT_第2页
数理统计复习PPT_第3页
数理统计复习PPT_第4页
数理统计复习PPT_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章样本及抽样分布,一、重点与难点,1.重点,(1)正态总体某些常用统计量的分布.,2.难点,(1)几个常用统计量的构造.,(2)临界值的查表计算.,(2)标准正态分布和F分布临界值的查表计算.,总体,个体,样本,常用统计量的分布,分位点,概率密度函数,二、主要内容,统计量,常用统计量,性质,关于样本和方差的定理,t分布,F分布,分布,样本,总体,试验的全部可能的观察值称为总体.,个体,总体中的每个可能观察值称为个体.,直方图、箱线图,统计量,常用统计量,(1)样本平均值:,(2)样本方差:,(3)样本标准差:,常用统计量,(4)样本k阶(原点)矩:,(5)样本k阶中心矩:,常用统计量的分布(一),分布的性质,性质1,性质2,常用统计量的分布(二),t分布又称学生氏(Student)分布.,常用统计量的分布(三),常用统计量的概率密度函数,常用统计量的概率密度函数,常用统计量的概率密度函数,常用统计量的分布的分位点,常用统计量的分布的分位点,常用统计量的分布的分位点,关于正态总体的样本和方差的定理,定理一,定理二,定理三,定理四,第七章参数估计,一、重点与难点,1.重点,最大似然估计.一个正态总体参数的区间估计.,2.难点,显著性水平与置信区间.,矩估计量,估计量的评选,截尾样本的最大似然估计,截尾寿命试验,二、主要内容,最大似然估计量,最大似然估计的性质,似然函数,无偏性,正态总体均值方差的置信区间与上下限,有效性,置信区间和上下限,求置信区间的步骤,相合性,矩估计量,用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,这种估计法称为矩估计法.,矩估计法的具体做法:,最大似然估计量,似然函数,最大似然估计的性质,无偏性,有效性,由于方差是随机变量取值与其数学期望的偏离程度,所以无偏估计以方差小者为好.,相合性,置信区间和置信上限、置信下限,单侧置信区间的定义,求置信区间的一般步骤,正态总体均值方差的置信区间与上下限,单个正态总体,两个正态总体,正态总体均值与方差的单侧置信区间,分布的置信区间,假设检验,第八章,一、本章知识回顾,1.重点,掌握一个正态总体的期望和方差的假设检验.,2.难点,确定零假设H0和备择假设H1;理解显著性水平以及确定检验统计量和根据样本值作出拒绝还是接受H0的判断.,原假设与备择假设,常见的假设检验,单边检验拒绝域,单边、双边检验,主要内容,检验统计量,拒绝域与临界点,两类错误,正态总体均值的检验,正态总体均值差的检验,正态总体方差的检验,置信区间,特征函数,分布拟合检验,秩和检验,原假设与备择假设,假设检验问题通常叙述为:,检验统计量,拒绝域与临界点,边界点称为临界点.,当检验统计量取某个区域C中的值时,我们,拒绝原假设H0,则称区域C为拒绝域,拒绝域的,两类错误,显著性水平,又叫取伪错误,1.当原假设H0为真,观察值却落入拒绝域,而作出,了拒绝H0的判断,称做第一类错误,又叫弃真错误,这类错误是“以真为假”.,犯第一类错误的概率是,2.当原假设H0不真,而观察值却落入接受域,而作出了接受H0的判断,称做第二类错误,这类错误是“以假为真”.,正态总体均值的检验,利用t统计量得出拒绝域的检验法称为t检验法.,正态总体均值差的检验,故拒绝域为,正态总体方差的检验,(1)双边假设检验:,拒绝域为:,(3)左边检验问题:,拒绝域为,(2)右边假设检验:,拒绝域为:,(1)检验假设:,拒绝域为,(2)检验假设:,拒绝域为,(3)检验假设:,拒绝域为,置信区间,施行特征函数,Z检验法右边检验OC函数的性质如下:,两种检验法的OC函数如表,单边、双边假设检验,单边检验的拒绝域,第九章方差分析和回归分析,一、重点与难点,1.重点,单因素试验方差分析的数学模型,双因素试验方差分析的数学模型,一元线性回归的数学模型,多元线性回归的数学模型,2.难点,方差分析表数学模型的应用,二、主要内容,方差分析,单因素试验,双因素试验,等重复试验,无重复试验,回归分析,一元线性回归分析,多元线性回归分析,(1)数学模型,1.单因素试验的方差分析,或等价于检验假设,方差分析的问题是检验假设,(2)离差平方和分解公式及显著性检验,(3)参数估计,(1)数学模型,2.双因素等重复试验的方差分析,双因素等重复试验的方差分析就是检验以下,三个假设,(2)离差平方和分解公式及显著性检验,其中,若,若,若,(1)数学模型,3.双因素无重复试验的方差分析,方差分析的问题就是要检验假设,(2)离差平方和分解公式及显著性检验,若,若,(1)数学模型,(2)线性回归方程,4.一元线性回归分析,(3)线性假设的显著性检验,(4)系数b的置信区间,(1)数学模型,5.多元线性回归分析,(2)多元回归方程中参数的最小二乘估计。,回归平方和,剩余平方和(或残差平方和),显然R越接近1,回归效果就越好。,对线性回归模型的显著性检验,不全为零,(),第十章趋势面分析,趋势面数学模型,最小二乘估计,趋势面方程的显著性检验,趋势面方程的显著性检验,不全为零,F检验,剩余分析,第十一章判别分析,马氏距离,D2(X,Y)=(XY)T1(XY),两总体线性模型形成思路,Fisher判别,数学模型,显著性检验,回判率,若75就认为判别模型有效,否则就认为无效。,待判样品的归类门槛值,贝叶斯判别,计算待判样品X来自g个总体的条件概率,按照条件概率最大进行归类,数学模型,显著性检验,回判率,若75就认为判别模型有效,否则就认为无效。,待判样品的归类,则归入第l类。,第十二章聚类分析,数据预处理,标准化后变量的平均值为0,标准离差为1,标准化,正规化,规格化,分类统计量(距离、相似系数、相关系数),明考夫斯基(Minkowski)距离,绝对值距离,欧氏(Euclid)距离,切比雪夫(Chebyshev)距离,相似系数,越接近1,说明样品间越相似。,相关系数,样本相关系数,Q型聚类法:研究样品与样品之间关系,R型聚类法:研究变量与变量之间的关系,对小样品数的样品进行聚类是常用系统聚类法;对大样品数的样品进行聚类时常用动态聚类法。,系统聚类法,1每个样品为一类,计算各样品之间的距离系数;2把距离最小的两类合并为一类;3计算新的类间的距离;4重复2、3步一直到合并为一类为止,最短距离法,动态聚类法,动态聚类法,选择k个凝聚点;计算每个样品点与每个凝聚点间的距离,按距离最小值归类即将每一样品点归到离它最近的凝聚点的所属类,这样全部样品就分成类;计算每一类的重心,将重心再作为新的凝聚点,再加到步骤(2),直到某一次计算的重心与前次的凝聚点重合,则过程停止,这种过程也称为迭代过程。,分类函数,第十三章主成分分析,主成分分析是研究如何将多个特征变量综合成少数几个变量的一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论