SAS假设检验(公选)ppt课件.ppt_第1页
SAS假设检验(公选)ppt课件.ppt_第2页
SAS假设检验(公选)ppt课件.ppt_第3页
SAS假设检验(公选)ppt课件.ppt_第4页
SAS假设检验(公选)ppt课件.ppt_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章假设检验,1,4.1参数估计与假设检验的基本概念,4.1.1参数估计4.1.2假设检验,2,4.1.1参数估计,从总体中抽取样本,以样本统计量(即样本数字特征)作为未知总体参数(即总体数字特征)的估计量,并通过对样本观察值分析来估计和推断,即根据样本来推断总体分布的未知参数,称为参数估计(parameterestimation)。参数估计有两种基本形式:点估计和区间估计。,3,1.点估计点估计是用样本统计量估计总体分布中所含的未知参数。因为样本统计量为数轴上某一点,估计的结果也以一个点的数值表示,所以称为点估计。通常它们是总体的某个特征值,如均值、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。2.区间估计区间估计是通过从总体中抽取的样本,根据一定的正确度与精确度的要求,以一定可靠程度推断总体参数所在的区间范围,作为总体分布的未知参数或参数的函数的真值所在范围的估计。,4,区间估计是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间。其中这个给定的概率值称为置信度或置信水平(confidencelevel),指总体参数值落在样本统计值某一区内的概率。这个建立起来的包含待估计参数的区间称为置信区间(confidenceinterval),表示总体参数的可能范围。置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。,置信区间,5,双侧:,置信区间,置信下限,置信上限,置信水平或置信度(称为显著性水平),单侧:,或,置信区间,6,正态分布(NormalDistribution),实践中,许多频率分布形状如此:中间高,两侧低、对称,7,8,计算中心,正态分布的实例,如果数据来自正态分布总体,则:68%的值落在距均值1个标准差的范围之内95%的值落在距均值2个标准差的范围之内99%的值落在距均值3个标准差的范围之内,例如:由12岁女孩体重组成一个总体,这个总体服从均值为39公斤,标准差4.5公斤,则:68%的值落在34.543.5公斤之间95%的值落在3048公斤之间99%的值落在25.552.5公斤之间,9,正态分布描述落入不同范围的概率.例如,近似地有(“3”原则):68%的数据落入以均值为中心一倍标准差的范围内;95%的数据落入以均值为中心两倍标准差的范围内;99%的数据落入以均值为中心三倍标准差的范围内;若样本均值的分布为正态的,当构造置信区间时就可用正态分布给定的概率,这一概率对应于置信水平.所以,构造一个95%的置信区间,这个置信区间就有95%的概率包括总体均值.95%就为置信水平.,10,小概率事件的含义,小概率事件的含义:发生概率一般不超过5的事件,即事件在一次试验中几乎不可能发生,11,4.1.2假设检验,假设检验是抽样推断中的一项重要内容,是一种基本的统计推断形式,用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先依据原资料对总体的参数或分布作出某种假设,然后再利用样本对总体提供的信息,用适当的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来对假设作出应该拒绝或不拒绝推断。,12,对总体参数进行假设检验时,首先要给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设H1,H0与H1有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率事件),可以依据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设不真,作出拒绝原假设H0,接受H1的决定;反之,若小概率事件没有发生,就没有理由拒绝H0,从而应作出拒绝H1的决定。,1.假设检验的基本思想,13,根据问题确立原假设H0和备择假设H1;确定一个显著性水平,它是衡量稀有性(小概率事件)的标准,常取为0.05;选定合适的检验用统计量W(通常在原假设中相等成立时,W的分布是已知的),根据W的分布及的值,确定H0的拒绝域。由样本观测值计算出统计量W的观测值W0,如果W0落入H0的拒绝域,则拒绝H0;否则,不能拒绝原假设H0。,2.假设检验的基本步骤,14,概率p值是SAS系统根据样本分布和样本数据自动计算一个实际的显著性水平,在SAS系统中进行假设检验,p值提供了一个直观的判断依据:当p=0.4H1:1000。在Hypotheses栏设置原假设的值0.4,选择备择假设Prop0.05,所以不能拒绝原假设,该校学生月支出在1000元以上的人所占比例在0.05的显著性水平下超过40%。,48,3.单样本正态总体方差的假设检验【例4-6】某工厂生产的人造纤维强度服从标准差为5的正态分布,为检测生产的人造纤维强度是否符合要求,某日随机抽取12根人造纤维进行试验,测得纤维强度如下:278285284282285286290292289280275293设测量数据存放于数据集Mylib.strength中,其中纤维强度变量名为str。这是一个单样本正态总体方差的假设检验,根据题意,设置假设:H0:2=25H1:225,49,用分析家作单样本正态总体方差的假设检验,步骤如下:选择菜单“统计”“假设检验”“方差的单样本检验”命令。在“One-SampleTestforaVariance”对话框中选择变量str作为分析变量。在Hypotheses栏设置原假设的值Var=25,选择备择假设Var=25。单击“Plots”按钮,在打开的对话框中选择Probabilitydistributionplot。单击“OK”按钮,返回到“One-SampleTestforaVariance”对话框,再次单击“OK”按钮,得到分析结果如图4-25所示。,50,结果显示,样本方差为30.811,由于p值为0.5170,所以不能拒绝原假设,即生产的人造纤维强度是符合要求的。,51,4.3两样本正态总体的参数估计与假设检验,4.3.1两独立样本4.3.2两配对样本,52,4.3.1两独立样本正态总体的参数估计与假设检验,1.两独立样本正态总体均值的比较2.两独立样本正态总体比例的比较3.两独立样本正态总体方差的比较,53,1.两独立样本正态总体均值的比较【例4-7】为比较大一新生男女生身高有无明显差别,分别抽取10名男生和8名女生为两个样本,数据如表4-7所示。建立数据集mylib.height,男女生身高数据记录在同一分析变量A下,分类变量B的值用以区分两个样本,试以0.05的显著性水平推断男女生身高是否存在明显差别。根据题意,设置假设:H0:男生平均身高与女生平均身高无显著差异,1-2=0H1:男生平均身高与女生平均身高有显著差异,1-20,54,(1)用分析家模块对两独立样本正态总体均值进行比较,其步骤如下:在分析家模块中打开数据集mylib.height。选择菜单“统计”“假设检验”“均值的双样本t-检验”命令。在“Two-Samplet-testforMeans”对话框中选择变量A填入Dependent框中,选择变量B填入Group框中,如图4-27a所示。单击“Plots”按钮,在打开的对话框中选中tdistributionplot复选框,如图4-27b所示。单击“OK”按钮,返回到“Two-Samplet-testforMeans”对话框,再次单击“OK”按钮,得到分析结果如图4-28所示。,55,结果显示,t统计量的P值=0.00640.05所以不能拒绝方差相等的假设。在方差相等的前提下,检验t均值,相应的P值=0.00640.05所以在0.05的显著性水平下不能拒绝原假设,两种教学法的考试成绩的平均值没有显著差异,即两种教学法没有显著差异。,61,2.两独立样本正态总体比例的比较【例4-9】为调查男女生语文学习情况,在小学一年级随机抽取了27名男生和20名女生,记录下他们语文考试的成绩如表4-9所示。试以0.05的显著性水平推断考试成绩在90分以上的男女生所占比例是否有显著差异?设考试成绩存放于数据集Mylib.chinese中,其中语文成绩变量名为chinese。这是一个两独立样本比例检测的问题,若1和2分别表示男生和女生语文成绩90分以上的人所占比例,根据题意作如下假设:H0:1-2=0H1:1-20,62,用分析家模块作两样本正态总体比例的假设检验,步骤如下:在分析家中打开数据集mylib.chinese。将变量chinese重编码得到新变量chinese_recoded。选择菜单“统计”“假设检验”“比例的双样本检验”命令,选择分析变量chinese_recoded,sex作为分组变量。单击“Levelofinterest”右侧下拉按钮,选择90。在Hypotheses栏设置原假设的值prop1-prop2=0,选择备择假设prop1-prop20,如图4-34a所示。单击“Plots”按钮,在打开的对话框中选择Normaldistributionplot。单击“OK”按钮,得到分析结果如图4-35所示。结果显示,z统计量的p值为0.3138,所以在0.05的显著性水平下不能拒绝原假设,考试成绩在90分以上的男女生所占比例没有显著差异。,63,3.两独立样本正态总体方差的比较【例4-10】一家机床厂以生产某种圆形零件为主,每天的产量大约是8000个,每个零件的尺寸规格为直径21.5mm。生产厂家现购进一台新的机床进行生产,为了分析新机床生产的零件的尺寸是否比旧机床生产的零件尺寸偏差更小,现从某天新旧机床生产的零件中各随机抽取了10个,测得每个零件尺寸如表4-10所示。由于两样本大小一致,所以在数据集mylib.size中分别用变量A和变量B存储两个样本,如果12和22分别表示旧机床生产的零件的尺寸和新机床生产的零件尺寸的方差,根据题意,设置假设:H0:1222H1:1222,64,用分析家模块作单样本正态总体方差的假设检验,步骤如下:选择菜单“统计”“假设检验”“方差的双样本检验”命令。在打开的“Two-SampleTestforVariances”对话框中,选择“Groupsarein”中的Twovariables,选择分析变量A和B分别填入Group1和Group2中,如图4-36所示。在Hypotheses栏设置选择备择假设Variance1/Variance20.05,因此在0.05的显著性水平下不能拒绝原假设,两种公式还原魔方所需时间无显著差异。,70,(3)用TTEST过程步对两配对样本正态总体均值进行比较,程序如下:procttestdata=mylib.time;pairedA*B;run;,71,4.4分布检验,4.4.1正态分布4.4.2正态性检验,72,4.4.1正态分布,正态分布(Normaldistribution)又名高斯分布(Gaussiandistribution),该分布由两个参数平均值和方差决定。概率密度函数曲线以均值为对称中线,方差越小,分布越集中在均值附近。1.正态分布的概率密度函数则称X服从正态分布,记作XN(,2)。其中为X的总体均数,2为总体方差。,73,(1)曲线在x轴上方,与x轴不相交。(2)曲线关于直线x=对称。(3)在x=时位于最高点。(4)当x时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。(5)当一定时,曲线的形状由确定。越大,曲线越“扁平”,表示总体的分布越分散;越小,曲线越“尖陡”,表示总体的分布越集中,2.正态分布曲线的性质,74,3.标准正态分布当0,1时,正态总体称为标准正态总体;其相应的曲线称为标准正态曲线。标准正态总体N(0,1)在正态总体的研究中占有重要地位。任何正态分布的问题均可转化成标准总体分布的概率问题。,75,4.4.2正态性检验,正态分布是连续型变量的理论分布,有些统计方法只适用于正态分布或近似正态分布资料,因此在用这些方法前,需考虑进行正态性检验。进行正态性检验的方法有非参数检验中的K-S检验,探索性描述统计中的P-P图,Q-Q图。对于正态性检验,原假设为H0:数据服从正态分布;备择假设H1:数据不服从正态分布。使用UNIVARIATE过程对变量进行正态分布检验,其一般格式为:PROCUNIVARIATEDATA=数据集NORMAL;VAR变量;RUN;,76,【例4-12】随机抽取某班22名学生3门功课的成绩如表4-12所示。将数据集保存在mylib.exam中,分析该班3门功课的成绩分布是否符合正态分布。1.用INSIGHT模块进行正态性检验,其步骤如下:在INSIGHT模块中打开数据集mylib.exam。选择菜单“分析”“分布”命令。在“分布”对话框中选择分析变量Subjects1,Subjects2,Subjects3。单击“输出”按钮,在打开的对话框中选中正态性检验复选框。单击“确定”按钮得到分析结果如图4-46所示。,77,用分析家模块进行正态性检验,其步骤如下:在“分析家”模块中打开数据集mylib.exam。选择菜单“统计”“描述性统计”“分布”命令,在打开的“分布”对话框中选择分析变量Subjects1,Subjects2,Subjects3。单击“Fit”按钮,在打开的对话框中选择“normal”复选框。单击“OK”按钮,返回到“分布”对话框,再次单击“OK”按钮。在分析家窗口的项目管理器中双击“FittedDistributionsofExam”,查看检验结果如图4-4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论