正态分布 t分布_第1页
正态分布 t分布_第2页
正态分布 t分布_第3页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计 量 资 料 统 计 分 析,t分布,正态分布 t分布,计量资料的统计推断是以正态分布、 标准正态分布 、t分布为理论基础。 正态分布、标准正态分布、 t分布的相互关系是参数估计和假设检验的理论基础。 本课件主要学习正态分布、标准正态分布、 t分布的概念、分布特征、相互关系。,一、正态分布,(一)正态分布的概念,正态分布又称高斯分布,是一种很重要的连续型分布,应用甚广。在医学卫生领域中有许多变量的频数分布资料可绘制成直方图而且频数分布是中间(靠近均数处)频数多,两边频数少,且左右对称。 可以设想,如果将观察人数逐渐增多,组段不断分细,图中直条将逐渐变窄,其顶端的中点的连线将逐渐接近于一条光滑

2、的曲线,这条曲线略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布曲线(图1),正态分布的特征,正态分布曲线以均数为中心,左右对称。 正态分布曲线下的面积分布有一定的规律 正态分布曲线在横轴上方均数处最高。 正态分布曲线有两个参数:均数 为位置参数,标准差 为形状参数。,(二)正态分布曲线下的面积分布规律,数理统计证明:正态分布曲线下与横轴之间的整体面积为1或100%。以为总体均数,为总体标准差,则正态分布曲线下面积的分布规律经积分法计算有如下规律(图2) + 1范围内的面积占正态曲线下总面积的68.27%,即有68.27%的变量值分布在此范围内; + 1.96范围内的面积占正态曲线下

3、总面积的95.00%,即有95.00%的变量值分布在此范围内; + 2.58范围内的面积占正态曲线下总面积99.00%,即有99.00%的变量值分布在此范围内,(三)正态分布曲线的两个参数,均数决定曲线在横轴上的位置是正态分布曲线的位置参数(图3.1)。 标准差决定曲线的形状是正态分布曲线的形状参数(变异度参数)(图3.2)。,(四)标准正态分布,对于任何一个均数为 ,标准差为的正态分布,都可以通过变换,使之成为=0, =1的标准正态分布。变换的方法是将变量值x变换为u,u=x- / ,u值的分布就是标准正态分布。,u=x-/,(五)标准正态分布曲线下的面积分布规律,标准正态分布曲线以u值为横

4、轴变量,位置参数=0,形状参数=1,标准正态分布曲线与横轴之间的整体面积为1或100%。标准正态分布曲线下面积的分布规律有如下规律(图5) u=-1,u=1范围内的面积占正态曲线下总面积的68.27%,即有68.27%的变量值分布在此范围内; u=-1.96,u=1.96 范围内的面积占正态曲线下总面积的95.00%,即有95.00%的变量值分布在此范围内; u=-2.58,u=2.58范围内的面积占正态曲线下总面积99.00%,即有99.00%的变量值分布在此范围内。,二、t 分布,(一)均数的抽样误差 标准误,在总体中随机抽取一部分个体作为样本,进行调查研究以推论总体的方法,称为抽样研究方

5、法。 由抽样而引起的样本均数与总体均数之间的差别及样本均数与样本均数之间的差别称为抽样误差。 从正态分布的同一总体中随机抽取例数相等的若干个样本,分别计算它们的均数,这些样本均数的标准差称为标准误。,标准误与标准差的区别,标准差描述个体变量值间的变异程度。凡同性质的资料,标准差大表示个体变量值变异大,样本均数对个体的代表性差。标准差小表示个体变量值变异小,样本均数对个体的代表性好。 标准误是样本均数的标准差,即描述样本均数的抽样误差。凡同性质的资料,标准误大说明抽样误差大,用样本均数估计总体均数的可靠性小;而标准误小,说明抽样误差小,用样本均数估计总体均数的可靠性大。,标准误与标准差的区别,x

6、1,x2,x3,s,(二)样本均数的正态分布(中心极限定理),从一个呈正态分布的总体中随机抽取样本含量相等的许多样本,分别计算出它们的样本均数。这些样本均数的频数分布仍是以总体均数为中心的正态分布。,(三)样本均数的标准正态分布,对于任何一个横轴变量为 均数为 ,标准误为 的正态分布,都可以通过变换,使之成为=0、 =1的标准正态分布。变换的方法是将变量值 变换为u,u= - / ,u值的分布就是标准正态分布。,u= -/,(四)t值 t分布,对于任何一个横轴变量为 均数为 ,标准误为 的正态分布,都可以通过变换,使之成为=0, =1的标准正态分布。变换的方法是将变量值 变换为u,u= - /

7、 ,u值的分布就是标准正态分布。实际工作中 常用 估计,t值就是样本均数 与总体均数的差数 除以 所得之商,实际工作中 用 估计,这时对正态变量 采用的不是u变换,而是t变换。如果从一个正态总体中,抽取样本含量为n的许多样本,分别计算其样本均数和标准误,然后再求出每一个t值,这样可有许多t值,其频数分布是一种连续型分布,这就是统计学上的t分布。,(五)t 分布特征,t 值自由度( ) t 分布特征 t界值 t值与自由度的关系 t界值与概率的关系 单侧、双侧t界值,t 值自由度( ),从一个总体中抽取200个样本,每一个样本含量n=6则200个样本可计算出200个样本均数 每一个样本均数可计算出

8、一个t值共计算出的200个t值,t值自由度 =6-1=5,t 分布特征,呈单峰曲线,以0为中心,左右两侧对称。 t分布曲线是一簇,不同自由度有不同t分布曲线。 越小, t分布曲线愈来愈平坦,曲线中间愈低,曲线两侧尾部翘得愈高; 越大, t分布曲线愈接近标准正态分布曲线, 当 t分布曲线就是标准正态分布曲线。,t界值,t分布曲线和横轴所夹全部面积为100%,当 时t分布越接近标准正态分布,这时t分布曲线中 1.96范围内占总面积95%, 1.96以外两侧面积为5%。 同理t分布曲线中 2.58范围内占总面积99%, 2.58以外两侧面积为1%。 把自由度为 的t分布曲线下两侧外总面积为5%界限的

9、t值叫 界值为p=0.05的t界值;两侧外总面积为1%界限的t值叫 界值为p=0.01的t界值。,t值与自由度的关系,一般情况下,t分布曲线较标准正态分布曲线低平,因此 , 自由度越小,t分布曲线越低平则 、 界值越大。,t界值与概率的关系,设以t 分布曲线与 横轴所夹总面积为100%,则横轴上某一区间和曲线所夹面积与总面积之比,相当于t值在该区间内出现的概率(p),从一个正态总体中随机抽样,获得t 值落于整个横轴的概率p=1,获得l t l 的p ,对应曲线面积 ,|t| 的p ,对应的曲线面积 。,单侧、双侧t界值,相同自由度的t分布曲线下t界值对应的概率 p 值有双侧概率和单侧概率之分,

10、双侧概率对应于双侧尾部面积占总面积之比;单侧概率对应于单侧尾部面积占总面积之比。,自我评估测试,名词解释,正态分布 标准正态分布 抽样误差 u分布 t分布 t值自由度,填 空,1、正态分布曲线下+ 1.96范围内的面积占正态曲线下总面积的 ,即有 的变量值分布在此范围内; 2、正态分布曲线下 范围内的面积占正态曲线下总面积99.00%,即有99.00%的变量值分布在此范围内 3、均数是正态分布曲线的 参数, 标准差是正态分布曲线的 参数。,填 空,4、对于任何一个均数为 ,标准差为的正态分布要变换成为=0, =1的标准正态分布可用 变换,公式为 。 5、对于任何一个横轴变量为 均数为 ,标准误为 的正态分布要变换成为=0, =1的标准正态分布可用 变换。公式 。,单项选择题,1、 反映了个体变量间差异及 对个体变量值代表性的好坏。 a、个体变量值 b、样本均数 c、总体均数 d、标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论