第四章 抽样误差与假设检验.ppt_第1页
第四章 抽样误差与假设检验.ppt_第2页
第四章 抽样误差与假设检验.ppt_第3页
第四章 抽样误差与假设检验.ppt_第4页
第四章 抽样误差与假设检验.ppt_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章抽样误差和假设检验,本章主要内容:第一节平均抽样误差和标准误差第二节平均估计第三节假设检验的意义和程序,第一节平均抽样误差和标准误差,是某年某地所有13岁女学生身高总体平均=155.4cm,总体标准偏差=5.3cm的正态分布n(155.4 ) 可以随机提取30个样本作为样本(n=30 ),计算样本的平均数目和标准偏差,可以提取总共100个样本以获得100份,并且可以计算每个样本的相应平均数目和标准偏差。1.156.75.16158.15.21155.65.3299.154.65.15100.156.65.25,=155.4cm=5.3cm,XS,100个样本, 采样误差(smplingerror )这样的采样引起的采样统计量和整体参数的差异成为采样误差,只要有个体变异和随机采样研究,采样误差就不可避免。 当从总体正态N(,2 )中多次随机抽出样本含量固定为n的样本时,这些样本的平均数也遵循正态分布。 样本平均数的总体平均数保持为,而样本平均数的标准偏差的计算公式包括:中心极限定理、SAMPLE1:x11x12x13x14.x1n、SAMPLE2:x21x22x23x24.x2n、SAMPLEk:xk1xk2xk3xk4.xkn、原始总体和k个样本平均数的频率分布图这反映了来自相同总体的样本平均数目之间的变化,即平均数目与总体平均数目之间的差异。 统计上用标准误差测量采样误差的大小! 在实际工作中,总体标准偏差是众所周知的,因为采用样本标准偏差s来代替,所以只能计算样本平均数的标准误差的估计SX,其计算公式为:估计,例如在4.1个市场中随机提取140名成年男子,获得红细胞平均数4.771012/L和标准偏差0.381012/L 第二节总体平均数的估计,1 .统计估计(statisticalinfection )在总体中随机提取一定数量的观察单位作为样本进行采样研究,从样本信息估计总体特征的过程称为统计估计。 另一方面,置信区间的概念、统计估计、参数估计、假设验证、点估计、区间估计(置信区间)、二.参数估计(parameterestimation )通过从样本统计量来估计整体参数,是统计估计的重要内容。 (1)点估计部(pointestimation )将样本统计量直接作为整体参数的估计值。 (2)区间估计(intervalestimation )也被称为置信区间(置信区间,CI ),以预先给定的概率计算区间以包含未知的总体的平均值。 另外,=155.4cm、身高(cm )、整体平均的95%置信区间,平均95%的置信区间包含整体平均,为仅不包含5个置信区间即估计错误率。 而且,在进行了100次采样后,一次采样量为n=30,利用采样的平均数和标准偏差估计了整体的平均数范围。 3 .置信区间有(1)精度(accuracy )置信度的大小、即置信区间包含的概率的大小(1-)这两个要素。 (2)精度(precision )反映在区间的长度中,区间的长度越小精度越高。 一般而言,95%的置信区间是更一般的。 当可靠性确定时,可以通过增加采样量来减少区间长度,并且可以提高精度。 t分布是t检验的基础,又称为studentt检验,是计量资料中最常用的假设检验方法。 戈特(WilliamSealeyGosset )英国着名统计学家。 出生于英国肯特郡坎特伯雷市,在曼彻斯特大学和牛津大学学习,主要学习化学和数学。 二、全体平均信赖区间的计算,1899年作为酿酒师在爱尔兰都柏林的啤酒厂工作,在那里他参与了有关酿造过程的数据处理问题。 由于酿酒厂的规定禁止塞特发表关于酿酒过程变化性的研究成果,塞特必须在1908年首次以“学生”(Student )为笔名,在生物计量学杂志上发表“平均概率误差”。 Gosset在文章中使用z统计量来验证正规分配母群的平均值。由于本文为“学生t检定”提供了基础,许多统计学家将1908年视为统计推断理论发展史上的里程碑。 此外,随机变量XN(m,s2)、标准正态分布n (0,12 )、u变换、平均数、标准正态分布n (0,12 )在实际工作中通常是未知的,通常被用来代替变换,即,根据不遵循标准正态分布的自由度=n-1的t分布,以t分布、1,0为中心左右对称的单峰分布。 2、t分布曲线是簇曲线,其形态变化与自由度的大小有关(=n-1 )。 t分布特征:自由度越小,t分布的峰值越低,两侧尾部高度翘曲的自由度逐渐变大时,t分布接近标准正态分布,自由度无限大时,t分布成为标准正态分布。 为了方便使用,统计学家制作了与自由度v相对应的t阈值表。 t分布的用途:主要用于整体均值的区间估计和t检验。 s不知道,n小(n50 )的u分布s已知,并且总体平均数可靠的时段的计算方法取决于总体标准偏差s是否已知,以及样本的含量n的大小。 通常有t分布和u分布两种方法:(一)为人所知,u转换式:(二)为人所知,1.n小(n50 ),例4.2某医师测定的动脉粥样硬化患者25名血浆纤维蛋白原含量平均为3.32g/L,标准偏差为0.57g/L 此患者血浆纤维蛋白原含量总平均的95%信赖区间为3.09g/L3.56g/L,例4.3试验计算例4.1中为该地区成年男性红细胞总平均的95%信赖区间。 当地成年男性红细胞平均数的95%置信区间为4.711012/L4.831012/L,第三节假设检验的意义和程序、第一、假设检验的基本思想、“反证”思想首先基于研究目的建立假设,从H0假设假设其正确, 分析样本提供的信息是否与H0有很大矛盾,即是否支持H0,如果样本信息不支持H0,则拒绝接受H1,否则不拒绝H0。 例4.4以前,某地区新生儿出生体重为3.30kg的大规模调查已为人所知。 从该地区难产儿中随机抽取35名新生儿样品,平均出生体重3.42kg,标准偏差0.40kg。 难产儿童的出生体重与普通新生儿的体重不同吗? 可能存在以下两种差异: 1、0=3.30kg次/分钟、已知总体、未知总体、n=35、=3.42kgS=0.40kg、与0的差异(不等于)、1、=0,因为仅为了估计而存在采样误差,所以导致与0的差异。 2、由于与0本身不相等,因此会产生之差。 假设检查的基本原理:采样误差引起的P0.05 (从同一整体)是? 如果检查回答本身存在差P0 (单侧检查)、0、单侧H1:,则由H0、拒绝H1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论