




已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章,小样本资料的差异显著性检验,本章主要介绍小样本时单个均数、两个均数的假设检验单个率、两个率间的假设检验应重点掌握各种情况下的t检验方法正确区分成组资料和配对资料,在上一章中,我们系统介绍了抽样分布和统计推断的基本原理和基本方法,即通过随机抽样的方法获得某一特定总体的随机样本,用这一样本进行试验,并对试验后所得资料进行分析,通过统计推断来定性或定量地分析研究总体的特征本章主要介绍总体方差未知、且样本较小时不同资料类型的统计推断差异显著性检验(假设检验)的具体方法,第一节 单个平均数的假设检验,单个平均数的假设检验是检验一个样本所属的总体平均数 与一个特定(已知)总体平均数 间是否存在显著差异的一种统计方法,也可理解为检验一个样本是否来自某一特定(已知)总体的统计分析方法根据统计假设检验的基本原理可知,假设检验的关键是根据统计量的分布计算实得差异(即表面效应)由抽样误差造成的概率测验的统计量分布服从 u- 分布或 t- 分布,所以单个平均数的假设检验可分为 u-test 和 t-test 两种,一、总体方差已知时单个平均数的假设检验,当总体方差 已知,不管样本多大,均可用 u- 分布计算实得差异由抽样误差造成的概率,所以称 u-testu- 检验(u-test)的方法和步骤见前一章内容(请逐一回忆一下检验公式和检验步骤),二、总体方差未知时单个样本平均数的假设检验,(一)当总体方差未知、而样本较大时,可以使用u- 分布计算实得差异由抽样误差造成的概率因此,其检验还是 u-test(请回忆一下以上两种 u-test 的共同点和不同点;公式的不同:哪里不同),(二)总体方差未知,且样本较小时的单个样本平均数的假设检验实际上,在很多情况下,总体方差往往是未知的,而由于各种条件的限制,试验的样本又不可能很大,即只能用小样本来作试验,或调查时抽取的样本较小因此,总体方差未知、样本较小是试验中最常见的一种情况,在第四章讨论 t- 分布时,我们已经知道,总体方差未知、且样本较小时,可以用 代替 ,其统计量 就不再服从标准正态分布,而是服从 t-分布:,(请回忆一下 t- 分布曲线及其特点) t- 分布曲线受自由度制约,不同自由度下的 t- 分布曲线其形状是不同的,因此不同自由度下算得的 t- 值落在某一范围内的概率值也随自由度的不同而不同,下面我们用例子来说明这一类型的 t-test例:猪的正常肛温为 39,今有一个猪场报告,怀疑其猪群可能是发病了,某兽医在该场内随机抽测了 24 头猪的体温,得到这 24 头猪的平均肛温为 = 40.2 ,标准差为 = 1.25 ,试问该猪场的猪犯病了吗?该例仅有总体平均值 = 39 ,而无总体方差,且样本量不大(n = 24 30),因此符合总体方差未知、且是小样本的情况,应使用 t-test 来进行检验,已知: = 39 ,样本 = 40.2 , = 1.25 检验步骤如下:设 计算 和 t 值:查附表4:t 分布表,得知:自由度为 df = 24 - 1 = 23 时的,本例中所得所得 t 值的概率 因此,应否定无效假设,接受备择假设即:该猪群肛温与正常猪肛温差异显著,我们有95% 以上的把握认为该猪群犯病了由于所得 t 值远大于 因此还应当作进一步的检验:所得 t 值出现的概率 ,因此更应该否定无效假设而接受备择假设即:该猪群肛温与正常猪肛温差异极显著,我们有99% 以上的把握认为该猪群犯病了,再举一例:药典规定,某药物每 100ml 中应含有 60mg 的总黄酮,现对某药厂生产的某一批次的这种药进行检测,得如下数据,试问该批次药物的总黄酮含量合格吗?58.3 59.2 58.6 60.6 60.3 59.5 59.1 58.0 61.0 58.9 n = 10下面我们作统计分析由于是小样本,且总体方差为未知因此应使用 t-test 进行分析(请同学们先自行立题、计算),首先计算平均数和标准差,得:第一步,设立无效假设设:查 t 值表,得: 即接受无效假设,即该批次药物的总黄酮含量符合药典规定 (试想一下,该题可以用一尾检验吗?),我们有三个公式用于单个样本的统计假设检验:能说出这三个公式各自的使用场合和它们之间的区别吗?,第二节 两个样本平均值相比较的统计假设检验,很多情况下,我们不只是将样本平均数与总体平均数相比较而是做一个试验,这个试验中设置两个组,一个组作试验,施加某种试验条件(即处理 ),另一个组作对照,试验完了将这两个组的试验数据进行比较这种试验可以采用两种方法进行:第一种方法是两个组的数据是相互独立的:一组是处理,另一组是对照第二种方法是两个组的数据是配对的,下面我们先讨论两个组是相互独立的情况这种统计假设检验的方法称为成组数据的比较一、成组数据的平均值比较方法介绍:在一个总体中,随机地抽取两个样本,在这两个样本中,被抽取的个体是相互独立的,且基本条件(如品种、日龄、性别、体况等)都应一致、均匀,必要时须作适当的调整,尽可能使两个组在样本量上一致,各组的基本情况一致随机地指定一组作处理,另一组作对照,一定要注意其中的任意一组作处理,一组作对照,而不能事先规定哪一组做处理,哪一组作对照试验过程中注意记录资料,结束以后整理资料并进行统计分析这样得到的资料称为成组数据这样的数据在组间、组内都是独立的成组数据的 t-test 其公式是:其中:,或:t 公式中分母两样本差的标准误也可以这样写:其中:当两样本量相等时:则:,在小样本时,两样本平均数差的标准化 是服从 t 分布的 因此:由于我们在之前的无效假设是:(备择假设是: )因此这一式子可以简化为:,得到成组数据所进行的试验称为完全随机设计法(仅两个组)两个组的样本量可以相等,也可以不等,但应尽量接近这种两个组是完全独立的试验,如:一组用药,一组不用药一组用试验药物,一组用常规药物一组用试验剂量,一组用常规剂量一组是引进品种(品系),一组是本地品种,等等就称为完全随机设计试验这里,前面的一组称为处理,后一组称为对照,下面我们以实例来说明成组数据的比较A、B 两厂生产某同类药物,现作 24 小时血液内残留量检测,得如下数据,试分析哪一厂家的该类药物的残留量大A厂:49.3 48.1 49.8 51.2 50.0 50.7 49.9 48.5 50.4 51.6B厂:48.3 49.7 48.2 48.8 47.3 47.7 50.4 49.2显然,这两个厂家的药物是相互独立的,试验所用动物也是独立的;样本较小因此应使用成组数据的 t-test 进行分析(同学们先行分析),先做预备计算,将两个样本的平均值、方差等计算出来:设立无效假设:计算 t 值,并作比较:所得 t 值出现的概率因此,否定无效假设,接受备择假设即:A、B 两厂生产的该类药物的 24h 血液残留量差异显著(下面应针对这一现象作出专业解释),在这种检验中,我们求 t 值时用的是合并均方,合并均方只有在两总体方差(我们一般用样本均方估计总体方差)相同,即两方差差异不显著的情况下才能得到这里我们总假定两个均方差异不显著,但如果两方差差异显著,就不能合并,两均方是否相等,必须用下一章的 F-test 进行检验才能知道,当两均方不等(称为方差不齐)时,用以下方法计算 和 t 值:当 用 的 作判断的临界值当 时须用 Cochran-cox 法:首先计算在水平上显著的临界值式中: ,,若 就否定 ,否则,就接受由于 处于 之间,因此,只有在实际计算得到的 在 之间时,才需要计算附:两均方是否齐性的判别方法:如果 表示两均方齐性,否则就是不齐(例题见P 52 该例实际是不需要计算 的,为什么? ),二、配对数据的平均值比较方法介绍:配对数据来自于配对试验,配对试验根据具体试验情况可以有好多种方法:1、将两个品种、性别、日龄、体况等一致的动物(最好是有血缘关系的同胞或半同胞)配成一对,任意一只进入试验组,另一只进入对照组,配成若干对,试验中做好记录,这种记录到的数据就是配对数据注意:对子内的两个个体应尽可能一样,但对子之间应有较大的差异,2、选取若干个动物,每一个动物在试验前测定一次,试验后测定一次,这样的两次记录就是配对数据,如同一个人吃早饭前后各测一次血糖值,这同一个人的两次血糖值就是一对数据,若干个人就有若干个数据对3、同一个体的不同部位可以配成一对,如一个兔子的左右体侧,就可以配成一对,若干个兔子的不同体表就是若干对4、同一个动物的不同试验时期所施加的不同处理形成一个对子,如一只猪在第一试验期施加 A 处理,在第二试验期施加 B 处理;或第一试验期施加处理,第二试验期作对照,凡此种种,都是配对试验,因此配对试验既有空间上的配对,亦有时间上的配对,配对试验所得到的数据,就称为配对数据配对数据的比较方法不同于成组数据的比较方法其 t-test 的公式为:其中: 而,而 n 是对子数,这里的样本量不是 2n,而是 n,因此自由度不是 2(n-1),而是 n-1 在对配对资料进行统计分析时,首先要计算每一对对子内两数据之差,即 d 值,然后对 d 值进行分析下面我们以实际例子来说明配对数据的差异性检验,研究 和 的关系,挑选体况基本相似的一对全同胞小鼠,其中任意一只放入组,另一只放入组,共挑选了8 对,分成了两组。一组饲喂正常饲料,另一组饲喂缺乏 的饲料。试验结束后检测小鼠肝脏中 的含量,得如下数据:对子号 1 2 3 4 5 6 7 8正常 3550 2000 3000 3950 3800 3750 3450 3050缺 2450 2400 1800 3200 3250 2700 2500 1750 差 1100 -400 1200 750 550 1050 950 1300,第一步,设立无效假设,即饲料中缺乏 不影响肝脏中 的储存量,对:饲料中缺乏 会严重影响肝脏中 的储存量简写为:设第二步,计算:首先计算各组数据的差然后计算,得得:即 t 值出现的概率否定无效假设,接受备择假设,即饲料中缺乏 会严重影响小鼠肝脏对 的储存量;或正常饲料与缺乏 的饲料两者对肝脏 的储存量差异极显著,随机抽取 10 名健康青年男子,测量一日中不同时间的血压(舒张压)变化,得如下数据,试分析不同时间血压的差异性序号 1 2 3 4 5 6 7 8 9 106时 80 83 75 78 71 89 77 81 72 75 9时 85 93 89 83 80 86 85 79 78 81差: 5 10 14 5 9 -3 8 -2 6 6上一例是两个试验动物配成一对,这一例是同一个试验材料不同的时间内测定的数据配成一对,这是在兽医类试验中经常使用的对比方法下面是统计分析结果(同学们可先行分析),设立无效假设:计算 t 值:先计算每一个人的差值,写于表格的最下面一行再计算差的平均值和标准误:计算 t 值:即出现t值的概率因此,否定无效假设,接受备择假设:上午 9 时血压舒张压极显著高于上午 6 时,或:上午 6 时和9 时的血压舒张压有极显著的差异差异不显著、显著、极显著也可以这样表示:不显著:n.s. 显著:* 极显著:* 如:,成组数据差异显著性检验和配对数据差异显著性检验的区别在于:1、在作试验设计和实施试验时,两者的差别就已经确定了,试验设计是配对的,就不能用成组比较法来分析所得资料;反之,试验设计是成组的,就不能用配对比较法来分析所得资料2、如果是分析别人的资料(如我们在统计学习中碰到的例题等),一定要根据例题(或习题)的内容来加以判断:独立抽取两个样本、将所抽得的样本随机分为两组;抽取一对相似的试验动物、一个个体在某一时间段作什么,另一时间段作什么、某一试验前测定一次,试验后测定一次;等,两者的区别千万不能搞错:配对试验如使用成组比较法,易发生型错误,即不能鉴别应属显著的差异,这是人为地扩大了标准误(存伪)成组试验的资料如果乱配成对子后用配对比较法,易使不显著的差异检验成显著的差异(弃真)成组试验应采用供试单位基本一致的材料,彼此独立,随机抽样、随机分组、随机供试,两组样本尽可能一致配对试验对子内应尽可能一致,对子间应适当扩大距离,以使试验有更大的适应性,第三节 百分资料的 u-test,在动物科学研究中,特别是兽医学科研究中,有很多资料是属于二项分布的这样的资料一般可用率来表示,如受精率、出苗率、孵化率、死亡率、存活率、治愈率、淘汰率,等计算这一类率时所用的样本一般很大,样本量较小时,所得到的率其实用意义不大当 p 或 1-p 不太小、而 np 或 n(1-p) 不小于 5 时,率的分布也服从正态分布,因此,率的检验可采用 u-test率的检验有单个样本率和两个率的比较两种,一、单个样本率的假设检验这是检验某一个率所属总体与理论率或期望率是否一致的假设检验,即某一个样本率 是否符合一预设的总体率其中:由于一般计算率的样本都比较大,因此可使用 u-test 进行检验,与之相比较的两个临界值就是 时取 1.96 , 时取 2.58,即当 时, 差异不显著 当 时, 差异显著 当 时, 差异极显著,例:某兽药厂称该厂生产的治疗猪丹毒病的某种新药其疗效达 85%,今有一养猪场购买了这种药,500头病猪经治疗后成活了 415头,该厂关于这一新药的宣传是否属实?设立无效假设:接受无效假设,即该厂生产的这种新药其疗效在95% 的水平上可以得到承认,又例:孟德尔的豌豆花试验中,孟德尔曾假设其红花和白花的比例是3:1,今一个试验中,得红花447朵,白花 165朵,问:这次试验的结果符合这一假设吗?作无效假设:这一次试验在95%的水平上可被接受,即本次试验的结果是符合孟德尔假设的,二、两个样本率差异的显著性检验这一类型的假设检验往往是检验两个样本率 和 所属总体率 和 是否一致,或者说两个样本率是否来自一个总体设两个样本容量分别是 和 ,两样本中发生某一阳性事件的次数分别是 和 ,则两样本率分别是 和 这两个样本率所属总体的率分别是 和我们通过两样本率的差 来推断 和 是否相等,这一类型的无效假设是其备择假设是,用以检验的公式为:其中:由于一般样本很大,因此可用 u-test得到的 u 值与 1.96 和 2.58 相比 时, ,差异不显著 时, ,差异显著 时, ,差异极显著,例:试验某种新药对杀灭猪体外寄生虫的效果,用常规药物作对比试验,常规药物施与 860 头虫体,死亡 585 头,该新药施与 920 虫体,死亡672 头,新药的疗效如何?新药的杀灭率和常规药物的杀灭率分别为设立无效假设:设,否定无效假设,即新药的除虫效果显著好于常规药物,又例:试验用 EM 制剂处理饲料可否提高苗猪的成活率:处理组(施用 EM)382 头苗猪成活 364头,对照组(未施用任何药剂)278 头成活 244头,EM 有效果吗?处理组成活率: 对照组成活率:设,否定无效假设,接受备择假设,即 EM 可以极显著提高苗猪的成活率,三、小样本率假设检验的校正质量性状的率的计算,一般应使用大样本,但有些特殊情况下,样本不够大,只能得到一个小样本的率,如 n 25、且 np 5 时,资料服从二项分布,不能再使用常规的 u-test,这时应进行校正,近似地进行 u-test,(a)单个小样本率的校正性检验其公式是:(b)两个小样本率的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【教案版】小学二班级上册 球类活动2
- 2025年电气工程师中级面试实战指南及模拟题答案详解
- 2025年熔化焊接工艺考试宝典与模拟题集
- 2025年营养师中级考试指南与备考策略
- 2025年电子商务运营专家初级面试预测题与解析
- 2025年电子商务网络安全工程师面试秘籍与预测题
- 电力基础安全知识培训课件
- 2025年护士执业资格高级考试试题集及答题技巧
- 2025年烈士纪念设施保护单位招聘面试常见问题及答案
- 2025年山东省青岛李沧区中考化学二模试卷
- 公司之间罚款协议书
- T/CECS 10246-2022绿色建材评价智能坐便器
- 2025年中国铂金属制品市场现状分析及前景预测报告
- 2025-2030年中国硅酸钇镥(LYSO)市场深度调查与发展前景预测报告
- TSG 23-2021气瓶安全技术规程
- 2025年渠道管理及维护工技能资格知识考试题与答案
- CCF全国青少年信息学奥林匹克联赛NOIP 2024真题
- 社区健康教育知识讲座
- 监护学徒协议书范本
- JISG3141-2017冷轧钢板及钢带
- 2025届苏锡常镇高三语文一模作文解读及范文:我会洗碗呀
评论
0/150
提交评论