版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物统计学复习题一、名词解释交互作用:表示当两种或几种因素水平同时作用时的效果较单一水平因素作用的效果加强或者减弱的作用。当因素间的互作效应为零时,称该因素间无交互作用,此时的因素是相互独立的因素。回归系数:回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化 量。整群抽样:就是将总体划分为假设干个小群体,再随机抽取局部小群体组成样本。F检验:即统计假设的显著性检验,用于推断处理间的差异是否存在。在计算F值时,以被检验因素的均方即处理间均方Sf作分子,以误差均方即处理内均方 Se2作分母。没找到无效假设:不管样本是否真的属于总体A,都首先假设是,即假
2、定“ X与口间的差异源自误差,并非本质差异,这就是无效假设,记H。相关变量:统计学把存在关联但并非确定的数量关系称为相关关系,把存在相关关系的变量称为相关变量。决定系数:是变量X引起Y变异的回归平方和占 Y变异总平方和的比率,为相关系数r的平方。取值范围:01。独立变量:一个量改变不会引起除因变量以外的其他量的改变,那么称这个量为独立变量。相关系数:就是两变量离均差乘积和平均数的标准化值。分层抽样:又叫分类抽样。先按某种特征将总体分为假设干个层次(strata),在每一层内随机抽取亚层,直到最后一层对观察单位随机抽样。比方资源调查中按片区 t地区t局部区域等分成假设干个地域层次。单位组:(相当
3、于一个区组)在盆栽和动物试验中,为随机分配到各个处理而挑选出来的尽可能一致的一组试验单位。不同 单位组可分别安排在有条件差异的场所。随机样本:在抽样过程中,通过一定的方法和条件控制,尽可能确保总体中的每一个体都有同等的时机被抽到,这样的抽样方法叫随机抽样 (random sampling)。通过随机抽样所得到的样本叫随机样本,通常简称样本。概率抽样:又叫随机抽样,就是调查研究对象的总体中每个局部都有被抽中的相同几率,是一种完全依照时机均等的原那么 进行的等概率抽样。随机抽样又有四种不同的方法。局部控制:将存在明显差异的整个试验环境分成假设干个小区域,使小区域内的差异尽可能小,然后将处理内的试验
4、单位 随机分组并随机安排到各个区域中,从而实现不同处理在小区域内相互比拟,这就是局部控制。参数估计:是统计推断除假设检验的另一个方面,是指由样本结果对总体参数在一定概率水平下所作出的估计。包括区间 估计和点估计。统计量:由样本观测值计算得到的描述样本特征的数值称为统计量或统计数。系统误差:是由试验因素以外的某些确定性原因引起的误差,也称偏差(bias)或片面误差(lopsided error)中心极限定理:如果原总体呈偏态态分布,那么随着样本容量n的增大,样本均数或率的抽样分布就逐步趋近于正态分布,这就是中心极限定理。点估计:就是直接用标定口可能出现的位置,并指出在一定概率1a保证下口以这个位
5、置点为中心的可能出现范围。因素水平:是指实验中每个因素的不同设置或组别,简称水平。总体:是指包含了具有某种共同属性的所有个体的集合,这里的 “共同属性依研究目的、研究对象不同而变。参数:由总体各观测值所计算得到的用来描述总体特征的数值称为参数(parameter)完全事件系:假设事件A1、A2、An两两互斥,且每次试验必有一件发生,那么事件A1、A2、An任中发生一件 就是必然事件,这样的一系列事件就是一个完全事件系。小概率事件:从概率密度函数曲线两端开始向中间累加概率值,到累积概率值一特定值a时为止就划定出变量的两个区域,变量值出现在这两个区域内就是小概率事件。试验因素:是指对性状表现可能有
6、影响的试验研究工程或内容,简称因素。样本:从总体抽出的对总体具有代表性的一小局部个体组成的小群体就叫样本(sample)。随机误差:由于试验过程中各种偶然因素的影响而造成的误差。一个观察值上的随机误差大小,事先完全没有确定性,找不出引起误差确实切原因,所以也叫偶然性误差概率分布:概率随变量实际取值Xi不同而变的变化规律与特征就是概率分布,可用图表或函数式描述。区间估计:利用样本平均数 亍和标准差S,对总体均数 ?在一定概率1a丨保证下的出现范围作出界定。试验处理:就是不同因素各个水平间的特定组合方式,简称处理。在单因素试验中,一个水平就是一个处理;在两因素试验中,处理个数=因素1水平数x因素2
7、水平数。观察单位:是根据研究目的而确定的观测总体,指在试验中能接受不同实验处理的独立的试验载体。没找到互作效应:两个或两个以上处理因素间相互作用所产生的效应,称为互作效应。二. 判断题(如是错的,那么需用最少的改动使其表达出正确意思)1. 1995年南京市雨花区蔬菜生产基地测量全部粉团萝卜肉质根重,所得的总体,称为无限总体。V 。2. N (0, 1)表示的是参数值 =0、c 2 = 1的特定分布。V4. 当u = 1.96时,统计假设测验的右尾概率为0.01。 X 5. 一个试验的数学模型是方差分析的理论依据,但该模型在试验开始时就已确定。V6. 单向分组资料作方差分析, 处理效应不管是固定
8、还是随机,其平方和与自由度的分解以及F值的计算和F检验均无区别。V7. 一元线性回归有重复观察值资料,Y方面总变异平方和分三局部,即回归平方和、离回归平方和和误差平方和。X8. 用=0.05作两尾检验时,查一尾表需要在表上找=0.10对应的值。X 9. 对于一个具体的试验结果,用两尾检验比用一尾检验更容易到达显著水平。X说反了10. 古典概型是说,随着 n的增大,随机事件A的频率越来越稳定地趋近于一定值p,这个p值就是A的概率。X11. t分布是一种不对称的分布,其曲线变化只受df影响。X 12. 试验单位的数目就是试验中所设的处理数。 X 2个变异来源。V 13. 单因素的随机区组试验无重复
9、观察值资料在方差分析中除总变异外还有14. 独立性检验按的有关生物学理论来计算各类别的理论次数。 X 15. 只要n足够大,犯I型错误概率就可小到微缺乏道甚至没有。X 16. 正态分布曲线与横轴之间的总面积小于1。 X =1,这种测验在统计上称为(A )。三. 单项选择题1. 如测验k个样本方差S2 (i=1,2,3)是否来源于方差相等的总体A. 方差的同质性测验B.学生氏t测验C. F测验 D. u测验2用标记字母法表示的多重比拟结果中,如果两个平均数的后面,既标有相同大写拉丁字母,又标有不同大写拉丁字母, 那么它们之间差异C 。A. 极显著 B.不显著3. 一尾测验指 B 。A. 具有一个
10、接受区的假设测验C.左边一尾为否认区的假设测验C.显著D.未达极显著B. 具有一个否认区的假设测验D.右边一尾为否认区的假设测验4. 在测验H0: d =0, Ha: d丰0,贝U d的95%的置信区间的两个置信限为(D)。A. 正号 B.负号 C.下限为正号,上限为负号5. 随机抽样的目的是A D.下限为负号,上限为正号A、消除系统误差C减少随机误差B、消除测量误差D、减少样本的偏性D D、四分位数间数6. 对于同一组资料,哪个指标没有考虑到每个观察值的变异A、方差 B、总体标准差C、变异系数7. 对两个变量进行直线相关分析,r=0.39 , P>0.05,说明两个变量之间A A、有相
11、关关系B、有数量关系C 、有伴随关系 D 、无相关关系8. 观察某地90年至2000年意外伤害发生率和摩托车数量的关系,宜选择的图形为A A、直方图 B 、直条图 C、散点图D 、线图9. 在假设检验时,本应作单侧检验的问题误用了双侧检验,可导致。C A.统计结论更准确B.增加了第一类错误C. 增加了第二类错误 D. 减小了可信度10. 样本容量确实定,下面哪种观点是错误的。(A )A.样本越大越好B. 在资源和投入许可的条件下尽量增大样本含量C. 保证一定检验效能条件下尽量减少样本含量D. 越易于组织实施的样本容量越好11. 卡平方的连续性矫正的公式为(D )。D. c2 =刀(|Oi -E
12、i|-0.5)2 /EiA. c2 =刀(Oi -Ei)2/EiB. c2 =刀(Oi -Ei -0.5)2 Ei C. c2 =E (|Oi £|-0.5)2 /Oi12. 以下哪种成比照较的无效假设的设立是正确的 ( D?)。A. Ho: dW 15 B. Ho: d > 12C. Ho: 1 - 2 < 10D. Ho: d工013在成对数据资料用 t 测验比拟时,假设对数 n=13 ,那么查 t 表的自由度为 A 。A. 12 B. 25 C. 24 D. 11对试验检测结果的比拟分14. 对两小麦品种的籽粒蛋白质含量差异性作比拟, 各品种皆随机取 1o 个样点测
13、定蛋白质含量, 析应采用 A 。A. 成对资料 t 检验 B. 成对资料 u 检验 C. 成组资料 t 检验 D. 成组资料 u 检验15. 关于相关系数,以下说法中错误的选项是 ( D )。A. 相关系数是反映两变量间相关密切程度和相关方向的统计量B. 相关系数没有单位或不带单位C. 相关系数的绝对值小于或等于 1D. 同一资料的相关系数和回归系数的正负符号相同,大小呈一定比例关系16. 实验设计的三个根本原那么是 ( C )。E. 处理因素、受试对象、实验效应B. 精确度、准确度、灵敏度C. 随机化分组、均衡对照、足够的受试对象D. 统计假设、统计描述、参数估计17. 分别用两种方法测定
14、12 株西红柿的果实中可溶性糖含量,以便比拟两种方法的测定结果有无差异,该研究可采用的最正确试验设计和分析方法是 ( B )。A. 完全随机设计 Z 检验B. 完全随机设计 t 检验C. 配对设计 Z 检验D. 配对设计 t 检验18 对男女两个样本小学生的不良饮食习惯发生率作假设检验,这项工作属于( D ) 。A. 总体研究B. 统计描述C. 实验设计 D. 统计推断19 关于总体置信区间,以下论述中错误的表述是( D )。A. 总体均数的区间估计是一种常用的参数估计方法B. 总体均数置信区间所求的是在一定概率保证下的总体均数出现范围C. 求出总体均数置信区间后,即可推断总体均数就在这个范围
15、内D. 总体均数置信区间的估计考虑了抽样误差的影响20. 关于完全随机设计的单因素方差分析,以下选项中 ( B ) 是不可能的。A. MS总=MS组间+ MS组内B. SS总=SS组间+ SS组内C. SS 组间v SS 组内D. MS 组间v MS组内21. 人口调查中 , 以人口性别所组成的总体是 ()总体。A. 正态 B. 对数正态 C. 二项D. 指数分布22. 以下哪个概率不可能是显著水平a的取值(A )。A. 95% B. 5% C. 1o% D. 2.5%23. 总体参数在区间L1,L2内的概率为1-a ,其中L1和L2在统计上称为(A )。24、一组变量的标准差将B A、随变量
16、值的个数n 的增大而增大C、随变量值的个数n 的增加而减少25、方差分析的两个根本假定是DA、方差同质和各个i都相等且等于B、随变量值之间的变异增大而增大D、随系统误差的减小而减小。B、各个i都相等且等于和处理间方差等于误差方差C、处理间方差等于误差方差和SS、df都是线性可加的26、27、28、29、D、 SS、 df 都是线性可加的和方差同质因素随机区组试验总变异的平方和可以细分成A、3B、4C、5用标记字母法表示的多重比拟结果, 这两个平均数之间的差异 A. 极显著 B. 不显著CC.D、C 项。如果两个平均数的后面既标有相同大写拉丁字母,又标有不同大写拉丁字母,那么 。显著 D. 介于
17、显著与极显著之间试验中进行局部控制的目的是A. 无法进行全面控制C. 减少整个试验的随机误差2分布中2值的变化范围是 0+B.D.。不需要全面控制 减少各处理内部的试验误差,在适合性检验和独立性检验中, 2 值 。B. 等于 1 时适合性最好或完全独立 等于 1 时适合性最好或完全不独立 是错误的。b.A. 等于 0 时适合性最好或完全独立 C. 等于 0 时否认 H0D.30.以下关于F检验的说法中, a. 方差分析中的 F 检验是右尾检验C. F 检验有时也需要作两尾检验 随机抽样的目的是 A 消除系统误差 B 、消除测量误差 变异系数的数值 B 一定大于 1 B 、一定小于 1 C 描述
18、一组数值变量资料的分布特征时 应同时选用算术平均数和标准差 应同时选用中位数和四分位数间距 根据分布类型选用相应的集中、离散趋势指标 以上都不正确 对两个变量进行直线相关分析, 有相关关系 B 、有数量关系 t 分布比标准正态分布 D 中心位置左移,但分布曲线相同 中心位置不变,但分布曲线峰高 随机事件一般是指 D A、发生概率为 0的事件B发生的概率很小如P<0.05在一次试验中可能发生也可能不发生的事件,其发生的概率0< P < 1比拟同一组儿童身高和体重两项指标的变异程度的大小,可选用的变异指标为 、变异系数 D 、四分位数间距 、度量了一组数据偏离均数的大小 、不会小
19、于算术平均数B 1、A、2、A、3、A、B、C、D、4、A、5、A、C、6、C、D、7、A、8、A、C、9、A、全距 B 、标准差 C 关于标准差,哪项说法是错误的 反映全部观察值的离散程度 反映了均数代表性的好坏d.方差分析中的 F 检验是左尾检验 使用 F 检验最多的就是方差分析、减少随机误差D 、减少样本的偏性、可大于 1,也可小于 1 D 、一定比标准差小 C r=0.39 , P>0.05 ,说明两个变量之间 A C BC、有伴随关系 D 、无相关关系、中心位置右移,、中心位置不变,、发生概率为 1但分布曲线相同 但分布曲线峰低,两侧较伸展的事件B D 以下哪一项描述不是正态分
20、布的特征 曲线位于横轴上方均数处最高E、以零为中心,左右对称C、均数为其位置参数D、标准差为其变异度参数10、甲药的疗效不会低于乙药,检验的目的是为了得出甲药的疗效是否明显地优于乙药,此时应选用:t 检验 B 、单侧检验 C 、卡方检验 D 、双侧检验在研究两种药物治疗高血压的效果的配对 t 检验中,要求两组的样本方差相等 B 、数据呈双变量正态分布差数 d 服从正态分布 D 、差数 d 的方差等于 0 系统误差两个小样本中的每个观察值都减去同一常数后再进行样本平均数间的差异显著性检验,那么计算的A、1、A、C、2、。t 值 A。A、变小 B 、变大 C 、不变 D、变小或变大观察单位3、算术
21、均数与中位数相比, C 。A、抽样误差更大 B 、不易受极端值的影响 C、更充分利用数据信息D 、更适用于分布不明及偏态分布资料4、甲药的疗效不会低于乙药,检验的目的是为了得出甲药的疗效是否明显地优于乙药,此时应选用:A、 t 检验 B 、单侧检验 C 、卡方检验 D 、双侧检验点估计5、为了使显著性检验的两类错误同时减少,可采取措施: B A、提高显著性水平B、增加样本含量C降低实验误差D、增加人员和设备1、在两样本均数差异的统计检验中,事先估计并确定适宜的样本含量的一个重要作用是C 。A、控制第一类错误概率的大小B、可以消除第一类错误C控制第二类错误概率的大小D、可以消除第二类错误2、在两
22、变量X1和X2的配对t检验中,差数的A A、总体均数就是总体均数之差B、方差就是两样本均数之差的方差C总体均数的可信区间一定包含 0 D 、均数的方差是03、在同一总体随机抽样,其他条件不变,样本含量越大,那么B? A、样本标准差越大B、样本标准差越小C总体均数的95緬信区间越窄D 、总体均数的95%可信区间越宽4、实际工作中,两均数作差异的统计检验,要求 C A、数据近似正态分布B、两样本均数相差不太大C、两样本方差同质D、两组数据标准误相近5、标准正态分布是指DA、N卩,八B、 N 0, 0C 、 N 1 , 1 D 、 N 0, 1 6、在某个连续分布总体中随机抽样, B ,理论上样本均
23、数的分布就趋向正态分布。A、变量X服从正态分布,随样本大小n增大B变量X不服从正态分布,随样本大小n增大C变量n不变,随样本个数 k增多D变量X不服从正态分布,随样本个数k增多7、为了通过测定碘含量来预测地方性甲状腺肿的患病率,应选用: B? A、相关分析B 、回归分析 C、多元回归分析 D、方差分析8、对于 t 分布来说,固定显著性水平的值,随着自由度的增大,t 的临界值将会怎样变化? B A、增大B 、减小 C 、不变 D、可能变大,也可能变小9、 有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度应该是:D A、 n1 n2 B 、 n1 n21 C 、
24、 n1 n2 1 D 、 n1 n2 210、 对于一组呈正态分布的计量资料,假设对每一个个体同减去一个不为零的数,那么B A、均数、标准差均不变E、均数变、标准差不变C、均数、标准差均变D、均数不变、标准差变6、关于四分位数间距,以下哪一项为哪一项错误的C A、适用条件同中位数E、反映数值变量资料的离散趋势C、考虑了每个变量值的变异情况D、较极差稳定7、关于变异系数,哪项说法是错误的。A、反映全部观察值的离散程度BC常与平均数一起使用D8、参数是指 B A、参与个体数 B、总体的统计指标9、配对设计的试验中,同一组内的A、个体间差异需尽可能小B C 、是评价一组数据偏离均数的相对指标 、可用
25、于比拟各种数量性状的变异程度C 、样本的统计指标式 C 、样本的总和A 、个体接受相同的处理C个体间差异越大越好D除处理因素外,其它或可能影响观察指标的因素和条件都相同或相近10、常用的三种多重比拟方法中, B A、q 检验法更易犯取伪错误C新复极差法的尺度最大、LSD法更易犯取伪错误D、LSD法的尺度最大填空题1、在同一连续分布总体中作随机抽样时,抽样分布标准误的大小受样本容量的影响。2、用 作假设检验时,如果在两尾 t 界值表上找 所对应的值,说明进行的是 两尾 检验。3、 在假设检验中如果本应作两尾检验的作了一尾检验,犯II 型错误的时机 ( 增大 )。4、 分布中的 2 值最小极限值是
26、 (1)。5、 概率有统计概率和古典概率两种定义。6、 中心极限定理的最大意义在于标准正态分布适用于各种总体的平均数抽样分布的分析。7、 比拟试验中设置重复的作用在于估计误差。8、 两因素随机区组试验无重复观察值资料的方差分析中包括总变异在内有5个变异来源。9、 随机事件的概率相乘原理在统计假设检验中有无直接应用?有 。10、 事件A1、A2、An构成的完全事件系中,必然事件 和事件发生的概率等于 1。11、 与相比算术均数,中位数更适用于极个别表现值特别大。12、 服从标准正态分布的变量,随机抽取到一个介于与之间的变量值的几率为99%。13、二项分布如果 P 远离 0.5, n 又太小分布就
27、只能在二项分布上直接进行假设检验。14、统计假设检验中的弃真错误不可防止,但在做出无效假设特别慎重的情况下犯这种错误是无关紧要的。15、与成组比拟相比,配对设计对于对之间的差异处理有无作用,因为配对试验中的个体间固有差异没有计算入处 理间的误差项里面 。16、在两变量 X1 和 X2 的配对 t 检验中,差数的平均数等于。17、回归和相关分析中的 t 检验是双侧的还是单侧的? 单侧 1 、在同一连续分布总体中作随机抽样, n 越大,那么抽样误差越小。2、用 作两尾检验时,查一尾表需要在表上找 =()对应的值。3、 对于一个具体的试验结果,用两尾检验比用一尾检验更( 容易 )到达显著水平。4、
28、正态分布曲线与横轴之间的总面积等于( 1 )。5、 随着 n 的增大 , 随机事件 A 的频率越来越稳定地趋近于一定值p, 这个 p 值就是 A 的概率。这样的概率类型叫统计 概率6、t分布与u分布的相同之处一是对称分布,二是曲线与横轴所围成的面积等于1丨。7、在单因素试验中,处理数等于水平数。8、 单因素随机区组试验无重复观察值资料的方差分析中除总变异外还有2 个变异来源。9、在X2检验中按的生物学理论或变量总体的各类别比率计算理论次数。1、样本容量n越大那么在同一连续分布总体中作随机抽样的抽样分布标准误越小。2、 用 作一尾检验时,查两尾表需要在表上找=( )对应的值。3、 在假设检验中,
29、用一尾检验比用两尾检验更(难)到达显著水平。4、 F分布和2分布的共同特点是分布区间都为0, + a)。5、在有限个 n 个可能出现的表现形式中,具有某种共同属性的表现形式有m 个,那么在随机抽查时具该种属性的个体出现概率属于时不必要求变量一定要呈正态分布。个变异来源。6、 根据,样本平均数的差异显著性性检验在7、在有 m 个因素且每个因素有 k 个水平的试验中,处理数等于 km。8、 两因素随机区组试验有重复观察值资料的方差分析中除总变异外还有59、在独立性检验中需要按随机事件的概率相乘原理来计算各类别的理论次数。10、假设每次试验中两两互斥的事件A1、A2、An,且“事件A1、A2、An构
30、成一个必然事件 , 这样的一系列事件就是一个完全事件系。Xi 与相应 P(Xi) 之间11、概率随变量实际取值 Xi 不同而变的概率变化规律或特征就叫概率分布。用于描述变量各个 对应关系的函数式叫概率密度函数。12、 服从正态分布的变量,随机抽取到一个介于与之间的变量值的几率为99%。13、二项分布在 p=q=0.5 时呈正态分布;如 p 或 q 不等于 0.5,只要偏离 0.5 不多且 n 足够大,那么从二项总体中随机抽 样的平均数抽样分布也趋近于正态分布了。14、在统计假设检验的两类错误中,I型错误的特点是犯I型错误的概率等于选择的显著水平a。为防止犯II型错误,可采取3个对策。10、 假
31、设事件A1、A2、An两两互斥,且每次试验必有一件发生,那么“事件A1、A2、An任中发生一件就是一 个必然事件,这样的一系列事件就是一个完全事件系。11、 概率随变量实际取值 Xi不同而变的变化规律与特征就是概率分布。用于描述变量各个 Xi与相应P(Xi)之间对应关 系的函数式叫概率密度函数。12、 服从正态分布的变量,随机抽取到一个介于一丨与之间的变量值的几率为95%。13、 二项分布在卩和q取值接近时趋近于正态分布。在n足够大时t分布就趋近于正态分布了。14、在统计假设检验的两类错误中,通过可以减少犯取伪错误的时机甚至防止犯这类错误。四简答题1、独立性检验和适合度检验有何异同?独立性检验
32、与适合性检验是两种不同的检验方法,除了研究目的不同外,还有以下区别: 1数据资料的结构不同独立性检验的资料是按两个因素的属性或类别归组。依两因素的属性类别数不同而构成2X2、2比、r尢列联表;而适合性检验只按一个因素如性别、表现型等的属性或类别对次数资料进行归组。2理论值计算的依据不同适合性检验按的生物学理论或变量总体的各类别比率计算理论次数。独立性检验的理论次数是在假设两因素相互独立的条件下按概率的乘法定理进行计算。3独立性检验与适合性检验的自由度不同在适合性检验中,自由度只有一个约束条件:各理论次数之和等于各实际次数之和,df= k -1。独立性检验有三个约束条件 : .所有rX c个Oj
33、之和必须等于rX c个Ej之和,所以整个试验有总自由度:rX c-; .c个Ci之和必须等于 c个Ei之和,所以有df = c -。但r因素与c因素独立与否,与c因素内部的df无关。 .r个Rj之和必须等于r个Ej之和,所以有df = r -。但r因素与c因素是否独立,与r因素内部的df无关。所以,独立性检验的自由度为:df = rX c -1 -(r -) -(c -1) = (r -1) X (c -1)即等于:(行的属性或类别数-1) X列的属性或类别数-1)2 x c列耳关表白勺一般开三武5c2c匚V> 1。们0/1OlnRi1S。2202nR.(1"7(爲T2、随机区
34、组单位组设计有何好外与缺乏?优点:设计简单,容易掌握; 灵活性大,适用于单因素、多因素及综合性试验; 符合试验设计的三原那么。在完全随机设计的根底上增加了局部控制的内容,将试验环境一致性的控制范围从整个试验地缩小到了单个区组,能有效减少单方向土壤肥力差异的影响,区组间的差异在统计分析时单独成为一个变异来源,降低试验误差,提高试验的精确度; 对试验地的形状和大小要求不严,必要时不同区组可以分散设置在不同的田块或地段上; 易于分析,当因某种偶然事故而损失某一处理或区组时,可以除去该处理或区组进行分析。缺乏:.处理数不能太多,否那么区组面积必然增大,内部的环境变异增大,局部控制的功能失效,试验误差增
35、大。田间试 验中,处理数一般不超过 20个,最好10个左右。有多方向或斑块状土壤差异时,须用拉丁方设计。3、假设检验根据什么原那么确定选用而不用?举例说明。通常以a =0.05为显著水平,a =0.01为极显著水平。都常用,但必须根据研究目的、遵循一定原那么来选用。对于差异容忍度小、要作出“没有本质差异的推断是需特别慎重、性状或研究的事物属性不易受偶然因素影响,用 a =0.05。证明没有核辐射污染等特殊情况可用a =0.10。如对差异容忍度大、要作出“存在本质差异的统计推断时需要特别慎重、或者性状受偶然因素影响大,选用a=0。01。如证明新产品、新品种或新方法比对照优越等。4、相关分析方法和
36、回归分析方法最重要的区别有哪两个?请作简要介绍。不懂题目问的啥子直线相关:研究偕同变化的变量间平行相关关系。-具有直接的内在必然联系t平行关系t互为因果关系:禾谷类植物的穗长与小穗数 ,幼苗根重与地上部重量的关系系等。-间接的内在必然联系-共同受其他因素影响:如臂长与腿长的关系,叶片的长度与宽度,嫩豆荚的成熟度与Vc含量,胚芽鞘长度与抗旱性等。直线回归:研究自变量对依变量的单向作用和影响。自变量与依变量间的 单方向因果关系 有3种类型:根底变量与后续变量t先因后果,直接作用。成因变量与表象变量 T无先后次序,直接作用。表征变量与标的变量T间接作用。5、什么叫试验设计?试验设计遵循的原那么有那些
37、?试验设计(Experimental design)是根据试验目的、试验条件和试验设计原那么对试验的因素与水平、试验单元及指标进 行合理安排的科学方法。遵循的原那么:重复、随机化、局部控制设置重复的一个重要作用:便于估计误差,更正确地估计处理效应 。在试验中,一个生物个体可以构成一个试验单位有时一组个体也可构成一个试验单位。如果一个处理只实施在一个试验单位上,那么只能得到一个观测值。不同处理的作用与偶然因素引起的随机误差就混在一起,因而无法估计试验误差的大小。如果一个处理实施在两个或两个以上的试验单位上,就可利用同一处理内观测值间的差异来估计试验误差。设置重复的另一个重要作用就是降低误差,提高
38、试验的精确度;随机化就是使每一个试验单位都有均等的时机进入各个处理,而且每一个处理都有均等的时机被安排到实施区域的各 个空间位置。在有多个重复的前提下,随机化具有两个重要作用:防止试验单位间可能存在的差异混入处理效应;防止试 验实施场所不同区域间的差异混入试验误差。将存在明显差异的整个试验环境分成假设干个小区域,使小区域内的差异尽可能小,然后将处理内的试验单位随机分 组并随机安排到各个区域中,从而实现不同处理在小区域内相互比拟,这就是局部控制。方差分析时,小区域之间的差异 单独成为一项变异来源,从而使试验误差得到有效控制。6. 何谓中位数?定义:将一组观察值从小到大排序后,居于中间位置的那个值
39、或两个中间值的平均值,用M表示。中位数有三个特点: 不受分布于两端的观察值大小影响,两端出现特大或特小的异常值时,只要n不变,M不变。 中位数也可叫第 50百分位数,比算术平均数稳定,因其大小只决定于居中位置的观察值。 理论上 对称分布的资料 的中位数等于算术平均数,正偏态分布资料的 MV算术平均数,负偏态分布资料的 M 算术平均数。应用:偏态资料。如 全社会家庭收入资料通常呈负偏态分布,中位数比算术平均数更具代表性。7、什么叫型错误?如何防止?在假设检验中,如果 Ho不是真实的,检验后却接受了它,就犯了第二类错误,即n型错误、B错误或纳伪错误。 减少甚至防止犯n型错误的途径:1适度增大样本容
40、量 n。抽样分布曲线随着 n增大越加陡峭,交叉区域就越小。n足够大时犯n型错误的概率就非常小甚至没有。2正确选用显著水平a。按显著水平确定原那么选用较大a如0.05时,不仅统计推断结论具有更高可靠性和公信力,而且接受区不易重叠或重叠区域较小,犯n型错误的几率较低。3 2和3 x进而减小口 B。如果差异显著但未达极显著水3严格控制偶然因素影响。通过严格控制试验条件课减小? 平,最好重做试验。8、什么情况下使用右尾检验?举例说明之。右尾检验是要推断X是否确实大于 卩0,只有右端一个否认区。即Ho:卩tA卩0;Ha:卩t>y o。试验组有可能与对照组没区别,也可能确有增加,但在试验前就可确知不
41、会比对照还小或少时。比方检验一次事故是否污染了环境;不 知优化或改进的效果是否显著,但不可能变得更糟的试验资料分析。检测有害成分含量或有害残留物是否超过国家标准和 国际标准时,含量越少越好,但不允许高于标准,权威机构或公众只关注是否含量过高或超标了。9、什么叫固定模型?固定模型是指因素下设定的各个水平包含了需要研究的所有水平,k个水平各有一个Ti值,构成有限总体,受刀T i=0约束。有:二,辽.it卅-朴" r : -固定模型必须同时满足下述两条:1因素下设置的各水平都可确切控制。如品种比拟试验,肥料、饲料、药效、操作方法的效果试验等。 2因素下水平的设置 不带有随意性。如研究目的关
42、注的所有水平都纳入试验。结果并不用于推断其他。比方温度的影响试验,如果确定的几个温度是室内严格控制的,而且仅限于研究这些温度条件下的作用效果而已,并不作为一定温度变化范围内的代表,那么也是固定模型。10、何时选用较小的显著水平 a =0.01,为什么?11、相对于成对资料,成组资料的比拟需要注意哪些问题?12、为什么正态分布具有广泛适用性?连续型变量在其取值范围内的概率密度分布呈两端低中间高的对称分布,且由口和3决定曲线特征的概率密度分布类型。遵从正态分布的连续型变量,所有可能的取值 Xi构成一个正态总体。根据正态分布的概率密度函数,任何一个可能的变量值所对应的出现概率都可以求出来。任何连续型
43、变量资料,只要服从正态分布,都可标准化为u变量,即u值概率分布表的用途极为广泛。13、 何时选用较大的显著水平a =0.05,为什么?14、相对于成组资料,成对资料的比拟的最大优点是什么?15、什么情况下使用左尾检验?举例说明之。左尾检验:检验X是否显著小于卩0,只有左边一个否认区。即H。:卩t<0;Ha :ytv卩0。试验处理有可能没效果,也可能确有降低,但试验前就能确知不会比对照组还大或多。比方试验各种无公害生物制剂防治害虫,调查植株上的虫口量;试验减肥药的减肥效果等。有效成分含量或使用寿命等质量分析,指标越高越好但不允许低于标准,社会只关注是否低于标准。16、什么叫方差分析的随机模
44、型,其最大特点是什么?随机模型:试验因素理论上可有无限多个水平,其Ti服从N 0, 3 t。试验中设置的k个水平不是固定的,只是无限多个水平的一组代表,存在抽样误差。所以有:''-随机模型的特点有:1设置的各个水平难以确切控制。如比拟大棚与露天条件对嫁接效果的影响,温光湿度都无法确切控制。 如再次做相同试验,两个水平的实际状况肯定都有所改变。2因素下水平的设置,是在一定范围内随机确定的。3只要符合上述两条中的任意一条,就算是随机模型。比方温度的影响试验,哪怕设置温度由设备严格控制 ,如根据研究目的,这些温度条件下仅仅作为一定温度变化范围内的一组代表,那么也是随机模型。17、冋归
45、分析中如果冋归关系显著是否就意味着可以利用冋归方程进行有效预测?为什么?不一定1在解读分析结果时,对客观因果关系和仅仅是预测需要的回归分析这两种情况要有区别。从统计学角度讲,相关关系显著,回归关系也就显著。反之亦然。但从生物学的专业角度讲,相关关系显著,不一定因果关系成立,有可能仅仅是伴随关系。如果对仅仅是伴随关系的两个变量进行回归分析,也只能是因为专业上有必要进行预测而为之。有些看似平行关系的变量,有可能存在不为人知的因果联系 ,相关分析可为揭示这种关系奠定根底,但不能人为确定哪个是因哪个是果。2回归方程显著不一定有现实的预测意义在统计学上显著的回归方程,并不一定都具有实践上的预测意义。由于
46、决定系数r2是总变异中可以相互以线性关系表示的局部所占比例,反映了回归直线拟合度的上下 ,所以可据此评价预测结果的可信度。比方X和Y两个变量相关系数r =,在df = 24时,ro.oi24=,r> ro.oi24,达极显著相关。然而由于r2 =,说明随着X的变化,Y变量按直线回归关系发生相应改变的局部只占总变异的25%。也就是说在利用回归方程进行预测时,通过X能够估计的 Y变量的变异量只占实际变异量的 25%,其余75%的变异无法借助直线回归来估计。预测结果的可信度显 然很低,不具有实际的预测效果。18、假设检验中哪些情况下不应该用而要用?为什么?19、假设检验中两尾检验、左尾检验、右
47、尾检验为什么不能误用?对于同一显著水平a,双尾检验Ho的否认区分别在分布的两尾,即每侧否认区概率值只有a/2;而单尾检验中 Ho的否认区只在分布的左尾或右尾,其相应的概率值为a。两尾检验:检验 与口 o间是否存在真实差异,在概率密度函数曲线上有两个否认区。无效假设Ho: 口 t=y o;备选假设Ha: 口产口 o。试验前不能确知哪一种假设一定不会发生时,需做两尾检验。左尾检验:右尾检验:对于同一显著水平a, 双尾检验的分位数|卩a/2|大于单尾检验的|卩a| ,此时可能会存在某些|卩|值,|卩a |<|卩|<|卩a创, 即假设用单尾检验可能会否认Ho,接受Ha;假设用双尾检验那么会
48、接受 Ho而否认Ha,从而掩盖了差异的显著性。所以单尾检验比双尾检验更容易对 Ho进行否认,也就是说,单尾检验比双尾检验的区分力强,灵敏度高。不可以误用。不能因为已经抽到的样本平均数比对照的大或小,就用单尾检验,误用相当于将显著水平降低1倍。2。、相关系数与回归系数的计算式各为什么?其意义有何不同?相关系数计算式:rS% _,回归系数计算式:r2SPXyJsSXSSTSSX SSr回归系数与相关系数取值不同。回归系数r2表示回归直线拟合度上下,就是相关系数 r的平方。.从数学角度:r是两个相反方向回归系数bxfy和bxfy的几何平均数,决定系数r2也就是bxy和bxy的乘积,所以决定系数r2介
49、于0和1之间0 r2 1,不能反响直线关系的性质。.从变量关系的角度:决定系数r2就是在总变异中,可以相互以线性关系表示的局部所占的比例。用于表示回归直线的拟合度上下,或者说用来评价回归效果的好坏。r2越大,由X预测Y的准确性就越高。.决定系数为回归平方和与总变异平方和的比值21、什么叫回归模型,其最大特点是什么?回归模型是在进行数据的回归分析,即通过计算变量之间的相关系数进而估计他们之间的联系公式,从而建立起的数 学模型。回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型。当函数形 式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时
50、,称为非线性回归分 析模型。当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。特点?22、什么叫抽样分布;在各种假设检验可以遇到哪些抽样分布?总体参数口和3 2都是常量,而样本统计量是随机变量 。每个特定都有一个出现概率,与口间的差异叫抽样误差。 所有可能的对应的概率构成概率分布,样本统计量的概率分布叫抽样分布。可能遇到的的分布:正态分布、t分布、U分布、二项分布。23、哪些情况下的假设检验宜选用?请各举一例加以说明。24、 什么叫方差分析的固定模型,其最大特点是什么?同25、假设检验的根本步骤是哪些?根本步骤为:1提出假设。对样本所属总体提出无效假设H。和备选假设Ha。2
51、确定显著水平。确定显著水平a为 0.05还是0.01 L3计算概率。在 H。正确的前提下,计算抽样分布的统计数或相应的概率值。4推断是否接受假设。根据小概率原理,进行差异是否显著的推断,并作出结论。26、假设检验中哪些情况下宜选用?请各举一例加以说明。27、假设检验有两尾检验、左尾检验、右尾检验三种类型,检验类型应该怎么确定?28、相关系数与回归系数之间有哪些联系?1 r与b的符号一致r为正时,b也为正,t两变量是正相关,是同向变化。r为负时,b也为负,t两变量是负相关,是反向变化。2r与b的显著性检验结果一致可用r的显著检验代替 b的显著性检验。3相关系数是两个相反方向回归系数的几何平均数,如果X与丫互为因果,可得两个b值,4决定系数r2表示回归直线拟合度上下29、 在假设检验中不仅要求给出显著或极显著的结论,通常还要求给出P值,为什么?P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值,一般以 P < 0.05为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肇庆市端州区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 孝感市云梦县2025-2026学年第二学期五年级语文第四单元测试卷(部编版含答案)
- 红十字会小组工作制度
- 纪律整顿长效工作制度
- 经济日报四天工作制度
- 维护维修管理工作制度
- 2025 初中写作运用日记片段串联生活点滴课件
- 数据库优化实践与性能调优
- 宜都市辅警考试题库2025
- 2026年小额信贷业务培训试题及答案解析
- 浙江弘利新材料有限公司年产2万吨造纸化学品中性施胶剂技改项目环境影响报告
- 新能源汽车电池介绍课件
- 车库拆除工程施工方案
- EXCEL培训-EXCEL函数教程
- 呼吸系统解剖生理学课件
- 烧结烟气循环
- 华兴数控7系列说明书(车)
- YY/T 0995-2015人类辅助生殖技术用医疗器械术语和定义
- YB/T 5146-2000高纯石墨制品灰分的测定
- SB/T 10728-2012易腐食品冷藏链技术要求果蔬类
- GB/T 37234-2018文件鉴定通用规范
评论
0/150
提交评论