(最新整理)生物统计学复习的题目_第1页
(最新整理)生物统计学复习的题目_第2页
(最新整理)生物统计学复习的题目_第3页
(最新整理)生物统计学复习的题目_第4页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(完整)生物统计学复习的题目(完整)生物统计学复习的题目 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)生物统计学复习的题目)的内容能够给您的工作和学习带来便利。同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快 业绩进步,以下为(完整)生物统计学复习的题目的全部内容。精彩文档生物统计学复习题一、名词解释交互作用:表示当两种或几种因素水平同时作用时的效果较单一水平因素作

2、用的效果加强或者减弱的作用。当因素间的互作效应为零时,称该因素间无交互作用,此时的因素是相互独立的因素.回归系数:回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。整群抽样:就是将总体划分为若干个小群体,再随机抽取部分小群体组成样本.f检验:即统计假设的显著性检验,用于推断处理间的差异是否存在。在计算f值时,以被检验因素的均方(即处理间均方st2)作分子,以误差均方(即处理内均方se2)作分母。(没找到)无效假设:不管样本是否真的属于总体a,都首先假设是,即假定“x与间的差异源自误差,并非本质差异,这就是无效假设,记h0。相关变量:统计学把存在

3、关联但并非确定的数量关系称为相关关系, 把存在相关关系的变量称为相关变量。决定系数:是变量x引起y变异的回归平方和占y变异总平方和的比率,为相关系数r的平方。取值范围:01。独立变量:一个量改变不会引起除因变量以外的其他量的改变,则称这个量为独立变量。相关系数:就是两变量离均差乘积和平均数的标准化值。分层抽样:又叫分类抽样.先按某种特征将总体分为若干个层次 (strata),在每一层内随机抽取亚层,直到最后一层对观察单位随机抽样。(比如资源调查中按片区地区局部区域等分成若干个地域层次。)单位组:(相当于一个区组) 在盆栽和动物试验中,为随机分配到各个处理而挑选出来的尽可能一致的一组试验单位。不

4、同单位组可分别安排在有条件差异的场所。 随机样本:在抽样过程中, 通过一定的方法和条件控制, 尽可能确保总体中的每一个体都有同等的机会被抽到, 这样的抽样方法叫随机抽样 (random sampling).通过随机抽样所得到的样本叫随机样本, 通常简称样本。概率抽样:又叫随机抽样,就是调查研究对象的总体中每个部分都有被抽中的相同几率,是一种完全依照机会均等的原则进行的等概率抽样。随机抽样又有四种不同的方法。局部控制:将存在明显差异的整个试验环境分成若干个小区域,使小区域内的差异尽可能小,然后将处理内的试验单位随机分组并随机安排到各个区域中,从而实现不同处理在小区域内相互比较,这就是局部控制。参

5、数估计:是统计推断除假设检验的另一个方面,是指由样本结果对总体参数在一定概率水平下所作出的估计.包括区间估计和点估计.统计量:由样本观测值计算得到的描述样本特征的数值称为统计量或统计数。系统误差:是由试验因素以外的某些确定性原因引起的误差, 也称偏差 (bias)或片面误差(lopsided error)中心极限定理:如果原总体呈偏态态分布, 则随着样本容量n的增大,样本均数或率的抽样分布就逐步趋近于正态分布, 这就是中心极限定理。 点估计:就是直接用 标定可能出现的位置,并指出在一定概率(1)保证下以这个位置点为中心的可能出现范围。因素水平:是指实验中每个因素的不同设置或组别,简称水平.总体

6、:是指包含了具有某种共同属性的所有个体的集合, 这里的 “共同属性 依研究目的、研究对象不同而变。参数:由总体各观测值所计算得到的用来描述总体特征的数值称为参数(parameter)完全事件系:若事件a1、a2、an两两互斥, 且每次试验必有一件发生, 则“事件a1、a2、an任中发生一件就是必然事件, 这样的一系列事件就是一个完全事件系。小概率事件:从概率密度函数曲线两端开始向中间累加概率值,到累积概率值一特定值时为止就划定出变量的两个区域,变量值出现在这两个区域内就是小概率事件。试验因素:是指对性状表现可能有影响的试验研究项目或内容, 简称因素。样本:从总体抽出的对总体具有代表性的一小部分

7、个体组成的小群体就叫样本(sample)。随机误差:由于试验过程中各种偶然因素的影响而造成的误差。一个观察值上的随机误差大小, 事先完全没有确定性, 找不出引起误差的确切原因, 所以也叫偶然性误差概率分布:概率随变量实际取值xi不同而变的变化规律与特征就是概率分布, 可用图表或函数式描述。键入文档的引述或关注点的摘要.您可将文本框放置在文档中的任何位置.可使用“文本框工具”选项卡更改重要引述文本框的格式.区间估计:利用样本平均数 和标准差s,对总体均数 在一定概率(1)保证下的出现范围作出界定。试验处理:就是不同因素各个水平间的特定组合方式,简称处理.在单因素试验中, 一个水平就是一个处理;

8、在两因素试验中, 处理个数=因素1水平数因素2水平数。观察单位:是根据研究目的而确定的观测总体,指在试验中能接受不同实验处理的独立的试验载体。(没找到)互作效应:两个或两个以上处理因素间相互作用所产生的效应,称为互作效应.二。判断题 (如是错的,则需用最少的改动使其表达出正确意思)1. 1995年南京市雨花区蔬菜生产基地测量全部粉团萝卜肉质根重,所得的总体,称为无限总体。 ( )。2. n (0, 1) 表示的是参数值 = 0、2 = 1的特定分布. ( )4. 当u = 1。96时,统计假设测验的右尾概率为0.01. ( )5。 一个试验的数学模型是方差分析的理论依据,但该模型在试验开始时就

9、已确定.( )6。 单向分组资料作方差分析,处理效应不论是固定还是随机,其平方和与自由度的分解以及f值的计算和f检验均无区别。 ( )7. 一元线性回归有重复观察值资料,y方面总变异平方和分三部分,即回归平方和、离回归平方和和误差平方和。 ( )8. 用a=0。05作两尾检验时,查一尾表需要在表上找a=0。10对应的值。( )9. 对于一个具体的试验结果,用两尾检验比用一尾检验更容易达到显著水平。( )说反了10。 古典概型是说,随着n的增大, 随机事件a的频率越来越稳定地趋近于一定值p,这个 p 值就是a的概率。( )11。 t分布是一种不对称的分布,其曲线变化只受df影响。( )12. 试

10、验单位的数目就是试验中所设的处理数.( )13. 单因素的随机区组试验无重复观察值资料在方差分析中除总变异外还有2个变异来源。( )14。 独立性检验按已知的有关生物学理论来计算各类别的理论次数。( )15. 只要n足够大, 犯型错误概率就可小到微不足道甚至没有。( )16。 正态分布曲线与横轴之间的总面积小于1。( )=1三. 单项选择题1. 如测验k个样本方差si2 (i=1,2,3) 是否来源于方差相等的总体, 这种测验在统计上称为( a )。 a。 方差的同质性测验 b. 学生氏t测验 c。 f测验 d. u测验2用标记字母法表示的多重比较结果中,如果两个平均数的后面,既标有相同大写拉

11、丁字母,又标有不同大写拉丁字母,则它们之间差异( c )。 a. 极显著 b. 不显著 c. 显著 d. 未达极显著 3。 一尾测验指( b ).a. 具有一个接受区的假设测验 b。 具有一个否定区的假设测验c. 左边一尾为否定区的假设测验 d。 右边一尾为否定区的假设测验4。 在测验h0: md =0, ha: md0时, 在0。05水平上接受了h0, 则md的95%的置信区间的两个置信限为( d )。a. 正号 b。负号 c。 下限为正号, 上限为负号 d。 下限为负号, 上限为正号5. 随机抽样的目的是( a )a、消除系统误差 b、消除测量误差c、减少随机误差 d、减少样本的偏性6.

12、对于同一组资料,哪个指标没有考虑到每个观察值的变异( d )a、方差 b、总体标准差 c、变异系数 d、四分位数间数7. 对两个变量进行直线相关分析,r=0.39,p0。05,说明两个变量之间( a )a、有相关关系 b、有数量关系 c、有伴随关系 d、无相关关系8. 观察某地90年至2000年意外伤害发生率和摩托车数量的关系,宜选择的图形为( a )a、直方图 b、直条图 c、散点图 d、线图9. 在假设检验时,本应作单侧检验的问题误用了双侧检验,可导致。( c )a. 统计结论更准确 b. 增加了第一类错误c. 增加了第二类错误 d. 减小了可信度10. 样本容量的确定,下面哪种观点是错误

13、的。( a )a. 样本越大越好b. 在资源和投入许可的条件下尽量增大样本含量c。 保证一定检验效能条件下尽量减少样本含量d. 越易于组织实施的样本容量越好11。 卡平方的连续性矫正的公式为 ( d )。a。 cc2 =(oiei)2/ei b。 cc2 =(oiei0.5)2 ei c。 cc2 =(oiei0.5)2 /oi d。 cc2 =(oiei0.5)2 /ei12. 下列哪种成对比较的无效假设的设立是正确的 ( d? )。a. h0: d15 b. h0: m d 12 c。 h0: m1m2 10 d。 h0: d013在成对数据资料用t测验比较时,若对数n=13,则查t表的自

14、由度为( a )。a。 12 b. 25 c。 24 d. 1114。 对两小麦品种的籽粒蛋白质含量差异性作比较,各品种皆随机取10个样点测定蛋白质含量,对试验检测结果的比较分析应采用( a ).a。 成对资料t检验 b. 成对资料u检验 c. 成组资料t检验 d. 成组资料u检验15。 关于相关系数,下列说法中错误的是 ( d ).a. 相关系数是反映两变量间相关密切程度和相关方向的统计量b. 相关系数没有单位或不带单位c. 相关系数的绝对值小于或等于1d. 同一资料的相关系数和回归系数的正负符号相同,大小呈一定比例关系16。 实验设计的三个基本原则是( c )。e. 处理因素、受试对象、实

15、验效应b. 精确度、准确度、灵敏度c。 随机化分组、均衡对照、足够的受试对象d。 统计假设、统计描述、参数估计17. 分别用两种方法测定12株西红柿的果实中可溶性糖含量,以便比较两种方法的测定结果有无差异,该研究可采用的最佳试验设计和分析方法是( b )。a. 完全随机设计z检验b。 完全随机设计t检验c. 配对设计z检验d。 配对设计t检验18对男女两个样本小学生的不良饮食习惯发生率作假设检验,这项工作属于( d )。a。 总体研究b. 统计描述c. 实验设计d。 统计推断 19关于总体置信区间,下列论述中错误的表述是( d )。a。 总体均数的区间估计是一种常用的参数估计方法b. 总体均数

16、置信区间所求的是在一定概率保证下的总体均数出现范围c. 求出总体均数置信区间后,即可推断总体均数就在这个范围内d. 总体均数置信区间的估计考虑了抽样误差的影响20. 关于完全随机设计的单因素方差分析,下列选项中( b )是不可能的.a. ms总 = ms组间 ms组内b. ss总 = ss组间 ss组内c。 ss组间 ss组内d。 ms组间 ms组内21. 人口调查中, 以人口性别所组成的总体是( )总体.a. 正态 b. 对数正态 c. 二项 d。 指数分布22. 下列哪个概率不可能是显著水平的取值 ( a ).a。 95% b。 5% c。 10% d。 2.5 23。 总体参数在区间l1

17、,l2内的概率为1,其中l1和l2在统计上称为( a )。a. 置信区间 b. 区间估计划 c。 置信距 d.置信限24、一组变量的标准差将( b )a、随变量值的个数n的增大而增大 b、随变量值之间的变异增大而增大c、随变量值的个数n的增加而减少 d、随系统误差的减小而减小25、方差分析的两个基本假定是( d )。a、方差同质和各个mi都相等且等于b、各个mi都相等且等于m 和处理间方差等于误差方差c、处理间方差等于误差方差和ss、df都是线性可加的d、ss、df都是线性可加的和方差同质26、二因素随机区组试验总变异的平方和可以细分成( c )项.a、3 b、4 c、5 d、627、用标记字

18、母法表示的多重比较结果,如果两个平均数的后面既标有相同大写拉丁字母,又标有不同大写拉丁字母,则这两个平均数之间的差异( c )。 a。 极显著 b. 不显著 c。 显著 d。 介于显著与极显著之间28、试验中进行局部控制的目的是( d )。a. 无法进行全面控制 b. 不需要全面控制c. 减少整个试验的随机误差 d. 减少各处理内部的试验误差29、c2分布中c2值的变化范围是0+,在适合性检验和独立性检验中,c2值( ).a。 等于0时适合性最好或完全独立 b。 等于1时适合性最好或完全独立c. 等于0时否定h0 d. 等于1时适合性最好或完全不独立30。下列关于f检验的说法中,( )是错误的

19、。a。 方差分析中的f检验是右尾检验 b。 方差分析中的f检验是左尾检验c。 f检验有时也需要作两尾检验 d。使用f检验最多的就是方差分析1、随机抽样的目的是( a )a、消除系统误差 b、消除测量误差 c、减少随机误差 d、减少样本的偏性2、变异系数的数值( b )a、一定大于1 b、一定小于1 c、可大于1,也可小于1 d、一定比标准差小3、描述一组数值变量资料的分布特征时( c )a、应同时选用算术平均数和标准差 b、应同时选用中位数和四分位数间距c、根据分布类型选用相应的集中、离散趋势指标d、以上都不正确4、对两个变量进行直线相关分析,r=0。39,p0.05,说明两个变量之间( a

20、)a、有相关关系 b、有数量关系 c、有伴随关系 d、无相关关系5、t分布比标准正态分布( d )a、中心位置左移,但分布曲线相同 b、中心位置右移,但分布曲线相同c、中心位置不变,但分布曲线峰高 c、中心位置不变,但分布曲线峰低,两侧较伸展6、随机事件一般是指( d )、发生概率为0的事件 b、发生概率为1的事件c、发生的概率很小(如p0.05)d、在一次试验中可能发生也可能不发生的事件,其发生的概率 0 p 17、比较同一组儿童身高和体重两项指标的变异程度的大小,可选用的变异指标为( c )a、全距 b、标准差 c、变异系数 d、四分位数间距8、关于标准差,哪项说法是错误的( d )a、反

21、映全部观察值的离散程度 b、度量了一组数据偏离均数的大小c、反映了均数代表性的好坏 d、不会小于算术平均数9、下列哪一项描述不是正态分布的特征(b)a、曲线位于横轴上方均数处最高、以零为中心,左右对称、均数为其位置参数、标准差为其变异度参数10、已知甲药的疗效不会低于乙药,检验的目的是为了得出甲药的疗效是否明显地优于乙药,此时应选用:( )a、t检验 b、单侧检验 c、卡方检验 d、双侧检验1、在研究两种药物治疗高血压的效果的配对t检验中,要求( )。a、两组的样本方差相等 b、数据呈双变量正态分布c、差数d服从正态分布 d、差数d的方差等于0系统误差2、两个小样本中的每个观察值都减去同一常数

22、后再进行样本平均数间的差异显著性检验,则计算的t值( a ).a、变小 b、变大 c、不变 d、变小或变大观察单位3、算术均数与中位数相比,( c )。a、抽样误差更大 b、不易受极端值的影响 c、更充分利用数据信息 d、更适用于分布不明及偏态分布资料4、已知甲药的疗效不会低于乙药,检验的目的是为了得出甲药的疗效是否明显地优于乙药,此时应选用:( )a、t检验 b、单侧检验 c、卡方检验 d、双侧检验点估计5、为了使显著性检验的两类错误同时减少,可采取措施:( b )a、提高显著性水平 b、增加样本含量c、降低实验误差 d、增加人员和设备1、在两样本均数差别的统计检验中,事先估计并确定合适的样

23、本含量的一个重要作用是( c )。a、控制第一类错误概率的大小 b、可以消除第一类错误c、控制第二类错误概率的大小 d、可以消除第二类错误2、在两变量x1和x2的配对t检验中,差数的( a )a、总体均数就是总体均数之差 b、方差就是两样本均数之差的方差c、总体均数的可信区间一定包含0 d、均数的方差是03、在同一总体随机抽样,其他条件不变,样本含量越大,则( b? )a、样本标准差越大 b、样本标准差越小c、总体均数的95可信区间越窄 d、总体均数的95可信区间越宽4、实际工作中,两均数作差别的统计检验,要求( c )a、数据近似正态分布 b、两样本均数相差不太大c、两样本方差同质 d、两组

24、数据标准误相近5、标准正态分布是指( d )a、n(,) b、n(0,0) c、n(1,1) d、n(0,1)6、在某个连续分布总体中随机抽样,( b ),理论上样本均数的分布就趋向正态分布.、变量x服从正态分布,随样本大小n增大b、变量x不服从正态分布,随样本大小n增大c、变量n不变,随样本个数k增多d、变量x不服从正态分布,随样本个数k增多7、为了通过测定碘含量来预测地方性甲状腺肿的患病率,应选用:( b? )a、相关分析 b、回归分析 c、多元回归分析 d、方差分析8、对于t分布来说,固定显著性水平的值,随着自由度的增大,t的临界值将会怎样变化?( b )a、增大 b、减小 c、不变 d

25、、可能变大,也可能变小9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度应该是:( d )a、n1n2 b、n1n21 c、n1n2 1 d、n1n2 210、对于一组呈正态分布的计量资料,若对每一个个体同减去一个不为零的数,则(b)a、均数、标准差均不变 、均数变、标准差不变、均数、标准差均变 、均数不变、标准差变6、关于四分位数间距,下列哪一项是错误的(c)、适用条件同中位数 、反映数值变量资料的离散趋势、考虑了每个变量值的变异情况、较极差稳定7、关于变异系数,哪项说法是错误的。( c )a、反映全部观察值的离散程度 b、是评价一组数据偏离均数的相对指

26、标c、常与平均数一起使用 d、可用于比较各种数量性状的变异程度8、参数是指( b )a、参与个体数 b、总体的统计指标 c、样本的统计指标式 c、样本的总和9、配对设计的试验中,同一组内的( a )a、个体间差异需尽可能小 b、个体接受相同的处理c、个体间差别越大越好d、除处理因素外,其它已知或可能影响观察指标的因素和条件都相同或相近10、常用的三种多重比较方法中,( b )a、q检验法更易犯取伪错误 b、lsd法更易犯取伪错误c、新复极差法的尺度最大 d、lsd法的尺度最大填空题1、在同一连续分布总体中作随机抽样时,抽样分布标准误的大小受(样本容量)的影响。2、用a=0.05作假设检验时,如

27、果在两尾t界值表上找a=0.1所对应的值,说明进行的是( 两尾 )检验。3、在假设检验中如果本应作两尾检验的作了一尾检验,犯ii型错误的机会( 增大 )。4、c2分布中的c2值最小极限值是 ( 1 ).5、概率有(统计概率和古典概率 )两种定义。6、中心极限定理的最大意义在于( 标准正态分布适用于各种总体的平均数抽样分布的分析 )。7、比较试验中设置重复的作用在于(估计误差)。8、两因素随机区组试验无重复观察值资料的方差分析中包括总变异在内有(5)个变异来源。9、随机事件的概率相乘原理在统计假设检验中有无直接应用?( 有 )。10、事件a1、a2、an构成的完全事件系中,( 必然事件 )发生的

28、概率等于1.11、与相比算术均数,中位数更适用于(极个别表现值特别大)。12、服从标准正态分布的变量,随机抽取到一个介于(2。58)与(+2.58)之间的变量值的几率为99%。13、二项分布如果(p远离0.5,n又太小)分布就只能在二项分布上直接进行假设检验。14、统计假设检验中的(弃真)错误不可避免,但在(做出无效假设特别慎重)的情况下犯这种错误是无关紧要的.15、与成组比较相比,配对设计(对于对之间的差异)处理有无作用,因为配对试验中的个体间固有差异(没有计算入处理间的误差项里面)。16、在两变量x1和x2的配对t检验中,差数的平均数等于( ).17、回归和相关分析中的t检验是双侧的还是单

29、侧的?( 单侧 )1、在同一连续分布总体中作随机抽样,n越大,则(抽样误差)越小。2、用a=0。01作两尾检验时,查一尾表需要在表上找a=( 0。05 )对应的值。3、对于一个具体的试验结果,用两尾检验比用一尾检验更( 容易 )达到显著水平。4、正态分布曲线与横轴之间的总面积等于( 1 )。5、随着n的增大, 随机事件a的频率越来越稳定地趋近于一定值p, 这个 p值就是a的概率。这样的概率类型叫(统计概率)6、t分布与u分布的相同之处一是(对称分布),二是(曲线与横轴所围成的面积等于1 )。7、在(单因素)试验中,处理数等于水平数。8、单因素随机区组试验无重复观察值资料的方差分析中除总变异外还

30、有( 2 )个变异来源。9、在(x2)检验中按已知的生物学理论或变量总体的各类别比率计算理论次数。1、样本容量n(越大)则在同一连续分布总体中作随机抽样的抽样分布标准误越小。2、用a=0.05作一尾检验时,查两尾表需要在表上找a=( 0。01 )对应的值。3、在假设检验中,用一尾检验比用两尾检验更(难)达到显著水平.4、f分布和c2分布的共同特点是(分布区间都为 0,+ ) )。5、在有限个(n个)可能出现的表现形式中,具有某种共同属性的表现形式有m个,则在随机抽查时具该种属性的个体出现概率属于( )6、根据( ),样本平均数的差异显著性性检验在( )时不必要求变量一定要呈正态分布。7、在有m

31、个因素且每个因素有k个水平的试验中,处理数等于(km)。8、两因素随机区组试验有重复观察值资料的方差分析中除总变异外还有( 5 )个变异来源。9、在(独立性)检验中需要按随机事件的概率相乘原理来计算各类别的理论次数.10、若每次试验中两两互斥的事件a1、a2、an( ), 且“事件a1、a2、an( )”构成一个必然事件, 这样的一系列事件就是一个完全事件系。11、概率随变量实际取值xi不同而变的(概率变化规律或特征)就叫概率分布.用于描述变量各个xi与相应p(xi)之间(对应关系的函数式)叫概率密度函数。12、服从正态分布的变量,随机抽取到一个介于(2。586)与(+2。586)之间的变量值

32、的几率为99。13、二项分布在p=q=0。5时呈(正态)分布;如p或q不等于0。5,只要偏离0.5不多且n足够大,则从二项总体中随机抽样的平均数抽样分布也趋近于(正态分布)了。14、在统计假设检验的两类错误中,i型错误的特点是(犯i型错误的概率等于选择的显著水平)。为避免犯ii型错误,可采取( 3 )个对策。10、若事件a1、a2、an两两互斥, 且每次试验必有一件发生, 则“事件a1、a2、an任中发生一件”就是一个(必然)事件, 这样的一系列事件就是一个(完全事件系)。11、概率随变量实际取值xi不同而变的变化规律与特征就是(概率分布).用于描述变量各个xi与相应p(xi)之间对应关系的函

33、数式叫(概率密度函数)。12、服从正态分布的变量,随机抽取到一个介于(1.96 )与(+ 1。96)之间的变量值的几率为95%.13、二项分布在(p)和(q取值接近)时趋近于正态分布.在n足够大时t分布就趋近于(正态分布)了.14、在统计假设检验的两类错误中,通过(p8。7)可以减少犯取伪错误的机会甚至避免犯这类错误。四简答题1、独立性检验和适合度检验有何异同?独立性检验与适合性检验是两种不同的检验方法,除了研究目的不同外,还有以下区别:1)数据资料的结构不同独立性检验的资料是按两个因素的属性或类别归组.依两因素的属性类别数不同而构成 22、2c、rc 列联表;而适合性检验只按一个因素如性别、

34、表现型等的属性或类别对次数资料进行归组。2)理论值计算的依据不同适合性检验按已知的生物学理论或变量总体的各类别比率计算理论次数。独立性检验的理论次数是在假设两因素相互独立的条件下按概率的乘法定理进行计算。3)独立性检验与适合性检验的自由度不同在适合性检验中, 自由度只有一个约束条件: 各理论次数之和等于各实际次数之和, df = k1。 独立性检验有三个约束条件: . 所有 rc 个 oij 之和必须等于rc 个 eij 之和, 所以整个试验有总自由度: rc1;。 c 个ci 之和必须等于 c 个ei 之和, 所以有 df = c 1.但 r 因素与 c 因素独立与否, 与 c 因素内部的

35、df 无关. r 个rj 之和必须等于 r 个 ej 之和, 所以有 df = r 1 。但 r 因素与 c 因素是否独立, 与 r 因素内部的 df 无关。所以, 独立性检验的自由度为:df = rc 1 (r 1) (c 1) = (r 1)(c 1) 即等于: (行的属性或类别数1)(列的属性或类别数1)2、随机区组(单位组)设计有何好处与不足?优点:. 设计简单,容易掌握;. 灵活性大, 适用于单因素、多因素及综合性试验;。 符合试验设计的三原则.在完全随机设计的基础上增加了局部控制的内容,将试验环境一致性的控制范围从整个试验地缩小到了单个区组,能有效减少单方向土壤肥力差异的影响,区组

36、间的差异在统计分析时单独成为一个变异来源,降低试验误差,提高试验的精确度;。 对试验地的形状和大小要求不严,必要时不同区组可以分散设置在不同的田块或地段上;. 易于分析,当因某种偶然事故而损失某一处理或区组时,可以除去该处理或区组进行分析.不足:. 处理数不能太多, 否则区组面积必然增大, 内部的环境变异增大, 局部控制的功能失效, 试验误差增大。田间试验中, 处理数一般不超过 20 个, 最好 10 个左右。. 有多方向或斑块状土壤差异时,须用拉丁方设计。3、假设检验根据什么原则确定选用a=0.05而不用a=0。01?举例说明。通常以=0。05为显著水平,=0.01为极显著水平.都常用,但必

37、须根据研究目的、遵循一定原则来选用.对于差异容忍度小、要作出“没有本质差异”的推断是需特别慎重、性状或研究的事物属性不易受偶然因素影响,用=0。05。证明没有核辐射污染等特殊情况可用=0。10。如对差异容忍度大、要作出“存在本质差异”的统计推断时需要特别慎重、或者性状受偶然因素影响大,选用=0。01.如证明新产品、新品种或新方法比对照优越等。4、相关分析方法和回归分析方法最重要的区别有哪两个?请作简要介绍。(不懂题目问的啥子). 直线相关: 研究偕同变化的变量间平行相关关系。 具有直接的内在必然联系平行关系互为因果关系: 禾谷类植物的穗长与小穗数, 幼苗根重与地上部重量的关系系等 。 间接的内

38、在必然联系共同受其他因素影响: 如臂长与腿长的关系, 叶片的长度与宽度, 嫩豆荚的成熟度 与 vc 含量, 胚芽鞘长度与抗旱性等。 直线回归: 研究自变量对依变量的单向作用和影响。自变量与依变量间的单方向因果关系有 3 种类型:基础变量与后续变量先因后果, 直接作用。成因变量与表象变量无先后次序, 直接作用。表征变量与标的变量间接作用。5、什么叫试验设计?试验设计遵循的原则有那些?试验设计 (experimental design) 是根据试验目的、试验条件和试验设计原则对试验的因素与水平、试验单元及指标进行合理安排的科学方法。遵循的原则:重复、随机化、局部控制设置重复的一个重要作用:便于估计

39、误差, 更正确地估计处理效应 。在试验中, 一个生物个体可以构成一个试验单位, 有时一组个体也可构成一个试验单位 .如果一个处理只实施在一个试验单位上, 那么只能得到一个观测值。不同处理的作用与偶然因素引起的随机误差就混在一起, 因而无法估计试验误差的大小。如果一个处理实施在两个或两个以上的试验单位上, 就可利用同一处理内观测值间的差异来估计试验误差。设置重复的另一个重要作用就是降低误差, 提高试验的精确度;随机化就是使每一个试验单位都有均等的机会进入各个处理,而且每一个处理都有均等的机会被安排到实施区域的各个空间位置。在有多个重复的前提下,随机化具有两个重要作用:避免试验单位间可能存在的差异

40、混入处理效应;避免试验实施场所不同区域间的差异混入试验误差.将存在明显差异的整个试验环境分成若干个小区域,使小区域内的差异尽可能小,然后将处理内的试验单位随机分组并随机安排到各个区域中,从而实现不同处理在小区域内相互比较,这就是局部控制。方差分析时,小区域之间的差异单独成为一项变异来源,从而使试验误差得到有效控制。6 何谓中位数?定义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值,用m 表示。中位数有三个特点:不受分布于两端的观察值大小影响,两端出现特大或特小的异常值时,只要 n 不变,m 不变.中位数也可叫第50百分位数,比算术平均数稳定,因其大小只决定于居中位置的观

41、察值.理论上对称分布的资料的中位数等于算术平均数,正偏态分布资料的m算术平均数,负偏态分布资料的m算术平均数。应用:偏态资料.如全社会家庭收入资料通常呈负偏态分布,中位数比算术平均数更具代表性。 7、什么叫型错误?如何避免?在假设检验中,如果h0不是真实的,检验后却接受了它,就犯了第二类错误,即型错误、错误或纳伪错误。减少甚至避免犯型错误的途径:(1)适度增大样本容量n。抽样分布曲线随着n增大越加陡峭,交叉区域就越小。n足够大时犯型错误的概率就非常小甚至没有。(2)正确选用显著水平。按显著水平确定原则选用较大(如0.05)时,不仅统计推断结论具有更高可靠性和公信力,而且接受区不易重叠或重叠区域

42、较小,犯型错误的几率较低。(3)严格控制偶然因素影响。通过严格控制试验条件课减小?2和x进而减小b。如果差异显著但未达极显著水平,最好重做试验.8、什么情况下使用右尾检验?举例说明之。 右尾检验是要推断 是否确实大于0,只有右端一个否定区。即h0:t0;ha:t0.试验组有可能与对照组没区别,也可能确有增加,但在试验前就可确知不会比对照还小或少时。比如检验一次事故是否污染了环境;不知优化或改进的效果是否显著,但不可能变得更糟的试验资料分析。检测有害成分含量或有害残留物是否超过国家标准和国际标准时,含量越少越好,但不允许高于标准,权威机构或公众只关注是否含量过高或超标了。9、什么叫固定模型?固定

43、模型是指因素下设定的各个水平包含了需要研究的所有水平, k 个水平各有一个i值, 构成有限总体, 受i= 0约束。有: 固定模型必须同时满足下述两条:(1)因素下设置的各水平都可确切控制。如品种比较试验, 肥料、饲料、药效、操作方法的效果试验等.(2)因素下水平的设置不带有随意性。如研究目的关注的所有水平都纳入试验。结果并不用于推断其他。 比如温度的影响试验, 如果确定的几个温度是室内严格控制的, 而且仅限于研究这些温度条件下的作用效果而已, 并不作为一定温度变化范围内的代表, 则也是固定模型。10、何时选用较小的显著水平(=0。01),为什么?同p7.3 11、相对于成对资料,成组资料的比较

44、需要注意哪些问题?12、为什么正态分布具有广泛适用性?连续型变量在其取值范围内的概率密度分布呈两端低中间高的对称分布,且由 和决定曲线特征的概率密度分布类型。遵从正态分布的连续型变量, 所有可能的取值xi构成一个正态总体。根据正态分布的概率密度函数,任何一个可能的变量值所对应的出现概率都可以求出来。任何连续型变量资料,只要服从正态分布,都可标准化为u变量,即u值概率分布表的用途极为广泛.13、何时选用较大的显著水平(=0。05),为什么?同p7.314、相对于成组资料,成对资料的比较的最大优点是什么?15、什么情况下使用左尾检验?举例说明之.左尾检验:检验 是否显著小于0,只有左边一个否定区。

45、即h0:t0;ha:t0。试验处理有可能没效果,也可能确有降低,但试验前就能确知不会比对照组还大或多。比如试验各种无公害生物制剂防治害虫,调查植株上的虫口量;试验减肥药的减肥效果等。有效成分含量或使用寿命等质量分析,指标越高越好但不允许低于标准,社会只关注是否低于标准。16、什么叫方差分析的随机模型,其最大特点是什么? 随机模型:试验因素理论上可有无限多个水平,其i服从 n(0, t)。试验中设置的 k 个水平不是固定的, 只是无限多个水平的一组代表, 存在抽样误差。所以有: 随机模型的特点有:(1)设置的各个水平难以确切控制。如比较大棚与露天条件对嫁接效果的影响, 温光湿度都无法确切控制。如

46、再次做相同试验, 两个水平的实际状况肯定都有所改变。(2)因素下水平的设置,是在一定范围内随机确定的。(3)只要符合上述两条中的任意一条,就算是随机模型。比如温度的影响试验, 哪怕设置温度由设备严格控制, 如根据研究目的, 这些温度条件下仅仅作为一定温度变化范围内的一组代表, 则也是随机模型。17、回归分析中如果回归关系显著是否就意味着可以利用回归方程进行有效预测?为什么? 不一定 (1)在解读分析结果时, 对客观因果关系和仅仅是预测需要的回归分析这两种情况要有区别.从统计学角度讲, 相关关系显著, 回归关系也就显著。反之亦然。但从生物学的专业角度讲,相关关系显著, 不一定因果关系成立, 有可

47、能仅仅是伴随关系。如果对仅仅是伴随关系的两个变量进行回归分析, 也只能是因为专业上有必要进行预测而为之.有些看似平行关系的变量, 有可能存在不为人知的因果联系, 相关分析可为揭示这种关系奠定基础, 但不能人为确定哪个是因哪个是果。(2)回归方程显著不一定有现实的预测意义在统计学上显著的回归方程,并不一定都具有实践上的预测意义.由于决定系数 r2 是总变异中可以相互以线性关系表示的部分所占比例, 反映了回归直线拟合度的高低, 所以可据此评价预测结果的可信度。比如 x 和 y 两个变量相关系数 r = 0。5,在 df = 24 时, r0。01(24) = 0。496, rr0。01(24) ,

48、 达极显著相关。然而由于 r2 = 0.25,说明随着 x 的变化, y 变量按直线回归关系发生相应改变的部分只占总变异的 25 。也就是说在利用回归方程进行预测时,通过 x 能够估计的 y 变量的变异量只占实际变异量的25,其余 75 的变异无法借助直线回归来估计。预测结果的可信度显然很低,不具有实际的预测效果。18、假设检验中哪些情况下不应该用a=0.05而要用a=0.01?为什么?同p7。319、假设检验中两尾检验、左尾检验、右尾检验为什么不能误用?对于同一显著水平,双尾检验h0的否定区分别在分布的两尾,即每侧否定区概率值只有/2;而单尾检验中h0的否定区只在分布的左尾或右尾,其相应的概

49、率值为。两尾检验:检验 与0间是否存在真实差异,在概率密度函数曲线上有两个否定区。无效假设h0:t=0;备选假设ha:t0.试验前不能确知哪一种假设一定不会发生时,需做两尾检验。左尾检验:p9。15右尾检验:p9.8对于同一显著水平,双尾检验的分位数|/2大于单尾检验的|,此时可能会存在某些|值,|/2|,即若用单尾检验可能会否定h0,接受ha;若用双尾检验则会接受h0而否定ha,从而掩盖了差异的显著性。所以单尾检验比双尾检验更容易对h0进行否定,也就是说,单尾检验比双尾检验的辨别力强,灵敏度高.不可以误用。不能因为已经抽到的样本平均数比对照的大或小,就用单尾检验,误用相当于将显著水平降低1倍

50、。20、相关系数与回归系数的计算式各为什么?其意义有何不同?相关系数计算式: 回归系数计算式: 回归系数与相关系数取值不同.回归系数 r2 表示回归直线拟合度高低,就是相关系数 r 的平方。. 从数学角度: r 是两个相反方向回归系数 bxy 和 bxy 的几何平均数, 决定系数 r2 也就是 bxy 和 bxy 的乘积, 所以决定系数 r2 介于 0 和 1 之间 (0 r2 1),不能反应直线关系的性质 。 从变量关系的角度: 决定系数 r2 就是在总变异中, 可以相互以线性关系表示的部分所占的比例。用于表示回归直线的拟合度高低, 或者说用来评价回归效果的好坏。r2 越大, 由 x 预测

51、y 的准确性就越高。 决定系数为回归平方和与总变异平方和的比值21、什么叫回归模型,其最大特点是什么?回归模型是在进行数据的回归分析,即通过计算变量之间的相关系数进而估计他们之间的联系公式,从而建立起的数学模型。回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型。当函数形式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时,称为非线性回归分析模型。当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归.特点?22、 什么叫抽样分布,在各种假设检验可以遇到哪些抽样分布?总体参数 和2都是常量, 而样本统计量是随机变量.每个特定 都有一个出现概率, 与间的差异叫抽样误差。所有可能的 对应的概率构成概率分布,样本统计量 的概率分布叫抽样分布。可能遇到的的分布:正态分布、t分布、u分布、二项分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论