版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 .课程名称(1)2 .课程性质(1)3 .课程学时(1)4 .课程学分(1)5 .课程简介(1)6.教学大纲(1)7 .教学日历(7)8 .讲授提纲(14)9 .思考题(35)10.参考文献及阅读书目(35)11.教师简介(35)课程名称:生物统计学课程性质:必修课总学时:72学时学分:4学分课程简介:生物统计学是生态专业和生物技术专业开设的一门专业必修课。本门课程是概率论与数理统计原理和方法在生物科学中的应用,它研究数据的搜集、整理和分析,在生物科学的很多领域以及农业科学和医学科学中发挥了重要作用,是一门重要的方法论科学。通过本课程的学习,可以学会如何合理地进行试验设计和野外调查,对所获
2、取的数据资料如何进行科学地分析。掌握统计推断检验等方法,并能够应用这些方法对研究对象的客观规律性做出种种合理的估计和判断。培养学生在实际工作中应用统计方法的基本能力,树立学生实事求是的科学态度。生物统计学教学大纲课程性质:必修课课程教学目的:生物统计学是应用概率论和数理统计的基本原理和方法,研究生物科学领域数据的搜集、整理、分析的一门应用性学科,它在生物科学的很多领域以及农业科学和医学科学中发挥了重要作用,是一门重要的方法论科学。通过本课程的教学,使学生掌握统计学的基本原理和方法知识,学会如何合理地进行试验设计和野外调查,对所获取的数据资料如何进行科学地分析。让学生掌握统计推断检验等方法,并能
3、够应用这些方法对研究对象的客观规律性做出种种合理的估计和判断。培养学生在实际工作中应用统计方法的基本能力,树立学生实事求是的科学态度。课程教学原则和教学方法本门课程的教学重在培养学生的应用能力,所以在教学中不侧重于公式的数学推导过程,而着重于对基本概念、方法原理的正确理解。以教材为中心,适当补充相关知识,并学习有关的统计学软件,利用计算机来大大提高效率。教学以讲授为主,突出重点、难点,多运用启发式语言,鼓励学生积极思考,引导并培养学生尽快适应概率统计特有的思维方式。有关概念的引入要侧重客观背景的阐述。各种统计推断方法的讲授要侧重统计思想的论述。通过运用多媒体中丰富的图片资料、各种实验的模拟演示
4、,活跃课堂气氛,激发学生的求知欲。在学习完课程的全部内容后,引入一些研究实例,让学生进行课堂讨论,内容包括如何进行试验设计或确立调查方案,对所获取的数据资料应该用什么方法进行分析。通过讨论提高学生分析问题和解决问题的能力。运用多媒体介绍统计软件的使用,让学生进行分组操作练习,如果条件允许,可在计算机房进行这部分的学习。在每节的内容学习完后,留2-3个作业题。既可以使学生巩固所学的知识,也可使教师在批改作业时发现存在的问题,及时解决。作业成绩计入平时成绩。总学时:72学时教学内容要点及建议学时分配:(一)教学内容要点第一章统计分析的基础知识(概率论部分)第一节概率论序言一、生物统计学的发展史,研
5、究对象及应用意义。二、几个基本概念1 .随机试验2 .随机事件、基本事件、复合事件3 .样本点与样本空间4 .事件之间的关系及事件的运算第二节概率的计算一、概率的基本概念二、古典概型(概率的古典定义)三、概率的统计定义四、加法公式及其应用五、乘法公式及其应用六、全概率公式七、逆概率公式第三节随机变量与分布函数一、随机变量二、分布函数第四节离散分布一、离散型随机变量及其概率函数二、离散型随机变量的数学期望和方差三、几个常见的离散分布1 .伯努里分布2,二项分布3 .普阿松分布4 .超几何分布第五节连续分布一、连续型随机变量及其密度函数二、连续型随机变量的数学期望和方差三、两个重要的连续分布5 .
6、均匀分布6 .正态分布第六节中心极限定理.一、同分布的中心极限定理二、二项分布的正态近似第二章数据资料的统计分析(数理统计部分)第一节数据资料的获得与整理一、抽样技术二、试验设计三、试验数据的整理第二节样本平均值与标准差一、样本平均值二、样本标准差三、标准误四、变异系数五、偏斜度六、峭度第三节总体参量估计一、点估计二、科的区间估计第四节单个样本的统计假设检验一、统计假设检验的一般原理二、单个样本显著性检验第五节两个样本的差异显著性检验一、两个方差的检验二、两个平均数差异的显著性检验1 配对数据均数间的比较2 成组数据比较三、两个百分率的比较第六节非参量检验法一、符号检验二、秩和检验第七节X2检
7、验2一、四格表X检验二、多格表X2检验第八节方差分析一、单因素多组群的方差分析二、两因素多组群的方差分析三、拉丁方资料的方差分析四、正交拉丁方资料的方差分析第九节回归分析一、一元线性回归二、一元非线性回归三、多元线性回归第十节协方差分析协方差分析方法第十一节多元统计分析简介一、多元分析技术的一般特点二、相似系数三、聚类分析四、主成分分析第十二节统计软件介绍介绍统计软件SPSS,内容包括:建立数据文件、统计图表生成、t检验方法、方差分析、相关分析、回归分析、聚类分析及主成分分析等。(二)建议学时分配第一章统计分析的基础知识(概率论部分)第一节概率论序言1学时第二节概率的计算7学时第二节随机变量与
8、分布函数1学时第四节离散分布6学时第五节连续分布4学时络q姑用八P中心极限定理1学时第一早数据资料的统计分析(数理统计部分)第一节数据资料的获得与整理5学时第二节样本平均值与标准差1学时第二节总体参量估计1学时第四节单个样本的统计假设检验5学时第五节两个样本的差异显著性检验5学时络q姑用八P非参量检验法1学时第七节X2检验4学时第八节方差分析7学时第九节回归分析7学时协方差分析3学时第卜节多兀统计分析简介3学时田一一节统计软件介绍10学时教材和主要教学参考书:教材:杨持.生物统计学.呼和浩特:内蒙古大学出版社,1996主要教学参考书:1李春喜,王志和,王文林.生物统计学.北京:科学出版社,19
9、972杜荣骞.生物统计学.北京:高等教育出版社,1999课程考试与评估:本课程为考试课,平时成绩占20%期末考试占80%(执笔人:王铁娟)内蒙古师范大学教学日历(2006-2007学年二学期)课程名称生物统计学主讲教师王铁娟实验或辅导教师任课班级2004级生态班、2005生物技术班生命科学与技术学院生态专业2006年9月13日上课周数15总学时72周学时5上课与自习比主讲教帅职称副教授辅导教帅职称实(帅工佥教直称教研室审核意见教研室主任签名年月日院、系、部审核意见院、系(部)主任签名年月日注:1、教学日历经教研室、院系(部)主任审定后,不得随意变动。2、作业、实验需认真填写时间。3、教学日历一
10、式两份,一份交院系(部)办公室,一份教师留存。周次讲授题目及内容作业、实验题目及内容第一周章统计分析的基础知识第f概率论序言三、生物统计学的发展史,研究对象及应用意义。四、几个基本概念第二节概率的计算一、概率的基本概念(一)概率的古典定义1 .古典概型2 .古典概型中事件概率的计算3 .排列、组合的几个简单公式4 .古典概率计算举例事件的表示第一周(二)概率的统,计定义二、概率的运算1 .加法公式及其应用2 .乘法公式及其应用3 .全概率公式概率的计算第三周4.逆概率公式第二节随机变量与分布函数三、随机变量四、分布函数第四节离散分布四、离散型随机变量及其概率函数1 .概率分布的定义2 .表小方
11、法3 .举例五、离散型随机变量的数学期望和方差1.数学期望全概率与逆概率公式的应用周讲授题目及内容作业、实验题目及内容第四周2.方差六、几个常见的离散分布1 .伯努里分布2 .二项分布3 .普阿松分布第五节连续分布一、连续型随机变量及其密度函数二、连续型随机变量的数学期望和力差三、两个重要的连续分布1.均匀分布计算数学期望、方差及标准差二项分布概率的计算第五周2.正态分布第六节中心极限定理第二章数据资料的统计分析(数理统计部分)A节数据资料的获得与整理一、抽样技术1 .样本与总体2 .抽样方法3 .取样数目正态分布概率的计算第六周二、试验设计1 .单因子优选法2 .对比法3 .单因素完全随机化
12、设计4 .随机区组法5 .拉/设计6 .裂区设计7 .正交拉丁方设计周讲授题目及内容企业、实验题目及内容第七周三、试验数据的整理第二节样本平均值与标准差一、样本平均值;二、样本标准差;三、标准误;四、变异系数;五、偏斜度;六、峭度第二节总体参量倩计一、点估U二、科的区间估计第四节单个样本的统计假设检验一、统计假设检验的一般原理1 .假设2 .小概率原理计算科的置信区间;第3.单侧检验与双侧检验八4.两种类型的错误二、单个样本显著性检验周1.(T已知时平均数的检验一一U检验单个样本显著性检验的计算2.(T未知时平均数的检验t检验3.变异数的显著性检验一一x2检验4.单个样本频率的假设检验第第五节
13、两个样本的差异显著性检验九一、两个方差的检验二、两个平均数差异的显著性检验周1.配对数据均数间的比较2.成组数据比较两个样本显著性检验的计算(1)(T已知(2)b未知且方差具齐性(3)(T未知且方差不具齐f生三、两个百分率的比较周讲授题目及内容作业、实验题目及内容次第十周第六节丫检验一、两组数据的X2检验二、四格表X2检验二、多次重复的四格表X检验四、多格表X2检验五、2X2列联表的精确检验法第七节方差分析一、单因素多组群的方差分析1.重复数相等rX2检验的计算方差分析的计算第十一周2.重复数不等二、两因素多组群的方差分析三、拉.方资料的方差分析四、正交拉丁方资料的方差分析1.直观分析第十一周
14、2.方差分析第八节回归分析一、一元线性回归1 .回归直线的求法2 .相关系数及其显著性检验3 .回归直线方程效果的检验4 .预报的精确度二、一元非线性回归一元非线性回归方程的建立及效果分析回归方程的计算周次讲授题目及内容作业、实验题目及内容第十三周三、多元线性回归第九节协方差分析第十节总结、实例讨论与分析第1节统计软件介绍spss数据的建立、图表的制作单个样本检验、两个样本检验第单因素、两因素、拉丁方方差分析的软件使用、正十交拉丁方的力差分析,协力差分析四周第相关分析,回归分析的软件使用十五周讲授提纲第一章统计分析的基础知识第一节几个基本概念一、基本概念随机试验、随机事件、基本事件、复合事件、
15、样本点与样本空间。二、事件的关系与运算第二节概率的计算一、概率的基本概念研究随机现象,不仅关心试验中会出现哪些事件,更重要的是想知道事件出现的可能性大小,也就是事件的概率.我们用P(A)表示事件A发生的概率,则0WRA)W1(一)概率的古典定义(古典概型)1 .古典概型2 .古典概型中事件概率的计算(1)加法原理设完成一件事有m种方式,第一种方式有ni种方法,第二种方式有n2种方法,;第m中方式有nm种方法,无论通过哪种方法都,可以完成这件事,则完成这件事总共有n1+n2+nm种方法.(2)乘法原理设完成一件事有m个步骤,第一个步骤有n1种方法,第二个步骤有n2种方法,;第m个步骤有nm种方法
16、,必须通过每一步骤,才算完成这件事,则完成这件事共有则完成这件事共有n1xn2xxnm种不同的方法.3 .排列组合的几个简单公式4 .古典概率计算举例(二)概率的统计定义在充分多次试验中,事件的频率总在一个定值附近摆动,而且,试验次数越多,一般来说摆动越小.这个性质叫做频率的稳定性.频率在一定程度上反映了事件发生的可能性大小.尽管每进行一连串(n次)试验,所得到的频率可以各不相同,但只要n相当大,频率与概率是会非常接近的.因此,概率是可以通过频率来“测量”的,频率是概率的一个近似.在实际中,当概率不易求出时,人们常取实验次数很大时事件的频率作为概率的估计值,称此概率为统计概率这种确定概率的方法
17、称为频率方法二、概率的运算(一)加法公式及其应用事件互斥时的加法公式P(A+B尸P(A)+P(B)事件相容时的加法公式P(A+B尸P(A)+P(B)-P(AB)推广到多个事件n个事件和的概率为nnP(Ai)P(Ai)P(AiAj)P(AiAjAk)(1)n1P(AAAn)i1i11ijn1ijkn(二)乘法公式及其应用1 .条件概率(1)条件概率的概念在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.如在事件B发生的条件下求事件A发生的概率,将此概率记作P(A|B).一般RA|B)丰RA)条件概率的定义设A、B是两个事件,且RE)>0,则称P(A/B)p(AB)p(B
18、)为在事件B发生的条件下,事件A的条件概率.(3)条件概率的计算1)用定义计算2)从加入条件后改变了的情况去算2.乘法公式由条件概率的定义:若已知P(B),RAB)时,可以反求P(AB>.P(AB)P(A|B)P(A)>0,则 P(A0=P(A)P(B| A)P(B)若P(E)>0,则RAB=P(E)P(AE)或推广到多个事件的乘法公式:当P(A1A2-An-1)>0时,有P(AiA2An尸P(Ai)RA2lA1)"(。|心篙一)3.事件的独立性(1)两事件的独立性(2)多个事件的独立性(3)独立性的概念在计算概率中的应用(三)全概率公式与逆概率公式全概率公式
19、和贝叶斯公式主要用于计算比较复杂事件的概率,它们实质上是加法公式和乘法公式的综合运用.1.全概率公式nP(B)P(Ai)P(B|Ai)1 1设A1,A2,人门是两两互斥的事件,且P(Ai)>0,i=1,2,n,另有一事件B,它总是与A1,A2,,An之一同时发生,则2.逆概率公式(贝叶斯公式)设A1,A2,-An是两两互斥的事件,且P(A)>0,i=1,2,,n,另有一事件B,它总是与A1,A2,An之一同时发生,则P(Ai|B)P(AJP(B|Aj/P(Aj)P(B|Aj)j1第三节随机变量与分布函数一、随机变量(一)随机变量概念的产生(二)引入随机变量的意义(三)随机变量的分类
20、随机变量通常分为两类:离散型随机变量续型随机变量所有取值可以逐个一一列举如“取到次品的个数”,“收到的呼叫数”等.一个区间.例如,“电视机的寿命”,实际中常遇到的“测量误差”等全部可能取值不仅无穷多,而且还不能一一列举,而是充满随机变量取什么值是有一定规律的,这个规律具有可观测或可试验的频率意义。随机变量X取某个Xi值这一事件的概率记为P(X=Xi),那么X的值落在半开半闭区间XI,X2上的概率就记为P(xi<X<x2)P(xi<X<x2)是区间xi,X2的函数。为了把这个函数化为点函数以便于数学上处理,下面引入分布函数的概念二、分布函数随机变量X的值小于等于实数x的概
21、率P(XWx),显然这个概率是点x的函数,故可写成F(x)=P(X<x),函数F(x)叫做随机变量的分布函数。第四节离散分布一、离散型随机变量及其概率函数1 .离散型随机变量概率分布的定义离散型随机变量X可能取得的数值为有限个或可数无穷个孤立的值,因此,对于X的每一个值都能得出一个概率值。可以将随机变量X所取的数值x的概率P(X=x)写成x的函数p(x),这样的函数称为随机变量X的概率函数。p(x)=P(X=x)将X的一切可能值X1、X2Xn,以及取得这些值的概率P(X1)、P(X2)P(Xn)排列起来,就构成了离散型随机变量的概率分布。2 .表示方法列表法、图示法、公式法3.举例二、离
22、散型随机变量的数学期望与方差1.平均数与数学期望(1)平均数的种类算术平均数中位数众数(2)算术平均数的计算方法直接计算法nxip(x)加权平均法数学期望的公式E(X)=X1p(x1)+X2p(x2)+xnp(xn)=2 .变异数与方差(1)极差(2)标准离差(标准差)(3)方差3 .数学期望在运算上的性质三、几个常见的离散分布1 .伯努里(Bernoulli)分布一个只取两个值的随机变量叫做伯努里随机变量,其分布称为伯努里分布2 .二项分布(1)二项分布的概率函数P(k)P(Xk)C:pk(1p)nk,k0,1,n分布函数为:xxkkn-kF(x)=p(k)=Cp(1-P)k0k0(2)二项
23、分布的数学期望与方差=E(X)=np2dx=npq(3)二项分布的应用举例3.泊松分布适用于随机反复出现的事件,其公式由二项分布推导求得。P(x)=eJ t)x!二项分布的泊松近似当试验次数n很大时,计算二项概率变得很麻烦,如果改用泊松近似计算,则比较容易第五节连续分布、连续型随机变量及其密度函数连续型随机变量X所有可能取值充满一个区间,对这种类型的随机变量,不能象离散型随机变量那样,以指定它取每个值概率的方式,去给出其概率分布,而是通过给出所谓“概率密度函数”的方式1 .连续型r.v及其密度函数的定义bP(axb)f(x)dxa2 .概率密度函数的性质f(x)>0f(x)dx1需要指出
24、的是:连续型r.v取任一指定值的概率为0.由此得:p(a&Xwb)=(a&X<b)=(a<X<b)=(a<X<b)二、连续型随机变量的数学期望及方差1.数学期望E(X)xf(x)dx2_22-%E(X2)2(x)f(x)dxxE(X)xf(x)dx2.方差或三、两个重要的连续分布1.均匀分布若r.vX的概率密度为:则称X服从区间(a,b)上的均匀分布a x b其它1f(x)rv0,均匀分布的数学期望为:bb1baE(X)xf(x)dxxdxaaba2方差为:xE(X2)2(ab)122.正态分布正态分布是应用最广泛的一种连续型分布(1)正态分布的定
25、义若r.vX的概率密度为1 (x)2f(x)e22,x2其中科和b2都是常数,科任意,b>0,则称X服从参数为科和的正态分布记作XN(5(T2)f(x)所确定的曲线叫作正态曲线分布函数为:(t)21X2F(x):e2dt,x2(2)正态分布N(J)的图形特点(3)标准正态分布科=0,b=1的正态分布称为标准正态分布其密度函数和分布函数常用(x)和(x)表示:(X)t2(x)2dt标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.它的依据是下面的定理:设XN(jb2),则Y=N(0,1)根据定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布
26、的概率计算问题(4)正态分布表(5)3(t准则(6)二项分布的正态近似第六节中心极限定理观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大.则这种量一般都服从或近似服从正态分布.定理1(独立同分布下的中心极限定理)设X1,X2,是独立同分布的随机变量序列,且E(Xi)=科,D(Xj)=屋i=1,2,,贝UnXinx1-t22.;而年1nx-.2edt它表明,当n充分大时,n个具有期望和方差的独立同分布的r.v之和近似服从正态分布.定理2(棣莫佛-拉普拉斯定理)设随机变量服从参数n,p(0<p<1)的二项分布,则对任意x,有t2limP
27、-Yn-nP-xx1e-dtn.np(1P)2定理表明,当n很大,0<p<1是一个定值时(或者说,np(1-p)也不太小时),二项变量的分布近似正态分布Nnp,np(1-p).第二章数据资料的统计分析第一节数据资料的获得与整理一、抽样技术1 .总体和样本(1)总体一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),总体中每个成员称为个体.(2)样本为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为木¥本容量.2 .抽样方法单纯随机抽样法.先
28、把每个个体编号,然后用抽签的方式(或利用随机数字表)从中抽取个体。这种方法仅适用于个体间差异较小,所需抽选的个体数较少,或个体的分布比较集中的研究对象.分区随机抽样法.将总体随机地分成若干部分,然后再从每一部分随机抽选若干个体组成样本.这种抽样法可以更有组织地进行,而且中选的个体在总体的分布比单纯随机抽样更均匀.系统抽样法(规则抽样法).先有系统地将总体分成若干组,然后随机的从第一组决定一个起点,如每组15个元素,决定从第一组的第13个元素选起,那么以后选定的单位即28,43,58,73等等.分层抽样法(类型抽样法)根据对总体特性的了解,把总体分成若干层次或类型组,然后从各个层次中按一定比例随
29、机抽选.此法的代表性最好,但若层次划分的不正确,亦不能获得有高度代表性的样本.3 .取样数目取样数目的多寡决定于研究对象的变异大小,通常用方差来表示变异大小,也就是说,取样数目取决于方差大小。在一般情况下,总体的方差是不知道的,用什么方法来估测呢?有以下几个方法可以作为参考:根据过去资料,用同一或类似的总体中s2(样本方差)或p二项分布的参数,s2=pq=p(1-p)值来估计。根据少量个体的调查,找出变异的最大值和最小值的幅度,查“估计标准差和标准误差”表(植物生态学中的数量方法),可以得出一个估计的方差数值.估计标准差和标准误差表样品数目anan/ViF20.88620.626330.590
30、80.341140.48570.242850.42990.192260.39460.161170.36980.139780.35120.124190.33670.1122100.32490.1027110.31520.0951120.30690.0886130.29980.0832140.29350.0789150.28800.0744160.28310.0708170.27870.0676180.27470.0617190.27110.0623200.26770.0598300.245400.231500.222标准差:anx范围标准误=(an/Vn)x范味通过少量样本计算出标准差,给以大概
31、估计。在随机取样时,一般采用下列公式来估计取样数目。就不连续函数讲:n。t2PQL2就连续函数讲:.22tsn。-TL公式中P为某一事物出现的概率,Q=l-P;就二项分布讲,方差(s2)=PQ,L为可以允许的误差,这是已知数.二、试验设计1 .试验处理设计分为单因子试验、双因子试验、多因子多水平的试验。2 .试验方法设计单因子优选法这类方法中有两个最简单易行的,一个叫0.618法(折纸条法),一个叫分数法.对比法将参加试验的个体随机地分为两组,一组作对照,一组接受处理。分别求出每组的数据平均值,比较于均值以判断处理的效果。单因素完全随机化设计将参加试验的个体随机地分为若干组,每组接受一种处理。
32、随机区组法(两因素)将参加试验r的个体按性质不同分为若干区组,使区组内的环境差异最小而区组间的环境差异最大,区组内的不同个体分别接受不同的处理,每个个体究竟接受那种处理是随机的。这种设计可以通过区组内、区组间差异的比较,正确地估计出随机误差的大小,判断处理的效果。拉丁方设计(三因素)拉丁方设计是区组数与处理数相同的随机区组试验.可以排列成正方形,以A、B、C、DE、F等表示不同的处理.每种处理在每行中只出现一次,在每列中也只出现一次,没有重复.由于构成上述方阵的各小区是用拉丁字母表示的,所以称为拉丁方。裂区设计此法适用于双因子试验.在设计时,先将某一试验因子各个处理分别置于不同的小区内,这些小
33、区称为主区;然后再将另一试验因子的各个处理分别排列于每个主区内,主区内划分成的小区称为副区。要求在每个重复内的各个主区处理作随机排列,每个主区内的各个副区处理的位置也依随机排列决定.正交拉丁方设计:也称多因子优选法。正交拉丁方的概念:当把两个同阶拉丁方叠合起来时,如果一个拉丁方的每个字母同另一拉丁方的每个字母一起出现一次,而且只出现一次,那么,称这两个拉丁方互为正交,这样叠合的方称为正交拉丁方.利用正交表来安排试验三、试验数据的整理整理的步骤如下第一步原始数据整列第二步数据的归类、分组,绘制次数分布表第三步绘制直方图、累积频率图第二节样本平均值与标准差1 .样本平均值样本平均值是表示一个变量数
34、列中各变数分布的中心位置的一个数值,在均值上下点的地方频数最高,故均值对一个变量数列具有较大的代表性.样本平均值的计算方法有几种: 当样本容量少时,可按习惯的算术平均值求法求得:一XiX2XnxiXnn 对于分组数据,可按下式计算:f2X2fkXk)fiXi1一一(fiXinX1Xk为分组后各组的组中值,fk为各组的频数。单位进级法当样本容量很大,分组又多,采用上式仍感麻烦,可改用单位进级法计算,详见教材。2 .样本标准差Sx标准差是表示一变量数列离开均值的偏离程度,是度量变量数列分散程度的指标,以表不。样本标准差的计算方法也有几种,小样本的标准差公式Sx./一(XiX)n-1为自由度(小样本
35、时值与总体偏差大,用n-1更接近总体。、n1实际计算中常用的公式SXi2(Xi)2/n分组数据与单位进级法见教材3 .标准误标准误(即平均数的标准差)估计标准误Sx(是由样本估计总体的标准误,所以加估计两字)4 .变异系数变异系数是测量变异的绝对常数,单位与原样本的单位相同,当两个变量数列的均数相同时,可以直接根据两者标准差的大小来确定变异程度的大小。如果有两个均数不同,或单位不同的变量数列,就不能用标准差的大小来判断变异程度了,需要有一个相对指标,这个表示变异程度的相对指标就是变异系数。SxC/x通过变异系数c的比较,说明变异程度的差别。5 .偏斜度m3q13/2m2它是一个纯数,不带有任何
36、单位,它的大小说明曲线偏斜的程度。6 .峭度峭度是度量曲线形状的量,表达为:q2m42m2q2=o,可以认,为数据是正态的;当q2为正数时,曲线过于陡峭;当q2为负数时,曲线过于平坦.第三节总体参量估计点估计用由样本数据所计算出来的单个数值,对总体参量所做的估计称为点估计。一般来说,一个好的估计量应该满足以下三个条件:即无偏性、有效性和一致性。的区间估计1. 已知(或.未知,但n>30,即为大样本)从一个正态总体 N(2一)。标准化的平均数u n2)中抽取含量为n的样本,样本平均数x服从正态分布N(x五服从N(0,1)分布。的95%置信区间为:/.np(u置信区间又可表达为:(xu_jn
37、),叫显著性水平,i概率2. 未知x未知时可用s代替,变量方服从n-l自由度的t分布,的95%置信区间为s/、n,X,p(t(双侧)-t(双侧)1s/n因此,置信区间又可表达为:第四节单个样本的统计假设检验一、统计假设检验的一般原理i.假设零假设:在实际工作中,往往把不轻易否定的命题作为原假设,用H)表示。与零假设对立的假设为备择假设备择假设具有三种形式:HA:0Ha:0H-2 .小概率原理HA:0小概率事件在一次试验中基本上不会发生3 .单侧检验与双侧检验4 .两种类型的错误二、单个样本的差异显著性检验检验一个总体与已知总体的差异性1 .(T已知时的单个平均数的显著性检验U检验检验的统计量X
38、0u._,2 .b未知时的单个平均数的显牌怛检验一一t检验检验的统计量3 .变异性的显著性检验-x2检验2检验的统计量2(n1)sn124 .单个样本频率的检验0在不需进行连续性矫正时,u值的计算公式为:u1色+估"宵"u在进行连续性矫正时,u值的计算公式为:I ? P0I0.522n2第五节两个样本的差异显著性检验比较两种分析方法;两种处理;两种不同的物质;两种试验方法;两种药物或两种不同的过程等,判断它们之间是否存在足够显著的差异。一、两个方差的检验F检验s2检验的统计量Fdfi,df22人”aS2二、两个平均数差异的显著性检验1.配对数据平均数间的比较配对设计是指先根
39、据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致。配对的方式有两种:自身配对与同源配对。检验的统计量2.成组数据均数间的比较SSd(d d)2d、 n. n(n 1)成组设计或非配对设计是指将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。(1)标准差(b)已知时两个平均数间的差异显著性检验一一u检验X1X2检验的统计量(2)标准差(b)未知时两个平均数间的差异显著性检验一一t检验方差具齐性时,两个均数差异显著性检验
40、统计量公式:tn1n2222(心1)Si2(n21)S;,11、方差不具齐性时,两个均数的碧鼻显差楂检*2二2()(n11)(n21)n1n2统计量公式:tx1x2三、两个百分率的比较S12S2百分率之间的比较,需用到两个H分率同差数标准差,计算公式为:统计量公式:Sf1R1p/Ik专毛黑卜谭图藤检辕)-x2测验2,一,-SP1,P2x2检验可以表布测量实际值与根据一定假设得到的理论值之间的偏离程度。计算公式为:2(实际数理论数)2(fT)2k_2在计算X2时应注意以下两个问叫2理诒砥inpi)T(1)任何一组的理论数必须大于5,M束小于np5则需要并组或增大样本容量,以满足理论数大于5。(2
41、)在自由度df=1时,需进行连续性矫正,其矫正的x2为:_22(|fT|0.5)自由度按(行数-1)x(列数-1)计算,身行数(列数)为1时,自由度按列数(行数)-1计算。X2检验一般有两种类型:适合性检验:比较观测数与理论数是否符合的检验(检验是否符合某一规律)独立性检验:检验事件间的独立性或者说检验处理之间的差异显著性(检验两个或多个因子差异是否显著)一、适合性检验1 .两组资料222 .多组资料2(1)的1-二、独立性检验2nniPinp(xj1 .四格表(2X2列联表)的独立性检验nP(xi)(IfnPiInPi四格表X2检验也可以不计算理论数,按下列两个公式之一直接计算:22 |ad
42、bc|N/2N减去N/2是为了做连续性校正nmsr2 .多次重复NJ格表国独)生检验应用2adnRnbcN,计算每次试验的2值,最后求和.3 .2Xc列联史的mg柿检验为避免求理论数的麻烦,可用以下两个公式计算:pnpni-22(Mninj(ni)2ni一 nj12c合计1O11O1201cR12O21%R2rO-1O-2OrcRr合计C15CcTr xc列联表的一般形式Oi2以上的各种X 2检验均可按最和的(.2 .三、2 X 2列联表的精确检验法1数)2理论数第七节方差分析计算(f T)2T方差分析即用方差作为统计量对试验结果进行统计分析。作用:检验多个总体均值是否相等而方差分析是平均数差异显著性检验的一种引伸。可以同时判断多组数据平均数之间的差异显著性。方差是表示变异的量,在一个多处理试验中,可以得出一系列不同的观测值,造成它们不同的原因是多方面的,有的是处理不同引起的,叫处理效应(或叫条件变异),有的是试验过程中偶然性因素的干扰和测量误差所致,这一类误差称试验误差。方差分析的基本思想是将测量数据的总变异(总变差)按照变异原因不同分解为处理效应(处理间的差异,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026浙江丽水市质量检验检测研究院见习人员招聘6人笔试备考题库及答案解析
- 2026广东中山市沙溪华强学校教师招聘2人笔试备考题库及答案解析
- 2026广东省疾病预防控制中心招聘科研助理1人笔试备考试题及答案解析
- 2026年土地承包法实施条例题库及答案
- 家装公司业务拓展经理的岗位职责及招聘策略
- 物流行业客户经理面试须知
- 初中生领悟教师情感支持与学业倦怠的关系-心理资本的中介及干预研究
- 银行分行经理业务发展规划及执行策略
- 餐饮业数据分析师工作手册与安排
- 技术团队组织架构及职能说明
- 网络安全外文翻译文献
- 《陋室铭》同课异构教学一等奖课件
- 中国旅游地理试题库(含参考答案)
- 口腔颌面外科学第十章 口腔颌面部损伤
- SB/T 10625-2011洗染业服务质量要求
- LY/T 2118-2013大径级用材林培育导则
- GB/T 27760-2011利用Si(111)晶面原子台阶对原子力显微镜亚纳米高度测量进行校准的方法
- GB/T 12914-2018纸和纸板抗张强度的测定恒速拉伸法(20 mm/min)
- 思想政治教育案例分析
- GA/T 170-2019法医学猝死尸体检验规范
- 文物古建筑修缮工程施工组织设计
评论
0/150
提交评论