生物统计学第2章-2012_第1页
生物统计学第2章-2012_第2页
生物统计学第2章-2012_第3页
生物统计学第2章-2012_第4页
生物统计学第2章-2012_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第二章试验资料的整理与特征数的计算第一节试验资料的搜集与整理第二节试验资料特征数的计算2对试验资料进行分类是统计归纳的基础。试验资料类型数量性状资料质量性状资料/属性性状资料计数资料/非连续变量资料计量资料/连续变量资料第一节:试验资料的搜集与整理一、试验资料的类型3

数量性状(quantitativecharacter)是指能够用计数、测量或度量所获得的数值来表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料(dataofquantitativecharacteristics)。(一)数量性状资料4

1.计数资料

指用计数方式获得的数量性状资料。以整数表示,不得有任何带小数的数值,因此各观察值是不连续的,所以该类资料也称为非连续变量资料或间断变量资料或离散变量资料。

2.计量资料

指用测量或度量法获得的数量性状资料。可以有带小数的任何数值,观察值是连续性的,因此计量资料也称为连续变量资料。5(二)质量性状资料

质量性状(qualitativecharacter)指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是质量性状资料(dataofqualitativecharacteristics),

也称为属性性状资料。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:6

1.统计次数法

在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,子二代中红花、紫花和白花的株数分类统计如下表。株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%这种由质量性状数量化得来的资料又叫次数资料。7

2.评分法

对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法。从而将质量性状进行数量化,以便统计分析。8调查试验资料搜集的方法普查抽样调查详见:第八、九章第一节:试验资料的搜集与整理二、试验资料的搜集9(一)原始资料的检查与核对调查试验原始数据核对检查订正

目的:确保原始资料的完整性和正确性。第一节:试验资料的搜集与整理三、试验资料的整理缺失重复错误异常……三、试验资料的整理10(二)次数分布表统计表的结构和要求:结构简单,层次分明,安排合理,重点突出,数据准确。总横标目(或空白)纵标目1纵标目2……横标目1横标目2数字资料……表号标题1、标题简明扼要、准确地说明表的内容,有时须注明时间、地点。2、标目标目分横标目和纵标目两项。横标目列在表的左侧,纵标目列在表的上端,标目需注明计算单位,如%、kg、cm等等。3、数字一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用“─”表示,数字是“0”的,则填写“0”。4、线条多用三线表,上下两条边线略粗。三、试验资料的整理11150尾鲢鱼体长(cm)1712141314121114131614141317151414161414151514141411131214131413151413151413141516161413141513151315151514141614151713161416151314141414161213121412151615161413151714131412171415

100只来亨鸡每月的产蛋数564962784147654558555252605162786645585856465870727677566658635765855958546248635852545566524856755563756548525554626162545365428366485358576054584952568263614870694056586154535243585256615954596468515547565864677258545246573839646263676552596058465357376252596562575150484658646869735248657276565863121.计数资料的整理计数资料基本上采用单项式分组法进行整理。特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。三、试验资料的整理1712141314121114131614141317151414161414151514141411131214131413151413151413141516161413141513151315151514141614151713161416151314141414161213121412151615161413151714131412171415表2-1

100只来亨鸡每月的产蛋数11~17来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算频率和累积频率制表三、试验资料的整理每月产蛋数次数频率累积频率

FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.00表2-2

100只来亨鸡每月产蛋数次数分布表三、试验资料的整理每月产蛋数次数频率累积频率

FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.28

14350.350.6315210.210.8416110.110.951750.051.00表2-2

100只来亨鸡每月产蛋数次数分布表1自然值进行分组,最大值17,最小值11。2数据主要集中在14,向两侧分布逐渐减少。三、试验资料的整理表2-3小麦品种300个麦穗穗粒数的次数分布表每穗粒数次数频率累积频率

FrequencyPercentCumulativePercent

18-2230.01000.010023-27180.06000.0700

28-32

380.12670.1967

33-37510.17000.3667

38-42680.22670.5934

43-47530.17660.7700

48-52410.13670.906753-57220.07330.980058-6260.02001.000045组?9组18~62变动范围:三、试验资料的整理172.计量资料的整理计量资料一般采用组距式分组法。全距组数组距组限归组制表三、试验资料的整理表2-4

150尾鲢鱼体长(cm)564962784147654558555252605162786645585856465870727677566658635765855958546248635852545566524856755563756548525554626162545365428366485358576054584952568263614870694056586154535243585256615954596468515547565864677258545246573839646263676552596058465357376252596562575150484658646869735248657276565863(1)求全距,又称极差

(range):R=Xmax-Xmin

=85-37=48(cm)三、试验资料的整理19(2)确定组数和组距(classboundary)

组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。组数组距多小统计数精确,计算不方便少大统计数不精确,计算方便三、试验资料的整理20组数的确定样本容量分组数

30~60

5~860~100

7~10100~200

9~12200~500

10~18>500

15~30表2-5样本容量与分组数的关系组距的确定即每组内的上下限范围。组距=全距/组数=48/10=4.810组5cmL=1+3.322lgn三、试验资料的整理21(3)确定组限(classlimit)和组中值(classmidvalue)组限

是指每个组变量值的起止界限。上限下限组中值是两个组限的中间值。组中值=下限+上限2=组距2下限+=组距2上限-三、试验资料的整理22表2-4

150尾鲢鱼体长(cm)56496278414765455855596569627352526051627866455858605752514856465870727677566658585553506563576585

5958546248634661625738585254556652485675725737

467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263最小一组的下限必须小于资料中的最小值,最大一组的上限必须大于资料中的最大值;组限可取到10分位或5分位上;临界值就高不就低。35~,40~,45~,…,85~。三、试验资料的整理23(4)归组和制表确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。计数的方法卡片法唱票法画“正”字画“”计算机分组三、试验资料的整理

组限组中值次数频率累积频率

FrequencyPercentCumulativePercent35~37.530.02000.020040~42.540.02670.046745~47.5170.11330.160050~52.5280.18670.3467

55~57.540

0.26660.613360~62.5250.16670.780065~67.5170.11330.897370~72.560.04000.933375~77.570.04670.980080~82.520.01330.993385~87.510.00671.0000表2-6

150尾鲢鱼体长的次数分布表完?简要分析:

1)体长变化范围:37~85cm;

2)从表2-6可看出,55~60cm体长组尾数最多,占26.66%(或50~65cm尾数最多,共占62.00%);向两侧分布逐渐减少。三、试验资料的整理10组?25(三)次数分布图和频率分布图定义:把次数(频率)分布资料画成统计图形。特点:直观、形象包括:条形图、直方图、多边形图、饼图和散点图三、试验资料的整理26统计图绘制的基本要求:(1)标题简明扼要,列于图的下方;(2)纵、横两轴应有刻度,注明单位;(3)横轴由左至右,纵轴由下而上,数值由小到大;图形长宽比例约5:4或6:5;(4)图中需用不同颜色或线条代表不同事物时,应有图例说明。三、试验资料的整理27图2.1月产蛋数次数分布柱形图图2.2月产蛋数频率分布柱形图1.条形图(barchart),又称柱形图特点:柱形之间要间隔一定的距离

计数资料质量性状资料三、试验资料的整理282.饼图(piechart)图1来亨鸡月产蛋次数分布图计数资料质量性状资料三、试验资料的整理29354045505560657075808590图2.3鲢鱼体长次数分布图3.直方图(histogram),又称矩形图计量资料特点:各组之间没有距离

三、试验资料的整理304.多边形图(polygon),又称折线图(broken-linechart)计量资料图2.3鲢鱼体长次数分布图三、试验资料的整理315.散点图(scatter)123456432112345643211234564321a.正向直线关系b.负向直线关系c.曲线关系计数资料计量资料三、试验资料的整理32第二节试验资料特征数的计算集中性是变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。离散性是变量有着离中心分散变异的性质。变量的分布具有两种明显的基本特征:集中性和离散性。33集中性离散性平均数变异数极差方差标准差……算术平均数中位数众数几何平均数……特征数34一、平均数

平均数平均数是统计学中最常用的统计量,是计量资料的代表值,表示资料中观测数的中心位置,并且可作为资料的代表与另一组相比较,以确定二者的差异情况。35一、平均数(一)平均数的种类算术平均数中位数众数几何平均数361.算术平均数

(arithmeticmean)定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值。总体:μ=x1+x2+x3+…+xNN=N1样本:=x1+x2+x3+…+xnnx=n1一、平均数372.中位数(median)

资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。Md一、平均数381)、当观测值个数n为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数:

Md=

2)、当观测值个数为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数,即:

一、平均数393.众数(mode)

资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。M0注意:(1)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以上的众数;(3)主要用来描述频率分布。一、平均数404.几何平均数(geometricmean)资料中有n个观测数,其乘积开n次方所得数值。G适用范围:几何均数适用于变量X为对数正态分布,经对数转换后呈正态分布的资料。G=一、平均数41(二)算术平均数的计算方法直接计算法减去常数法加权平均法一、平均数主要用于样本含量n≤30以下、未经分组资料平均数的计算。42离均差之和等于零。离均差平方和最小。Σ(x-x)=0Σ(x-x)2<Σ(x-a)2

(三)算术平均数的重要性质一、平均数43(四)算术平均数的作用(1)指出一组数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平。(2)作为样本或资料的代表数与其他资料进行比较。(3)通过平均数提供计算样本变异数的基本数据。(4)用样本的平均数估计总体平均数。一、平均数44二、变异数变异数的种类极差方差标准差变异系数标准误45二、变异数(一)极差(全距,range)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论