统计数据的搜集与整理PPT课件_第1页
统计数据的搜集与整理PPT课件_第2页
统计数据的搜集与整理PPT课件_第3页
统计数据的搜集与整理PPT课件_第4页
统计数据的搜集与整理PPT课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020/4/30,.,1,总体(Population)指研究的全部对象,是由所研究具有某种共同性质的全部个体所组成的集合体。分为有限总体(finitepopulation)和无限总体(infinitepopulation)。样本(Sample)为总体的一部分,样本内包含的个体数目称为样本含量。,1.1.2总体与样本,2020/4/30,.,2,从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。抽样方法有随机抽样、分类抽样等。生物统计学上要求抽样具有代表性,应是一个总体的缩影,因此要根据具体情况采用不同抽样方法。,1.1.3抽样,2020/4/30,.,3,要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。如抽签,抓阄,用随机数字表等。随机表的用法(附表1,自习),1.1.4随机抽样,2020/4/30,.,4,放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。非放回式抽样:从总体中抽出个体后,不再放回。有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。尤其是总体量不大,或抽样范围小的时候。无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。一般情况样本的含量越大越有代表性。,1.1.5放回式抽样和非放回式抽样,2020/4/30,.,5,1.2.1连续型数据和离散型数据统计学的最基本工作是收集数据,数据收集得越多越有可能揭示客观现象的特性和变化规律。数据类型:连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。对连续型数据进行分析的方法,通常称为变量的方法。离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。,1.2数据类型及频率分布,2020/4/30,.,6,1.2.2频数(率)表和频数(率)图的编绘,离散型数据与连续型数据的频数(率)表和频数(率)图略有不同。离散型数据频数(率)表和频数(率)图。例:调查每天出生的10名新生儿中,体重超过3kg的人数,共调查120天。每天的10名新生儿中,体重超过3kg的人数,可能有11种情况:1名也没有,有1名,有2名,10名都是,如表1-1的第一列所示,这一组称为组值。,2020/4/30,.,7,表1-1每10名新生儿体重超过3kg的人数频数(率)表,2020/4/30,.,8,图1-1每10名新生儿体重超过3kg的人数频数图,2020/4/30,.,9,例:表1-2列出了某农场做高粱“三尺三”提纯时所调查的100个数据,试做其频数(率)表和频数(率)图。,连续型数据频数(率)表和频数(率)图。,表12“三尺三”株高测量结果,2020/4/30,.,10,1、从原始数据中找出最大值和最小值,并求出极差。R=mamx-minx(R=170-141=30)2、决定划分的组数,分组数是由数据的多少决定的,美国统计学家斯特吉斯提出分组数公式:n=1+3.322lgN(式中为样本数)。3、根据极差与决定划分的组数、确定组限。(30/103)4、在频数表中列出全部组限、组界及中值。5、将原始数据表中数据,填入频数表中,计算出每组的频数和频率。,编制连续型数据的频数(率)表的步骤:,2020/4/30,.,11,表1-3“三尺三”株高频数(率)表,2020/4/30,.,12,直方图:又称组织图,横轴表示组界,纵轴表示频数(频数图)或频率(频率图),两者图形完全一样。,直方图,2020/4/30,.,13,多边形图(折线图):横轴表示各组中值,纵轴表示频数(率),连接各点得到多边形图。累积频数图:横轴表示各组中值,纵轴表示累积频数(率),连接各点得到累积频数(率)图(向上累积与向下累积)。,频数(率)图的编绘,2020/4/30,.,14,根据频数(率)表或频数(率)图,可以看出数据的三个重要特征。集中情况:平均数,中位数,众数。变异情况:集中在平均数两侧的程度,越集中在平均数附近说明数据越整齐。图形的形状:对称与不对称,也可能显示异常分布,出现一些不规则的情况,需要寻找原因。,1.2.3研究频数(率)分布的意义,2020/4/30,.,15,同一总体中随机抽取的样本,其频数分布不完全相同,有时差距还很大。由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有不同,因此,需要考察结果的可信度。为了回答这一问题,首先要对总体分布有所了解。后面的第二、三章的内容就是围绕总体展开的。,1.2.4频数分布的不恒定性,2020/4/30,.,16,样本特征数:描述样本频率分布特征的数字.1.3.1平均数:数据集中点的度量,种类很多。算术平均数:通常简称平均数。常用简单算术平均数方法,实际应用中也常用加权平均的方法来计算。几何平均数:处于稳定消长过程中生物群体的数量变化呈几何级数,如在细菌、藻类等培养,求平均消长率应采用几何平均数,若用算术平均数则偏高(几何平均数小于算术平均数)。,1.3样本的几个特征数,2020/4/30,.,17,中位数:居于中间位置个体的数值。众数:具有最高频数的组值或中值。有单众数、双众数、三众数等。生物统计学中一般都是用平均数,中位数和众数很少使用。自习:频数图、频数表、平均数的性质、平均数的简化计算公式。,1.3.1平均数,2020/4/30,.,18,数据的变异程度范围(或极差)(R)Rmaxx-minx平均离差(MD):离均差绝对值的和的平均数。,1.3.2标准差,2020/4/30,.,19,样本方差(S2):离均差平方的和(离差平方和)除以n。标准差(SD)或(S):样本方差的开平方。,1.3.2标准差(续),2020/4/30,.,20,非频数资料标准差的简化计算公式:,标准差的简化计算方法,2020/4/30,.,21,连续型数据:用中值代替,类似离散型数据计算方法(数据较大时可用编码):,频数资料标准差的简化计算公式:,离散型数据:,2020/4/30,.,22,一般用三阶中心矩m3:m3=0,说明曲线对称于平均数,此时平均数等于中位数也等于众数。m30,说明曲线向左偏斜,称左偏或正偏,此时众数小于中位数,而中位数小于平均数。见图A。m30,说明曲线过于陡峭;g200、判断峭度g时,样本含量至少要1000。,峭度g2:也是用来度量曲线形状,其值为四阶中心距m4与二阶中心距m2的平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论