统计数据的收集与整理.ppt_第1页
统计数据的收集与整理.ppt_第2页
统计数据的收集与整理.ppt_第3页
统计数据的收集与整理.ppt_第4页
统计数据的收集与整理.ppt_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论,一、生物统计是应用于生物科学的数理统计方法,(1)科学的发展总是从定性研究到定量(2)研究生物学和数学之间的一门交叉科学(3)生物统计的基础:概率论和数理统计(4)生态数学、数量遗传学、群体遗传学、数量分类方法,二、统计学研究的是随机现象,确定性现象在一定的条件下必然发生(结果可以预言)。非确定性现象又称随机现象在一定条件下,具有多种可能结果,而究竟出现哪种结果,事先不可断言在个别试验中呈现出不确定性,但经大量重复试验,又具有统计规律性,三、生物统计的研究内容,1研究简缩数据和描述数据描述统计学2研究样本和总体的关系A.从已知的总体研究样本的特性。b.根据部分样本数据去推断总体。3研究实验设计。,四、课程安排,学时51学时作业辅导5学时+计算器使用2学时+统计软件使用3学时。成绩理论成绩:70(闭卷50,开卷50)平时成绩:作业30%。准备课代表一人练习本一本,带统计功能的计算器,五、学习要求,1、掌握数据分析的基本方法会算2、理解统计学的基本概念弄懂3、提高分析问题和解决问题的能力灵活应用,包括分析数据的合理性,针对具体研究项目,进行合理的试验设计,六、参考书,1、生物统计刘来福北师大出版社2、现代生物统计杨纪柯安徽教育出版社3、统计学导论美A.M穆德,科学出版社4、田间试验和统计方法5、生物统计,第1章统计数据的收集与整理,11总体与样本,一、总体和样本,总体指研究对象的全体,可以看成一个集合每一个研究对象个体,元素无限总体和有限总体样本总体的一部分,即总体的一个子集样本含量研究样本的目的上为了推断总体,二、随机抽样,要求总体中的每一个个体被抽到的机会相等1抽样的方式:有放回抽样和无放回抽样样本容量的大小,是统计学研究的课题之一2抽样的方法:(1)抽签、抓阄(2)计算机,RND()(3)随机数字表,随机数字表附表11p224,随机数字表附表12p225,三、连续型数据和离散型数据,连续型数据由称量、度量或测量等计量方法所得到的数据,又称计量数据离散型数据(间断性数据):用计数的方法获得的数据。是整数、可数的、又称计数数据。观察值每一个个体的某一性状、特征的测定数值,12频数分布,频数表或频数图,一、离散型数据资料的整理,举例:每10个新生儿中体重超过3公斤的人数共调查120次,每次只调查10人),特点:根据样本数据的自然值进行分组如果观察值个数较多,变异幅度较大,可扩大以几个观察值为一组。,每10名新生儿中体重超过3kg人数的频数(频率)表,二、连续型数据资料和整理,举例:高梁“三尺三”株高测量结果,样本容量100,株高数据,p4。表1-2,表1-2“三尺三株高测量结果,分组数:10,组下限,组上限,组中值,表1-2“三尺三株高测量结果,二、连续型数据资料和整理,1求极差:又称全距R=最大观察值最小观察值170-141292确定组数:考虑到:(1)观察值的多少(2)便于计算(整数)(3)能反映出资料的真实面貌两种确定组数的方法:经验公式:G=1.87(N-1)2/5,二、连续型数据资料和整理,3确定组距:每一组的范围称为组距分组时要求各组的距离相等一般以整数作为组距,二、连续型数据资料和整理,4选定组限与组中值(1)选定第一组的组中值最好接近于最小观察值,141组中值最好是整数或与观察值的位数相同。(2)求第一组的组下限:下限=组中值-1/2组距(3)求各组的组中值和组限:(组中值)i(组中值)i-1+组距(组限)i=(组限)i-1+组距,二、连续型数据资料和整理,5.唱票唱票程序L第一组下限;D组距DimFrequency(N)AsInteger,Data(nSample)AsSingleDimiAsInteger,nGroupAsIntegerFori=1TonSamplenGroup=Int(Data(i)-L)/D)Frequency(nGroup)=Frequency(nGroup)+1Nexti,二、连续型数据资料和整理5.唱票,说明第组的下限等于第组的几种处理方法:(1)组限明确,比原始数据多一位小数,LXH(2)对各组的下(上)限不记载,用一缺横表示607080LXH,表1-3“三尺三株高的频数分布统计,6绘制直方图(histogram),7多边形图(polygon),7多边形图(polygon),7多边形图(polygon),三、研究频数分布的意义,1、可以看出数据的集中情况平均、大部分数据集中在何处、重心所在。,三、研究频数分布的意义,2、可以看出数据的变异情况是整齐还是分散,这些数据是集中在平均数附近,还是分散在平均数的两侧,三、研究频数分布的意义,3、可以看出数据的分布是否对称,13平均数和标准差,mean&standarddeviation,一、平均数(average)的意义、种类,1意义(1)资料中观察值的中心位置(2)不同资料进行比较2算术平均数(arithmeticmean)设x1,x2,x3,xn表示样本内的几个观察值,一、平均数(average)的意义、种类,3中位数(median)有序数列的中点上的数排序,中间位置所对应的那个数样本为奇数和偶数的情况4众数(mode)具有最高频数的组值或组中值5几何平均数,二、算术平均数的基本特征和算法,1特征(1)每个观察值都对有贡献1/n(2)(3)(4)如果(5)样本平均数是总体平均数的无偏估计,二、算术平均数的基本特征和算法,2算法(1)一般算法:根据定义的公式。(2)频数分组资料用组中值代表每一组的平均数,三、变异程度的几种度量方法,1、极差又称全距,记作R是资料中最大观察值与最小观察值的差数。R=max(x)min(x)优点:简单。样本数小于10时常用缺点:没有充分利用资料,完全受极端值的影响2平均离差(meandeviation)平均离差,三、变异程度的几种度量方法,3样本方差(samplevariance)说明:(1)平方的作用:消除负号,加重较大的分量(2)样本方差是总体方差的无偏估计(3)除以n-1的问题,三、变异程度的几种度量方法,4样本标准差,又称标准差(samplestand

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论