




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生 物 统 计 学,主讲教师:刘建,第一章 统计数据的收集与整理, 1.1 总体与样本 1.2 数据类型及频数(率)分布 1.3 样本的几个特征数,第一节 总体与样本,1.1.1 样本数据的不齐性 实例:1. 考察我国18岁男青年身高 2. 考察我国新生儿体重 3. 测定某块实验田中稻穗品平均重量 4. 测定某块实验田中某种小麦的百粒重,1.1.2 总体与样本 总体(population):是指研究对象的全部个体. 无限总体(infinite population) 有限总体(finite population) 个体(individual):构成总体的每个成员称为个体。 样本(sample):从总体中抽出的一部分个体叫样本. 样本含量(sample size):样本中包含的个体数量称为样本含量,1.1.3 抽样(sampling) 定义:从总体中获得样本的过程。 目的:希望通过对样本的研究,推断其总体。 抽样方法:随机数字表 放回式抽样(sampling with replacement): 非放回式抽样(sampling without replacement):,1.2数据类型与频数(率)分布,1.2.1 数据类型 连续型数据(continuous data):为与某种标准相比较所得到的数据,又称为度量数据(measurement data)。如长度、重量等,若精确度提高的话,总会出现小数。对连续型数据进行分析的方法称为变量的方法(method of variable)。 离散型数据(discrete data):为纪录不同类别个体的数目所得到的数据,又称为计数数据(count data)。所得数据均为整数。对离散型数据进行分析的方法,通常称为属性的方法(method of attribute)。,1.2.2 频数(率)表和频数(率)图 离散型数据的整理 现以50枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。 50枚受精种蛋孵化出雏鸡的天数,小鸡出壳天数在1924天范围内变动,有6个不同的观察值。用各个不同观察值进行分组,共分为6组,可得表2-3形式的次数分布表,连续型数据的整理 计量资料不能按计数资料的分组方法进行整理,在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组。下面以126头基础母羊的体重资料为例, 说明其整理的方法及步骤。,1、求全距 全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即 R=Max(x)-Min(x) 表中,基础母羊的最大体重为65.0kg,最小体重为37.0kg,因此 R=65.0-37.0=28.0kg。 2、确定组数 组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。一般组数的确定,可参考下表。本例中,n126,根据表,初步确定组数为10组。,3、确定组距 每组最大值与最小值之差称为组距,记为 i。分组时要求各组的组距相等。组距的大小由全距与组数确定,计算公式为: 组距(i)全距组数 本例i28.0103.0。 4、 确定组限及组中值 各组的最大值与最小值称为组限。最小值称为下限, 最大值称为上限。每一组的中点值称为组中值,它是该组的代表值。组中值与组限、组距的关系如下: 组中值(组下限组上限)/2组下限1/ 2组距组上限1/2组距,于相邻两组的组中值间的距离等于组距,所以当第一组的组中值确定以后,加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推。 组距确定后, 首先要选定第一组的组中值。在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近于或等于资料中的最小值为好。第一组组中值确定后,该组组限即可确定,其余各组的组中值和组限也可相继确定。注意,最末一组的上限应大于资料中的最大值。 表中, 最小值为37.0, 第一组的组中值取37.5,因组距已确定为3.0,所以 第一组的下限=37.5-(1/2)3.036.0;第一组的上限也就是第二组的下限为36.0+3.0=39.0;第二组的上限也就是第三组的下限为39.0+3.0=42.0,以此类推,一直到某一组的上限大于资料中的最大值为止,于是可分组为:36.0 39.0,39.0 42.0,。为了使恰好等于前一组上限和后一组下限的数据能确切归组,约定将其归入后一组。通常将上限略去不写。如第一组记为36.0 ,第二组记为39.0 ,。,5、归组划线计数,作次数分布表 分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。如表2-5中,第一个观察值53.0,应归入表中第六组,组限为51.0 54.0;第二个数50.0,应归入第五组,组限为48.0 51.0;依次将126个观察值都进行归组划线计数,制成次数分布表,见下表。,总结:编制连续型数据的频数表的步骤 1. 从原始的数据表中找出最大值和最小值,并求出极差 2. 决定划分的组数 3. 根据极差和决定划分的组数,确定组限 4. 在频数表中列出全部组限、组界和种值 5.将原始数据表中数据,用唱票的方式填入频数表中,计算出各组的频数的频率,1.3 样本的几个特整数,1 平均数 2 标准差 3 偏斜度和峭度,1 平均数,平均数的意义 平均数的种类 算术平均数的计算方法 算术平均数的重要特性,一、平均数的意义: 平均数是数据的代表值,表示资料中观察值的中心位置。 二、平均数的种类 算术平均数 为所有测量值之和除以变量值个数(即,样本含量Sample Size)。反映一组呈对称分布的变量值在数量上的平均水平。 中数:又名中位数,是指将所得资料从大到小排序,居中间位置的观察值称为中数,记作Md。 众数 :M0 。在一个变数的观察值中,出现资料最多的观察值称为众数。 几何平均数,三、算术平均数的计算方法 直接法 加权法,举例1:试计算1,3,7,9的均数?,例2:试计算1,3,3,7,7,9,9,9的均数?,加权法,四、算术平均数的重要特性 离均差的总和等于0 离均差的平方和最小,中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。,11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60,存活天数 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60 秩次 1 2 3 4 5 6 7 8 9 10 11,中位数的计算,公式: n为奇数时 n为偶数时,例 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19 天,求其中位数。,众数(Mode) 是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。 例 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,55,55,55,55 ,61,61,61,61,62,62,65 试求众数。,2 变 异数,变异数:用来反映平均数代表性的优劣。常用的有极差、方差、标准差和变异系数。,一、极差:极差又称全距。是资料中最大观察值与最小观察值的差数。用“R”来表示。我们举个例子来说明。例如调查两个不同品种的富士苹果的维生素含量,每品种计10个数,经过整理其数字为,甲 乙,样本平方和 总体平方和,二、方差与标准差,用观察值数目来除平方和,得到平均平方和,简称均方或方差,即离均差的平方和,样本均方用s2来表示,定义为,由于方差的单位是原始数据单位的平方,不能直接地指出某个数小x与平均数之间的偏离到什么程度,因此我们采用标准差s作标准衡量x与平均数间的偏离程度。标准差一般记作SD。,标准差的计算方法,直接法:分四个步骤:先求出 ,再求出各个 和各个 ,求和得 ,即可代入公式求得标准差。 矫正数法:矫正数记为C且 所以 矫正数法用的最多,最普遍,一般用 于非频数资料的计算。,三、变异系数:反映不同资料的整齐度。比较两个样本,单位不同,均数不同,不能用标准差直接比较。这时可计算样本的标准差对均数的商,称之为变异系数。,变异系数(coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。由于变异系数是一个不带单位的纯数,故可用以比较两个事物的变异度大小,例如,赞皇大枣果皮厚、角质层厚测量结果,例 题,3. 偏斜度和峭度,适用范围:变化规律,但频数分布不对称的大样本。 自学,要求定义。,补充 频数分布,100听罐头样品的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第3课 太平天国运动 课件 部编历史八年级上册
- 宁夏工商职业技术学院病理与病理生理期末模考模拟试题及答案详解1套
- 南充文化旅游职业学院2025年第一批公开招聘员额人员(37人)模拟试卷及答案详解一套
- 税务师社会公信力-洞察及研究
- 乡村智慧旅游建设规划
- 企业内部知识管理平台构建指南
- VRAR营销体验设计-洞察及研究
- 跨设备衔接策略-洞察及研究
- 2025年事业单位笔试-河北-河北医学技术(医疗招聘)历年参考题库典型考点含答案解析
- 2025年事业单位笔试-新疆-新疆护理学(医疗招聘)历年参考题库典型考点含答案解析
- 农村伪劣食品总结汇报
- 人体解剖学与组织胚胎学(高职)全套教学课件
- 展会现场管理方案
- 二年级上册语文教材解读-
- 舟山沈家门渔港案例详解
- 宫颈癌护理教学查房
- 浅谈欧派系列产品营销策略
- 2012年数学建模D题机器人避障问题论文
- 学校文印室及时服务方案
- 毛振明《体育教学论》(第3版)配套题库【课后习题+专项题库】
- 消防喷淋设施暂停申请书
评论
0/150
提交评论