




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生 物 统 计 学,主讲教师:段彦玲,第一章 统计数据的收集与整理, 1.1 总体与样本 1.2 数据类型及频数(率)分布 1.3 样本的几个特征数,第一节 总体与样本,1.1.1 样本数据的不齐性 遗传因素 环境因素 发育噪声(development noise) 实例:1. 考察我国18岁男青年身高 2. 考察我国新生儿体重 3. 测定某块实验田中稻穗品平均重量 4. 测定某块实验田中某种小麦的百粒重,1.1.2 总体与样本 总体: 研究对象的全部个体. 无限总体 有限总体 个体:构成总体的每个成员 样本:从总体中抽出的一部分个 体 样本含量:样本中包含的个体数量称为样本含量,1.1.3 抽样(sampling) 定义:从总体中获得样本的过程。 目的:希望通过对样本的研究,推断其总体。 抽样方法:随机数字表 放回式抽样: 非放回式抽样: 样本的含量越大越有代表性,1.2数据类型与频数(率)分布,1.2.1 数据类型 连续型数据:为与某种标准相比较所得到的数 据,又称为度量数据。如长度、重量等,若精 确度提高的话,总会出现小数。对连续型数据 进行分析的方法称为变量的方法。 离散型数据:为纪录不同类别个体的数目所得 到的数据,又称为计数数。所得数据均为整数 。对离散型数据进行分析的方法,通常称为属 性的方法。,1.2.2 频数(率)表和频数(率)图 离散型数据的整理 例:调查新生儿体重增长超过3kg的 人数,每次调查10名,共 调查120天。每天的10名新生儿中,增重超过3kg的人数, 可能有11种情况:1名也没有,有1名,有2名, 10名都是,如表1-1的第一列所示,这一组称为组值。,连续型数据频数(率)表和频数(率)图。,例:表1-2列出了某农场在做“三尺三”提纯时所调查的100个数据,试做其频数(率)表和频数(率)图,1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx(R=170-141=30) 2、决定划分的组数,分组数是由数据的多少决定 的,美国统计学家斯特吉斯提出分组数公式: n=1+3.322lgN(式中为样本数)。 3、根据极差与决定划分的组数、确定组限。 (30/103) 4、在频数表中列出全部组限、组界及中值。 5、将原始数据表中数据,填入频数表中,计算出 每组的频数和频率。,总结:编制连续型数据的频数表的步骤 1. 从原始的数据表中找出最大值和最小值,并求出极差 2. 决定划分的组数 3. 根据极差和决定划分的组数,确定组限 4. 在频数表中列出全部组限、组界和种值 5.将原始数据表中数据,用唱票的方式填入频数表中,计算出各组的频数的频率,次数分布图,柱形图 多边形图(包括饼图、曲线图、折线图、直方图等),1.3 样本的几个特整数,1 平均数 2 标准差 3 偏斜度和峭度,1 平均数,平均数的意义 平均数的种类 算术平均数的计算方法 算术平均数的重要特性,一、平均数的意义: 平均数是数据的代表值,表示资料中观察值的中心位置。 二、平均数的种类 算术平均数 为所有测量值之和除以变量值个数(即,样本含量Sample Size)。反映一组呈对称分布的变量值在数量上的平均水平。 中数:又名中位数,是指将所得资料从大到小排序,居中间位置的观察值称为中数,记作Md。 众数 :在一个变数的观察值中,出现资料最多的观察值称为众数。 几何平均数,三、算术平均数的计算方法 直接法 加权法,举例1:试计算1,3,7,9的均数?,例2:试计算1,3,3,7,7,9,9,9的均数?,加权法,中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。,11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60,存活天数 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60 秩次 1 2 3 4 5 6 7 8 9 10 11,中位数的计算,公式: n为奇数时 n为偶数时,例 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19 天,求其中位数。,众数(Mode) 是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。 例 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,55,55,55,55 ,61,61,61,61,62,62,65 试求众数。,2 变 异数,变异数:用来反映平均数代表性的优劣。常用的有极差、方差、标准差和变异系数。,一、极差:极差又称全距。是资料中最大观察值与最小观察值的差数。用“R”来表示。我们举个例子来说明。例如调查两个不同品种的富士苹果的维生素含量,每品种计10个数,经过整理其数字为,甲 乙,样本平方和 总体平方和,二、方差与标准差,用观察值数目来除平方和,得到平均平方和,简称均方或方差,即离均差的平方和,样本均方用s2来表示,定义为,由于方差的单位是原始数据单位的平方,不能直接地指出某个数小x与平均数之间的偏离到什么程度,因此我们采用标准差s作标准衡量x与平均数间的偏离程度。标准差一般记作SD。,标准差的计算方法,直接法:分四个步骤:先求出 ,再求出各个 和各个 ,求和得 ,即可代入公式求得标准差。 矫正数法:矫正数记为C且 所以 矫正数法用的最多,最普遍,一般用 于非频数资料的计算。,1.3.3 偏斜度和峭度,偏斜度:度量数据围绕众数呈不对称的程度。 一般用三阶中心矩m3 m3=0,说明曲线对称于平均数,此时平均数等于中位数也等于众数。 m3 0,称为正偏,此时众数小于平均数。见图A。 m30,称为负偏,此时平均数小于众数,见图B图,用三阶中心距的两个缺陷: 单位为物理学单位的立方,因此不同类型数据之间不易进行比较 没有计算数据变异的性质,因此没有一个绝对的含义。 标准化的三阶中心距g1 其判断方法与m3是一样的。,峭度g2 : 也是用来度量曲线形状,其值为四阶中心 距m4与二阶中心距m2的平方的商再减去: g=0,认为数据是正态的; g0,说明曲线过于陡峭; g 200、判断峭度g时,样本含量至少要1000。,三、变异系数:反映不同资料的整齐度。比较两个样本,单位不同,均数不同,不能用标准差直接比较。这时可计算样本的标准差对均数的商,称之为变异系数。,变异系数(coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。由于变异系数是一个不带单位的纯
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 科技园区场地合作经营与管理协议书范本
- 餐厅装修及设备采购安装监理合同
- 软件开发采购合同知识产权保护及售后服务协议
- 书法创新活动方案
- 义捐活动策划方案
- 副科干部宿舍管理制度
- 农林牧废弃物综合利用项目环境影响评价报告
- 儿科护理急性感染性喉炎
- 学校联合教研管理制度
- 厨房过失扣分管理制度
- 火锅店员工合同协议书
- 企业如何通过激励措施促进员工参与数字化转型
- 雇人包工免责协议书
- 船舶应急部署表及船员应变卡
- 2025年下半年山东能源集团权属企业内蒙古荣信化工限公司社会招聘易考易错模拟试题(共500题)试卷后附参考答案
- 陕西邮政校招笔试题及答案
- 山东省济南市2025届高三三模历史试卷(含答案)
- 小学语文大单元整体教学设计讲座
- 风力发电场调试规程
- 2024-2025学年广东省深圳市高一数学下学期7月期末考试(附答案)
- 血管内导管相关性血流感染预防与诊治指南(2025)解读课件
评论
0/150
提交评论