




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
幻灯片1第一章 统计数据的 收集与整理幻灯片2本 章 内 容第一节 总体与样本第二节 数据类型及频数(率)分布第三节 样本的几个特征数幻灯片3第一节 总体与样本不齐性一、统计数据的特点 形成不齐性的原因:生物个体间存在着广泛的变异(variation),变异是自然界存在的客观规律,由变异性决定了统计数据的不齐性。形成变异的原因:生物体的遗传因素、环境因素、发育噪音。幻灯片4二、总体(population)总体:依据研究目的确定的同质研究对象的全体(集合)。分为有限总体和无限总体。 有限总体:总体中所包含的个体数目是有限的。无限总体:总体中所包含的个体数目是无限的或近似于无限的。个体(individual):构成总体的每个成员称为个体。幻灯片5三、样本(sample)样本:总体的一部分,即从总体中随机抽取的部分研究对象所组成的小的集合,称为样本。总体与样本样本含量(sample size): 样本内包含的个体数目。幻灯片6四、抽样(sampling)抽样:从总体中获得样本的过程。分为放回式抽样和非放回式抽样。抽样的目的:得到样本,然后对样本进行研究,以推断样本所处总体的特性。对抽样得到的样本的要求:得到的样本应该是总体的缩影,应具有可靠性和代表性。抽样的操作:进行随机抽样。幻灯片7随机抽样(random sampling):在抽取样本时,总体中每个个体被抽中的机会均等的抽样方式。随机抽样的方法:抽签、拈阄、使用随机数字表等。随机数字表的使用:附表1 随机数字表。幻灯片8第二节 数据类型及频数(率)分布一、统计数据的收集途经 1. 调查记录2. 实验记录3. 常规保存数据4. 其他幻灯片9二、统计数据的预处理1、审核 2、筛选 3、简单排序幻灯片10三、统计数据的类型1、连续型数据连续型数据:与某种标准做比较所得到的数据,又称度量数据,观察数据有度量衡单位,如长度、时间、重量等。特性:提高精确度后会出现小数。分析方法:采用变量的方法进行分析。幻灯片112、离散型数据离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,观察数据之间有缝隙,通常没有度量衡单位,如班级的学生人数、作物的品种数等。特性:数据是整数,不能进一步提高精确度。分析方法:采用属性的方法进行分析。幻灯片12四、统计数据的显示 频数(率)分布表和图的编绘1、概念频数:某一类别事物(由组值或组界来表示)的实际发生数称为频数。频率:某一类别事物(由组值或组界来表示)的实际发生数与总数的比率,称为频率。频数(率)分布:由把频数(率)按类别(组值或组界)的顺序以表和图的形式排列、编绘出来而得到。 可将数据编绘成频数(率)表或频数(率)图,依据数据的频数(率)分布研究数据变化规律。幻灯片132、离散型数据频数(率)表和图的编绘步骤:a 确定组值 (类别的特征值)b 频数(率)的统计、计算c 填表、绘图幻灯片14【例1.1】 调查每天出生的10名新生儿中,体重超过3kg的人数,以了解新生儿体重状况。共调查120d,对结果加以整理,列表绘图。组值(体重超过3kg的人数)频数计算(统计结果)频数频率00012121939341031200.0000.0000.0000.0080.0170.1000.1580.3250.2830.0830.0250.999012345678910总计一丁正正丁正正正丁丁正正正正正正正丁丁正正正正正正丁丁正正三幻灯片153、连续型数据频数(率)表和图的编绘a 求出极差 R=max x - min xb 划分组数,确定组间距c 确定组限(上、下限)d 列出组限、组界、中值e 频数(率)的统计、计算f 填表、绘图(直方图、多边形图、累积频数图) 步骤:直方图:以组界和频数为边所做的连续矩形图。多边形图:以中值为横坐标,频数为纵坐标,所绘的连续型折线图。累积频数图:以中值为横坐标,累积频数为纵坐标,所绘的S形连续型折线图。幻灯片16【例1.2】 某农场在做高粱“三尺三”提纯时调查了100株高粱的株高,结果如下。对结果加以整理,编绘出频数分布表和图。155159150159157161158148164158153158150161149159155163155166159153160156153161153156156154155153156141153156151163158154150144160156155162157154164157159156155145162151156158148167157150160156154152153152164157159157151153152154147163154159151160157158162157158158157170152150155161155162155154165158幻灯片17组限/cm组界/cm中值频数计算频数频率累积频数141, 143144, 146147, 149150, 152153, 155156, 158159, 161162, 164165, 167168, 170总计140.5143.5146.5149.5152.5155.5158.5161.5164.5167.51421451481511541571601631661691241323281510311000.010.020.040.130.230.280.150.100.030.011.00一丁丁丁正正三正正正正三正正正正正三正正正正正三一137204371869699100幻灯片184、离散型与连续型频数(率)分布表的比较 离散型 连续型数据特点 孤立的数值 数据在区间内 组值 有 无 组限 无 有 组界 无 有 中值 无 有幻灯片19五、研究频数(率)分布的意义1、显示出数据的集中情况2、显示出数据的变异情况3、显示出图形形状4、显示出数据的不规则情况幻灯片20六、频数(率)分布的不恒定性l 用随机抽样的方法,从同一总体中抽取多个含量相同的样本,它们的频数(率)分布不完全相同,有时差距还很大,频数(率)分布的这一特性称为频数(率)分布的不恒定性。l 频数(率)分布的不恒定性是由于样本分布的不恒定性造成的。l 由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有所不同。幻灯片21第三节 样本的几个特征数样本特征数:定量描述样本频率分布特征的量。数据集中点的度量平均数数据变异程度的度量标准差数据分布的对称程度的度量偏斜度数据分布的陡峭程度的度量峭度 幻灯片22一、平均数(average)1、平均数的种类 算术平均数 简称平均数(mean),是样本中所有测量值之和除以样本含量所得到的值,是一组数据的重心所在。直接计算公式: 幻灯片23 中位数 位于有序数列中点上的数;或者在累积频数图上,一半总频数位置上的数值。 众数在频数图上频数最高的组值或中值。幻灯片242、平均数的计算 离散型数据频数资料平均数的计算y=组值,f=频数,N=总频数,k=组数,fy代表f和y相乘。 幻灯片25【例1.3】 调查每天出生的10名新生儿中体重超过3kg的人数,以了解新生儿体重状况,共调查120d。计算平均每天10个新生儿中有几个新生儿体重超过3kg。解:列出计算表:计算:组值 y(体重超过3kg的人数)频数 ffy012345678910总计000121219393410312000038601142732729030850幻灯片26幻灯片27幻灯片28幻灯片29幻灯片30幻灯片31【例1.5】 从两个小区分别随机抽取20株小麦,测其单穗粒数,结果如下表,计算其标准差。小区号单穗粒数26252627282421252524232730272227232628232926302423282624212529232627252522252828幻灯片32解:计算:Y10-2-210-11321-231022-2-107Y21044101194149104441053Y267662552952967662557667678472967652978467662572972952957662512903Y283029212224272625252122302928252724232851425.70Y278490084144148457672967662562544148490084178462572957652978413374列出计算表幻灯片33 离散型数据频数资料标准差的计算f=频数, y=组值, N=总频数, k=组数。 幻灯片34【例1.6】 调查每天出生的10名新生儿中体重超过3kg的人数,以了解新生儿体重状况,共调查120d。计算平均每天10个新生儿中有几个新生儿体重超过3kg,并计算标准差。解:列出计算表:计算:yy2ffyfy2012345678910总计0149162536496481100000121219393410312000038601142732729030850000932300684191121768103006222幻灯片35 连续型数据频数资料标准差的计算f=频数, d=编码后的中值, k=组数,n=样本含量。幻灯片36【例1.7】 某农场在做高粱“三尺三”提纯时调查了100株高粱的株高,根据频数表计算株高平均数,并计算标准差。解:列出计算表:计算:mdd2ffdfd2142145148151154157160163166169总计-15-12-9-6-3036912-1522514481369093681144765124132328151031100-15-24-36-78-69045602712-7822528832446820701353602431442394幻灯片37三、变异系数变异系数(coefficient of variation,CV):单位平均数变异
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 会议承办服务协议书8篇
- 国家事业单位招聘2025中国国土勘测规划院招聘应届毕业生拟聘人员笔试历年参考题库附带答案详解
- 奔驰车辆无偿赠与协议9篇
- 南京市2025江苏城乡建设职业学院招聘工作人员26人(第一批)笔试历年参考题库附带答案详解
- 临夏回族自治州2025年甘肃临夏某部招聘民兵教练员笔试历年参考题库附带答案详解
- 2025陕西陕建瑞高科技园有限公司招聘(25人)笔试参考题库附带答案详解
- 2025广东湛江经济技术开发区建设投资发展集团有限公司招聘1人笔试参考题库附带答案详解
- 2025年萍乡市工程咨询管理顾问有限责任公司招聘第一批外聘人员23人笔试参考题库附带答案详解
- 2025年烟台莱州市财金投资有限公司招聘(10人)笔试参考题库附带答案详解
- 2025年江苏昆山创业控股集团有限公司第一批人才招聘15人笔试参考题库附带答案详解
- 2024年贵州遵义市市直事业单位选调31人历年高频难、易点(公共基础测验共200题含答案解析)模拟试卷
- 《建筑基坑工程监测技术标准》(50497-2019)
- GA 1809-2022城市供水系统反恐怖防范要求
- 近效期药品登记表
- 2022年全国工会财务知识大赛参考题库精简600题(含各题型)
- 特高压交流与特高压直流输电技术特点对比分析
- 康复医学科关于无效中止康复训练的制度与流程
- GB/T 13460-2016再生橡胶通用规范
- 《矩阵论》研究生教学课件
- 中国荨麻疹诊疗指南(2022版)
- 北京市统一医疗服务收费标准
评论
0/150
提交评论