版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章次数分布和平均、变异数、第一节整体及其样本第二节次数分布第三节平均第四节变异数第五节理论整体(集团)的平均和标准偏差、再学习、1、生物统计修订学的定义2、生物统计修订学的主要内容3、生物统计修订学的一些用语、今天学习的主要内容1 .一些新的生物统计修订学名词2 修订量资料的整理4,修订量资料的整理5,次数分布表和次数分布图的制作和用途,第一节整体和其样本整体(population ) -由具有共同性质的个体构成的集团.有限整体-整体中包含的个体数无限多.无限整体-由有限个体构成的整体.观察值(observation )生物样本(sample ) -从全体抽取几个个体的集合称为样本(sam
2、ple )。 从随机样本-整体随机提取的样本将通过测定随机样本容量-样本中包含的个体数称为样本容量或样本含量的整体中的各个个体而获得的样本特征数称为残奥仪表。 第二节次数分布,一,试验资料的性质和分类二,次数分布表三,次数分布图,一,试验资料的性质和分类,(一)数量性状资料(二)质量性状资料,(一)数量性状资料2 .修正量数据(连续性数据),用修正量平衡工具直接测定得到的数据(continuous varius ) 在集成校正学中,数据也称为变量,因此校正预测数据也称为连续性变量,计数数据也称为不连续性或断续性数据。 (二)质量性状资料质量性状(qualitative trait )是指可观察
3、但不能测定的形状的属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。 为了从这种性状获得数量数据,集成校正次数方法可以采用这两种方法:在给定整体或样本内校正具有与某个个性状的个体的数量不同的性状的个体的数量,并按类别对其次数或相对次数进行计数。 2 .对分法赋予各种性状相对数量的方法,二、次数分布表,(一)间断性变量数据的整理(二)连续性变量数据的整理(三)属性变量数据的整理,(一)间断性变量数据的整理,以现在某小麦品种的每穗的穗数为例,表3.1每100穗的穗小穗数从表3.2每100穗的穗小穗数的次数分布表可以看出,从表3.2可以初步整理出杂乱的原始资料表3.1的山,可以看出资
4、料的大致情况,而且整理的资料也更容易分析。 上述资料为断续变量资料,每穗的小穗数在1520的范围内变动,所有观察值按每穗的小穗数多少分类,分为修正6组,组与组之差为1小穗,称为组距离。 由此得到表3.2形式的次数分布表。 (2)连续性变量数据的整理,以表3.4的水稻试验100行的产量为例,说明整理方法。 表3.4 140行的水稻产量(单位:克),具体的顺序:1.数据排序(sort ),首先按对数数据从小到大的顺序(升序)或者从大到小的顺序(降序)排列。 2 .获得所有极差数据中的最大观察值和最小观察值之差的数目,其被称为极差,(极差)是整个样本的变异幅度。从表3.4可以看出,最大观察值为254
5、g,最小观察值为75g,最差的为25475=179g。 3 .确定组数和“组距离”(class interval )可分为极差的组,各组的距离相等,称为组距离。 在确定组数和组距离时,可反映(1)观察值的个数的多少(2)极差的大小(3)校正计算容易(4)资料的原样的姿态等。 可以通过参照表3.5来确定样本的大小(即,样本中所包括的观察值的数量的多少)和组的数量的多少之间的关系。 表3.5样本容量和组数的关系,确定组数后,还必须确定组距离。 组距=极差/组数。 以表3.4中的140行水稻产量为例,样品内观察值的个数为140,查找表3.5分为816组,假设分为12组,则组距离为179/12=14.
6、9g,为了便于分组,将15g分为组距离和4、限制选择组(class limit )决定组中值(class value )以表3.4中的140行水稻产量为例,所选择的第一组的中值为75g,与最小观察值75g相等的第二组的中值为75 15=90g,类推选定各组的中点值,可以求出各组的组限制。 每个组有两个组限制,数值小的称为下限(lower limit ),数值大的称为上限(upper limit )。 在上述资料中,第一组的下限是该组的中点值减去1/2组的距离的75(15/2)=67.5g,上限是中点值加上1/2组的距离的75 (15/2)=82.5g。 因此,第一组限制为67.582.5g。
7、用这种方法修正那个侑各组的组限制,就可以写出组数列。 5 .分组使得能够按照数列中的每一组对原始资料的每个观察值分组并且能够按照原始资料中的观察值的顺序逐一地对数值分组。 当所有观察值均被分组时,可确定各组的次数并创建次数分布表。 例如,在表3.4中的第一观察值177应当属于在表3.6中的第八组,选出组限制是172.5187.5,而第二观察值149属于第六组,并且组限制是142.5157.5。 通过依次组合140个观察值,能够制作140行的水稻产量的频数分布表(表3.6 )。 表3.6 140行的水稻的次数分布,注:上述分为12组,但由于第一组的中点值接近最小观察值,因此第一组的下限比最小观察
8、值小,实际上由于增加了大致1/2组,最后组的中点值也接近最大值,进而(3)属性变量的数据的整理、属性变量的数据也能够以类似次数分布的方法进行整理。 整理前,将资料按各种质量性状分类,分类数等于组数。 然后,根据各个个体在品质属性上的具体表现,分别进行对应的分组,可以得到属性分布的规则性的认识。 例如,某水稻杂种第二代株米粒性状的分离情况,归属于表3.7。 表3.7水稻杂种两代植株米粒性状的分离状况、三、次数分布图、(一)方柱图(二)多边形图(三)条形图(四)圆形图、(一)方柱图(histoot )方柱图、表3.6的140行水稻产量的次数分布表为例进行说明。 即棱柱的次数分布图3.1。 (2)多
9、边形图、多边形图也是表示连续性变量数据的一般方法,能够在同一图表上对2个以上的数据进行比较。 以尚有140行水稻产量的次数分布为例,制作的图形为次数多边形图(图3.2 )。 (注意:横轴的数字和方条图的不同),(3)条形图、条形图(bar )适用于表示这些变量的次数分布状况的间歇变量和属性变量数据。 其横轴表示断续的中点值或分类性状,纵轴表示次数。 现以表3.7水稻杂种第二代米粒性状的分离情况为例,可制作水稻杂种第二代植株的4种米粒性状分离情况柱状图(3.3 )。 图3.3水稻F2代米粒性状分离条形图、(4)圆形图、圆形图(pie ),为了表示这些变量中的各种属性或各种断续性数据的观察值相对于
10、总观察个数的比例,被应用于断续性变量和属性变量数据。在图3.4中,白米糯米在F2组中占8%,白米非糯米、红米糯米和红米非糯米分别占17%、21%、54%。频率分布,第一章了解频率和概率,一个样本资料可以根据次数分布修正该频率分布,根据频率分布估计该样本所在的整体概率分布。 例如,根据140行水稻的频数分布表修正该频数分布表,根据该频数分布表推定该品种的水稻产量达到112.5-202.5的概率是多少,在工作中我们面临的问题基本上是根据样本推定整体状况。 140行水稻频度分布表组限制组中的值(y )次数(f ) 频率累计频率67.582.5752.014.01482.597.59070.0510.
11、0510.06597.5112.510570.051112.5127.512013.093.209127.5142.515020 . 518021.15.801187.5202.519513.0930.894202.5520.979232.5247.52402.0140.993247.5262.52551.007修订(n ) 140,阶数分布表和阶数分布图的、小结、1、一些新的生物统计学名词变量(修正量资料、修正量资料残奥仪表和修正量) 2、资料分类3、修正量资料整理4、修正量资料整理5、频率分布表和频率分布图的制作和用途、学习问题、1、修正量资料是什么、修正量资料是? 2 .修订量资料的整理
12、顺序是什么? 3 .次数分布表(图)的用途主要是什么? 4 .对某绿化苗木反复抽取100株,测定苗高的资料如下(单位: cm):127、118、121、113、145、125、87、94、118、111、111 87、88、105、115、134 对108、129、133 86、113、97、122、86、94、118、109、84、117、112、125、94、79、93、112、94样本数据进行分组和整理,以列出频率分布的表并创建样本频率分布图拜托了很多联系。 李春爱办事处:周山校区行政楼112房间电话: 4283386 (处理) 4282096 (住宅)见,复习
13、,1,一些新的生物统计修订名词2,资料分类3,修订量资料整理4,修订量资料整理5,次数分布表和次数分布图,今天学习一、平均数的含义和种类二、算术平均数的校正方法三、算术平均数的重要特性四、整体平均数、一、平均数的含义和种类、平均数的含义:平均数(average )是资料的代表值,指出了资料中观察值的中心位置。 表示可以比较一个数据和另一个数据。 平均数的种类: (1)算术平均数一个数量的资料的各观察值的总和除以观察值的个数而得到的商数,记作算术平均数(arithmetic mean )。 由于其应用广泛,常简称为平均或均数(mean )。 均数的大小由样品的各观察值决定。 (2)将中间数据中的
14、所有观察值从大到小排序,将位于中间位置的观察值称为中间数(median ),并且设置Md。 如果观察值的个数为偶数,则将中间的两个观察值的算术平均设为中数。(3)将众数资料中最常见的一数或次数最多的一组中点值称为众数(MOde ),设为mo。 用于棉花纤维检验的本体长度为众数。 (4)若存在几何平均n个观测值,则将其积n次幂,成为几何平均(geometric mean ),用g表示。 (31 )、二、算术平均数的校正方法可以直接校正由于样本数小,即包含在资料中的观察值的个数少的平均数。 假定包含n个观察值的样本是一个并且相应观察值是y1、y2、y3、yn,则可以按照下式校正算术平均:(32 )当样本较大且组合在一起时(如表3.6中),可以使用加权法来校正算术平均,例如3.1水平湘低早4号的5个小区产量分别为20.0、19.0、21.0、17.5、18.5kg,求出了该品种的小区平均产量。 例3.2用表3.6资料修订了平均每行水稻产量。 采用直接法,=157.47。 因此,两者的结果非常接近。 (32 )具有三、算术平均数的重要特性,其中,(1)每个样本的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年大学第四学年(药学)药物制剂稳定性测试题及答案
- 2026年大学第四学年(康复管理)康复治疗方案制定测试题及答案
- 浙江省鄞州区重点达标名校2026届初三下学期9月初态测试数学试题含解析
- 山东省济南市中学2025-2026学年中考英语试题(课标版)押题卷解析含解析
- 山东省济南市市中区重点达标名校2026年初三下第三次月考综合试卷含解析
- 重庆市重庆一中2026年初三3月联合质量检测试题化学试题试卷含解析
- 泰州市智堡实验校2025-2026学年初三年级英语试题二模试题含解析
- 温州市达标名校2026年全国中考统一考试模拟试题(二)物理试题含解析
- 浙江省绍兴市皋埠镇中学2025-2026学年初三年级一模语文试题含解析
- 2026年中国避债蛾市场数据研究及竞争策略分析报告
- 2026年学生入团摸底考试题库及参考答案
- 2026年温州职业技术学院单招综合素质考试题库有答案详细解析
- 会务接待人员奖惩制度
- 2025年公共营养师三级(理论+技能)考试试题+答案
- 国航机务系统AMECO工程师岗位校园招聘笔试题库2026
- 微流控芯片分离技术-洞察与解读
- AI医疗治理白皮书(2026版)
- 亚马逊运营奖惩管理制度
- 小学电梯安全知识课件
- 雨课堂学堂在线学堂云《研究生学术规范与学术诚信》单元测试考核答案
- 2026年武汉警官职业学院单招职业技能考试题库及参考答案详解一套
评论
0/150
提交评论