《平均数和标准差》PPT课件.ppt_第1页
《平均数和标准差》PPT课件.ppt_第2页
《平均数和标准差》PPT课件.ppt_第3页
《平均数和标准差》PPT课件.ppt_第4页
《平均数和标准差》PPT课件.ppt_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/9/7,1,第二章 平均数和标准差,2019/9/7,2,2.1 总体及其样本,总体(population):具有相同性质的个体组成的集团。 无限总体(infinite population):总体中包含的个体数目有无穷多个,这种总体称为无限总体。,2019/9/7,3,有限总体(finite population):总体中包含的个体数目有限,这种总体称为有限总体。 观察值(observation):每一个体的某一个性状、特性的测定数值叫做观察值。 变数(variable):观察值集合起来,称为变数。,2019/9/7,4,变量(variate):变数中每一成员称为变量。 例如:测定8个人的身高,得到以下数据: 160、167、175、180、158、169、173、170、,观察值,变数,参数(parameter):由总体的全部观察值而算得的总体特征数,如总体平均数,称为参数, , 。,2019/9/7,5,样本(sample):从总体中抽出的一部分个体的集合。 统计数(statistic):测定样本中的各个体而得到的样本特征数,如平均数。 估计值(estimate):统计数是总体相应参数的估计值。 随机样本(random sample):从总体中随机抽取的样本。 样本容量(sample size):样本中包含的个体数,用n表示。,2019/9/7,6,2.2 平均数,2.2.1 平均数的意义和种类,2.2.2 算术平均数的计算方法,2019/9/7,7,2.2.1 平均数的意义和种类,一、平均数的意义 平均数(average) 指在一组数据中所有数据之和再除以数据的个数。平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。 1、算术平均数(arithmetic mean):一个数量资料中各个观察值的总和除以观察值的个数所得的商,记作,2019/9/7,8,2、中数(median):将资料内所有观察值从大到小排列,居中间位置的观察值称为中数,记作Md 例如: 1、2、3、4、5 中数是3 1、2、3、4、5、6 中数是: (3+4)/2=3.5,2019/9/7,9,2.2.2 算术平均数的计算方法,1、直接以观察值进行计算,2、若样本较大,且已分组,可采用加权法计算算术平均数,即以组中值代表该组出现的观察值以计算平均数。,2019/9/7,10,利用140行水稻产量资料计算每行平均产量,若采用直接法进行计算,平均数等于157.47。因此,两者的结果十分接近。,2019/9/7,11,2.2.4 总体平均数,总体平均数用来表示,其计算公式为:,从公式中可以看出,除非是有限总体,否则总体平均数是无法通过计算得到的。,2019/9/7,12,2.3 变异数,2.3.1 极差,2.3.2 方差,2019/9/7,13,代表值只是反映了数值资料的一个方面集中程度的特征,资料的另一方面和的特征是变异程度。请看下面的例子: A组资料:3、4、5、6、7 平均数为:5 B组资料:1、3、5、7、9 平均数仍为:5 这里的平均数5对于A组资料的代表性好?还是对于B组资料的代表性好?,2019/9/7,14,明确了数据的集中程度(平均数)是远远不够的,还需要进一步说明数据的变异程度。只有通过变异程度的描述,才知道代表值的代表性。 表示数据变异特征的数值叫变异数。常用的变异数有:极差、方差、标准差、变异系数等。,2019/9/7,15,2.3.1 极差,极差(range),又称全距,记为R,是资料中最大值与最小值之差。 例如:A组资料的极差 RA734 B组资料的极差 RB918 极差的计算简单,但是它只是两个极端数据决定的,没有地方充分利用资料的全部信息,而且易于受到资料中不正常的极端值的影响。所以用它来代表整个样本的变异度是有缺陷的。,2019/9/7,16,2.3.2 方差,由于算术平均数的可信度比较高,我们设想用观察值与算术平均数之间的差异来度量一组观察值的变异性,但是这又遇到 的困难。为了解决这一矛盾,将离均差平方后再相加就不再为0。从这个式子知道 愈大,则资料的变异程度也就愈大。 称为离均差的平方和(简称平方和),记为SS(Sum Of Square)。,2019/9/7,17,样本的平方和为,总体的平方和为,由于各个样本所包含的观察值数目不同,为便于比较,用观察值数目除平方和,得到平均平方和,简称均方(mean square)或方差(variance)。 样本均方用s2表示,定义为:,它是总体方差(2)无偏估计值。,2019/9/7,18,2.3.3 标准差,一、标准差的定义 标准差是方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。 样本标准差的计算公式为:,总体标准差用表示:,2019/9/7,19,二、自由度的意义 自由度(degree of freedom)最早是一个物理学上的名词,它表示一个质点在空间运动的自由程度。统计学借此来反映一批变量的约束条件。 例如一个有5个观察值的样本,因为受到统计数 的约束,在5个离均差中,只有4个数值可以在一定范围内自由变动取值,而第五个离均差必须满足 这一限制条件。,2019/9/7,20,自由度记作df,具体数值用表示 一般,样本自由度等于观察值个数(n)减去约束条件的个数(k),即 (df) n k。,2019/9/7,21,2019/9/7,22,标准差(sd,standarddeviation)和标准误(se or sem,standard error of mean) 完全独立重复试验也就是biological repeat 测试结果用se表示误差大小,而technique repeat用sd表示误差大小. 举个例子可能就更清楚,比如简单的测定某种细胞的生长量,每个生长周期平行处理3个,这3个平行处理的误差反映的是某一个特点生长周期及测定时的误差为technique repeat,而不同生长周期的同样处理的测定结果就是biological repeat.,2019/9/7,23,平均值和标准误是衡量平均值的波动范围,而平均值和标准差是衡量原始数据的波动范围,如果你是比较2组间的数据有没有差异,比如生物实验中常用的空白组和给药组的话,因为标准误比标准差要小,那么用平均值和标准误组合一般好看点,也常被文献来用(但注意:此时平均值和标准差也可以标示,但如上所述,表述的目的就不一样了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论