2022年统计术语_第1页
2022年统计术语_第2页
2022年统计术语_第3页
2022年统计术语_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计术语平均数mean:是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标。解答平均数应用题的关键在于确定“总数量以及和总数量对应的总份数。在统计工作中,平均数均值和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。加权平均数weighted average:将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。某集市出售一种 蔬菜相关问答:1肉牛的肥育类型有哪些?2放牧肥育指的是什么?3成年牛的肥育方法是什么?4肉牛肥育技术是什么?5犊牛肥育指的是什么?6育成牛的肥育方法有哪些优点?7舍饲肥育有哪些优点?8肉牛

2、肥育技术原理是什么?9肉牛肥育化学技术有哪些?10提高母牛繁殖率的措施有哪些?,上午每千克4元,成交200千克;下午每千克3元,成交50千克,求这种蔬菜这一天的平均价格。按照简单的算术平均:(4+3)/2=3.5(元/千克),这显然并不能正确反映这一天这种蔬菜的平均价格;正确的算法应该是:(4*200+3*50)/(200+50)=4*(200/250)+3*(50/250)=4*(4/5)+3*(1/5)=16/5+3/5=19/5=3.8(元/千克),即这一天这种蔬菜的平均价格是每千克3.8元。就是说在这个问题里,4与3在计算平均值时权重是不一样的,数4/5,1/5分别称为它们的权数,式子

3、4*(4/5)+3*(1/5)就称为它们的加权平均。权重weight:有很多成分要算平均,但是每个成分对整体的影响不同,所以有权重。离散度Dispersion标准差是反映一组数据离散程度最常用的一种量化形式,是表示准确度的重要指标。说起标准差首先得搞清楚它出现的目的。我们使用方法去检测它,但检测方法总是有误差的,所以检测值并不是其真实值。检测值与真实值之间的差距就是评价检测方法最有决定性的指标。但是真实值不得而知。因此怎样量化检测方法的准确性就成了难题。这也是临床工作质控的目的:保证每批实验结果的准确可靠。虽然样本的真实值是不可能知道的,但是每个样本总是会有一个真实值的,不管它终究是多少。可以

4、想象,一个好的检测方法,其检测值应该很严密的分散在真实值周围。如果不严密,与真实值的距离就会大,准确性当然也就不好了,不可能想象离散度大的方法,会测出准确的结果。因此,离散度是评价方法的好坏的最重要也是最根本的指标。一组数据怎样去评价和量化它的离散度,有很多种方法:极差Range:最直接也是最简单的检测离散度的方法。是指一组测量值内最大值与最小值之差,又称范围误差或全距,以R表示。 它是标志值变动的最大范围,它是测定标志变动的最简单的指标。 移动极差Moving Range是其中的一种。比方比赛中去掉最高最低分就是极差的具体应用。离均差平方和SS,sum of squares of devia

5、tion from mean:由于误差的不可控性,因此只由两个数据来评判一组数据是不科学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差我们叫它离均差加起来就能反映出一个准确的离散程度。和越大离散度也就越大。但是由于偶然误差是成正态分布的,离均差有正有负,对于大样本离均差的代数和为零的。为了防止正负问题,在数学有上有两种方法:一种是取绝对值,也就是常说的离均差绝对值之和。而为了防止符号问题,数学上最常用的是另一种方法平方,这样就都成了非负数。因此,离均差的平方和成了评价离散度一个指标。方差variance, S2:s2=(x1-x)2+(

6、x2-x)2+.(xn-x)2/(n) x为平均数由于离均差的平方和与样本个数有关,只能反响一样样本的离散度,而实际工作中做比拟很难做到一样的样本,因此为了消除样本个数的影响,增加可比性,将离均差的平方和求平均值,这就是我们所说的方差成了评价离散度的较好指标。方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望即均值之间的偏离程度。统计中的方差样本方差是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。样本量越大越能反映真实的情况,而算术平均值却完全忽略了这个问题,对此统计学上早有考虑,在统计学中

7、样本的均差多是除以自由度n-1,它的意思是样本能自由选择的程度。中选到只剩一个时,它不可能再有自由了,所以自由度是n-1。协方差Covariance:在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是一样的情况。协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。如果X与Y是统计独立的,那么

8、二者之间的协方差就是0,因为两个独立的随机变量满足EXY=EXEY。但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。协方差Cov(X,Y)的度量单位是X的协方差乘以Y的协方差。而取决于协方差的相关性,是一个衡量线性独立的无量纲的数。协方差为0的两个随机变量称为是不相关的。标准差Standard Deviation: N=n-1由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数

9、一样的两组数据,标准差未必一样。在统计学中样本的均差多是除以自由度n-1,它是意思是样本能自由选择的程度。中选到只剩一个时,它不可能再有自由了,所以自由度是n-1。变异系数Coefficient of Variance,CV:标准差能很客观准确的反映一组数据的离散程度,但是对于不同的工程,或同一工程不同的样本,标准差就缺乏可比性了,因此对于方法学评价来说又引入了变异系数CV。标准误standard error:表示的是抽样的误差。因为从一个总体中可以抽取出无数多种样本,每一个样本的数据都是对总体的数据的估计。标准误代表的就是当前的样本对总体数据的估计,标准误代表的就是样本均数与总体均数的相对误

10、差。标准误是由样本的标准差除以样本容量的开平方来计算的。从这里可以看到,标准误更大的是受到样本容量的影响。样本容量越大,标准误越小,那么抽样误差就越小,就说明所抽取的样本能够较好地代表总体。一个正态分布的总体,抽取n个作为样本,可以得到样本平均值,用样本均值估计总体均值需要考虑样本均值的方差或标准差也就是标准误。公式:中位数又称中值,英语:Median:统计学中的专有名词,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两局部。对于有限的数集,可以通过把所有观察值上下排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。众数Mode:统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平众数可以不存在或多于一个。 修正定义:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用M表示。 理性理解:简单的说,就是一组数据中占比例最多的那个数。ANOVA 和 T-test的区别是什么?ANOVA 使用的是F统计量,统计量是组间方差与组内方差之比,多用于组数超过两组的情形。T-test使用的是 t 统计量,统计量是均值之差与加权平均标准差之比,用于两组同/异方差的数据。内容总结1统计术语平均数mean:是表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论