频数分布表课件_第1页
频数分布表课件_第2页
频数分布表课件_第3页
频数分布表课件_第4页
频数分布表课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量资料的分类:1.离散型资料(discretedata):是指变量取值可以一一列举的资料。例如,每个育龄妇女现有的子女数。2.连续型资料(continuitydata):是指变量取值不能一一列举(即变量取值为一定范围内的任意值)的资料。例如,人体的身高(cm)、体重(kg)等。第一页第二页,共41页。第一节频数分布表和频数分布图频数表适用于:观察例数较多的计量资料。一、频数分布表:

频数(frequency):不同组别内的观察值个数称为频数,表示观察值在各组内出现的频繁程度。

频数表:将分组标志和相应的频数列表,即为频数分布表,简称频数表。

第二页第三页,共41页。(一)离散型计量资料的频数表见P7(二)连续型计量资料的频数表频数表编制:

1.求全距(极差):

R=MAX-MIN

2.定组距和组段,一般8~15组为宜组距=[R/10]组段=R÷组距

组中值=(本组段下限+下组段下限)÷2

第三页第四页,共41页。第一组段应包括MIN最末组段应包括MAX且同时写出下限和上限每一组段数值范围:下限≤X<上限下限(lowerlimit):每个组段的起点称为该组的下限。上限(upperlimit):每个组段的终点称为该组的上限。

3.列表划记第四页第五页,共41页。频数分布表的用途(1)是大样本数据常用的表达方式。(2)便于观察数据的分布类型(以便选择相应的统计指标和分析方法)。对称分布:集中位置在中间。左右两侧频数基本对称。偏态分布正偏态分布:集中位置偏向数值较小的一侧。负偏态分布:集中位置偏向数值较大的一侧。第五页第六页,共41页。(3)便于发现资料中的可疑值(4)当n足够大时,以f

P的估计值,便于进一步计算统计指标和进行统计分析。二、频数分布图直方图:适合描述连续型资料的频数分布。第六页第七页,共41页。第七页第八页,共41页。第八页第九页,共41页。第二节计量资料集中趋势的描述平均数(average):是一类描述计量资料集中位置或平均水平的统计指标。常用的平均数——算术平均数、几何均数、中位数第九页第十页,共41页。一、算术均数算术均数简称均数(mean),描述一组同质资料的平均水平。总体均数:样本均数:(一)计算方法

1.直接法:适用于样本量较小的计量资料。第十页第十一页,共41页。2.加权法:适用于样本量较大的计量资料。(二)均数的特性1.各观察值与均数之差(离均差)的总和等于零,即第十一页第十二页,共41页。2.各观察值的离均差平方和最小,即(三)均数的应用1.均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。2.均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。

第十二页第十三页,共41页。二、几何均数(geometricmean)(一)计算方法

1.直接法:适用于样本量较小的计量资料。或

第十三页第十四页,共41页。2.加权法:适用于样本量较大的计量资料,如频数表资料。第十四页第十五页,共41页。(二)几何均数的应用注意事项

1.几何均数常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。2.观察值中若有0或负值,则不宜直接使用几何均数。3.观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。第十五页第十六页,共41页。三、中位数(median)中位数是将一组观察值按大小顺序排列后,位次居中的观察值。(一)计算方法

1.直接法:适用于样本量较小的计量资料。当为奇数时

当为偶数时

第十六页第十七页,共41页。2.频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。

第十七页第十八页,共41页。(二)中位数的应用注意事项1.中位数可用于各种分布的资料。2.中位数不受极端值的影响,因此,实际工作中主要用于:(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料第十八页第十九页,共41页。百分位数1.定义:百分位数(percentile)是指将观察值从小到大排列后处于第x百分位置上的数值。用符号表示为,它是个位置指标。2.计算方法:

第十九页第二十页,共41页。

PX

X%(100-X)%第二十页第二十一页,共41页。8010012029.81%64.40%第二十一页第二十二页,共41页。第三节计量资料离散趋势

的描述第二十二页第二十三页,共41页。衡量变异程度(或离散程度)的指标分类:(按间距)—极差(R)和四分位数间距(Q)(按平均差距)—离均差平方和(SS)、方差(S2)、标准差(S)和变异系数(CV)第二十三页第二十四页,共41页。公式:R=MAX-MIN性质:R大(小)变异度大(小)

一、极差和四分位数间距(一)极差(全距)(range)第二十四页第二十五页,共41页。应用:适用于任何分布的计量资料(端点无确切值者除外)优点:简单明了,应用广泛,如用于说明传染病、食物中毒等的最短、最长潜伏期等。

第二十五页第二十六页,共41页。缺点:a.除MAX和MIN外,不能反映组内其它数据变异度。b.极差抽样误差大,受两个极端值影响,不够稳定,通常只用于资料的粗略分析和小样本数据。第二十六页第二十七页,共41页。X=M=4例1:甲:14447乙:44444

R=6R=0第二十七页第二十八页,共41页。例2:A26℃A2℃BB50℃

X=26℃第二十八页第二十九页,共41页。X=M=6例3:甲:246810

乙:256710R=8第二十九页第三十页,共41页。(二)四分位数间距(quartile,简记为Q公式:性质:Q越大,说明数据的变异越大;反之,Q越小,说明变异越小。

应用:适用于任何分布的计量资料,计算结果较稳定,尤其适用于大样本偏态分布资料。

Q=P75-P25第三十页第三十一页,共41页。特点:比极差稳定,但仍未考虑到每个观察值的变异度,在统计分析中应用得不普遍。

第三十一页第三十二页,共41页。0P25P50P75100%第三十二页第三十三页,共41页。百分位数1.定义:百分位数(percentile)是指将观察值从小到大排列后处于第x百分位置上的数值。用符号表示为,它是个位置指标。2.计算方法:

第三十三页第三十四页,共41页。第三十四页第三十五页,共41页。(一)平均偏差(meandifference,简记为M.D)公式:平均偏差=

二、离均差平方和、方差、标准差第三十五页第三十六页,共41页。应用:平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大的限制,实际中很少使用。

第三十六页第三十七页,共41页。(二)离均差平方和(SS)

公式:SS=

第三十七页第三十八页,共41页。(三)方差(variance),方差有时也表示为MS方差计算公式:(1)总体方差:=

(2)样本方差:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论