集中趋势的统计描述_第1页
集中趋势的统计描述_第2页
集中趋势的统计描述_第3页
集中趋势的统计描述_第4页
集中趋势的统计描述_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集中趋势的统计描述集中趋势:观察值的平均水平或集中位置,用平均数反映离散趋势:观察值的变异程度或离散程度,用变异指标反映描述资料的集中趋势与离散趋势第2页,共36页,2024年2月25日,星期天第二章计量资料的集中趋势

一、计量资料的频数分布二、集中趋势指标*1.

了解统计描述的基本概念,频数分布表的编制、类型及用途,连续型变量的频数分布图。掌握算术平均数、几何平均数、中位数的计算及适用范围。第3页,共36页,2024年2月25日,星期天一、计量资料的频数分布频数分布表的概念频数分布表的制作频数分布表在统计分析中的作用第4页,共36页,2024年2月25日,星期天(一)频数分布表

frequencydistributiontable对观察到的计量资料,按变量的取值范围进行分段,统计变量值出现在每一个段中的次数(即频数,frequency),以表格的形式列出各个段及其对应的频数.此类表格称为频数分布表.第5页,共36页,2024年2月25日,星期天频数分布表第6页,共36页,2024年2月25日,星期天(二)频数表的制作方法计算极差(R)

决定组数(k)、组段和组距(i)列表划记第7页,共36页,2024年2月25日,星期天

例1.1某地140名正常成年男子红细胞数P8第8页,共36页,2024年2月25日,星期天极差:组数:组距:组段:解题步骤:第9页,共36页,2024年2月25日,星期天第10页,共36页,2024年2月25日,星期天

图2-1140名正常男子红细胞计数的直方图

第11页,共36页,2024年2月25日,星期天1、作为陈述资料的形式:

简单明了或直观形象,便于进一步作统计分析。(三)频数表与频数分布图的用途第12页,共36页,2024年2月25日,星期天2、揭示计量资料的分布特征频数分布类型正偏态分布右偏态分布负偏态分布左偏态分布正态分布第13页,共36页,2024年2月25日,星期天101名正常成年女性血清总胆固醇频数分布频数血清总胆固醇正态分布第14页,共36页,2024年2月25日,星期天第15页,共36页,2024年2月25日,星期天第16页,共36页,2024年2月25日,星期天3、描述资料的集中趋势与离散趋势频数分布特征集中趋势离散趋势

指频数分布集中分布于某些组段趋势

指频数分布从集中位置逐渐向两侧递减的趋势第17页,共36页,2024年2月25日,星期天4.便于发现一些特大或特小的可疑值可疑值可疑值第18页,共36页,2024年2月25日,星期天二、集中趋势指标

statisticsoflocation平均数(average)是一类用描述数值变量资料集中趋势(即平均水平)的指标.第19页,共36页,2024年2月25日,星期天平均数的表示符号第20页,共36页,2024年2月25日,星期天1.算术平均数

意义:一组性质相同的观察值在数量上的平均水平。样本算术平均数的计算公式:

第21页,共36页,2024年2月25日,星期天组段(1)频数,f(2)组中值,X(3)

fX(4)=(2)×(3)3.80~23.907.804.00~64.1024.64.20~114.3047.34.40~254.50112.54.60~324.70150.44.80~274.90132.35.00~175.1086.75.20~135.3068.95.40~45.5022.05.60~25.7011.45.80~6.00

合计15.905.9140669.8第22页,共36页,2024年2月25日,星期天算术平均数的适用条件资料呈现正态分布或对称分布第23页,共36页,2024年2月25日,星期天2.几何平均数

意义:N个数值的乘积开N次方即为这N个数的几何均数。

样本几何平均数的计算公式:

第24页,共36页,2024年2月25日,星期天直接法:例2.2Page11例2.2

测得10人的血清滴度的倒数分别为2,2,4,4,

8,8,32,32,求平均滴度。

第25页,共36页,2024年2月25日,星期天间接法:例2.3Page11例2.3某医师使用胎盘浸液钩端螺旋体菌对326名农民接种两月后测得血清IgG抗体滴度如下,计算平均抗体滴度。

IgG滴度倒数XlgX例数lgX

201.3011620.816401.6025791.417801.90376144.6351602.20475165.3093202.50554135.2786402.8062570.15512803.1072371.466第26页,共36页,2024年2月25日,星期天①变量值中不能有0;

②不能同时有正值和负值;

③若全是负值,计算时可先把负号去掉,得

出结果后再加上负号。计算几何均数注意事项:第27页,共36页,2024年2月25日,星期天几何平均数的适用条件当一组观察值为非对称分布、且差距较大数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系或呈对数正态分布。常用于计算抗体平均滴度、药物的平均效价等第28页,共36页,2024年2月25日,星期天3.中位数(median)*

1)直接法:当n为奇数时当n为偶数时

2)频数表法:

该公式适用于原始数据资料

该公式适用于频数表资料LM,iM,fM分别为M所在组段的下限、组距和频数,

fL为M所在组段之前各组段的累积频数。

样本中位数的计算公式意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。第29页,共36页,2024年2月25日,星期天

1,3,7,55,86,100,中位数为多少?

1,3,7,55,100,中位数为多少?第30页,共36页,2024年2月25日,星期天

表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂频数累积频数累积频率(%)0.10~

27

27

4.30.40~169196

31.10.70~167363

57.61.00~

94457

72.51.30~

81538

85.41.60~

42580

92.11.90~

28608

96.52.20~

14622

98.72.50~

4626

99.42.80~

3629

99.83.10~

1630100.0

合计630

-

-M第31页,共36页,2024年2月25日,星期天中位数的适用条件当资料呈明显的偏态分布资料一端或两端无确定数值资料的分布情况不明*对于任何分布资料都可以用中位数反映平均水平,但中位数没有利用全部数据的信息,只受位置居中的观察值的影响.*若资料呈对称或正态分布,总体中位数与总体算术平均数相等;样本中位数与样本算术平均数不一定完全相等,但一般情况下,近似相等.第32页,共36页,2024年2月25日,星期天4.百分位数Px(percentile)百分位数是把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数.中位数即第50百分位数,记为P50.把某些特殊的百分位数结合起来,能较全面地反映数据的集中趋势和离散趋势.如P5,

P25,

P50,

P75,

P95

等指标结合起来.百分位数常常用于医学参考值范围的估计.第33页,共36页,2024年2月25日,星期天计算公式:例2.5资料P25,P50,P75,P90

计算结果第34页,共36页,2024年2月25日,星期天先找到包含Px的最小累计频率;该累计频率同行左边的组段值为L;3.

L

同行右边的频数为fx(或fm

);4.

L前一行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论