第2章 数值变量的统计描述_第1页
第2章 数值变量的统计描述_第2页
第2章 数值变量的统计描述_第3页
第2章 数值变量的统计描述_第4页
第2章 数值变量的统计描述_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章数值变量资料的统计描述第一节频数与频数分布第二节定量变量的特征数第一节频数分布

一、频数分布表(frequencytable)

例2-2测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876一、定量变量的频数分布(1)求极差(range):即最大值与最小值之差,又称为全距。R=84–57=27(次/分)(2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。27/10=2.7≈3

(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56~59~……80~83~86(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。频数表的编制步骤表2-2130名健康成年男子脉搏(次/分)的频数分布表N=∑f

二、频数分布图三、频数表和频数分布图用途1.描述频数分布的类型(对称分布、偏态分布)

(1)对称分布:若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布是否为对称分布?是否为对称分布?(2)偏态分布:

1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。

表2-3115名正常成年女子血清转氨酶(mmol/L)含量分布

2)左偏态分布(负偏态分布):

左侧的组段数多于右侧的组段数,频数向左侧拖尾。

表2-4101名正常人的血清肌红蛋白含量分布2.描述频数分布的特征表2-2数据的频数分布特征:①数据变异(离散)的范围在57~84(次/分)②数据集中(平均)的组段在68~73(次/分)之间,尤以组段的人数71~(次/分)最多。且上下组段的频数分布基本对称。3.便于发现一些特大或特小的可疑值

4.便于进一步做统计分析和处理第二节数量变量的特征数数量变量特征数集中趋势离散趋势一、集中趋势的描述

统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:

算术均数(均数)(mean)几何均数(geometricmean)中位数(median)与百分位数(percentile)

众数(mode)

1、算术均数算术均数:简称均数(mean)

可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。计算方法(1)直接计算法

公式:举例:试计算4,4,4,6,6,8,8,8,10的均数?

例2-3测得130健康成年男子脉搏资料(次/分)如下,试计算均数。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876(2)加权法(利用频数表):公式:k:频数表的组段数,f:频数,X:组中值。表2-5130名健康成年男子脉搏(次/分)的频数分布表N=∑f∑fX∑fX2哪些分布类型适合用均数?

均数适用于对称分布,特别是正态分布资料。2、几何均数(geometricmean)

可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。几何均数(geometricmean)几何均数:变量对数值的算术均数的反对数。

其他对数(如自然对数)变换获得相同的几何均数例2-4有8份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。平均抗体效价为1:57加权法公式:

例2-569例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-6第(1)、(2)栏,求其平均抗体滴度。哪些分布类型适合用几何均数?

适用于成等比数列的资料,特别是服从对数正态分布资料。3、中位数与百分位数11个大鼠存活天数:4,10,7,50,3,15,2,9,13,>60,>60平均存活天数?(1)中位数(median)是将每个变量值从小到大排列,位置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论