版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十五章数值变量的统计分析一、数值变量的频数分布表与频数分布图在医学研究工作中,所收集到的原始数据一般是无规律所循的,特别当观察值较多时,直接从原始数据很难得出概括的印象。必须通过资料清理,编制频数表,来显示数据分布的范围、数据最集中的区间和频数分布的形态等。第一节集中趋势和离散趋势的统计描述例15.1一般可分为计量资料、计数资料和等级资料。对医学资料的统计描述是统计分析的一个方面,也是科研结果表述的基本内容。描述的方法包括计算相关的指标、用统计表和统计图来表示。
统计分析统计描述统计推断(第十六章)统计描述统计推断统计分析的两大方面统计描述—用适当的统计图(表)和统计指标(如均数、标准差、有效率、治愈率等)来描述资料的分布规律(图表)和数量特征(统计指标)。目的:用直观的、简单的形式来表达测定了110例正常人血铅含量(μg/L),见下表。血铅含量0-4-8-12-16-20-24-28-合计频数1423301914613110广西人均卫生事业费在全国位次(1998年)1999年中国农村死亡原因构成(%)计量资料是连续性的资料,我们可把该组数据范围大小分成若干段,然后再统计各段的频数,并用表格来表示,即称为计量资料的频数分布表。
(一)频数分布表的编制
最小值最大值个数:28152516742计量资料的频数表:即按数量大小分组,然后再清点各组(段)的个数(一)频数分布表的编制
(1)求全距R=最大值-最小值
=104.8-80.1=24.7
例15.1
150名3岁女孩身高值(cm)。编制步骤:计量资料的频数表:即按数量大小分组,然后再清点各组(段)的个数R最小值最大值(2)划分组段②求组距(i):
i=极差/组数=24.7/10=2.47≌2.5①确定组数原则:n<50,5-8组;n>50,9-15组。实际应用时,应根据研究目的和分析要求,灵活确定组数。一般以能反映频数分布的特征为原则。③确定各组段的上下限原则:第一组段包括最小值,最后组段包括最大值。每一组段都有上限和下限下限:组段的起点(最小值)上限:组段的终点(最大值)
一般只列出下限!80.1104.8组距⑶组距=极差/组数(拟采用等距分组)24.7⑵确定组数:拟分几个组?(一般10组)⑴求全距:线段的长度⑷定组段:划范围⑸统计各组段的人数:下限上限(下组段的下限)编制步骤:读取数据,然后“对号入座”划记80.1100.1
频数表的用途:1.描述频数分布的类型和特征
DescriptiveStatistics频数分布表(frequencytable)2.便于发现一些特大或特小的可疑值3.便于进一步做统计分析和处理(二)频数分布的特征1、集中趋势(centraltendency):数据向某一数值集中的倾向(中等身高[92-94cm]的人数最多)2、离散趋势(tendencyofdispersion):数据的数值大小不等的倾向
(由中间向两侧逐渐减少)集中趋势离散趋势离散趋势(三)频数分布的类型
正态、对称分布偏态分布
正偏态负偏态频数分布图以观察变量(组段)为横轴,频数或频率为纵轴绘制统计图。可直观地反映频数分布的特征。对称分布示意图正态分布示意图可以是多峰,只要左右对称只能是单峰二集中趋势的描述
描述计量资料分布特征的指标集中趋势指标离散趋势指标平均数(average)R、Q、S、CV常用平均数的种类:
1、算术均数(arithmeticmean)(简称均数,mean)
2、几何均数(geometricmean)3、中位数(median)(一)算术均数(均数)样本均数用X表示,总体均数用μ表示.1、适用范围对称分布,尤其是正态分布的资料
2、计算方法:
(1)直接法例有10人身高值:92.5,82.5,…,95.1求平均身高。(2)加权法f为相同观察值的个数(频数)例:2,3,3,4,4,4,5,5,5,6求均数。方法一:方法二:直接法加权法加权法用于频数表资料其中:
X=组中值=(上限+下限)/2f=频数
为什么用组中值?问题:所有的频数表资料计算均数都需要用组中值计算吗?3、均数的应用⑴反映一组观察值的平均水平⑵描述正态分布特征的重要参数原始数据的分布为偏态分布,但经对数变换后的分布呈正态分布(二)几何均数(geometricmean,简记为G)
1、适用资料:
对数正态分布资料
(血清抗体滴度资料)(微量元素资料)xlgxlgx2、计算方法:(1)直接法
G=lg-1
设:(正态分布)(求均数)(还原)例15.21:10,1:100,1:1000,1:10000,1:100000,求平均血清抗体效价。该5人的平均血清效价为1:1000。注:用抗体倒数直接计算。(2)加权法G=log-1
抗体滴度资料的计算:不用组中值计算其中:
X=组中值=(上限+下限)/2f=频数
为什么?不需计算组中值,为什么?例15.33、应用几何均数注意事项:(1)观察值不能有0;(2)观察值不能同时有正负值,若全部为负值,可按正值先求,然后加上负号;(3)同一资料求得的G<
(三)中位数(M)和百分位数(Px)
1、定义中位数:
将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数。在全部观察值中,大于和小于中位数的观察值的个数相等。
M
50%50%百分位数:将一组观察值从小到大按顺序排列,一个百分位数将全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。P50分位数也就是中位数。
25%P25
75%
2、中位数和百分位数的适用范围:(1)偏态分布资料(2)分布类型不明资料(3)分布末端无确定值资料(开口资料)理论上,中位数和百分位数可用于任何分布的计量资料,但实际应用中常用于偏态分布,特别是开口资料。
某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。潜伏期(小时)12-24-36-48-60-72-84-96-≥108合计病例数11018145442260开口资料偏态分布资料3、计算方法:(1)直接法:适用于观察数少资料(中位数)
n为奇数时,
M=
3,4,6,7,9,10,26
x1x2x3x4x5x6x7M
n为偶数时,
M=
x1x2x3x4x5x6x7x8
35789101327
M(2)频数表法:适用于频数表资料
步骤:①从小到大计算累计频数和累计频数;②确定百分位数和中位数所在组段;③计算百分位数Px和中位数M
Px=
M=P50=
L=Px或M所在组段的下限
i=Px或M所在组段的组距
fx=Px或M所在组段的频数=小于L各组段的累计频数
Px=
起点平均每例的组距从起点到Px的例数L(起点)Px累计频数/181M所在组段明显偏态分布L=12(M所在组段的下限)
i=12(M所在组段的组距)
fx=63(或M所在组段的频数)=30(小于L各组段的累计频数)
M=
M=23.52(h)下限值L上限值U中位数M
中位数(median
)和百分位数(
percentile
)描述数值变量资料的集中趋势(centraltendency)
DescriptiveStatistics描述数值变量资料的集中趋势(centraltendency)指标(二)百分位数(percentile)
中位数(median
)和百分位数(
percentile
)百分位数(percentile)是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M
。
DescriptiveStatistics描述数值变量资料的集中趋势(centraltendency)描述数值变量资料的集中趋势(centraltendency)指标正态分布时:均数=中位数=众数
正偏态分布时:均数>中位数>众数
负偏态分布时:均数<中位数<众数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 政府采购询价采购制度
- 商贸企业采购合同管理制度
- 采购监督管理制度
- 程序文件采购管理制度
- 幼儿园食品采购索证票制度
- 设备招标采购制度
- 后勤采购流程管理制度
- 招标采购内控制度
- 采购部门发票管理制度
- 采购部门评估制度
- 工程标杆管理办法细则
- 尿源性脓毒血症的护理
- 光电信息工程相关课件
- 殡仪馆司机管理制度
- 绿色船舶拆除-绿色船舶拆除技术
- 马工程西方经济学(精要本第三版)教案
- 香港公司劳动合同协议
- 【初中 语文】第15课《青春之光》课件-2024-2025学年统编版语文七年级下册
- 2024年海南省烟草专卖局招聘考试真题
- GenAI教育在不同场景下的应用案例分析与演进路径
- 大连重工:中企华评报字(2024)第5436号资产评估报告
评论
0/150
提交评论