版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节第三节 描述离散趋势的统计指标描述离散趋势的统计指标 学习目标:学习目标: 1、熟悉离散程度的指标种类、熟悉离散程度的指标种类; 2、掌握标准差、掌握标准差s、四分位间距、四分位间距p75-p25、 变异系数变异系数CV的适用范围的适用范围; 3、掌握标准差、正态分布、参考值、掌握标准差、正态分布、参考值 范围的概念;范围的概念; 4、掌握参考值范围的制定方法。、掌握参考值范围的制定方法。 描述定量资料的分布特征仅有平均指标是不 够的,还需要有描述离散程度的指标。假如 一班的5名同学成绩 60,70,80,90,100 平均80分 R=40 二班的5名同学成绩 70,75,80,85,9
2、0 平均80分 R=20 三班的5名同学成绩 65,75,80,85,95 平均80分 R=30 描述离散程度的指标有多种:极差、方差、标极差、方差、标 准差、四分位间距、变异系数。准差、四分位间距、变异系数。 一、极差和四分位间距一、极差和四分位间距 1、极差极差(Range,全距) R=max-min 缺点是:只反映最大和最小值的变异,不缺点是:只反映最大和最小值的变异,不 够全面;容易受够全面;容易受n大小的影响,不稳定。大小的影响,不稳定。 2、四分位间距、四分位间距(quartile range,Q) (1)百分位数百分位数:表示一组观察值按表示一组观察值按 升序排列,并等分为升序排
3、列,并等分为100等份,位居第等份,位居第 x%位置的数。位置的数。用用Px 表示表示。是一个位置指 标。 它将全部数据分成两部分,有它将全部数据分成两部分,有X%的数据的数据 小于小于Px,有有1- X%的数据大于的数据大于Px,中位数中位数M是特是特 殊的百分位数,殊的百分位数,M=P50。 。是表示集中趋势的 是表示集中趋势的 指标。指标。 (2)四分位数四分位数 下四分位数即下四分位数即P25 ;上四分位数即;上四分位数即P75; ; 四分位间距四分位间距Q= P75-P25 是指上、下四分位数的间距,它是从小到它是从小到 大排列后中间一半数据所在的范围。四分位大排列后中间一半数据所在
4、的范围。四分位 数间距越大,数据分布的离散程度越大。数间距越大,数据分布的离散程度越大。 它描述了中间50%数据的离散程度,比 极差稳定。 四分位数间距P75-P25, 计算: )(91.40) 8%2550( 11 12 36 25 小时P 例如 对例2-8题求P25 )%( L x x fxn f i LP 本例的四分位数间距: Q= P75 - P25 =73.20-40.91=32.29(h)。 )(20.73)37%7550( 5 12 72 75 小时P 二、方差与标准差二、方差与标准差 1、方差、方差 (Variance) 是描述数据分布离散程度 的指标。S2表示样本方差, 表示
5、总体方差, 总体方差一般未知,常用样本方差来估计, 样本方差的计算公式: 2 1 /)( 1 )( 222 2 n nxx n xx s 上式中的分子部分称为离均差平方和, 它描述了每个x相对于 分布的集中程度, 若数据x分布相对于 很集中,则分子部 分很小;分子部分很大时,则意味着数据 分布分散。 因为对所有x,均有 ,所以样本 含量n越大,分子越大。为消除n大小不同 的影响,将离均差平方和除以(n-1)即得方 差。 x x 0)( 2 xx 故方差既描述了所有数据的离散程度,又可 用于不同样本含量数据离散程度的比较。 方差越大,数据分布的离散度也越大。 方差计算公式中的n-1,称为自由度(
6、degree of freedom)。 自由度:允许其自由变动的变量值个数。自由度:允许其自由变动的变量值个数。如 有n个变量,不受任何条件的限制,可自由 变动,其自由度则得n ,如受到一个条件限 制,自由度则得n-1。自由度用 表示。 方差为一描述离散程度的指标,既有优点 也有缺点,如5名儿童的体重方差 2、标准差标准差(standard deviation,s ) 是描述正是描述正 态分布的定量变量离散程度的指标。标准态分布的定量变量离散程度的指标。标准 差越大,说明个体变异越大。差越大,说明个体变异越大。 为克服方差的单位是平方,与均数不符的缺 点,将S2开方即为标准差S 2 222 2
7、 2 )(10 15 )3034()3028()3026( 1 )( kg n xx s 标准差的计算:标准差的计算: 公式中 是变量值的平方和 , 是变量值和的平方。 1 )( 2 2 n n x x s 2 x 2 )(x 如今有5名儿童的身高为110、115、 120、125、112厘米,其平均身是 其标准差是: 式中 4 .116 5 582 5 112125120115110 n x x 1 . 6 15 5/)582(67894 1 /)( 2 22 n nxx s 67894112115110 2222 x 标准差的适用范围:标准差的适用范围: 适用于对称分布资料,尤其正适用于对
8、称分布资料,尤其正 态分布,近似正态分布的资料。与态分布,近似正态分布的资料。与 均数配套使用。均数配套使用。 三、变异系数(三、变异系数(coefficient variation, cv) (1)、计算计算 (2)、适用范围适用范围: 比较资料的变异度比较资料的变异度,度量衡单位不同时。度量衡单位不同时。 比较资料的变异度,均数相差较大时。比较资料的变异度,均数相差较大时。 %100 x S CV 例如 调查得知,某农村周岁女童其身高调查得知,某农村周岁女童其身高 均数为均数为74.2cm,标准差标准差3.0cm;其体重均其体重均 数为数为8.42kg,标准差标准差0.98kg。欲比较身高
9、。欲比较身高 与体重的变异情况,应用变异系数。与体重的变异情况,应用变异系数。 身高 体重 %64.11%100 42.8 98.0 %14.4%100 4.72 0.3 CV CV 思考题 1、为什么要把资料列出频数分布表或图? 频数分布表的划记步骤? 2、常用平均指标在应用上有哪些异同点? 3、标准差、四分位间距、变异系数在应用上 有何区别?例如? 正态分布正态分布 55页页 正态分布的概念和特征 一、概念:一组变量值的频数分布是中间多,一、概念:一组变量值的频数分布是中间多, 两边少,且左右对称的连续性分布。两边少,且左右对称的连续性分布。 如果设想成年男子的血清铁观察的人数很多, 且组
10、段分得很细,则频数分布图中的直条 变的很窄,其顶端窄到是一个点,将这些 点连线则成为一条光滑曲线,这条光滑曲 线呈钟型,两头低中间高,左右对称,则 称其为正态分布曲线。见P56正态分布图。 二、正态分布(曲线)的特征:二、正态分布(曲线)的特征: 1、曲线在横轴之上,以均数处最高;、曲线在横轴之上,以均数处最高; 2、以均数为中心左右对称,两端永远、以均数为中心左右对称,两端永远 不与横轴相交;不与横轴相交; 3、正态分布有两个参数:、正态分布有两个参数:为位置参为位置参 数,数, 为形状参数为形状参数, 描述了正态分布的集中位置,所以称描述了正态分布的集中位置,所以称 为位置参数,为位置参数
11、, 又称其为总体均数;又称其为总体均数; 描述了正态分布的离散程度,描述了正态分布的离散程度, 决定了决定了 正态曲线的形状,正态曲线的形状, 越小,分布越集中,越小,分布越集中, 所形成的曲线形状越高尖,所形成的曲线形状越高尖, 越大,分越大,分 布越离散,所形成的曲线形状越低平。布越离散,所形成的曲线形状越低平。 所以称所以称 为形状参数,为形状参数, 又称其为总体又称其为总体 标准差。曲线形状见标准差。曲线形状见P57图图 三、三、 正态曲线下面积分布规律正态曲线下面积分布规律 1、正态曲线下全面积为、正态曲线下全面积为100%,或等于,或等于1。 2、 占全面积的占全面积的68.27%
12、 占全面积的占全面积的95.00% 占全面积的占全面积的99.00%。 一个服从正态分布的指标,只要求得均数一个服从正态分布的指标,只要求得均数 和标准差,就可全面掌握该指标的频数分布和标准差,就可全面掌握该指标的频数分布 规律。规律。 服从正态分布的指标,可简记为服从正态分布的指标,可简记为 xN(,) 96. 1 58. 2 标准正态分布标准正态分布 标准正态分布与标准化变换 虽然正态曲线下面积分布很有规律,对 于服从正态分布的指标,只要知道均数, 与标准差 ,就可用公式 求得曲线下(x1,x2)范围内的面积,从而估计 在(x1,x2)范围内的频数分布比例,但上述 积分是相当困难的,这给实
13、际应用带来诸多 不便。 dxeD x x x 2 2 1 2 2 )( 2 1 为方便使用,又方便不同为方便使用,又方便不同 , 使用,考虑使用,考虑 对服从正态分布的变量对服从正态分布的变量x进行标准化转换:进行标准化转换: 则z(u) 就服从均数为就服从均数为0,标准差为,标准差为1 的正态分的正态分 布,这种正态分布称为标准正态分布。简布,这种正态分布称为标准正态分布。简 记作记作zN(0,1)。 x uz)( 引进标准化转换后,制定一个标准正态曲线下面引进标准化转换后,制定一个标准正态曲线下面 积分布表,就可借助标准正态表估计任何(积分布表,就可借助标准正态表估计任何(x1,x2) 范
14、围内的频数分布比例。范围内的频数分布比例。 标准正态表即附表标准正态表即附表1 (P433)。 正态分布的应用正态分布的应用 一、估计频数分布一、估计频数分布 例如例如 出生体重低于出生体重低于2500克为低体重儿。若克为低体重儿。若 由某项研究得某地婴儿出生体重均数由某项研究得某地婴儿出生体重均数3200 克,标准差为克,标准差为350克,估计该地当年低体重克,估计该地当年低体重 儿所占的比例。儿所占的比例。 记记X为当年该地新生儿出生体重,则为当年该地新生儿出生体重,则X服从正服从正 态分布态分布N(3200,350)。)。 先求(转换)先求(转换) 再查标准正态表得:再查标准正态表得:
15、即标准正态曲线下从即标准正态曲线下从到到u-2范围内的面范围内的面 积为积为2.28%,从而在正态分布,从而在正态分布N( 3200, 350)曲线下,从)曲线下,从到到X=2500的比例为的比例为 2.28%,即,即X2500克的比例为克的比例为2.28%。故估。故估 计该地当年低体重儿所占的比例为计该地当年低体重儿所占的比例为2.28%。 2 350 32002500 z 0228. 0)2( 二、确定医学参考值范围二、确定医学参考值范围 1、概念概念:参考值范围也称为正常值范围。医参考值范围也称为正常值范围。医 学上常把绝大多数正常人的某指标波动范围,学上常把绝大多数正常人的某指标波动范
16、围, 称为该指标的正常值范围。这里的称为该指标的正常值范围。这里的“绝大多数绝大多数” 可以是可以是90%、95%、99%等等,最常用的是等等,最常用的是95%。 所谓所谓“正常人正常人”不是指完全健康的人,而是指不是指完全健康的人,而是指 排除了影响所研究指标的疾病和有关因素的同排除了影响所研究指标的疾病和有关因素的同 质人群。质人群。 2、估计方法、估计方法: 常用的有百分位数法和正态分布常用的有百分位数法和正态分布 法,见法,见P59。 3、制定正常值选计算方法的原则:、制定正常值选计算方法的原则: (1) 根据资料的分布类型选方法根据资料的分布类型选方法 对 于服从正态分布的资料正态分
17、布的资料,其参考值范围的制 定可用正态分布法正态分布法计算; u 是系数,根据%大小定, 对于不服从正态分布的指标,直接利用百分不服从正态分布的指标,直接利用百分 位数法(或进行变量变换使之服从正态分布)位数法(或进行变量变换使之服从正态分布) 制定参考值范围。求制定参考值范围。求px sux sx96. 1 (2) 根据专业知识确定该指标的参考值范根据专业知识确定该指标的参考值范 围是双侧范围还是单侧范围围是双侧范围还是单侧范围。 若一个指标过大过小均属异常,制定双侧若一个指标过大过小均属异常,制定双侧 参考值范围,即参考值范围应既有上限又参考值范围,即参考值范围应既有上限又 有下限有下限;
18、若一个指标仅过大属异常,则此 指标的参考值范围只有上限,是单侧参考 值范围;若一个指标仅过小属异常,则此若一个指标仅过小属异常,则此 指标的参考值范围只有下限,也是单侧参指标的参考值范围只有下限,也是单侧参 考值范围。考值范围。 对于一个指标,随机抽取一个大样 本后,如何据样本资料利用正态分 布法或百分位数法制定参考值范围。 例如 某地调查正常成年男子144人的 红细胞数(近似正态分布),得均 数 =55.381012/L,标准差S=0.44 1012/L, 试估计该地成年男子红细胞 数的95%参考值范围。 X 因红细胞数过多或过少均为异常,故此参 考值范围应是双侧范围。又因为此指标 近似正态
19、,故可用正态分布法求95%参考 值范围如下: )/10(24.5652.54 44. 096. 138.5596. 1 12 L SX 三、进行质量控制三、进行质量控制 常用常用 作为上、下警戒限作为上、下警戒限 作为上、下控制限作为上、下控制限 四、正态分布是许多统计方法的基四、正态分布是许多统计方法的基 础。础。 如如t检验,检验,F检验等。检验等。 sx2 sx3 第五章第五章 参数估计参数估计 一、均数的抽样误差一、均数的抽样误差 (Sampling error of mean) 由于个体存在差异,又因抽样造成的样本均数由于个体存在差异,又因抽样造成的样本均数 与总体均数间的差异,称为
20、均数的抽样误差与总体均数间的差异,称为均数的抽样误差,用均用均 数的标准误数的标准误 (Standard error ,SE) 表示。表示。 均数的标准误均数的标准误 是表示均数抽样误差大小的指是表示均数抽样误差大小的指 标,描述样本均数的离散程度,反映用样本均数标,描述样本均数的离散程度,反映用样本均数 估计或推断总体均数的可靠性估计或推断总体均数的可靠性. x x 二二、均数标准误的计算、均数标准误的计算 表示总体标准差表示总体标准差,当当 不知道不知道,只知只知S时时,可用下可用下 式计算式计算: 从公式中可看出从公式中可看出,均数的标准误与两个因素有关均数的标准误与两个因素有关, 与标
21、准差成正比与标准差成正比,与样本例数的平方根成反比。与样本例数的平方根成反比。 若标准差固定不变时,可增加若标准差固定不变时,可增加n而缩小抽样误差。而缩小抽样误差。 n x n S S x n x 三、均数标准误的应用三、均数标准误的应用 1、表示均数抽样误差大小,描述(表示均数抽样误差大小,描述(n相相 同)样本均数的离散程度,反映用样本均同)样本均数的离散程度,反映用样本均 数估计或推断总体均数的可靠性;数估计或推断总体均数的可靠性; 2、用于估计总体均数的可信区间、用于估计总体均数的可信区间 ; 3、用于进行均数的假设检验、用于进行均数的假设检验。 第二节 t t 分布分布 一、一、t
22、分布概念:若干个分布概念:若干个t值分布所形成的曲线分布。值分布所形成的曲线分布。 t值是两均数之差相当于标准误的倍数值。即值是两均数之差相当于标准误的倍数值。即 如何理解如何理解t分布呢?不妨再回忆一下正态分布和标准正态分分布呢?不妨再回忆一下正态分布和标准正态分 布:布: 当变量当变量x服从均数为服从均数为,标准差为,标准差为的正态分布时,的正态分布时, 可简记为可简记为xN(,)。为了方便使用,可对变量。为了方便使用,可对变量x进行标准化转进行标准化转 换:换: x s x t x u 则u的分布服从标准正态分布N(0,1),即u 分布。 若从N(,)的正态分布总体中,随机抽 样并算得多
23、个样本均数 ,它们则服 从总体均数为 ,总体标准差为 的 正态分布,对于 也可经过标准化转 换,使 服从uN(0,1)的标准正态 分布。 但在实际工作中,由于 未知,多是 知道 ,则 服从t分布。 x x x x x x x s x S x 二、二、t 分布的图形和特征分布的图形和特征 1、 t 分布的图形分布的图形: t 分布是一簇曲线。它受自由度分布是一簇曲线。它受自由度 的的 影响(实际是受影响(实际是受n不同的影响不同的影响), 自由度不自由度不 同时,曲线的形状不同。同时,曲线的形状不同。 n小时,小时, 亦小,亦小, t 分布曲线的形状越分布曲线的形状越 低平,低平,n越大,越大, 亦越
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院防疫绩效考核制度
- 国企风控制度
- 经络学护理的社会推广与应用
- 公证处绩效考核制度
- 审计政务服务工作制度范本
- 公司审计档案保管制度
- 4s店经员工绩效考核制度范本
- 2026年及未来5年市场数据中国机动车检测行业市场发展数据监测及投资前景展望报告
- 内审审计食堂购卖制度
- 乡镇慢性病绩效考核制度
- DB32∕T 5167-2025 超低能耗建筑技术规程
- 2026年湖南商务职业技术学院单招职业技能测试必刷测试卷及答案1套
- 雨课堂学堂在线学堂云《科学研究方法与论文写作(复大)》单元测试考核答案
- 高考语文二轮复习高中语文选用变换句式练习题含答案
- 异地升学协议书范本
- 水利工程项目法人保证安全生产措施方案
- 《AIGC文案策划与写作》-课程标准
- 企业管理顶层设计方案
- 2025年军事基础知识试题及答案
- 雨课堂在线学堂《资治通鉴》导读课后作业单元考核答案
- 2025年南京市事业单位招聘考试综合类专业能力测试试卷(管理类)真题
评论
0/150
提交评论