版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(计量资料的统计描述)
第二章集中趋势的统计描述
第三章变异程度的统计描述
第二章第三章定量资料描述内容:1、频数分布表的编制2、计量资料集中趋势的统计描述第二章第三章定量资料描述问题:何为计量资料?何为统计描述(statisticaldescription)?第二章第三章定量资料描述
统计描述:用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。目的使资料简洁、明了,便于人们了解资料的规律性。第二章第三章定量资料描述一、变量的频数分布1、离散型定量变量的频数分布例2-11998年某山区96名孕妇产前检查次数资料如下:
0,3,2,0,1,5,6,3,2,4,1,0,6,5,……,4,7。第二章第三章定量资料描述检查次数频数频率(%)累计人数累计频率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合计96100.0————表2-11998年某地96名妇女产前检查次数频数分布第二章第三章定量资料描述第二章第三章定量资料描述
频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。
频数分布表(frequencydistributiontable)简称频数表(frequencytable):含有组段与频数的统计表,称频数表。
直方图(histogram):为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。第二章第三章定量资料描述2、连续型定量变量的频数分布问题:
1)何为连续型定量变量?
2)其与离散型定量变量有何区别?
3)连续型定量变量的频数分布表该如何绘制?第二章第三章定量资料描述4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76
例2.1某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表2-1所示:
表2-2某地140名成年男性红细胞数(×1012/L)第二章第三章定量资料描述表2-3某地140名成年男性红细胞数的频数表第二章第三章定量资料描述第二章第三章定量资料描述找出观察值中的最大值和最小值,并求出极差。最大值与最小值之差称为极差(range),记为RR=5.95-3.82=2.13
最大值与最小值反映了观察值的分布范围,极差反映了观察值分布的跨度。第二章第三章定量资料描述按极差大小决定组段数和组距频数表一般设8~15个组段,视观察单位数的多少而定,其原则是要充分反映数据的分布特征。组距即各组的跨度,是每一组内的范围,常采用等距分组。
第二章第三章定量资料描述为了计算方便取0.2为组距各组段应界限分明,上下衔接,互不交叉,第一组段要包括最小值,最后一组段要包括最大值。每一组的起点称下限,终点称上限。第二章第三章定量资料描述3.84.24.65.05.45.805152535人数4.04.44.85.25.66.0图2-2140名正常男子红细胞计数的直方图第二章第三章定量资料描述潜伏期(小时)频数累计频数0---353512---7010524---4014536---2316848---1218060---618672---841187合计187——表2-4187例某种沙门氏菌食物中毒潜伏期分布第二章第三章定量资料描述图2-3187例某种沙门氏菌食物中毒潜伏期频数直方图第二章第三章定量资料描述某城市892名老年人生存质量自评分的频数分布0102030405060708090100自评分4003002001000人数第二章第三章定量资料描述变量频数分布的类型:1)对称分布2)偏态分布:正偏峰(positiveskew)分布负偏峰(negativeskew)分布第二章第三章定量资料描述变量频数分布的两个特征1)集中趋势(centraltendency)2)离散趋势(tendencyofdispersion)第二章第三章定量资料描述二、计量资料集中趋势(平均水平)的描述指标第二章第三章定量资料描述1、描述集中趋势的统计指标(平均数average)1)算术均数(arithmeticmean),简称均数2)几何均数(geometricmean,G)3)中位数(median,M)第二章第三章定量资料描述加权法根据频数表计算均数的一种方法。第二章第三章定量资料描述P9例:求140名成年男子红细胞数平均水平红细胞计数组中值频数fxfx23.80~3.9027.8030.424.00~4.10624.60100.864.20~4.301147.30203.394.40~4.5025112.50506.254.60~4.7032150.40706.884.80~4.9027132.30648.275.00~5.101786.70442.175.20~5.301368.90365.175.40~5.50422.00121.005.60~5.70211.4064.985.80~5.9015.9034.81合计140669.803224.20第二章第三章定量资料描述加权法:加权法与直接法结果为什么有不同?第二章第三章定量资料描述工资人数125010140013165017200010合计50表2-5某单位工资情况求该单位平均工职?=1575第二章第三章定量资料描述几何均数(geometricmean)
第二章第三章定量资料描述对于频数表资料第二章第三章定量资料描述例2.2测的10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度。如果计算均数,其值为X=10.8现计算几何均数显然在这里均数不能代表其平均水平,选择几何均数则比较合适,故10份血清滴度的平均水平1:7第二章第三章定量资料描述例:100名受试者接种某疫苗三周后,抗体测定结果如下表,试计算平均抗体滴度。第二章第三章定量资料描述100名受试者平均抗体滴度为1:32.2。第二章第三章定量资料描述计算几何均数时注意:变量值中不能有0;同一组变量值不能同时存在正负值;若变量值全为负值,可在计算时将负号除去,算出结果后再冠以负号。医学工作中常用于处理:抗体滴度水平等成倍数增长的数据(等比级数资料)第二章第三章定量资料描述中位数例9例正常人的发汞值:
1.1,1.83.54.24.85.65.97.110.5
M=4.89例正常人的发汞值:
1.1,1.83.54.24.85.65.97.1>16
M=4.810例正常人的发汞值:
1.1,1.83.54.24.85.65.97.110.5>16
M=(4.8+5.6)/2=5.2第二章第三章定量资料描述
频数表法:
当观察例数较多时,可先编制频数表,再计算中位数。计算公式:
式中LM表示中位数M所在组段的下限;i和fM分别表示中位数M所在组段的组距和频数;∑fL表示小于LM的各组段的累计频数。第二章第三章定量资料描述确定中位数所在组段的方法:累计频数恰好第一次大于n/2的组段为中位数所在组段。或累计频率恰好第一次大于50%的组段第二章第三章定量资料描述例:某种传染病的潜伏期(天)见下表,试求平均潜伏期。
第二章第三章定量资料描述4~组段累计频数(∑f=74)恰好第一个大于n/2(110/2=55),故中位数位于4~组段。平均潜伏期为5.21天。
第二章第三章定量资料描述百分位数位置指标,以表示;理论上有X%的观察值比小,有(100-X)%的观察值比大;百分位数是一个界值,是分布数列的一百等份分割值;即是中位数。百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位数结合使用可全面地描述资料的分布特征。第二章第三章定量资料描述百分位数的计算方法计算公式:
式中LX表示第X百分位数PX所在组段的下限;i和fX分别表示第X百分位数PX所在组段的组距和频数∑fL表示小于LX的各组段的累计频数。确定第X百分位数PX所在组段的方法:累计频数恰好第一次大于n×X%的组段为第X百分位数PX所在组段。第二章第三章定量资料描述例:某种传染病的潜伏期(天)见下表,试求平均潜伏期。
第二章第三章定量资料描述某传染病的潜伏期资料为例,试计算P2.5,P25,P75。
由确定PX所在组段方法可判定P2.5,P25,P75分别在2~,4~,6~三个组段内。第二章第三章定量资料描述中位数和百分位数的应用对资料的分布没有特殊要求;中位数只受位置居中的变量值影响,抗极端值,具有较好的稳定性,但不如均数精确,不便于统计运算;当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。百分位数常结合使用说明某一特定问题。第二章第三章定量资料描述思考题:算术平均数与中位数的异同点第二章第三章定量资料描述问题:考核甲、乙两中药店服务员的技术水平,令每人每次从盒中取10克某种中药,各取5次进行称量,结果如下(g):甲:9.610.510.09.510.4乙:9.910.19.910.29.9第二章第三章定量资料描述2、描述离散趋势(变异)的统计指标1)极差(range,R)2)四分位数间距(quartilerange,QR)3)方差(variance)4)标准差(standarddeviation)5)变异系数(coefficientofvariation)第二章第三章定量资料描述1)极差:
R=最大值–最小值A:2628303234B:2427303336C:2629303134第二章第三章定量资料描述极差:计算方便;只考虑两个极值;与n有关,用于比较是需注意。
第二章第三章定量资料描述2)四分位数间距:
QR=P75–P25第二章第三章定量资料描述四分位数间距:包抱总体中数值居中的50%的个体;计算是没用到每个个体的数值;其值越大,说明变量变异越大。第二章第三章定量资料描述3)方差,又称均方差(meansquaredeviation)第二章第三章定量资料描述xX-u(x-u)226-41628-243000322434416合计04029第二章第三章定量资料描述第二章第三章定量资料描述4)标准差:方差的算术平方根,即为标准差。第二章第三章定量资料描述
标准差与方差的含义类似,值越大,说明变量的变异越大,都适合用来表达对称分布的离散趋势。两者不同的是量纲不一样。第二章第三章定量资料描述5)变异系数:标准差与均数之比,即为变异系数。用于描述对称分布资料的变异程度。变异系数无量纲,其值大,说明相对均数而言的相对变异较大。可用于量纲相同、或不同的变量变异程度大小的比较。第二章第三章定量资料描述例:某地7岁男孩身高的均数为123.10cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg,比较其变异度?
第二章第三章定量资料描述
n1=351015均数=10元标准差=5元n2=395100105均数=100元标准差=5元第二章第三章定量资料描述下列两组数据(量纲相同)何者变异较大?甲:124816乙:10204080160第二章第三章定量资料描述问题:均数、方差(标准差)常用来描述对称分布资料,为什么?第二章第三章定量资料描述对称分布偏态分布开口数据等比级数资料平均水平算术均数中位数中位数几何均数中位数变异程度标准差方差变异系数全距四分位数间距全距四分位间距全距对数标准差描述统计量的一般应用总结表第二章第三章定量资料描述正态分布第二章第三章定量资料描述正态分布的概念
120名13岁女孩身高频率密度直方图12413214014815616400.020.040.060.08频率密度第二章第三章定量资料描述(a)(b)(d)(c)第二章第三章定量资料描述
当n大时,频率密度曲线可估计概率密度曲线。医学中的许多变量,其概率密度曲线类似正态曲线。故可用正态曲线的特点来描述这些变量的统计规律。第二章第三章定量资料描述
正态曲线(normalcurve):是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。其概率密度函数为:-∞<X<+∞第二章第三章定量资料描述正态分布图示x0.1.2.3.4f(x)-3-2-++2+3
第二章第三章定量资料描述正态分布有两个参数:位置参数:μ
变异度参数:σ2正态分布的表示方法:
X~N(μ,σ2)第二章第三章定量资料描述第二章第三章定量资料描述第二章第三章定量资料描述正态分布的性质正态分布只有一个高峰,高峰位置在均数处(说明什么?);正态分布以均数为中心,左右对称;正态分布的两个参数μ和σ决定了分布的位置和形状;正态分布曲线下的面积分布是有规律的。第二章第三章定量资料描述正态曲线下面积的分布规律1)由频率密度直方图的含义,我们不难理解频率(概率)密度曲线下面积的含义。2)正态曲线可作为很多医学变量概率密度曲线的近似。3)当知道了密度函数f(x)时,频率(概率)密度曲线下的面积可通过对密度函数求定积分的方法获得。4)定积分的方法求正态曲线下的面积过于复杂,我们可用简便的查表法解决这一问题。第二章第三章定量资料描述若变量
u~N(0,1),我们称u为标准正态变量,其密度曲线称为标准正态曲线,其概率密度函数为:-∞<u<+∞标准正态分布是正态分布的一种特例。正态曲线下的面积规律与标准正态曲线下的面积规律有什么关系呢?第二章第三章定量资料描述由积分知识可证明:式中分别是正态分布和标准正态分布的概率密度函数,分别是它们的分布函数。,和F(X)和注意:请正确理解分布函数的意义第二章第三章定量资料描述
标准正态分布160170176f(X)
正态分布X~N(170,62)-1.66701.00uf(u)Ф(-1.667)=0.0475第二章第三章定量资料描述第二章第三章定量资料描述第二章第三章定量资料描述统计学家编制了标准正态分布函数表(附表1),故求正态曲线下的面积可通过查附表1获得。因为正态分布的对称性,为节省篇幅,附表1只给出Z取负值的情况。第二章第三章定量资料描述第二章第三章定量资料描述例:已知健康成年男性身高(厘米)X~N(170,62),求成年男性中身位于165厘米至175厘米的人占整个成年男性的比例。例:对于35至44岁的男性,如果舒张压是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海电机学院《当代世界经济与政治》2025-2026学年期末试卷
- 四平现代职业学院《中国现代文学三十年》2025-2026学年期末试卷
- 上海第二工业大学《社会语言学》2025-2026学年期末试卷
- 沈阳药科大学《德育与班级管理》2025-2026学年期末试卷
- 山西信息职业技术学院《电子商务概论》2025-2026学年期末试卷
- 山西电子科技学院《政策与法律法规》2025-2026学年期末试卷
- 上海杉达学院《教育文化学》2025-2026学年期末试卷
- 上海中医药大学《大学英语精读》2025-2026学年期末试卷
- 太原科技大学《教育学原理》2025-2026学年期末试卷
- 上海立达学院《精神障碍学》2025-2026学年期末试卷
- 配送业务人员管理制度
- 消防维修业务管理制度
- 管理人员三级教育考核试卷附答案
- 供应链管理体系规范手册(标准版)
- 加油站新员工三级安全教育培训试题(附答案)
- 建筑施工安全教育培训指南(标准版)
- 鲜花介绍课件
- 企业品牌保护与维权制度
- 2025下半年事业单位联考《综合应用能力》A类考试测试题含答案
- 雨课堂学堂在线学堂云《Age of Sustainable Development(SDG Academy)》单元测试考核答案
- 不追究社保协议书
评论
0/150
提交评论