统计学教案习题计量资料的统计描述_第1页
统计学教案习题计量资料的统计描述_第2页
统计学教案习题计量资料的统计描述_第3页
统计学教案习题计量资料的统计描述_第4页
统计学教案习题计量资料的统计描述_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章计量资料的统计描述一、教学大纲要求(一)掌握内容1 .频数分布表与频数分布图(1)频数表的编制。(2)频数分布的类型。(3)频数分布表的用途。2 .描述数据分布集中趋势的指标掌握其意义、用途及计算方法。算术均数、几何均数、中位数。3 .描述数据分布离散程度的指标掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。二、教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选

2、用适当的统计指标。(一)频数分布表的编制频数表(frequencytable)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:1 .求数据的极差(range)。R XmaxXmin(2-1)2 .根据极差选定适当“组段”数(通常8T0个)。确定组段和组距。每个组段都有下限L和上限U,数据x归组统一定为

3、Lw%U。3 .写出组段,逐一划记。频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。4 .算术均数算术均数(arithmeticmean)简称均数,描述一组数据在数量上的平均水平。总体均数用表示,样本均数用X表示,其计算方法如下:(1)直接法:直接用原始观测值计算。X(2-2)n(2)加权法:在频数表基础上计算,其中X为组中值,f为频数。(2-3)5 .几何均数几何均数(geometricmean)用以描述

4、对数正态分布或数据呈倍数变化资料的水平。记为G其计算公式为:(1)直接法G 1g1g X(2-4)n(2)加权法G 1g i f lg X(2-5)3.中位数中位数(median)将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。为奇数时M X n 1(2-6)-2、,1为偶数时M - X n X n(2-7)2(2)(2 1)平均数意义均数平均数量水平应用甚广,最适用于对称分布,特别是正 态分布几何均数平均增(减)倍数等比资料;对数正态分布中位数位次居中的观察值水平2-1常用平均数的意义及其应用场合(一)反映数据变异程度大小的变异指标变异指标的应

5、用亦根据资料的不同而选取不同指标进行描述。 差和变异系数,尤其是方差和标准差更为常用。常用的变异指标有极差、四分位数间距、方差、标准1 .极差极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。R X Xmax 八 min(2-1)2 .百分位数与四分位数间距(1)百分位数(percentile )是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。 百分位数的计算公式为:百分位数用Px表示,0V x v 100,如25%位数表示为P25。在频数表上,ixFxLx - n x% fx(2-

6、8)(2)四分位数间距(inter-quartile range )是由第3四分位数(Q3= P75)和第1四分位数(Qi= P25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。其计算公式:QRQ3 Q1(2-9)6 .方差方差(variance)表示一组数据的平均离散情况,其计算公式为:S2(2-10)7 .标准差标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:X2( X)/(2-11)(2-12)8 .变异系数)用于观察指标单位不同或均数相差较大时两组资

7、料变异程度的比较。用变异系数(coefficientofvariationcvw示,计算公式为:SCV=100%X作为资料的总结性统计量,两类指标要求一起使用。如常用X S平均指标和变异指标分别反映资料的不同特征,或M(QR。三、典型试题分析1 .名词解释:平均数答案:平均数(average)是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。评析本题考察平均数的概念。平均数是一类统计指标,并不单纯指算术均数。2 .描述一组偏态分布资料的变异度,以()指标较好。A.全距B.标准差C.变异系数D.四分位数间距答案:D评析标准差和变异系数均用于描述正态分布资料

8、的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,故选Do3 .用均数和标准差可以全面描述()资料的特征。A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布答案:C评析本题考察均数和标准差的应用条件。4 .同一资料的标准差是否一定小于均数?答案:均数和标准差是两类不同性质的统计指标。标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小。标准差可大于均数,也可小于均数。5 .试述极差、四分位数间距、标准差及变异系数的适用范围。答案:这三个指标均反映计量资料的离散程度。极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的

9、变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。四、习题(一)名词解释1 .频数表2.算术均数3.几何均数4.中位数5.极差6 .百分位数7.四分位数间距8.方差9.标准差10.变异系数(二)单项选择题1 .各观察值均加(或减)同一数后()。A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变2 .比较身高和体重两组数据变异度大小宜采用()。A.变异系数B.差C.极差D.标准差3 .以下指标中()可用来描述计量资料的离散程度。A.算术均数B.几何均数C.中位数D.标准差4 .偏态分布宜用()描述其

10、分布的集中趋势。A.算术均数B.标准差C.中位数D.四分位数间距5 .各观察值同乘以一个不等于0的常数后,()不变。A.算术均数B.标准差C.几何均数D.中位数6. ()分布的资料,均数等于中位数。A.对称B.左偏态C.右偏态D.偏态7. 对数正态分布是一种()分布。A.正态B.近似正态C.左偏态D.右偏态8. 最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。A.均数B.标准差C.中位数D.四分位数间距9. ()小,表示用该样本均数估计总体均数的可靠性大。A.变异系数B.标准差C.标准误D.极差10. 血清学滴度资料最常用来表示其平均水平的指标是()。A.算术平均数B.中

11、位数C.几何均数D.平均数11. 变异系数CV的数值()。A.一定大于1B.一定小于1C.可大于1,也可小于1D.一定比标准差小12. 数列8、-3、5、0、1、4、-1的中位数是()。A.2B.0C.2.5D.0.513. 关于标准差,那项是错误的()。A.反映全部观察值的离散程度B.度量了一组数据偏离平均数的大小C.反映了均数代表性的好坏D.不会小于算术均数14. 中位数描述集中位置时,下面那项是错误的()。A.适合于偏态分布资料B.适合于分布不明的资料C.不适合等比资料D.分布末端无确定值时,只能用中位数15. 5人的血清滴度为1:20、1:40、1:80、1:160、1:320描述平均

12、滴度,用那种指标较好()。A.平均数B.几何均数C.算术均数D.中位数16. 数列0、48、49、50、52、100的标准差为()。A50B.26.75C.28.90D.70.7817. 一组变量的标准差将()。A. 随变量值的个数n的增大而增大B. 随变量值的个数n的增加而减小C. 随变量值之间的变异增大而增大D. 随系统误差的减小而减小18. 频数表计算中位数要求()。A.组距相等B.原始数据分布对称C.原始数据为正态分布或近似正态分布D.没有条件限制19. 一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。A1.5B.1.9C. 2.1D.不知道数据的总个数,不能

13、计算平均数20. 某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30则平均潜伏期为()。A.均数为7天,很好的代表了大多数的潜伏期B.中位数为3天C.中位数为4天D.中位数为3.5天,不受个别人潜伏期长的影响21. 某地调查20岁男大学生100名,身高标准差为4.09cm,体重标准差为4.10kg,比较两者的变异程度,结果()。A.体重变异度大B.身高变异度较大C.两者变异度相同D.由单位不同,两者标准差不能直接比较(三)判断正误并简述理由1 .均数总是大于中位数。()2 .均数总是比标准差大。()3 .变异系数的量纲和原量纲相同。()4 .样本均数大时,标准差也一定会大。()5 .样

14、本量增大时,极差会增大。()(四)计算题1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示:mg/m3:12345ug/m3:10002000300040005000分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。2.尸检中测得北方成年女子80人的肾上腺重量(g)如下,试(1)编制频数表,(2)求中位数、均数和标准差。19.012.014.014.08.213.06.512.015.017.212.012.725.08.520.017.08.48.013.015.020.013.013.014.015.07.910.59.510.012.06.511.012

15、.57.514.517.512.010.011.011.516.013.010.511.014.07.514.011.49.011.110.010.58.012.011.519.010.09.019.010.022.09.012.08.014.010.011.511.015.016.08.015.09.98.512.59.618.511.012.012.03.测得某地300名正常人尿汞值,其频数表如下。表2-2300试计算均数、中位数、何者代表性较好。例正常人尿汞值(Wg/L)频数表尿水俱例数尿汞值例数尿汞值例数0-4924-1648-34-2728-952-8-5832-956-212-50

16、36-460-16-4540-564-20-2244-68-14.有5个变量值7,9,10,14,15,试计算X及XX。5.下表为10例垂体催乳素微腺瘤经蝶手术前后的血催乳素浓度,试分别求术前、术后的均数,标准差及变异系数。应以何指标比较手术前后数据的变异情况?能说明手术前数据的变异大吗?为什么?表2-3手术前后患者血催乳素浓度(mg/ml)例号术前术后例三术前术后127641626643288011075002531600280817003004324619500215539810510220926.某地微丝蝴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。求平均滴度。抗体滴度的倒

17、数10204080160例数5121375五、习题答案要点(一)名词解释1 .答案:频数表(frequencytable)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,220个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。2 .答案:算术均数(arithmeticmean)描述一组数据在数量上的平均水平。总体均数用!i表示,样本均数用X表示。3 .答案:几彳S均数(geometricmean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G

18、o4 .答案:中位数(median)将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。5 .答案:极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。6 .答案:百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。7 .答案:四分位数间距(inter-quartilerange)是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。8 .答案:方差(variance):

19、方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。9 .答案:标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。10 .答案:变异系数(coefficientofvariation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表不。(二)单项选择题1.B2.A3.D4.C5.B6.A7.C8.C9.C10.C11.C12.B13.D14.C15.B16.C17.C18.D19.B20.D21.D(三)判断正误并简述理由1 .错。均数和中位数的大小关系取决于所描述资料

20、的分布状况。对于负偏态的资料来说,均数大于中位数;对于正偏态的资料来说,均数小于中位数;对称分布的均数和中位数相等。2 .错。3 .错。变异系数无量纲,是一个相对数。4 .错。5 .正确。样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越大。(四)计算题1 .答案:用第一组资料计算得几何均数为2.61mg/力,标准差为0.27mg/岳;第二组资料算得几何均数为2605.17ug/m3,标准差为0.27ug/m3。两组资料均数不等,标准差相等,可见标准差的大小只与资料的离散程度有关,而与均数的大小无关。2 .答案:(1)编制频数表求极差:RXmaxXmin=25.0-6.5=18.5

21、。根据极差确定组距为2.0,组段数为10。编制频数表。表2-480名北方成年女子肾上腺重量(g)频数分布表(g)(X)(f)fXfX2累计频数(%6.00-7.00535.00245.0056.258.00-9.0014126.001134.001923.7510.00-11.0019209.002299.003847.5012.00-13.0017221.002873.005568.7514.00-15.0012180.002700.006783.7516.00-17.00585.001445.007290.0018.00-19.00476.001444.007695.0020.00-21.00242.00882.007897.5022.00-23.00123.00529.007998.7524.00-25.00125.00625.0080100.00合计801022.0014176.0080100.00(2)求中位数,均数和标准差。求中位数M,ixnLx-fM2工2.0fL=12.0+17(80-50%-38)=12.24g求均数XfX=12.78f求标准差SXX2.IffXLf2”小:n1一;f.g13.答案:2-5300g/L)频数表尿汞值(科g/L)组中值(X)频数(f)累计频数(%0.00-2.00

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论