计量资料的统计分析.ppt_第1页
计量资料的统计分析.ppt_第2页
计量资料的统计分析.ppt_第3页
计量资料的统计分析.ppt_第4页
计量资料的统计分析.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量资料的统计分析,主要内容 1、算术均数、标准差、变异系数的概念、适用条件和 计算方法。 2、正态分布概念与特征、正态曲线下面积规律和应用。 3、标准误的意义和总体均数的区间估计。 4、标准差和标准误的异同点。 5、假设检验的意义和一般步骤。 6、假设检验应用的注意事项。,情景资料,1:110名男大学生的身高资料: 173.9 173.9 166.9 179.5 171.2 167.8 177.1 174.7 173.8 182.5 173.6 165.8 168.7 173.6 173.7 177.8 180.3 173.1 173.0 172.6 173.6 175.3 178.4 18

2、1.5 170.5 176.4 170.8 171.8 180.7 170.7 173.8 164.4 170.0 175.0 177.7 171.4 162.9 179.0 174.9 178.3 174.5 174.3 170.4 173.2 174.5 173.7 173.4 173.9 172.9 177.9 168.3 175.0 172.1 166.9 172.7 172.2 168.0 172.7 172.3 175.2 171.9 168.6 167.6 169.1 166.8 172.0 168.4 166.2 172.8 166.1 173.5 168.6 172.4 17

3、5.7 178.8 169.1 175.5 170.3 171.7 164.6 171.2 169.1 170.7 173.6 167.2 170.7 174.7 171.8 167.3 174.8 168.5 178.7 177.3 165.9 174.0 170.2 169.5 172.1 178.2 170.9 171.3 176.1 169.7 177.9 171.1 179.3 183.5 168.5 175.5 175.9 1、如果计算平均身高,你首先会怎样处理这些资料? 2、如何整理资料? 3、该资料分布有何特点? 4、可用什么指标描述其平均水平?理由?,情景资料,2:10个人在

4、饭店用餐后发生食物中毒,潜伏期分别为:3、8、5、8、10、10、9、8、10、23小时。 可用什么指标描述其平均水平?理由? 讨论题: 1、如何描述计量资料的分布特点? 2、计量资料分布类型有哪些? 3、三种平均数指标适用条件?,(一)频数分布表的绘制,1、编制 a 求极差 R=max-min b 划组段 确定组数 、确定组距i(i=R/组数)、确定上下限 c 归组并统计频数 110名20岁健康男大学生身高(cm)的频数分布,2、频数分布表的作用: a 观察集中、离散趋势。 b 描述资料的分布特点,初步判断分布类型。 c 便于发现特大、特小的可疑值。 d 便于统计计算。,(二)集中趋势,1、

5、均数 ,X 2、几何均数 G 3、中位数 M,1、算术均数(简称均数),描述一组数据在数量上的平均水平 。 适用于正态或近似正态分布的资料 计算方法:直接法、加权法,加权法,132名高知血清总胆固醇均数、标准差计算 血清胆固醇(mmol/L) X f fx fx2 3.0 3.25 3 9.75 31.69 3.5 3.75 6 22.50 84.38 4.0 4.25 20 85.00 361.25 4.5 4.75 22 104.50 496.38 5.0 5.25 31 162.75 854.44 5.5 5.75 26 149.50 859.62 6.0 6.25 18 112.50

6、703.12 6.5 6.75 5 33.75 227.81 7.0 7.25 1 7.25 52.56 合计 132 687.50 3671.25,=687.50/132=5.21mmol/L,S= ( fx2 ( fx) 2/n)/(n1) =(3671.25687.5 2 /132)/(1321) =0.83mmol/L,2、几何均数G,概念:指一组数据的倍数平均。 应用: (1)变量值呈倍数关系 (2)对数正态分布如血清抗体滴度资料 。,例 设有6份血清的抗体效价为 1:10,1:20,1:40,1:80,1:80,1:160。求其平均效价。 本例可将各抗体效价的倒数代入公式,求平均效

7、价数的倒数。 该6份血清的平均抗体效价为1:45。,3、中位数,M ,P50 (注意与百分位数的关系) 一组按大小排列的资料中处于中间位置的数值. 适用于任何分布的计量资料,但较粗糙。 方法:直接法 频数表法,直接法实例,n为奇数时 n为偶数时 实验组: M=(X5+X6)/2=(16+17)/2 =16.5 对照组: M=(X6+X7)/2=(7+8)/2 =7.5,频数表法实例,164名食物中毒潜伏期的中位数和百分位数计算表 潜伏期(小时 )人数f 累计频数 累计频率(%)(1) (2) (3) (4) 0 25 25 15.2 12 58 83 50.6 24 40 123 75.0 3

8、6 23 146 89.0 48 12 158 96.3 60 5 163 99.4 7284 1 164 100.0,50%在“12”组段内,则L=12,i=12,f=58,fL=25,n=164,按式(3.8)计算 =23.8(小时),百分位数,求P95时,x=95,即累计频率为95%所在组段。本例为“48”组段,则L=48,i=12,f=12,fL=146,n=164,代入公式(3.9) =57.8(小时),情景资料,1、如果1、2班的平均身高均为160cm,是否可以认为二个班的身高情况没有差别? 2、可以用哪些指标反映身高的变异程度?哪个最合适?为什么? 3、计算本班身高的变异程度?

9、4、举例说明,什么情况下需要计算变异系数?描述本班身高变异程度时是否需要用该指标?,(三)离散趋势,甲 26 28 30 32 34 乙 24 27 30 33 36 丙 26 29 30 31 34 三组资料均数相同, 但分散度不同。,描述分散度的常用指标: 极差 R 方差 2 标准差 1/4间距 Q1/4 变异系数 CV%,标准差(、S),计算 适用: 对称分布,尤其是正态分布 应用: 1、描述资料的离散程度,反映均数对变量值的代表性,标准差 越大,代表性越差。 2、计算变异系数和标准误。 3、估计指标的正常值范围 NR,变异系数,CV%用于比较几组资料的变异程度 适用情况具有以下之一时:

10、 a 资料的单位不一样 b 资料的均数相差太大 CV%=S/ x 100% 案例,课外练习,某医科大学抽查了100名健康女大学生的血清总蛋白含量(g/L),检查结果如下: 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5

11、 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 70.3 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7 试回答以下问题: 1.这是总

12、体还是样本资料? 2.上述资料的观察单位是什么?是数值变量还是分类变量? 3.怎样对这样一个资料(分布规律)进行简单描述?,练 习,1、反映偏态分布资料集中趋势的统计指标是; A . X B. G. C. M. D. S E. CV. 2、某病患者6人,其潜伏期(天)分别为2,3,8,5,2,20天,则其平均潜伏期为( )天. A. 6.67 B. 6.5 C. 4 D. 5 3、血清学滴度资料最常用来表示其平均水平的指标是 A. 均数 B. 中位数 C. 几何均数 D. 百分位数,练习,4、5人的血清滴度为 1:20、1:40、1:80、1:160、1:320描述平均滴度,用哪种指标较好?

13、A.平均数 B.几何均数 C.算术均数 D.中位数 E. 百分位数 5、偏态分布宜用 描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 E方差,练习,6、 分布的资料,均数等于中位数。 A.对称分布 B.左偏态 C.右偏态 D.正态分布 E都不是 7、下列哪项不是标准差的应用? A 描述资料的离散程度 C 结合均数描述正态分布的特征 B 计算变异系数 D 衡量抽样误差的大小 E 计算标准误,练习,8、关于标准差,哪一项是错误的 。 A.反映全部观察值离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 E多用于正态分布计量

14、资料的描述 9、一组变量的标准差将 A.随变量值的个数n的增大而增大 B.随变量值得个数n的增大而减少 C.随变量值之间的变异增大而增大 D.随系统误差的减少而减少 E以上都不对,练习,10、某地调查20岁男大学生100名,身高标准差为4.10cm,体重标准差为4.10kg,比较两者的变异程度,结果 A.体重变异度大 B.身高变异度较大 C.两者变异度相同 D.由于单位不同,不能直接比较 11、关于变异系数的使用错误的是 A 在比较两组资料的变异时,若单位不一致则用CV B 在比较两组资料的变异时,若均数相差很大则用CV C 在比较两组资料的变异时,必须用CV D 比较身高和体重的变异时,必须用CV E 比较新生儿和成年人体重的变异时,必须用CV,练习,12、变异系数CV的数值 。 A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小 E一定比标准差大 13、用均数和标准差可以全面描述 资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E各种分布,是非题,1.均数总是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论