




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,第二章,统计工作基本步骤: 设计收集整理分析,(按资料类型) 整理资料-制作频数表 分析资料 统计描述: 指标、图表 统计推断:参数估计、假设检验,第二章,计量资料的统计描述(指标),第二章,主要内容,第一节 频数分布表和频数分布图(整理) 第二节 集中趋势 第三节 离散趋势 第四节 正态分布 第五节 医学正常值范围的估计,分析,应用,表2.1 某年某地区434名15-64岁少数民族 已婚妇女现有子女数的频数分布,5,例2.1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示:,6,一、频数表 (Frequency Table) 同时列出观察指标的可能取值区间及其在各区间内出现的频数。 1.求全距:R= 5.95-3.82=2.03 2.确定组数k:通常选择在815之间 3.确定组距: 参考组距为R/k , R为全距 4.确定组段: 包含下限不包含上限 5.对各组段计数: 划记,汇总.,7,某地140名正常男子红细胞数的频数表,8,二、直方图(Histogram) 直观、形象地表示频数分布的形态和特征。,140名正常男子红细胞计数的直方图,9,频数表的用途 1.作为陈述资料的形式 2.便于观察数据的分布类型 3.便于发现资料中含有的异常值 4.便于进行统计指标的计算和进一步的分析.,1. 频数表的编制步骤,表2.2 某市120名5岁女孩身高频数分布,1. 频数表的编制步骤,第二节 集中趋势的描述,为了进一步揭示数据分布的规律,尚需要用统计指标来较为准确地描述数据的分布特征:集中趋势和离散趋势 平均数(average)是一组反映资料集中趋势( central tendency )的指标。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 众数(mode),一、算术平均数( The Arithmetic mean),简称均数(Mean)或均值,定义为所有变量值之和除以变量值个数(即,样本含量Sample Size)。反映一组呈对称分布的变量值在数量上的平均水平。,13,(1)直接计算法 公式 :,例1:试计算1,3,7,9的均数?,例2:试计算1,3,3,7,7,9,9,9的均数?,14,(2)加权法,为求和符号,读成sigma,15,1. 频数表的编制步骤,意义:一组性质相同的观察值在数量上的平均水平。表示 :(总体) X(样本) 计算:直接法、间接法、计算机 特征: (X- X)=0 。 (X- X)2 (X- a)2(其中a X) 易受到极端值的影响。 应用:正态分布或近似正态分布; 可以作为样本的代表值与其他样本进行比较。 注意:合理分组,才能求均数,否则没有意义。,算术均数小结,在数量上的平均水平。,例 一组血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求均数。,此例的算术均数为22222,显然不能代表滴度的平均水平。 直观看,其平均水平应为1000, 如何求得这一数据呢?,在数量上的平均水平。,可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。,二、几何均数(geometric mean),19,(1)直接法,几何均数:变量对数值的算术均数的反对数。,其他对数(如自然对数)变换也可获得相同的几何均数,20,例3.6 测定10名伤寒病人血清 抗体滴度分别为1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1:16,1:64, 1:128,求其平均抗体滴度。 以其滴度的倒数为原变量值,代入公式有:,平均抗体滴度为: 1:11,21,(2)加权法,公式:,22,例2.5 75名儿童的平均抗体滴度计算,几何均数小结,意义:N个数值的乘积开N次方即为这N 个数的几何均数。表示:G 计算:直接法、间接法 应用: 原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。 等比资料 注意 观察值不能同时有正负或有零,若全是负值,则计算时可先去掉负号,得出结果后再加上负号。 同一资料,几何均数均数,3. 中位数(median),中位数是将一批数据从小至大排列后位次居中的数据值,符号为M,反映一批观察值在位次上的平均水平。,11只大鼠平均存活时间如下,求其平均存活天数? 4,10,7,50,3,15,2,9,13,60,60,变量排序 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60 秩 次 1 2 3 4 5 6 7 8 9 10 11,(一) 中位数计算方法,1.直接法:适用于样本量较小的计量资料。 当n为奇数时 当n为偶数时,1. 频数表的编制步骤,例 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天, 求其中位数。,1. 频数表的编制步骤,2.频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。,M : 中位数所在组段下限 i: 组距 fM : 中位数所在组段频数 f:中位数所在组段前一组的累计频数,28,频数表资料的中位数,下限值L 100cm,上限值U 120cm,i; fm,中位数M,29,中位数100+20x(1503x50%448)/520 111.67(分),1. 频数表的编制步骤,中位数小结,计算时只利用了位置居中的测量值 优点:对极值不敏感 缺点:并非考虑到每个观测值 适用于各种分布类型的资料,特别适合于: 大样本偏态分布资料 或者一端或两端无确切数值的资料 或分布不清的资料 对于正态分布资料,中位数等于均数,对于对数正态 分布资料,中位数等于几何均数,1. 频数表的编制步骤,第三节、离散趋势的描述,变异(variation)指标:反映数据的离散度( Dispersion )。即个体观察值的变异程度。常用的指标有: 1. 极差(Range) (全距) 2. 百分位数与四分位数间距 Percentile and Quartile range 3. 方差 Variance 4. 标准差Standard Deviation 5. 变异系数 Coefficient of Variation,1. 频数表的编制步骤,例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3),甲,乙,丙,1. 频数表的编制步骤,1.极差(Range) (全距),优点:简便 缺点: 只利用了两个极端值;n大, R也会大,不稳定。 应用: 用于描述单峰对称分布小样 本资料;初步了解资料的变 异程度。,120,40,20,max - Xmin,2.百分位数与四分位数间距 Percentile and quartile range,百分位数 :数据从小到大 排列;在百分尺度下,所占百分比对应的值。记为Px。,35,PX,X% (100-X)%,Xmin,Xmax,P100,变量值从小到大排列,P0,百分位数示意图,百分位数的计算,直接法:略 频数表法:公式,37,P2580+20x(1503x25%0)/44896.77(分) P75120+20x(1503x75%968)/226134.09(分),38,四分位间距: QP75 P25 Q越大,表示资料的离散程度越高,反之亦然。与中位数的应用条件相同可以看作是一对指标。,0 P25 P50 P75 100%,3.方差,方差 (variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。,平均偏差,=,离均差平方和(SS),=,离均差,=,总体方差,方差性质:方差越大说明数据的变异越大 n为自由度(degree of freedom,简记为DF) 指随机变量能自由取值的个数,样本方差为什么要除以(n1),与自由度(degrees of freedom)有关。 自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度了。计算标准差时, n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”。因此只有(n1)个自由度。,42,例题:求某市城区11名岁女孩身高的样本方差,已知107.39。,2 =(112.9-107.39)2+(99.5-107.39)+(116.5-107.39)/(11-1) =48.75(cm)2,方差的计算,4.标准差,标准差 (standard deviation)即方差的正平方根;其单位与原变量X的单位相同。 计算公式:,44,标准差(standard deviation),样本标准差为样本方差的平方根; 总体标准差为总体方差的平方根。,45,频数表标准差计算公式,1. 频数表的编制步骤,表2.2 某市120名5岁女孩身高频数分布,47,5. 变异系数,变异系数(coefficient
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 豆类食品的加工副产物利用考核试卷
- 呼吸道清理方法与护理要点
- 长途客运企业社会责任实践与评估考核试卷
- 药店常见疾病联合用药指南
- 鱼鳃的呼吸器官
- 游客疾病案例分析与应对策略
- 广东省深圳市2024-2025学年高一下学期期中考试 化学 PDF版含解析【KS5U 高考】
- 小儿急性呼吸衰竭诊疗要点
- 2025年城市更新背景下的历史文化街区保护与特色商业开发研究报告
- 2025年智慧城市背景下低碳城市规划创新案例解析
- 小学数学练习设计的有效性研究结题报告
- 江苏省苏州市工业园区2023-2024学年八年级下学期期末语文试题(解析版)
- 浙江温州十校2023至2024学年高二下学期6月期末联考化学试题附参考答案(解析)
- 湖南省娄底市涟源市2023-2024学年六年级下学期6月期末英语试题
- 上海市徐汇区市级名校2025届物理高一第二学期期末考试模拟试题含解析
- 2024年安徽省初中(八年级)学业水平考试初二会考生物+地理试卷真题
- DL-T5017-2007水电水利工程压力钢管制造安装及验收规范
- 天一大联盟2024届高一数学第二学期期末统考试题含解析
- (高清版)JTG 3370.1-2018 公路隧道设计规范 第一册 土建工程
- 湖南省长沙市2024年七年级下学期数学期末考试试题附答案
- 消化道穿孔患者的护理课件
评论
0/150
提交评论