




已阅读5页,还剩75页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中医药统计学与软件应用 曹治清成都中医药大学管理学院数学与统计教研室czq9771 2 第3讲统计描述 频数分布计量资料的统计描述计数资料的统计描述统计表和统计图统计描述的电脑实验 3 统计描述 第一节频数分布 一 频数分布表 频数分布 即观测值按大小分组 各个组段内观测值个数 频数 的分布 它是了解数据分布形态特征与规律的基础 中医药研究中得到的原始数据资料往往都是庞杂无序的 可以通过分组整理 制作频数分布表或频数分布图 显示数据的分布规律 以便对资料进一步进行统计分析 频数 观察数据的个数频数分布 观察数据在其取值范围内的分布情况频数分布表 又称频数表 以表格的形式描述频数分布 4 统计描述 第一节频数分布 连续型计量资料的频数分布表 频数表编制步骤找出最大值与最小值计算全距R 也称极差 R 最大值 最小值确定组数与组距列表 5 例4 1120名9岁男孩肺活量 L 资料 6 表4 2120名9岁男孩肺活量 L 频数分布 7 统计描述 第一节频数分布 离散型计量资料的频数分布表 离散型计量变量的取值不连续 可直接清点各变量值及相同变量值出现的频数 8 统计描述 第一节频数分布 表4 12005年某市102名高中男生引体向上完成次数的频数分布 9 统计描述 第一节频数分布 二 频数图 频数图 frequencygraph 亦称直方图 histogram 是在频数表的基础上 以直方的面积大小表示频数的多少 或以直方面积在总面积中的比例表示频率大小的图形 频数图按照特点 对称和非对称两种 10 统计描述 第一节频数分布 对称分布 指集中位置居中 左右两侧的频数分布基本对称的频数分布非对称分布 指集中位置偏倚 两侧频数不对称的频数分布 亦称偏态分布 偏态分布正偏态分布 峰段位于数据小的一侧负偏态分布 峰段靠向数据大的一侧 11 统计描述 第一节频数分布 频数图主要用于描述或探察数据的分布类型特征 12 统计描述 第一节频数分布 三 频数分布的用途 描述频数分布的集中趋势与离散趋势 直观地揭示数据的分布特征和分布类型 为选择适当的统计方法提供依据 利于发现某些特大或特小的可疑值 如果在频数表的两端 连续出现几个组段的频数为0后 又出现一个特大值或特小值 这种数值称为可疑值 需要进一步检查和核对 必要时通过统计方法判断 决定取舍 在样本含量足够大时 频率可以作为概率的估计值 利于进一步计算统计指标和统计分析 13 统计描述 第二节计量资料的统计描述 集中趋势 描述频数分布集中的位置 总体中的个体之间具有同质性 离散趋势 描述数据分散状况 同一总体中的个体之间存在变异性 集中趋势与离散趋势同时存在 是统计总体的重要特征 频数分布特征 14 统计描述 第二节计量资料的统计描述 算术均数几何均数中位数 一 集中趋势的统计描述 15 统计描述 第二节计量资料的统计描述 总体均数 样本均数适合描述对称分布资料的集中位置 计算方法直接法 算数均数 16 统计描述 第二节计量资料的统计描述 加权法 对于样本含量较大的频数表资料计算均数组中值x 组段上限 组段下限 2 17 统计描述 第二节计量资料的统计描述 18 统计描述 第二节计量资料的统计描述 适用于 1 原始数据呈倍数关系的资料 2 4 8 16 322 4 6 8 102 偏峰分布资料在取对数后呈对称分布的资料 几何均数 19 统计描述 第二节计量资料的统计描述 直接法 观察对象较少 加权法 频数表资料 20 统计描述 第二节计量资料的统计描述 表4 375名儿童的平均抗体滴度计算表 21 统计描述 第二节计量资料的统计描述 几何均数常用于等比级资料或对数正态分布资料 观察值中若有0或负值 则不宜直接使用几何均数 因为0和负值不能取对数 观察值一般同时不能有正值和负值 若全是负值 计算时可先将负号去掉 得出结果后再加上负号 注意事项 22 统计描述 第二节计量资料的统计描述 将一组观察值按从小到大的顺序排列 位置居中的就是中位数 大于和小于中位数的观察值个数相等 135791113 中位数M 23 统计描述 第二节计量资料的统计描述 直接法 适用于样本含量较小的未分组资料n为奇数时 3 4 4 5 6 7 7 9 11n为偶数时 3 4 4 5 6 7 7 9 11 13 计算方法 24 百分位数法 适用于样本含量较大的频数表资料 公式 说明 L表示M所在组段的下限 i表示该组段的组距 f表示该组段的频数 n表示样本含量 fL表示小于该组段的累计频数 25 统计描述 第二节计量资料的统计描述 中位数可用于各种分布的资料 在完全对称分布中 中位数等于均数 在对数正态分布中 中位数等于几何均数 中位数实际主要应用于偏态分布资料 无确切端点值或分布不明确的资料 中位数的应用 26 统计描述 第二节计量资料的统计 极差四分位数间距方差标准差变异系数 二 离散趋势的统计描述 27 A 8 8 9 10 11 12 12B 5 6 8 10 12 14 15C 1 2 5 10 15 18 19说明要比较全面的把握数据的分布特点 不仅需要了解数据的集中位置 而且需要了解数据的离散状况 28 统计描述 第二节计量资料的统计描述 R 最大值 最小值极差越大表示数据间变异越大 优点 计算方便 容易理解缺点 易受极端值左右 不够稳定 不能反映组内其他观察值的变异情况 一般常用于描述单峰分布小样本资料的离散程度 或用于初步了解资料的变异程度 极差R 29 百分位数Px是位置指标 用Px表示 用于描述观察值序列在某百分位位置的水平 Px表示将全部观察值分为两部分 有x 的观察值比Px小 有1 x 的观察值比Px大 P50即中位数 直接法 4 94 10频数表法 30 31 四分位数间距Q Q P P 四分位数间距是总体中数据居中的50 个体散布的范围 Q越大即数据间变异越大 适用于各种类型的定量变量 常用于偏态分布资料 两端无确切值资料或分布不明资料 注意 在样本量较小时不宜使用Q 32 方差 总体方差样本方差S2 33 标准差 总体标准差 样本标准差S 34 标准差反映观察值对均数的变异程度 在单位相同 均数相差不大的条件下 标准差大表示变异程度大 即观察值较分散 反之则表示变异程度小 观察值较集中 适合于描述对称分布的离散趋势 常与均数联用表达对称分布资料的集中趋势和离散趋势 35 对称分布资料 算术均数和标准差其他分布资料 中位数和四分位数间距 36 变异系数CV 当两组资料单位不同或均数相差较大时 变异大小不能直接用标准差进行比较 应计算标准差对均数的百分比 即变异系数 37 例某年某市城区120名5岁女孩身高均数为110 10cm 标准差为5 90cm 体重均数为17 71kg 标准差为1 44kg 比较身高与体重的离散程度 例某年某市城区120名5岁女孩体重均数为17 71kg 标准差为1 44kg 同年该地120名5个月女孩体重均数为7 37kg 标准差为0 77kg 比较其离散程度 38 某地不同年龄儿童身高 cm 的变异度 39 变异系数大表示变异更大 优点 无单位但是变异系数并不是万能的 两组资料的观察对象或观察指标至少一样相同的时候使用 两样均不同的时候比较没有意义 只有比较的时候才用 40 对称分布偏态分布对数正态分布集中趋势均数中位数几何均数离散趋势标准差四分位数间距对数标准差变异系数 描述频数分布特征的指标总结 41 统计描述 第三节计数资料的统计描述 绝对数 absolutenumber 是指计数资料各类别的频数 反映事物在某时某地出现的实际水平 是实际工作和科研中不可缺少的基本数据 但绝对数不便于相互比较和寻找事物之间的联系 计数资料的统计描述常使用相对数 relativenumber 以进一步分析现象间的关系 相对数是指两个及以上有联系的指标之比 常用的相对数指标有率 构成比和相对比 42 统计描述 第三节计数资料的统计描述 定性变量可以通过频率分布表描述其分布特征 还可以利用相对数指标进行描述和推断 一 常用相对数指标 43 统计描述 第三节计数资料的统计描述 说明某一事物内部各组成部分所占比重 常用百分数表示 构成比 44 Example 对某班级学生血型进行调查 共调查56人 调查结果为 A型14人 B型26人 O型10人 AB型6人 问 该班级学生各血型的构成比为多少 45 46 鼻咽癌患者的血型构成ABABO20 26 30 24 47 48 统计描述 第三节计数资料的统计描述 构成比特点 1 总体内各组构成比的总和应为100 2 如果某一部分比重增加 其它部分相应减少 49 统计描述 第三节计数资料的统计描述频率型指标 概念 说明某现象出现的强度或频度 K为比例基数 为100 1000 10000 万和100000 10万等常见的有发病率 患病率 死亡率 病死率等 率 50 发病率与患病率 发病率意义 常用来描述疾病分布 探讨发病因素 提出病因假设和评价预防措施效果 51 患病率意义 患病率是用以估计某病对居民危害的严重程度 发病率与患病率 52 oneyear 调查2004年某地感冒发病情况 该地总人口为100万 1月新发病例2000例 2月新发病例为2100例 2004年总计新发病例为23600例 该地2004年感冒发病率为多少 较长时间内新发病例的强度 53 oneyear 调查2004年某地胃癌患病情况 该地总人口为100万 于2004年11月的调查中发现胃癌患者有300例 则胃癌患病率为多少 调查 某一个时间点上的患病情况 多用于慢性病 54 死亡率和病死率 死亡率 指一定时期一定人群中 死亡发生的频率或强度 表示该病在人群中的死亡危险 55 病死率 表示患某病的全部病人中死于该病的频率 反映该病对于个体而言导致死亡的可能性大小 表示疾病的严重程度 也可反映医疗水平的高低 死亡率和病死率 56 病死率与死亡率的区别 死亡率的分母是人群 有健康人和病人 病死率的分母是本病的总例数 57 1996年6月某远洋客轮上发生一起军团病爆发流行 船离开港口时载有350名乘客 50名船员 6月1日前一周在一次风暴中有1 7乘客遇难 6月份第一周内船上有30人发生军团病 其中一半很快死亡 随后的一周又有20名发病 但无死亡 假设症状持续一个月 计算6月1 14日军团病的发病率计算6月7日军团病的患病率 58 统计描述 第三节计数资料的统计描述 两个指标可以是绝对数 相对数或平均数 可以性质相同 也可以性质不同 常见的是 男女性别比 每千人口的医生数 每千人口的病床数等 相对比 59 统计描述 第三节计数资料的统计描述 计算相对数时分母应有足够数量分析时不能以构成比代替率应分别将分子和分母合计求合计率相对数间的比较要具备可比性样本率或样本构成比的比较要做假设检验 应用相对数的注意事项 60 例 某医生用自制的中药汤剂治疗了10例AIDS患者 其中7例有效 即报告有效率为70 请问该说法是否正确 61 甲医院治疗某类患者100人 40人有效 乙医院治疗同类患者5人 2人有效 问 两医院治疗该病的有效率 Example 62 某医院统计1985 1990年儿科住院病人疾病种类分布情况见表 某医院儿科住院病人疾病种类分布情况疾病种类病人数 先天性心脏病25023 8风湿性心脏病75071 4其它504 7结论 我国少年儿童 18岁以下 的风湿性心脏病发病率约为71 4 63 在对某月交通事故的数据进行分析后发现 在发生交通事故的车辆中 高速行驶的占31 中速行驶的占56 低速行驶的占13 据此认为 中速行驶的车辆最容易发生交通事故 64 例某产院拟分析畸形儿与母亲年龄的关系 检查了新生儿4470例 畸形儿116例 得以下资料 据此得出结论 母亲年龄在24 29岁时 最易生产出畸形儿 该结论是否合理 65 某班有男生50人 女生20人 男生英语四级通过率为80 女生四级通过率为100 请问该班四级通过率为多少 答案1 90 答案2 85 7 66 统计描述 第三节计数资料的统计描述 67 68 思考1 由甲医院可知 在治愈病人中 42 为重病人 所占比重最大 因此认为甲医院对重病人治疗效果较好 对否 一个医生调查肺癌病人500例 发现400人吸烟 结论吸烟导致肺癌 对否 69 思考2 按病情程度看 甲医院轻中重病人的治愈率均高于乙医院 但从总治愈率看确发现甲医院低于乙医院 为什么 病情程度 在两资料中 内部构成不一致 此时不能直接比较两总率的大小 可以比较各分率的大小 或计算标准化率 70 思考3 用甲药治疗100名冠心病早期患者 治愈率50 用乙药治疗100名冠心病晚期患者 治愈率40 说明甲药疗效比乙药好 对否 71 统计描述 第三节计数资料的统计描述 比较的两个组除研究因素外 其余重要的非处理因素 如观察对象 研究方法 观察时间 地区和民族等因素应相同或相近 两比较组的内部构成应相同或相近 两个率或构成比的对比应注意可比性 72 统计描述 第三节计数资料的统计描述 标准化法的基本思想是 采用统一的标准构成 以消除构成不同对总率的影响 使算得的标准化总率具有可比性 标准化率的计算分为直接法和间接法 二 率的标准化 73 直接法 标准人口的选择 以比较的两组资料各部分之和作为标准在比较的两组资料中任选一组资料作为标准以某地的标准人口分布作为标准 74 75 76 77 标准化率不表示某地实际水平 仅反映资料间的相对水平 选用不同标准 所算得的标准化率的数值也有所不同 各年龄组率若
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 恒力招聘考试题及答案
- 雨露助残活动方案
- 杭州自考试题及答案
- 骨科知识考试题及答案
- 高空吊绳考试题及答案
- 分拣货物考试题及答案
- 多场景信息管理系统框架模型
- 电梯故障考试题及答案
- 跨部门协作沟通及会议记录工具
- 文档管理自动化系统及文件归档指南
- 高中英语新课标3000词汇表(新高考)
- 《中国政法大学》课件
- 班本课程的实施与开展培训
- 旅馆消防安全灭火疏散应急预案模版(3篇)
- 汽车吊维保记录
- 机房网络改造升级方案
- 函数的单调性与最值课件高三数学一轮复习
- DL∕T 5344-2018 电力光纤通信工程验收规范
- DL∕T 2528-2022 电力储能基本术语
- DL∕T 1785-2017 电力设备X射线数字成像检测技术导则
- 不交社保劳动合同模板
评论
0/150
提交评论