




已阅读5页,还剩88页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医药统计学 一 基本概念 概率论 probability 是研究随机现象数量规律的数学学科 eg 研究运动员打靶成绩的规律 分析11种可能结果 0 1 2 3 4 10环 出现的概率及其规律性 数理统计 mathematicalstatistics 以概率论为基础 通过对数据的收集 整理 分析和推断来研究随机现象的统计规律的学科 研究对象 统计学 statistics 以概率论 数理统计学为基础 研究资料和信息 数据 的搜集 整理 分析和解释的科学 目的是帮助人们分析所占有的信息 达到去伪存真 去粗取精 正确认识世界的一种重要手段 1 statistics 单数名词表示统计学 复数名词表示统计数据或资料 Webster国际大辞典 第三版 对统计学的定义是 asciencedealingwiththecollection analysis interpretationandpresentationofnumericaldata LastJM主编的一本流行病学辞典对统计学的定义是 thescienceandartofdealingwithvariationindatathroughcollection classificationandanalysisinsuchawayastoobtainreliableresults 由此看出 统计学是处理资料中变异性的科学和艺术 是在收集 归类 分析和解释大量数据的过程中获取可靠结果的一门学科 强调了 过程 2 统计学 统计工作 的内容 任何统计工作和统计研究的全过程都可分为以下五个步骤 设计 design 关键 依据 在进行统计工作和研究工作之前必须有一个周密的设计 前期准备工作 查阅文献了解现状征询意见 设计内容包括 确定研究目的 研究假说 确定观察对象 观察单位 样本含量和抽样方法 拟定研究方案 预期分析指标 误差控制措施 进度与费用等 设计是整个研究工作中最关键的一环 也是指导以后工作的依据 收集资料 collectionofdata 遵循统计学原理采取必要措施得到准确可靠的原始资料 基本原则 及时 完整 准确 可靠 系统原则 资料来源 原始资料 一手资料 包括经常性资料 eg 日常医疗卫生工作记录 统计报表 专门报告卡等 专题研究资料 一时性资料 eg 专题调查资料 实验研究资料 次级资料 二手资料 文献的二次开发 循证医学 整理资料 sortingdata 通过科学的分组和归纳 用图表的形式来展示资料特征 使原始资料系统化 条理化 便于进一步计算统计指标和分析 步骤 审核 遵循及时性 完整性 准确性 有效性原则 包括逻辑检查与技术检查 eg 录入误差 170输入为17 对结果影响较大 故应进行双份录入 分类或分组 质量分类 按性质 类别分类整理 即 同质者合并 非同质者分开 的原则对资料进行分组 多用于定性数据 定类或定序数据 的整理 一般用二维表 数量分组 按数量大小分组整理 即在同质基础上根据数值大小进行分组 组与组之间是连续的或非连续的 多用于定量数据 数值数据 的整理 拟订整理表 汇总归纳 制定统计图表或报告 4 分析资料 analysisofdata 目的是计算有关指标 反映数据的综合特征 阐明事物的内在联系和规律 是统计学的核心 包括 统计描述 descriptivestatistics 用统计指标 样本均数 标准差 率 与统计图 表 等方法对样本资料的数量特征及其分布规律进行描述分析事物特征 统计推断 inferentialstatistics 指如何抽样 以及如何用样本信息推断总体特征 分析事物间相互关系 eg 药物疗效的统计学分析 解释资料 interpretationofdata 对统计结果进行说明和应用 eg 药物疗效的统计判断 进行资料分析时 需根据研究目的 设计类型和资料类型选择恰当的描述性指标和统计推断方法 统计工作的五个步骤紧密相连 不可分割 任何一步的缺陷 都将影响整个研究结果 目前 应用广泛 成为医药学研究 疾病防治 卫生事业管理等多方面的重要手段 工具之一 即成为方法论 医药数理统计学 Mathematicalstatisticsofmedicine 应用概率论与数理统计学的原理与方法研究医药学以及卫生服务领域中数据的收集 整理 分析和解释的一门科学 理论基础 概率论 数理统计研究对象 随机 不确定的现象医药领域 新药研制 药物鉴定 药理分析 试验设计 药政管理 处方筛选 医药信息等 二 学习医药数理统计学的目的与要求 目的 掌握医药数理统计学的基本理论 基本方法 基本统计技能 为今后从事医药领域的科学研究 阅读专业书刊 从事具体的实践工作打下必要的数理统计学基础 第一节数据的类型和整理 一 数据的统计整理和图示 研究统计资料的第一步工作是判断统计资料的频数分布类型 故应初步编制频数分布表 绘制频数分布图 频数 frequence 各类别的数据个数 即观察值的个数 频率 frequency relativefrequency 各类别的数据个数占总数据个数的比例值 频数分布表 frequencytable 反映各类别及其相应频数的表格形式 即观察值在其所取范围内分布的情况 1 确定组数k 100 400个数据 一般分5 15个组段 可适当变动 观察单位较少时组段数可相对少些 观察单位较多时组段数可相对多些 Sturgesr的经验公式计算组数 k 1 lnN ln2 N 数据的个数 ln 以e为底的自然对数 不可过多 资料分散 编制与计算繁锁 且分布规律不能显示 不可过少 损失信息 计算误差较大 且无法显示分布特征 原则 以显示数据的分布特征和规律为依据 2 确定组距 classinterval classwidth 相邻两组段的下限之差称为组距 全距或极差 range R 最大值 最小值 Xmax Xmin组距 d d R k d可等距 也可不等距 eg 数据中有特大或特小的数值 食物中毒的潜伏期 年龄分组0 7 18 60 等 3 确定组段 各组段的起点和终点分别称为下限和上限 原则 不重不漏 第一组段应包括全部观察值中的最小值 最末组段应包括全部观察值中的最大值 并且同时写出其下限与上限 连续性资料的某组段包含下限 但不包含上限 4 计算频数 形成频数分布表 确定组段界限 列成表1 3的形式 采用计算机或用划记法将原始数据汇总 得出各组段的观察例数 即频数 表中的第 1 2 栏即所需的频数表 连续性计量资料各组段上限不标出 以表示其连续性 计算机编制准确 快速 但应保证原始数据的准确输入和组距的合理设计 频数表的用途陈述资料 便于进一步分析 观察频数分布的特征 定性描述 集中趋势 离散趋势和分布的的形状 观察数据的分布类型 初步判定 以便选取适当的统计方法 发现资料中某些特大或特小的可疑值 当样本含量较大时 各组段的频率作为概率的估计值 频数分布的类型对称分布 指多数频数集中在中央位置 两端的频数分布大致对称 特殊的对称分布为正态分布 normaldistribution eg 体重 身高等生理 生化检测结果等 偏态分布 频数分布不对称 集中位置偏向一侧 对称分布 图1某市110名7岁男童身高的频数分布 eg 正偏态分布 又称右偏态分布 指观察值较多的集中在数值较小的一侧 eg 传染病的潜伏期 非必需元素含量分布等 负偏态分布 又称左偏态分布 指观察值较多的集中在数值较大的一侧 eg 学生成绩 儿童视力 糖尿病年龄分布 冠心病 大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布 不同的频数分布类型资料应选用不同的统计分析方法 偏态分布 正偏态 负偏态 二 常用统计软件简介 一 SAS 统计分析系统 全称StatisticalAnalysisSystem 是当前最流行的国际标准通用的统计分析软件 但操作略为繁琐 二 SPSS 社会科学统计软件 全称StatisticalPackageforSocialScience 是当前最流行 应用最广泛的专业统计分析软件 操作方便 三 EXCEL 电子表格软件 可进行基本的统计分析 操作简便 第二节数据分布特征的统计描述 频数分布的特征 分布的集中趋势 centraltendency 身高有高有矮 但多数人身高集中在中间部分组段 以中等身高居多 此为集中趋势 分布的离散程度 dispersion 由中等身高到较矮或较高的频数分布逐渐减少 反映了离散程度 对于数值变量资料 可从集中趋势和离散程度两个侧面去分析其规律性 分布的形状 峰度与偏度 一 数据分布集中趋势的描述 频数分布表 图显示的集中趋势和离散程度较粗略 而计算其各指标则是准确 定量描述其分布特征 集中趋势指标 平均数 反映观察值的集中位置或平均水平 即观察值的典型水平或代表值 描述一组同质观察值的平均水平或中心位置的常用指标有均数 中位数 众数 几何均数等 平均水平指标 1 算术均数 arithmeticmean mean 简称均数 是反映一组同质的呈对称分布的数值数据的平均水平的指标 用得最多的统计描述指标 总体均数 样本均数 1 计算 直接法 样本含量较少 eg 10名七岁儿童体重 kg 分别17 3 18 0 19 4 20 6 21 2 21 8 22 5 23 2 24 0 25 5 求平均体重 解 加权法 weightingmethod 频数表资料或样本中相同观察值较多 它是权重 组中值 2 应用 适用条件 均数能全面反映全部观察值的平均数量水平 应用甚广 最适于对称分布资料 特别是正态或近似正态分布的数值资料 对于偏态资料 均数不能较好地反映其集中趋势 我也知道了 3 数学性质 0 2其中 a为任意实数 截尾均值 eg 比赛时去掉一个最高分 一个最低分 然后计算均值 2 中位数 median 将一组数据按从小到大的顺序排列 位置居中的数即是中位数 是反映一组同质的呈非正态分布的数值数据和定序数据的平均水平 用表示 1 计算 直接法 样本含量较少 eg 9例正常人的发汞值 1 1 1 83 54 24 85 65 97 110 5Me 4 8 9例正常人的发汞值 1 1 1 83 54 24 85 65 97 1 16Me 4 8 10例正常人的发汞值 1 1 1 83 54 24 85 65 97 110 5 16Me 4 8 5 6 2 5 2 加权法 频数表资料 我知道了 2 应用 适用条件 常用于描述偏态分布资料或开口资料的集中趋势 它与均数 几何均数不同的是 不是由全部观察值的数据综合得到 不受极端值的影响 而只受居中变量波动的影响 3 众数 mode 是数据中出现次数最多的观察值 用Mo表示 一般用来反映一组同质的定性数据的平均水平 应用条件 集中趋势较明显或仅为一个分布中心的定性数据资料 优点 易理解 不受极端值的影响 缺点 灵敏度 计算功能和稳定性差 具有不唯一性 在数值数据中 可能有多个或无Mo 二 数据分布离散程度的描述 离散程度用变异指标表示 反映各观察值与其平均水平 中心值 的偏离程度 集中趋势指标对一组数据的代表性取决于其离散程度 即离散程度越小 集中指标对一组数据的代表性代表性越好 eg 两名运动员分别打靶10次 对其成绩分别计算集中趋势与离散趋势指标 若集中趋势一致 则比较离散趋势 从而可说明平均水平对其真实能力的代表性 常用的变异指标有全距 方差 标准差 变异系数等 eg 设有三组同年龄 同性别儿童体重 kg 数据如下 甲组2628303234乙组2427303336丙组2629303134 一 极差 range 1 极差 全距 用字母R表示 最大值与最小值之差 R 最大值 最小值 Xmax Xmin描述数据分布的范围 个体差异的范围 极差大 说明数据分布较分散 变异度大 2 特点 计算方法简单 不灵敏 仅考虑资料两侧极端值 没有利用观察值中的全部信息 除了最大 最小值外 不能反映组内其他数据的变异 不稳定 样本较大时抽到较大值与较小值的可能性也较大 则样本极差也较大 故样本含量相差较大时 不宜用极差来比较分布的离散度 eg 上述三组数据中 甲组数据的极差R 34 26 8乙组数据的极差R 36 24 12丙组数据的极差R 34 26 8甲组 丙组数据分布较乙组集中 甲组与丙组的离散程度相同 二 方差与标准差 1 方差 variance 又称均方 MS 考虑观察值个数N的影响 总体方差 2表示 2 2 标准差 描述一组同质的呈正态分布的数值资料的变异程度的重要指标 常用SD表示 方差的度量单位是原度量单位的平方 故将方差开方后与原数据的度量单位相同 适用条件 正态或近似正态分布的数值资料 标准差的计算直接法 加权法 其中 xi是各组段的组中值 fi是相应的频数 eg 甲组 2628303234乙组 2427303336丙组 2629303134解 极差方差标准差甲组 810 03 16乙组 1222 54 74丙组 88 52 92 标准差的意义 反映一组定量观察值的离散程度 个体的变异程度 反映一组测量指标的精密度 反映样本均数描述一组个体的代表性 用于计算变异系数 标准误 结合均数与正态分布的规律估计参考值的范围 四 变异系数 简记为CV 离散系数 CV是描述离散程度的无量纲的相对指标 eg 某地20岁男子100人 身高均数为166 06cm 标准差为4 98cm 体重均数为53 72kg 标准差为4 96kg 试比较身高和体重的变异何者为大 解 由于度量单位不同 故不能直接比较两者的标准差 而应比较变异系数 身高体重由此可见 该地20岁男子体重的变异度大于身高的变异度 第三节数据的直观描述 统计图表 统计图表 统计表和统计图是重要的统计描述方法 优点 简单 明了 易于理解 代替冗长的文字叙述 表达清楚 对比鲜明 便于比较 一 统计图 statisticalgraph 统计图可形象 生动而直观地表达统计分析结果或资料的图形 缺点 不能精确地显示数字大小 医药学领域中常用的统计图有条形图 百分条图 圆图 线图 半对数图 直方图 散点图 箱式图与统计地图等 一 绘制统计图的基本要求根据资料性质和绘图目的选择适当的图形 标题应说明资料的内容 主词和宾词 时间和地点 一般位于图的下方 图的纵 横轴应注明标目及对应单位 尺度应等距或具有规律性 一般自左而右 自上而下 由小到大 为使图形美观并便于比较 统计图的纵横轴比例一般为5 7 有时为了说明问题也可加以变动 比较 说明不同事物时 可用不同颜色或线条表示 并常附图例说明 但不宜过多 放在纵 横标目之间或图域中 图域 圆图 直角坐标系第一象限 长方形框架 除线图 对数图和散点图外 其余图的纵轴尺度必须从0开始 二 常用统计图的适用条件与绘制 1 直条图 bargraph barchart 条形图 1 概念 用等宽直条的长短来表示各类别的数值大小 用于表示他们之间的对比关系 2 适用资料 独立性的 非连续性的定性数据或离散型数值数据资料 资料有明确分组 不连续 3 分类 分为单式和复式两种 单式适用于只有一组观察资料 复式适用于有若干组观察资料 4 绘制要点 坐标轴 横轴为观察项目 纵轴为数值 纵轴坐标一定要从0开始 直条的宽度 各直条应等宽 等间距 间距宽度和直条相等或为其一半 复式直条图在同一观察项目的各组之间无间距 排列顺序 可以根据数值从大到小 从小到大 或按时间顺序排列 5 应用 相互独立资料间的对比关系 图32007年某省不同地区 性别的卫生系统反应性评分比较 2 百分条图 percentagebarchart 1 概念 以长条面积为100 用长条内各段面积所占的百分比来表示各部分在全体中所占的比例 2 适用资料 构成比资料 3 应用 描述各部分的百分构成 4 绘制要点 标尺 有标尺 在图的上方或下方 起始的位置 总长度和百分条图一致 全长为100 分成10格 每格10 分段 按各部分所占百分比的大小排列 在图上标出百分比 图例 在图外要附图例说明 图52008年某医科大学公共卫生学院专业技术人员构成 3 圆形图 piegraph piechart 1 概念 又称饼图 圆形图适用于定性数据的百分构成比资料 表示事物各组成部分所占的比重或构成 以一个圆面积为100 用圆内各扇形面积所占的百分比来表示各部分所占的构成比例 2 适用资料 构成比资料 3 应用 描述各部分的百分构成 4 绘制要点 每3 6o为1 用3 6乘以百分数即为所占扇形的度数 用量角器画出 从相当于时钟12点或9点的位置开始由大到小按顺时针方向或自然顺序依次绘制方向绘图 每部分用不同线条或颜色表示 并在图上标出百分比 下附图例说明 当比较不同资料的百分构成时 可以画两个相等大小的圆 在每个圆的下面写明标题 并用相同的图例表示同一个构成部分 图72008年某医科大学公共卫生学院专业技术人员构成 4 线图 linediagram 折线图 1 概念 以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况2 适用资料 连续性的 但不表示频数分布的资料 3 应用 表示资料的变化趋势 并可表明一事物指标随另一连续变量而变化的趋势 如另一连续变量是时间 则称时间序列图 4 绘制要点 坐标轴 横轴表示时间或组段 纵轴表示频数或率 纵轴坐标可以不从0开始 因此在看图时要注意纵轴的起点坐标 数据点画在组段中间位置 相邻的点用直线连接 不要用平滑的曲线连接 无数据的组段用虚线连接 直线不能任意外延 同一张线图上不要画太多条曲线 通常 5条 否则不易分清 当有两条或两条以上曲线在同一张线图上时 须用不同颜色或不同的图形形式加以区分 并附图例加以说明 图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 在线学习平台中的知识评估与反馈机制-洞察及研究
- 版权运营策略与音乐科技创新:2025年音乐产业生态构建研究报告
- 无人机物流配送在快递行业中的无人机配送无人机行业投资报告
- 数字化技术在历史建筑保护与修复中的应用研究报告
- 2025年细胞治疗产品临床试验与审批流程:监管挑战与应对策略报告
- 火灾应对教学课件
- 文旅融合与乡村旅游产业链整合创新:2025年行业深度分析报告
- 巧用鸡蛋壳课件
- 巡视保密工作课件
- 巡护员湿地知识培训会课件
- HG+20231-2014化学工业建设项目试车规范
- 《百变扭扭棒》大班艺术课件
- FZT 73013-2017 针织泳装行业标准
- 软件开发功能验收表
- 生产部门年度经营计划
- 售后工程师的安全意识与操作规范
- 热力公司入户维修培训课件
- 给予肠内营养支持品管圈课件
- 2024-2025年全国初中化学竞赛试卷及答案
- 躺平与内卷现象看法
- 浆膜腔积液细胞病理学国际报告系统
评论
0/150
提交评论