




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第九章 人群健康研究的 统计学方法,2,一、统计学 (statistics),统计学是研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学推断。,第一节 统计学概述,3,二 统计学中的几个基本概念,4,(1)总体(Population) 是指根据研究目的所确定的同质研究对象的全体。更确切地说是同质的所有观察单位某种观察值(变量值)的集合。分有限总体与无限总体。,1、总体与样本,有限总体(finite population): 研究对象的个体数目是有限的总体。 无限总体(infinite population): 研究对象的个体数目不确定或无限多。,5,(2)样本(Sample) 是指从总体中随机抽取的一部分观察单位。 样本含量(Sample size)医学上称为样本例数 是指样本包含的个体的数目,用“n”表示。 而总体中包含的个体的数目,用“N”表示。,6, 样本的特性,1.随机性(randomization): 遵循随机化原则。(随机随意随便) 2.代表性(representative): 样本中的每个个体来自同一总体。 3.可靠性(reliability): 所作的结论可信度较高,样本含量“足够” 。 4.可比性(comparable): 遵循齐同对比的原则。,7,变量:被观察对象的特征或指标称为变量。 (习惯上称指标) 变量值: 也称观察值 (observed value, measurements) 是变量的观察结果 可以是定量的如:身高、体重血压等; 亦可以是定性的如性别、血型、疗效等),2.变量及变量值(variable and value of variable ),被观察对象的 年龄、体重、血压 性别、种族 文化程度等,3、 参数与统计量 (parameter and statistic),参数:总体的统计指标,如总体均数、总体标准差,分别用希腊字母记为、。固定的常数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。,9,统计上所说的误差包括: 实测值与真值之差(系统误差、随机测量误差); 样本指标与总体指标之差(抽样误差)。,4、 抽样误差,系统误差 是由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因使测量结果呈倾向性偏大或偏小。 特点: 可避免,随机测量误差 由于偶然因素(如操作技术不稳定、不同操作员之间的操作差异、电压不稳、环境温度差异等)的影响所致的误差。 特点:不可避免,抽样误差: 是指由随机抽样引起的某指标的样本统计量与该指标的总体参数的差异以及各样本统计量之间的差异 原因:个体之间存在差异 抽样只能抽取总体中的一部分 特点: 不可避免,10,11,(1)改进抽样方法,增加样本的代表性。 样本量 n 相等的情况下: 整群抽样单纯随机抽样系统抽样分层抽样 (2)增加样本量n (3)选择变异程度较小的研究指标,减少抽样误差的方法:,12,5、概率(probability): 是指某事件发生的可能性大小。用“P ”表示。 P的取值范围:0P1 P=0 不可能事件(事件必不发生) P=1 必然事件(事件必发生) 小概率事件: P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。 随着实验次数增至足够大,频率逐渐稳定于某一常数附近,则该常数称之为概率。,13,三 统计资料类型,14,一、资料的类型(变量类别),1、计量资料 (定量、数值变量) 2、计数资料 (定性、无序分类变量 ) 3、等级资料 (半定量、有序分类变量 ),15,1、计量资料(measurement data) 定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。 特点: 取值是定量的 表现为数值大小 有度量衡单位(计量单位) 变量值是连续的 如:身高、红细胞计数、血压等,16,2、计数资料(enumeration data) 定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 特点: 取值是定性的(无度量衡单位计量单位) 多为间断性资料 数据分类互相排斥(互不相容) 数据分类无逻辑顺序 可分二项分类和多项分类 如:性别、血型等,17,3、等级资料(ordinal data) 定义:是介于计量资料和计数资料之间的一种资料,通 过半定量方法测量得到。 特点: 取值是定性的(无度量衡单位计量单位) 数据分类互相排斥 分类等级有定量含义 (又称为半定量资料) 数据分类有程度上的差别 (等级顺序关系) 多为间断性资料 如:疗效(痊愈、好转、无效、死亡) 尿蛋白(-、+、+、+、+) 病情(轻、中、重)等,18, 资料间的转化 在实际应用中,根据分析的需要,各类变量间可以互相转化。例如: 血红蛋白 正常 重度贫血 (16.0g% ) 计量资料计数资料等级资料,19,四、统计工作的基本步骤,20,1、 统计设计 设计 (design) 是根据研究的目的,对研究工作的全过程作一个全面的规划,制定总的研究方案,是统计工作中最关键的一步。,设计,实验设计,调查设计,21,2、收集资料(collection data): 是根据研究目的及实验设计的要求,收集准确的、完整的、可靠的原始资料(raw data )。 收集资料是统计工作的前题和基础。,任务:取得准确可靠的原始数据,22, 医疗卫生 工作记录和报告, 专题调查 或试验研究, 统计报表(报告卡),经常性资料,一时性资料,(1)资料的来源,23,(2)资料的要求,必须完整、及时、正确 要有足够的数量 注意资料的 代表性和可比性,24,3、整理资料(sorting data): 把搜集到的原始资料有目的地进行科学加工, 使资料条理化、系统化,便于进一步的统计分析。,首要工作: 进行数据审核(资料清理data cleaning ) 完整性检查:要求无缺项和漏项。 准确性检查:要求无逻辑错误, 无区间错误。,25,整理资料的步骤,(1)检查核对资料,(2)设 计 分 组,(3)资料列表划记归组,按质分组 (用于计数资料和等级资料),按量分组 ( 用于计量资料 ),26,4、分析资料(analysis data): 把经过统计整理的资料作一系列的描述性分析和推断性分析,从而阐明事物的规律性。 不同类型的资料使用的统计分析的方法不一样。,分析的关键: 依据资料的类型和特征,正确选择统计分析方法。,27,统计描述 descriptive statistics,统计推断 inferential statistics,分析资料 analysis of data,统计描述:是指用一些统计指标、统计图表等方法描述数据的分布特征和变化趋势。 统计推断:是指用调查、实验取得的样本信息估计总体特征。,统计推断: 参数估计:由统计量来推断参数 假设检验:由样本差异来推断总体之间 是否可能存在差异,28,29,基本概念和基本步骤测试题,30,1、计量资料、计数资料和等级资料的关系是:,A、计量资料兼有计数资料和等级资料的一些性质。 B、计数资料兼有计量资料和等级资料的一些性质。 C、等级资料兼有计量资料和计数资料的一些性质。 D、计数资料兼有计量资料的一些性质。 E、三者差别不大。,A型题,31,2、统计学中的系统误差、随机测量误差和抽样误差,在实际工作中是:,A、三种误差都不可避免 B、系统误差和测量误差不可避免 C、系统误差和抽样误差不可避免 D、随机测量误差和抽样误差不可避免 E、三种误差都可避免,A型题,32,3、抽样误差是指:,A、个体值和总体参数之差 B、个体值和样本统计量之差 C、样本统计量和总体参数之差 D、样本统计量和总体测量值之差 E、总体测量值和总体参数之差,A型题,33,4、在统计工作中,整理资料时首要工作是:,A、设计分组 B、拟整理表 C、检查资料 D、资料归组 E、计算全距,A型题,34,5、搞好统计工作,达到预期目的,最重要的是:,A、原始资料要多 B、原始资料要正确 C、整理资料要详细 D、分析资料要先进 E、统计计算精度要高,A型题,35,6、关于随机抽样,下列说法哪一项是正确的:,A、随机抽样即随意抽取个体 B、研究者在抽样时应精心挑选个体,以使样本更能代表总体 C、抽样时应使得总体中的所有个体有同等机会被抽取到 D、为确保样本具有更好的代表性,样本量应越大越好 E、随机抽样即随便抽样,A型题,36,7、统计学中所说的总体是指:,A、根据目的划分的研究对象的全体 B、根据地区划分的研究对象的全体 C、根据人群划分的研究对象的全体 D、根据研究目的确定的同质研究对象的全体 E、随意想象的研究对象的全体,A型题,37,8、统计学中所说的样本是指:,A、随意抽取总体中任意部分 B、按照随机原则抽取总体中有代表性的一部分 C、有意识的选择总体中典型部分 D、依照研究者要求,选取总体中有意义的一部分 E、随便抽取总体中任意部分,A型题,38,9、搜集资料的具体要求是:,A、完整 B、及时 C、正确 D、条理化 E、系统化,X 型题,39,10、整理资料的目的是:,A、检查核对资料 B、使资料条理化 C、为了分组 D、便于统计分析 E、使资料系统化,X 型题,40,常 用 抽 样 方 法 特 点,简单随机抽样(simple random sampling): 最基本的抽样方法。 系统抽样(systematic sampling) : 又称等距抽样。 整群抽样(cluster sampling ): 群间差异小,群内差异大。 分层抽样(stratified sampling ): 层(strata)间差异大,层内差异小,抽样误差的大小: 分层抽样系统抽样简单随机抽样整群抽样,1)简单随机抽样(simple random sampling): 将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。 优点:操作简单,均数、率及相应的标准误计算简单。 缺点:总体较大时,难以一一编号。,2)系统抽样(systematic sampling):又称机械抽样、 等距抽样,即先将总体的观察单位按某一顺序号分 成n个部分,再从第一部分随机抽取第k号观察单位, 依次用相等间距,从每一部分各抽取一个观察单位 组成样本。 优点:易于理解、简便易行。 缺点:总体有周期或增减趋势时,易产生偏性。,3)整
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年江达县三上数学期末检测试题含解析
- 2025-2026学年巴中市通江县数学三年级第一学期期末教学质量检测试题含解析
- 2024年淮滨县数学三上期末监测模拟试题含解析
- 分析化学第1章 绪论 (2)课件
- 2025年执业医师实践演练试题及答案
- 自考行政管理职业发展试题及答案剖析
- 2025年主管护师考试知识汇编与试题及答案
- 行政管理技术策略试题及答案
- 行政管理人事管理试题及答案
- 决策性学习的卫生资格考试试题及答案
- 《机械制造技术基础》期末考试试卷及答案
- 高中语文《致大海》课件
- 后厨主管月度绩效考核表(KPI)
- 商品价格表模板
- 波浪理论基础要点图解[精]
- 汽车充电桩项目可行性研究报告【范文】
- 机械零部件过盈配合压入力与压出力计算
- 房屋建筑物构筑物检查表
- 实验室生物安全程序文件
- 房地产公司员工教育培训管理制度
- 《春酒》ppt课件(24页)
评论
0/150
提交评论