版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章第一章 绪论绪论卫生统计学 任艳峰l统计学:是一门处理数据中变异性的科统计学:是一门处理数据中变异性的科学与艺术,内容包括收集、整理、分析、学与艺术,内容包括收集、整理、分析、解释和表达数据,目的是求得可靠的结解释和表达数据,目的是求得可靠的结果。果。l医学统计学医学统计学( (Medical Statistics) ):是应用:是应用概率论和数理统计概率论和数理统计的原理和方法,研究的原理和方法,研究医学领域医学领域中有关数据的搜集、整理、分中有关数据的搜集、整理、分析的一门应用科学。析的一门应用科学。 一、统计学一、统计学(statistics)的定义及用途的定义及用途统计学的用途统
2、计学的用途 统计学好比总体和样本间的桥梁统计学好比总体和样本间的桥梁 ; 帮助人们设计和实施从总体中科学地抽取样本,帮助人们设计和实施从总体中科学地抽取样本,使样本中的个体不多也不少,信息丰富,代表性好;使样本中的个体不多也不少,信息丰富,代表性好; 帮助人们挖掘样本中的信息,推断总体的规律性;帮助人们挖掘样本中的信息,推断总体的规律性; 帮助人们确切地描述样本中观察到的现象,恰当帮助人们确切地描述样本中观察到的现象,恰当地解释总体中可能存在的规律性。地解释总体中可能存在的规律性。二、统计工作的基本步骤二、统计工作的基本步骤1、统计设计统计设计(design):包括观察性、实验性设包括观察性、
3、实验性设计。对资料收集、整理和分析全过程进行的总计。对资料收集、整理和分析全过程进行的总体设想和安排体设想和安排 。2、收集资料收集资料(collection of data):采取措施取):采取措施取得准确可靠的原始数据。得准确可靠的原始数据。 要求:准确、及时要求:准确、及时 来源:(来源:(1)统计报表)统计报表 (2)经常性工作记录)经常性工作记录 (3)专题调查或实验)专题调查或实验 3、整理资料整理资料(sorting of data):对数据进行清理、):对数据进行清理、改错、数量化,为后续研究奠定基础。改错、数量化,为后续研究奠定基础。 4、分析资料分析资料(analysis
4、of data):): 统计描述统计描述(descriptive statistics)利用统计指利用统计指标、统计图表等,对资料的数量特征及其分布规标、统计图表等,对资料的数量特征及其分布规律进行测定和描述。律进行测定和描述。 统计推断统计推断(inferential statistics)是用样本信息是用样本信息估计或推断总体特征估计或推断总体特征 ,包括参数估计和假设检,包括参数估计和假设检验。验。l同质性同质性(homogeneity) :处于同一总体的个体之:处于同一总体的个体之间存在共性,称为同质性。间存在共性,称为同质性。例如,同性别、同年龄的小学生具有同质性。l变异性变异性(v
5、ariation) :同一总体内的个体间大小不:同一总体内的个体间大小不等,存在差异,称为变异性。等,存在差异,称为变异性。例如,同性别、同年龄的小学生属于同一个总体,但他们的身高、体重又存在变异。变异性是统计学的根本需要。l 统计学的任务就是在变异的背景上描述同一总统计学的任务就是在变异的背景上描述同一总体同质性,揭示不同总体异质性体同质性,揭示不同总体异质性(heterogeneity) 。(一)同质与变异(一)同质与变异三、几个重要的统计学概念三、几个重要的统计学概念(二)总体和样本(二)总体和样本l总体总体 ( (population) ):表示大同小异的对象(某个测量:表示大同小异的
6、对象(某个测量值)全体。或根据研究目的所确定的同质研究对象的全值)全体。或根据研究目的所确定的同质研究对象的全体(集合)。如一个国家的所有成年人(身高值);某体(集合)。如一个国家的所有成年人(身高值);某地的所有小学生(身高值)地的所有小学生(身高值) 。l样本样本 (sample):从研究总体中随机抽取的一部分有代表:从研究总体中随机抽取的一部分有代表性的个体(性的个体( individuals )的观察值的集合;)的观察值的集合;l抽样抽样(sampling):从研究总体中抽取一部分有代表性的个:从研究总体中抽取一部分有代表性的个体的方法;体的方法;l数据数据(data):对样本中个体进
7、行深入的观察与测量,获取:对样本中个体进行深入的观察与测量,获取的测量值。的测量值。l 有限总体:有明确的时间、空间范围限制的总体。l 无限总体:没有明确的时间、空间范围限制的总体。l 目标总体(target population):研究结果所要推论到的总体,即试图对某个总体下结论。l 研究总体(study population):来源于目标总体中的一个较小的总体。l如关于吸烟与肺癌的研究以英国成年男子为目标总体;1951年英国全部注册医生只是成年男子中的一部分,是研究总体。 (三)参数与统计量(三)参数与统计量l参数(parameter) :描述总体特征的指标,常用希腊字母表示。l统计量(s
8、tatistic) :描述样本特征的指标。常用拉丁字母表示。统计量是参数附近波动的随机变量 。l抽样误差、S X样本样本抽取部分观察单位抽取部分观察单位 ? X推断推断inferenceinference (四)变量的类型(数据的类型)(四)变量的类型(数据的类型)l卫生统计学中把所有的医学资料分为两大类:卫生统计学中把所有的医学资料分为两大类:定性资料和定量资料。定性资料和定量资料。住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月202
9、56532025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产
10、早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月某医院产科住院产妇基本信息某医院产科住院产妇基本信息住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月20256532025653222216016074.074.05 5无无小学小学助产助产足月足月202583020258302525
11、15815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月2025783202578
12、3292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月Quantitative data 计量资料计量资料Qualitative data Qualitative data 计数资料计数资料观察单位observations个体individualsUnits;elements变量variablesl定性资料定性资料:按某种属性分类,然后清点每类的数:按某种属性分类,然后清点每类的数据,称计数资料据,称计数资料(count data)或或(enumeration data)。也也叫定性数据叫定性数据(Qualitative data) 。包括无序分类资料和有。包括无序分
13、类资料和有序分类资料。序分类资料。 无序分类变量无序分类变量(categorical variable)资料:或名义变量资料:或名义变量(nominative variable)变量只能定性的划分成两类或少数变量只能定性的划分成两类或少数几个互相排斥的类别。有二分类几个互相排斥的类别。有二分类(binary variable) ,多分,多分类等等。类等等。例如,性别(男女)、疾病(有无)和结局(生死)等。 有序分类变量有序分类变量(ordinal variable)资料:变量值之间存在资料:变量值之间存在程度上的差别。程度上的差别。例如,问卷调查常问对某件事情的满意程度:极不满意、有点满意、中
14、度满意、很满意、极满意。有些临床体检或实验室检验常用、+、+和+来表示测量结果l定量变量资料定量变量资料:用仪器、工具等测量:用仪器、工具等测量(measure) 方法获得的数据,即为计量资料方法获得的数据,即为计量资料(measurment data)。变量值是定量的,表现为数值的大小,变量值是定量的,表现为数值的大小,一般有度量衡单位。可分为离散型变量和连续一般有度量衡单位。可分为离散型变量和连续型变量。型变量。 离散型变量离散型变量(discrete variable) :变量值只能取:变量值只能取整数。整数。例如,一月中的手术病人数,一年里的新生儿数。 连续型变量连续型变量(conti
15、nuous variable) :变量可以在:变量可以在实数轴上连续变动。实数轴上连续变动。例如,血压、身高、体重等。 例:一组例:一组20 40岁成年人的血压(舒张压)岁成年人的血压(舒张压)以以12kPa12kPa(90mmHg90mmHg)为界分为正)为界分为正常与异常两组,统计每组例数。常与异常两组,统计每组例数。 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料l变量转化:变量只能由高级向低级转化。变量转化:变量只能由高级向低级转化。l离散型变量常
16、常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。连续型有序二值 (五)概率(五)概率( probability probability )l确定性现象:在一定条件下,一定会发生或一定确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。果的叫不可能事件。l随机现象:在同样条件下,可能会出现两种或多随机现象:在同样条件下,可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。种结果,究竟会发生哪种结
17、果,事先不能确定。其表现结果称为随机事件。其表现结果称为随机事件。 随机事件的特征:随机事件的特征:随机性;规律性:每次发生的可能性的大小是随机性;规律性:每次发生的可能性的大小是确定的。确定的。l概率概率(probability ) :描述随机事件发生可描述随机事件发生可能性大小的指标。常用能性大小的指标。常用P表示。表示。0 p 1。l小概率事件小概率事件 : 发生的可能性小于等于发生的可能性小于等于0.05( P 5)或)或0.01(P 1)称为小概率事)称为小概率事件件(习惯习惯),统计学上认为一次抽样过程中不大,统计学上认为一次抽样过程中不大可能发生。可能发生。l必然事件:必然会发生
18、的事件(必然事件:必然会发生的事件(P = 1 )。)。 l不可能事件不可能事件 :必然不会发生的事件(:必然不会发生的事件(P=0 ) 频率频率 frequencyl样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f / n。l 频率与概率间的关系: 样本频率总是围绕概率上下波动 样本含量n越大,波动幅度越小,频率越接近概率。(六)误差(六)误差l误差:实际观察值与客观真实值之差。 (1)系统误差 (2)随机误差l(1)系统误差(systematic error) 概念:由人为因素造成的有一定倾向性或规律性的误差。(在实际观测过程中,由受
19、试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成)。流行病学称之为偏倚(bias)。 特点:观察值有系统性、方向性、周期性的偏离真值。 控制:可以通过严格的实验设计和技术措施消除。l(2)随机误差(random error) 概念:排除上述误差后尚存的误差,受多种无法控制的偶然因素的影响。 特点:大小方向不一的随机变化。 种类: 测量误差( measurement error) 抽样误差( sampling error) 由于个体变异和抽样造成的样本统计量之间、样本统计量和总体参数之间的差异。四、统计、计算机和统计软件的关系四、统计、计算机和统计软件的关系l统计和计算机的关系统计和计算机的关系l统计和统计软件的关系统计和统计软件的关系lSPSS软件软件五、学习统计应注意的问题五、学习统计应注意的问题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年家庭过期药品回收服务合同
- 2026年城市公共设施合同
- 2025年多功能养老社区项目可行性研究报告
- 2025年生物质能源研发项目可行性研究报告
- 2025年氢燃料电池汽车产业链可行性研究报告
- 2025年智慧城市大数据中心可行性研究报告
- 保种协议书范本
- 供料协议书范本
- 2025年人工智能大数据应用项目可行性研究报告
- 理财保险合同协议
- 2025四川资阳现代农业发展集团有限公司招聘1人笔试历年参考题库附带答案详解
- 2025河北廊坊燕京职业技术学院选聘专任教师20名(公共基础知识)测试题附答案解析
- 0901 溶液颜色检查法:2020年版 VS 2025年版对比表
- 2025年10月自考04184线性代数经管类试题及答案含评分参考
- 国开2025年秋《心理学》形成性考核练习1-6答案
- 科技研发项目管理办法
- 个体诊所药品清单模板
- 267条表情猜成语【动画版】
- 突发公共卫生事件处置记录表
- 扑救初期火灾的程序和措施
- 检验科授权书
评论
0/150
提交评论