版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章绪论7年制规划教材《医学统计学》主编:余松林宇传华()1/41统计学(statistics)统计学是关于数据(data)科学,是从数据中提取信息一门学科,包含设计、搜集、整理、分析和表示等步骤。第一节概述2/41依据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、医学统计、卫生统计……医学统计学(medicalstatistics):用统计学原理和方法研究医学中问题。卫生统计学(healthstatistics):与医学统计学基本相同,但更侧重于社会、人群卫生问题。3/411.采取统计学方法,发觉不确定现象背后隐藏规律。变异(variation)是社会和生物医学中普遍现象。变异使得试验或观察结果含有不确定性,如每个人身高、体重、血压等各有不一样。
为何要学统计学?4/41
最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57。5/412.用统计学思维方式考虑相关医学研究中问题
“阳性”结果是否是虚假联络?某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?
“阴性”结果是否是样本含量不足?
有些人曾对发表在Lancet,NEnglJMed,JAMA等著名医学杂志上71篇阴性结果论文作过分析,发觉其中有62篇(93%)可能是因为样本含量不足造成假阴性。
6/413.
确保你研究论文能经过统计学审查
据国外60~80年代对不一样医学杂志发表论文调查,有统计错误论文百分比最高达72%,最低也有20%。国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。7/41JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。国际生物医学杂志编辑协会在其《生物医学期刊投稿统一要求》中也包含了统计学要求。UniformRequirementsforManuscripts
SubmittedtoBiomedicalJournals
http://8/414.取得循证医学证据主要伎俩“良好愿望医学”(well-meaningmedicine)转入“以证据为基础医学”(evidence-basedmedicine,EBM)需要有统计学方法支持。
全世界医学期刊每年大约登载600万学术论文,但能作为可靠“证据”论文并不多。
9/41第二节医学统计资料起源与分类一、原始统计数据起源常规保留数据医院信息系统(HIS)、统计报表等2.现场调查统计3.试验统计4.其它10/41二、统计数据分类只有认识了数据特点,才能正确地选取统计分析方法
按变量测量准确程度由低到高,将数据分类为:名义数据(如性别、婚姻情况)、有序变量(如疗效,类别间差异大小难以度量)、区间变量(如摄氏体温,类别间差异有实际意义)、比变量(如身高,除含有区间变量特征外,还含有真实意义零点。摄氏温度零点为水结冰时温度,并非绝对意义零点,所以它不属于比变量)定量数据定性数据11/411、定性数据(qualitativedata)
(二项与多项)分类数据(categoricaldata)计数数据(enumeration(counting)data)
2、定量数据(quantitativedata)
计量数据(measurementdata)区间数据(intervaldata)数值数据(numericaldata)3、等级资料(rankeddata)
有序资料(ordinaldata)
(一)定性与定量数据别名12/41(二)三类数据间关系
例:一组20
40岁成年人血压以12kPa为界分为正常与异常两组,统计每组例数
<8低血压8
正常血压12
轻度高血压15
中度高血压17
重度高血压定量数据等级数据定性数据13/41住院号年纪身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产4642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata定量资料Qualitativedata定性数据Units;elements14/41(三)三类数据编码与计算(1)
例:一组20
40岁成年人血压以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数
<8低血压418
正常血压102
12
轻度高血压13315
中度高血压164
17
重度高血压185定量数据等级数据定性数据15/41(三)三类数据编码与计算(2)1.定量数据:允许计算均数、标准差等(可采取t、F检验等,可当做有序或定性数据处理)2.定性数据:编码是任意,不能对编码执行均数标准差等计算,但可计算率或比(可采取卡方检验等)
调查14名男子婚姻情况分类编码频数(frequency)单身13已婚25离异32分居443.有序数据:允许基于次序计算,如计算中位数、百分位数(可当做定性数据处理)16/41第三节统计学惯用基本概念17/411、变量——能够测量任何特征或属性Anycharacteristicorattributethatcanbemeasured。(不一样个体结果可能不一样)随机变量——在概率论中称变量为随机变量
一、变量与随机变量Variableandrandomvariable依据观察数据之间有没有缝隙(gap),常将数据分类为离散型(discrete)变量(有缝隙)与连续型(continuous)变量(无缝隙)两大类。18/4119/41对随机变量取值过程为测量。取值所采取标准为测量尺度。二、测量和测量尺度采取统一标准化尺度进行测量,其测量结果普通是稳定和一致,比如身高、胸围等形态指标测量均采取统一测量尺度(全国统一研制身高计、胸围尺均以厘米为统计单位,体重以千克为统计单位,肺活量以毫升为单位等)20/41三、总体与样本populationandsample总体:依据研究目确实定同质研究对象全体(集合)。分有限总体与无限总体样本:从总体中随机抽取部分研究对象
21/41随机抽样randomsampling为了确保样本可靠性和代表性,需要采取随机方法抽取样本(在总体中每个个体含有相同机会被抽到)。22/4123/41四、参数与统计量
parameterandstatistic参数:总体统计指标,如总体均数、标准差,采取希腊字母分别记为μ、σ。固定常数
总体样本抽取部分观察单位
统计量
参数
推断inference统计量:样本统计指标,如样本均数、标准差,采取拉丁字母分别记为。参数附近波动随机变量。24/41
样本实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现频率为f/n。
概率:随机事件发生可能性大小,用大写P表示;取值[0,1]。五、频率与概率
frequencyandprobability25/41必定事件P=1随机事件0<P<1不可能事件P=0
P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件CertainImpossible0.50126/41频率与概率间关系:1.样本频率总是围绕概率上下波动2.样本含量n越大,波动幅度越小,频率越靠近概率。27/41六、误差(Error)测量值=真值+随机误差+非随机误差
Xi=
i+
i
1.随机误差(随机抽样误差):影响原因众多,改变无方向性,不可防止,但可用统计方法进行分析。2.系统误差受确定原因影响,大小改变有方向性。3.非系统误差(过失误差)研究者偶然失误而造成误差。偏差(bias)28/41七、准确度与可靠度准确度(accuracy)或真实性(validity):观察值与真值靠近程度,受系统误差影响(惯用指标:如灵敏度、特异度)。可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值靠近程度,受随机误差影响(惯用指标:一致百分率、Kappa值)。29/4130/41一、研究设计二、搜集资料三、整理资料四、分析资料五、结果表示第四节统计工作基本步骤31/411.调查设计(surveydesign)对研究对象不施加任何干预,通常建立随机抽样(randomsampling)方案。2.试验设计(experimentdesign)对研究对象施加干预,如动物试验研究、临床试验,通常建立随机分组(randomallocation)方案。一、研究设计32/41试验设计三个基本标准1.随机化(randomization)2.对照(control)3.重复(replication)33/41Fisher在他著作中屡次强调,统计学家与科学研究者合作应该在试验设计阶段,而不是在需要数据处理时候。“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败原因。”
34/41二、搜集资料(datacollection)搜集资料要遵照准确、完整、及时三个标准。资料搜集计划包含:①选择搜集资料地点、人员和时间;②搜集资料人员培训方案;③预调查或预试验方案确定;④资料统计方式;⑤调查表拟订和印刷;⑥调查或试验仪器、试剂准备;⑦调查资料抽样复核百分比和方法;⑧搜集资料所需经费准备等。35/41人员选择:高素质、有相关专业基础、以往曾有类似研究经历人员加以严格培训和管理是能够遵照三标准确保。搜集资料方式:直接观察、采访、填表和通信。直接观察、采访:调查人员亲自参加和统计,若调查人员素质高,工作认真负责,并接收过统一培训,调查结果可靠。填表和通信由被调查者自己填写,若被调查者文化水平高,素质高,愿意配合调查,也能够得到可靠资料,不然资料误差较大。36/41三、整理资料(datasorting)
目标是将搜集到原始资料系统化、条理化,便于深入计算与分析。编码,将数据输入计算机纠错改错、补漏等37/41四
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 未来五年安防线缆企业县域市场拓展与下沉战略分析研究报告
- 2026年山东文化产业职业学院高职单招职业适应性测试模拟试题带答案解析
- 2026年浙江纺织服装职业技术学院单招职业技能笔试备考试题带答案解析
- 2026年青岛电影学院高职单招职业适应性测试备考题库带答案解析
- 2025-2030农用无人机植保领域供应需求现状评估投资规划研究
- 2025-2030农作物种子研发生产现状市场需求与政策分析报告
- 养老院老人活动项目开发推广制度
- 2025-2030农业种植行业市场供需及投资布局规划研究分析报告
- 2025-2030农业生态保护以及环境保护和环境协调发展行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030农业灌溉设备产业技术革新需求调研技术储备投资规划
- SH/T 3115-2024 石油化工管式炉轻质浇注料衬里工程技术规范(正式版)
- FZ∕T 61002-2019 化纤仿毛毛毯
- 《公输》课文文言知识点归纳
- 23秋国家开放大学《机电一体化系统设计基础》形考作业1-3+专题报告参考答案
- 开封银行健康知识讲座
- 垃圾房改造方案
- 2023年工装夹具设计工程师年终总结及下一年计划
- 闭合导线平差计算表-电子表格自动计算
- 第七章腭裂课件
- 《大卫·科波菲尔》
- 电子档案需求规格说明书内容完整
评论
0/150
提交评论