版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学知识点整理第一节统计学中基本概念 一、同质与变异 同质:统il研究中,给观察单位规定一些柑同得因素情况。如儿童得生长发疗,规定同性別、同年龄、健康得儿童即为同质得儿童。变异:同质得基础上个体间得差异。同质”就是相对得,就是客观事物在特;条件下得相对一致性/而“变异”则就是绝对得 二、总体与样本1、总体:就是根据研究目得所确泄得,同质观察对象(个体)所构成得全体。2、样本:就是从总体中随机抽取得部分观察单位变量值得集合。三、参数与统计* 总体参数:根据总体个体值统计计算出来得描述总体得特征量。用希腊字母表示。6. n样本统计量:根据样本个体值统计讣算出来得描述样本得特征量。用拉丁字母表
2、示。X、S、P 总体参数一般就是不知道得,抽样研究得目得就就是用样本统计量来推断总体参数,包括区间 估讣与假设检验 四、误差:实测值与真值之差1、随机误差:就是一类不恒泄得、随机变化得误差,由多种尚无法控制得因素引超。随机测量误差、抽样误差。2、系统误差:就是一类恒世不变或遵循一泄变化规律得误差,其产生原因往往就是可知得或可能掌握得。3、非系统误差:过失误差,可以避免或淸除。五、概率 就是用来描述事件发生可能性大小得一个量值,常用P表示。概率取值旷仁统计上一般将PWO. 05或PWO、01得事件称为小概率事件表示英发生得概率很小,可以认为在一次抽样中不会发生。第二节统计资料得类型 变量:确世总
3、体之后,研究者应对毎个观察单位得某项特征进行观察或测量,这种特征能表现 观察单位得变异性,称为变量。一、数值变量资料 又称为il量资料、定量资料:观测每个观察单位某项指标得大小而获得得资料。表现为数值大小,带有度、SL衡单位。如身高(cm).体重(kg)、血红蛋白(g)等。二、无序分类变量资料 又称为;性资料或计数资料:将观察对彖按观察对象得某种类别或属性进行分组计数,分组汇 总各组观察单位后得到得资料。分类匚分类汁;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料B、讣量资料【例题单选】某地A、B. 0、AB血型人数分布得数据资料就是(A、定量资料C、il数资料D、等
4、级资料【答案】C【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为il数资料。因为就是按 照变量得血型分类,血型表现为互不相容得属性。所以本题选Co【例题单选】测量正常人得脉搏数所得得变量就是(A、二分类变量 B、多分类变量C.定量变量D、定性变量【答案】C【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象得某种属性得不同程度分成等级后分组计数, 分组汇总各组观察单位后得到得资料。特点:每一个观察单位没有确切值,齐组之间有性质上得差别或程度上得不同 举例: + + + 第三节统计工作得基本步骤1、
5、统il设汁 2、收集资料 3、整理资料 4、分析资料:统讣描述:就是利用统计指标、统计表与统讣图柑结合来描述样本资料得数量特征及分布规 律。统计推断:就是使用样本信息来推断总体特征。统计推断包括区间估计与假设检验。第四节统计表与统计图一、统计表 统计表得基本结构与要求 标题:高度概括表得主要内容,时间、地点、研究内容,位于表得上方,居中摆放/左侧加表得序 号。标目:横标目与纵标目。线条:通常采用三线表与四线表得形式。没有竖线或斜线。数字:表内数字一律用阿拉伯数字。同一指标,小数位数应一致,立次对齐。无数字用“一表 示。暂缺用“表示。为确切值。备注:位于表得下而,通常就是对表内数字得注解与说明,
6、必要时可以用等标出。一张统 计表得备注不宜太多。二、制表原则 重点突出,一个表一个中心内容 主谓分明,层次淸楚简单明了/一切文字数字线条尽量从简【例题单选】统计表内不列得项就是()(2010. 7)A、标目B、线条C、数字D、备注【答案】D【解析】统讣表内备注位于表得下而,不列在统计表内,所以本题选择D。三. 统计图1、(1)标题 标目刻度图例:不同颜色或者不同线条表示需要说明。2、常用统计图得适用条件打要求条图:适用于比较.分析独立得或离散变量得多个组或多个类别得统计指标.圆图与百分比条图;构成比得比较(3) 线图:描述某统计量随另一连续性数值变量变化而变化得趋势.(4) 直方图:数值变量得
7、频数分布(5) 散点图:用点得密集程度与趋势描述2个变量间得数量关系(6) 箱式图:多组数据分布得比较统计地图:用不同得颜色与花纹表示统计量得在地理分布上得变化,适宜描述研克指标得 地理分布图。【例题填空】描述某地十年间结核病死亡率得变化趋势宜绘制【答案】线图数值变量资料得统计分析第一节数值变量资料得统计描述一. 频数分布表1.编制步骤(1)2.频数分布表得主要用途:讣算全距确定组距划分组段统计频数确世频率打累il 频率(1)揭示资料得分布类型(2)观察资料得集中趋势与离散趋势(3)便于发现某些特大或特小离群值(4)便于进一步计算统计指标与作统讣处理 二、集中趋势指标 数值变量资料得集中趋势指
8、标就是用平均数来描述得,代表一组同质变量值得平均水平。常 用得有算术均数、几何均数与中位数。lx算数均数适用于对称分布(正态分布)或者近似对称分布得资料。习惯上以P表示总体均数,以X表示样本均数。2、几何均数数值变量呈倍数关系或者呈对正态分布,如抗体效价及抗体滴度,某些传染病得潜伏期细菌计数等,宜用几何均数(G)。几何均数常用于等比资料或对数正态分布资料。3s中位数 就是指将一组变量值从小到大排列,位次居中得观察值就就是中位数。适用条 件:变量值中出现个别特别大或特别小得数值;偏态分布资料;数值一端或两端无确定数值; 资料类型不明。4、百分位数就是一种位背指标,以Px表示,把一组数据从小到大排
9、列后,理论上有X%得变量比Px小有(100冈得变量值比Px大O【例题单选】描述正态分布资料集中趋势得指标就是(A、中位数B、几何均数D、标准差C、算术平均数【答案】C【解析】算数均数适用于对称分布或者近似对称分布得资料。几何均数常用于等比资料或对 数正态分布资料。中位数适用条件:变量值中出现个别特別大或特别小得数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。标准差描述数据得离散趋势指标。所以本题选 择Co三. 离散趋势指标1、极差与四分位数间距极差:简记为R,亦称全距,即一组变量值中最大值与最小值之差,反应变量值得离散范用。3.四分位数间距Q-般与中位数一起描述偏态分布资料得分布离
10、散趋势。方差与标准差:方差表示样本观察值得离均差平方与得均值。表示一组数据得平均离散情况。标准差就是方差得正平方根。用途:fl-l(1) 用于表示正态或近似正态分布资料得离散度;(2) 反映均数得代表性标准差越小,数据离散程度越小,均数得代表性越好。(3) 确定医学参考值范围95%医学参考值范围J + 1. 96s 3、变异系数(CV)适用条件:观察指标单位不同,如身高、体重 同单位资料,但均数相差悬四、正态分布与参考值范围得制定 ()正态分布1、概念:也称高斯分布,就是医学与生物学垠常见、最重要得一种连续性分布。2、特征:(1)在直角坐标得横轴上方呈钟型曲线两端与X轴永不相交,且以X=u为对
11、称轴左右完全对称(2)在x= U处,f(X)取最大值(3)正态分布有两个参数,即均数U与标准差。均数U描述了正态分布得集中趋势位置,若固定5改变U值,曲线沿着X轴平行務动,集形状 不变,故P称为位程参数。标准差。描述了正态分布得离散程度,若固定U, C越小曲线越陡 绡;反之,。越大,曲线越平坦故。称为形状参数或离散度参数。(4)正态曲线下得而积分布 有一世得规律。4、正态曲线下而积得分布规律(二)医学参考值范帀得制;医学参考值:就是指绝大多数正常人得人体形态、功能与代谢产物等各种生理及生化指标常数,也称正常值。表32参考值范B的定%双侧 -单侧双单側只有下限只有匕限只有下限只有t限9()X +
12、 I.64SX-1.28SX + 1.28S卩5讥Pw95X + i.965X-1.64SXU.645卩2.厂丹7 5Ps99X + 2.58SX-2.33SX 十 2.33SPd.lP的 5p.p正态分布医百分也数法第二节数值变量资料得统计推断均数得抽样误差与标准课抽样误差:由于个体变异与抽样造成得样本统计量与总体参数与样本统计量之间得差异。均数得抽样误差:由于抽样造成得样本均数与总体均数与样本均数间得差异。标准误:样本均数得标准差,用0壬來表示。9未知)二、t分布t分泮咄r线叹(L%q电*分繼序 单蜂分布曲线,U不同,曲线形状不同t分布审血关,富小,t值越分散,t分布得峰部越低,而两侧尾部
13、翘得越高t界值表中一侧尾部而积称单侧概率(0)两侧尾部面枳之与称双侧概率(1/2)如:to、0,9=2. 262, to、05,9=1 833在柑同自由度时.I t I值增大减小在相同。时,单尾。对应得t值比双尾a得小三.总体均数得区间估计统计描述统计分析参如诀i用样本指标估计总体指标统计推断假设检验总体均数置信区间(可信区间)得计算区间估计:就是按预先给定得概率(1。)所确定得包含未知总体参数得一个范围。()小样本或a未知按t分布G-ta/2.代,X + t*签金(二)1、已知 0一U 分布(无一/zJFr X+Ud/zJjQ2、a未知,但大样本(260 )按U分布四. 假设检验得意义与基本
14、步骤假设检验:先对总体得参数或分布做出某种假设,再用适当得统计方法根拯样本对总体提供得信息,推断此假设应当拒绝或不拒绝基本步骤:1、建立检验假设,确定检验水准Hl:(备择假设)pH Ho川卩0或HSo确检验水准 u =0、052、选圮检验方法,计算检验统计量3、确世P值/作出推断结论第三节 均数得t检验与U检验t检验应用条件:样本与总体/两样本均数得比较当n60时,要求样本取自正态分布得总体总体标准差未知;两小样本均数比较时,要求两样本总体方差柑等(?= 0尹 n含量较大川分布一、单样本t检验 适用于样本均数代表得未知总体均数卩与己知总体均数X得比较。 _X “o_X “0 / v=n-l二、
15、配对样本t检验 适用于配对设计得计S资料常见得配对设计主要有以下情形:自身比较:同一受试对象处 理前后-同一受试对象分别接受两种不同得处理-将条件近似得观察对象两两配成对 子,对子中得两个个体分别给予不同得处理。前提条件:d变量服从正态分布Sd/Vn Sd/n【例题单选】作配对样本t检验得前提条件就是(A、两组数据独立C、两组数据得差值服从正态分布D、两组数据得差值不服从正态分布B、两组数据不独立【答案】C【解析】配对样本t检验样本可以就是自身配对,也可以异体配对所以数据可以独立,也可以 不独立。它处理得就是两样本得差值,所以差值要服从正态分布才可以应用配对样本t检验, 所以本题答案选C。三、
16、两样本t检验 适用条件:完全随机设计得两样本均数得比较。比较两样本所代表得总体均数氏与七就是 否相等0完全随机设讣就是将受试对象完全随机分配到两个不同处理组。要求:独立、正态、方差齐性V=ni + n2-2S-=H“ ”2屮=工兀;一 兀 I y /| + 工X; 一 兀 2 y /2C“1 + ”2 2四. 两样本u检验完全随机设讣得两样本均数得比较”适用于样本量比较大得资料(nl60且n260)-Vi -V2-VI 心X X2.JS jg + g五. 假设检验应注意得问题假设检验应有严格得抽样设计同质2、要注意选用得假设检验方法得应用条件3、4、结论不能绝对化5、假设检验得单侧检验与双侧检
17、验得选择正确区分差别有无统il 意义与有无专业上得实际意义假设检验得两类错误第I类错误:拒绝实际上成立得Hs犯第I类错误得概率大小为CG第n类错误:不拒绝实际上不成立得Ho,犯第n类错误得概率为P.当样本含S n 一定时,a越小e越大;若想同时减少a与已只有增大样本含量.1-P称为假设检验得功效 当所研究得总体与确有差别时,按检验水准a能够发现它(拒绝Ho)得概率。分类变量资料得统计分析 第一节分类变量资料得统计描述一. 常用相对数 率:说明某现象发生得频率或强度。构成比:说明某一事物内部各组成部分所占得比重或分布。相对比:说明一个指标就是另一个指标得几倍或百分之几。【例题单选】某医院住院病人
18、中有15%得胃癌患考,该15%就是(A、虑病率C、构成比D、相对比【答案】C【解析】15%得肖癌虑者指得就是胃癌患者占住院病人得15%,所以就是构成比。【例题填空】构成比就是说明或分布指标。率就是说明或强度得指标。【答案】比重;频率 二、应用相对数时应注意得问题(2011. 7简答题)1. 讣算相对数时,观察单位数应足够多 2、分析时不能以构成比代替率 3、相对数得相互比较应注意可比性,不具有可比性应进行标准化 4、样本率或构成比得比较应做假设检验第二节分类变量资料得统计推斷一、率得抽样误差与标准课bpSpy( 1 一疋)J二、总体率得区间估计1、査表法:当n较小,如nW5(),特别就是P接近
19、与0或1时(小概率事件),按二项分布原则估计总体率得可倍区间。2、区间估计正态近似法:当样本含量n足够大,样本率P或1-P均不太小时如np与n仃-p) 均大于5,样本率得分布近似正态分布,总体率可信区间在(1-a)可信度下估计为:Pu“=Sp例:总体率95%得可信区间:Pl. 96Sp;总体率99%得可信区间:P+2、58Sp三. 两总体率之差得区间估计 条件:当样本含量n足够大,样本率P或1-P均不太小时,即np与n(l-p)均大于5,样本率得分布近似于正态分布(p -p:卜g( b-p: +Ua JS卄=徉竺+(1_4)(丄+丄)Y “I + 心,/I,(一)样本率与总体率比较得U检验pl
20、 - p2(二)两样本率比较得U检验/II? - + X2V M 十烏 S + 2第三节F检验四格表资料得屮检验 (一)四格表资料得屮检验得基本思想 假设两组资料率得差异来自抽样误差,用值反映实际频数勾理论频数吻合得程度。在Ho( n讦n 2)成立得条件下实际频数与理论频数相差不应该很大,若实际算出得X2值较大,超过了设窪得检验水准,则有理由怀疑H。得真实性,从而拒绝Hs接受HHi:九n 2)应用:推断两个(或多个)总体率或构成比之间就是否有差别与多个样本率间得多重比较四个表资料得卡方检验处理属性合计阳性阴性1组%(心 2)心(固定值)2组血S)也2)2(固定值)合计加1加2n四个表P检验基本公式:(ad才2=迟3,) A为实际频数,T为理论频数四个表於检验专用公式:宀()(+)(,+%+)适用条件:两样本率比较时,总例数n40且所有格子TM5 (二)四格表资料得F检验得校正公式adbe乙Tv Z=以( + h)(c + J)( + c)h + d)K当n40且所有得TM5时,用x,检验得基本公式或四格表资料屮检验得专用公式;当PQa时,改用四格表资料得Fishx确切概率法 2.当n罗40但有1WT5时,用四格表资料P检验得校正公式或改用四格表资料得Fisher确切概率法3、当nV40,或T1时P用四格表资料得Fisher确切概率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广西桂林信息工程职业学院人才招聘备考题库【夺分金卷】附答案详解
- 2026河北承德县招聘公益性岗位人员16人备考题库带答案详解(巩固)
- 施工质量验收标准培训方案
- 建筑施工现场用电安全培训方案
- 现场作业人员紧急情况处理方案
- 施工现场风险评估与管控培训方案
- 2026广东佛山南海区丹灶镇仙湖幼儿园招聘备考题库及参考答案详解(完整版)
- 2026四川宜宾江安县人力资源和社会保障局第一次招聘编外聘用人员14人备考题库及参考答案详解【满分必刷】
- 2026北京化工大学巴黎居里工程师学院物理实验助理招聘1人备考题库及完整答案详解(各地真题)
- 2026中煤财务有限责任公司招聘2人备考题库附参考答案详解(夺分金卷)
- 2026年licenseout对外授权交易关键条款与谈判要点
- 2026福建浦开集团有限公司、福建浦盛产业发展集团有限公司、福建浦丰乡村发展集团有限公司社会公开招聘补充笔试模拟试题及答案解析
- 桥牌协会内部管理制度
- 2026重庆市南岸区消防救援支队消防文员招录2人笔试备考试题及答案解析
- 2026年山东省立第三医院初级岗位公开招聘人员(27人)笔试备考试题及答案解析
- 2026年滁州天长市大通镇预任制村干及村级后备干部储备库选拔28名笔试备考试题及答案解析
- 2026秋招:广州环投集团笔试题及答案
- 【新教材】人教PEP版(2024)四年级下册英语全册教案(含教学计划)
- 加油站突发环境事件风险评估报告模板
- 挤塑工艺培训课件
- 生成式AI赋能下的高中地理教师教育观念更新与教学实践研究教学研究课题报告
评论
0/150
提交评论