第一章医学统计学基本概念与常用统计描述指标_第1页
第一章医学统计学基本概念与常用统计描述指标_第2页
第一章医学统计学基本概念与常用统计描述指标_第3页
第一章医学统计学基本概念与常用统计描述指标_第4页
第一章医学统计学基本概念与常用统计描述指标_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学

(MedicineStatistics)南京大学医学院范怡梅第一章医学统计学基本概念与常用统计描述指标统计学(statistics):

“Thescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresults.”第一节医学统计学在医学科学中的地位和作用医学统计学(MedicineStatistics)是应用概率论和数理统计的基本原理和方法,结合医学实际阐述统计设计的基本原理和步骤,研究资料或信息的收集、整理与分析的一门学科。是统计学在医学上的应用;理论基础是概率论和数理统计;SPSSStatisticalPackageforSocialSciencesStatisticalProductandServiceSolutions

SASStatisticalAnalysisSystem作用;统计工作的步骤。

第二节统计工作的步骤研究设计(researchdesign)调查设计、实验设计资料收集(datacollection)统计分析(statisticalanalysis)统计描述(statisticaldescription)统计推断(statisticalinference)例某医生发明了一种新的治疗某病的疗法(治疗组),用现在公用的疗法作为对照(对照组),经临床试验,对照组与治疗组的疗效分别为P1=75%与P2=95%,问:能认为这两个有效率之间的差别有显著性意义吗?假设的3批实验结果组别例数有效率(%)疗效:有效无效合计甲实验对照组治疗组乙实验对照组治疗组丙实验对照组治疗组1519303845575110215320204040606075.095.075.095.075.095.0甲实验中,c2=1.765,P>0.05,两个有效率之间的差别无显著性意义;乙实验中,2=6.275,0.01<P<0.05,两个有效率之间的差别有显著性意义;丙实验中,2=9.412,P<0.01,两个有效率之间的差别有极显著性意义。第三节统计学中的几个

基本概念1.总体与样本(populationandsample)根据研究目的确定的同质观察单位的全体称为总体。从总体中随机抽取、进行研究的一部分个体所组成的集合,称为样本。要保证样本的可靠性、代表性。2.同质与变异(homogeneityandvariation)统计研究的是有变异的事物,统计分析的任务就是在同质分组的基础上,通过对变异所呈现出来的统计规律性的研究,透过偶然现象,揭示同质事物的本质特征和规律。3.抽样误差(samplingerror)因抽样产生的样本与样本,样本与总体相应统计指标之间的差异,称为抽样误差。抽样误差的大小主要取决于观察单位间变异程度的大小和样本含量的多少。4.参数和统计量(parameterandstatistic)总体的指标统称为参数,样本指标称为统计量。5.概率(probability)概率是描述随机事件发生的可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,即0P1。习惯上将P0.05,称为小概率事件。6统计资料的类型定量资料分类资料如身高(cm)、体重(kg)等。无序分类有序分类二项分类多项分类(等级资料)如阳性与阴性、治愈与未愈。如血型为A、B、AB、O型。如治疗结果为治愈、显效、好转、无效四级。第四节数值变量的描述性统计统计图表;统计指标。一、频数分布

(frequencydistribution)(一)

编制频数表的步骤求极差R=84-57=27(次/分)划分组段确定组数:较大样本时,一般取10组左右。确定组距:极差/组数=27/10=2.7≈3(次/分)确定各组段的上下限:上限=下限+组距统计各组段内的数据频数,编制频数表表2.1130名健康成年男子脉搏(次/分)的频数分布表脉搏组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)56~59~62~65~68~71~74~77~80~83~85合计251215252619151011301.543.859.2311.5419.2320.0014.6211.547.690.7727193459851041191291301.545.3814.6226.1545.3865.3880.0091.5499.23100.00(二)

频数表的用途可以揭示资料的分布类型和分布特征,以便于选用相应的统计分析方法。便于进一步计算指标和统计处理。便于发现某些特大或特小的可疑值。二、烫集中违趋势(c惰en景tr抓al罚t尺en驾de姻nc淡y)的描睁述三种愚平均魔数(a黄ve践ra晶ge撑)算术芦均数(a骂ri暮th寇me许ti伸c摆me膊an游)几何柏均数(g庆eo导me皆tr泻ic丢m候ea扔n)中位渠数(m习ed桶ia泰n)(一怎)算秋术均裕数(ar送it得hm第et班ic鬼m返ea劣n,)简称慰均数牌,适愈合于虫表达田呈正滨态分雁布资积料的黑平均说水平滤。直接芹法:例2-忧2:=81鱼+7岁0+扶66逐+··特·+6速913=7早1.抖69(次/分)加权落法:例:=57所.5哑2姨+6娱0.鬼5励5+泳63守.5表1鞋2+··骡·+8元4.主5113械0=7章1.艳62(次/分)(二叨)几休何均影数备(ge写om救et锋ri漂c生me凡an捷,颠G)适用鼓于原患始数买据分北布不父对称不,但避经对朗数转汽换后狐呈对例称分歉布的坐资料霜。例:炎40蜘名麻霞疹易厨感儿惧童接苦种麻侄疹疫卫苗后马一个胞月,议测其慰血凝涛抑制得抗体姐滴度原,结号果如门表所哨示,挂求几盟何均互数。抗体铜滴度人数f滴度暴倒数Xlg购X1:41:81:161:321:641:12补81:25聚61:51奇21458116414816326412士825特651董20.墨60介210.垄90雅311.渠20稳411.蛋50辞511.趋80给612.牧10曲722.烤40方822.炕70桃93(三盯)中育位数青(me饰di裹an戒,讲M)适合习于表柴达偏仓态资弊料、请或分先布不枕明的策资料可的平倚均水承平,柳尤其歪适合被于表雅达只会知数它据的缝个数避、但症部分币较大候或较联小数纯据的降具体汤数值随未准低确知涌道的娃资料如的平把均水山平。对于膀原始邀数据膀和频离数分瓣布表灶资料拉,分吓别用嘱下列密两式施计算龟中位傲数。M=(Xn/梁2+X(n/陈2+病1))/2(n为偶系数)X(n+渗1)/2(n为奇举数)其中价,LM:中策位数贴所在干组下倚限;iM:中瓣位数敞所在馋组的绿组距修;fM:中宁位数咐所在食组的蔽频数性;fL:中召位数恭所在户组前蜓一组草的累长计频窃数。例2-皮4表2.殃3识1笔07正常驳人的湿尿铅舟含量秆(g/洗L)的中位校数计耻算表含量璃(g/疫L)(1)频数f(2)累计西频数f(3)累计煌频率%(4)0~4~8~12桶~16庄~20招~24票~28腹~合计142229181561210挎7143665839810烫410排510娘713缝.0肥833云.6骑460剪.7该577担.5夸791显.5糖997妨.2绍098牧.1渗310拉0.迷00M=毙8+垫(1遭07样/2鞋-六3病6)绕=份1旦0.秤41拆(g渔/L)429三、宗离散盒趋势羡(te纠nd迁en指cy恒o氧f己di磨sp俗er逼si虎on咸)的描相述例:兴设有落三组孝同年贺龄、感同性寻别儿题童体巡寿重(kg)数谁据如芒下:甲组26炕2击8乎30意3劈燕2没34乙组24单2萄7焦30告3滩3君36丙组26逢2驰9桂30强3蔑1崭34描述骗离散棵程度跳的指投标:极差挡、四见分位浮数间粘距、吸方差佣、标削准差驶及变东异系怠数。(一土)极差沾(全厨距,ra非ng涝e,矮R)为一爷组同衡质观国察值旧中最韵大值层与最慨小值馅之差来。甲组R=怕34挣-2垦6=供8乙组R=嗽36希-2革4=亏12甲组荡数据枝分布混较乙填组集谋中。优点颗:计识算简桃单缺点辆:1.没有闹充分秤利用对样本愤信息蛋,只碎考虑雅最大蚁值与凤最小莫值之酱差异戴,不柄能反辱映组暮内其饭它观僻察值殊的变宅异度嗓。2.样本稳含量基越大但,抽君到较悲大或姐较小陡观察询值的危可能杆性越腹大,宋则极督差可婆能越航大,铃因此锹,样渔本含授量悬味殊时涨不宜胖用极枕差比斑较分男布的丢离散番度。所以险,一限般不冬用极喝差来具反映颜离散些程度绒。(二莲)岭四分蝇位数贺间距露(qu雪ar生ti简le蔬i小nt著er叹va冰l,传Q)1.分位框数的耽概念分位禽数是另一种法位置触指标宅,一饮个特兄定的么分位房诚数将描任何燥一个竟频数烤曲线绢下的瞒面积柴分为爪两部狂分。第1四分怨位数刚记作Q1,第2、第3四分蹲位数仪,分殿别记万作Q2、Q3;第1百分板位数域,记搅作P1。同勾理,陵还有苍第2、第3、··川·、第99百分啊位数浇,分允别记耻作P2、P3、··民·、P99。显然直,Q1=P25、Q2=P50=M、Q3=P752.百分功位数(p截er饲ce卸nt厚il枝e)的计剃算公洽式对连狡续型抬变量澡频数汁表资涂料,越按下瓦式计模算第X百分冒位数PX:其中专,LX:第X百分概位数下所在潜组下会限;iX:第X百分触位数游所在倒组的圾组距嘱;fX:第X百分手位数换所在以组的丛频数抬;fL:第X百分钢位数是所在胆组前借一组犹的累沟计频隐数。例敬某梢地20饿0例正纹常成侨人血炎铅含芒量的妻频数纹分布凉如表康所示邀,请驼计算幅出血利铅含躬量的95浑%正常疮值范临围。20溪0例正驶常成趁人血叨铅含妥量的筛频数液分布蛮表血铅堂含量倦频费数施累染计频盟数(mo报l/杯L)私(1)层(2)0~0.职24独~0.虫48鬼~0.朗72径~0.残97倡~1.恢21置~1.爸45化~1.佛69腰~1.村93抗~2.减17牛~2.锣42腰~2.洽66猎~2.蝇90妖~3弦.1面464843362813144412016549713亿316坡117衣418雅819晚219忌619踏719罚919湖920李0解:靠即求P95。nX与%=轿20燥0×认95乞%=杂19义0故某瞎地正舅常人爬血铅增含量95槽%的单赴侧正图常值狸范围牧的上挽限为1.众81(mo货l/泼L)。3.四分两位数睛间距(qu嘴ar粉ti放le捞i吨nt拔er黑va棒l,凳Q)Q=省P75-P25Q=萝QU-QL优缺俯点:玩用四朗分位姑数间卖距作铺为描械述数遭据分弯布离执散程掉度的益指标引,比葡极差忠稳定佣,但喉仍未望考虑岂到每岩个数蚊据的还大小演,常改用于包描述太偏态举频数轿分布笔以及他分布村的一肝端或助两端霜无确总切数撑值资宋料的仓离散将程度集。例2-险10据书架中表2.仅3资料妈求四岭分位崖数间机距Q。P25=龄4+422(10凳72剃5%14)=6寇.3血2壁(g脑/L)P75=妨12泽+418(10剩77岔5%65)=1绒5.绸39溉(g困/L)Q=箩P75-督P25=1坏5.死39响-6准.3晚2=赞9.咳07昨(g蹲/L)(三艳)方才差(v诉ar湿ia伪nc断e)n像-载1称为经自由胁度(四想)标湾准差(s瘦ta尼nd截ar宋d栋de弦vi委at厨io千n)加权谁法:(五愿)变千异系刷数(co观ef勉fi句ci存en挎t纱of扫v岂ar量ia辱ti惭on响,辆CV)1.用于类比较售度量絮衡单扔位不狗同的创多组兔资料长的变饭异度洗。2.比较矮均数闻相差扭悬殊样的多傻组资宗料的贺变异棒度。例抢某地仪不同涌年龄刃组男乌子身揪高(cm)的亲变异词程度年龄拦组3~赞3.异5岁30奴~3保5岁人数10炕010筹0均数96雄.117纪0.蒙2标准庆差3.戒15.漆0变异谜系数3.妥2%2.最9%四、洁正态焰分布伤(no蹈rm叹al庸d喉is遗tr倡ib库ut稀io懂n)(一)正态刘分布悔的概焰念和衣特征正态竟分布事的图蝇形:佛正态窜分布袜的密洁度函草数:-<最X<珠+代通常渐用N(杆,往2)表禽示均嘉数为公、食方差芦为2的正住态分渗布。正态辉分布抛的特粗征1.正态仁曲线怒在横卡轴上脸方均奥数处葡最高化;2.正态誓分布沟以均当数为耳中心未,左半右对盲称;3.正态阻分布耗有两愚个参俱数,被即均句数与彻标准他差沟。灿是宝位置肃参数装,当崭固开定不运变时听,果越揪大,赵曲线格沿横绘轴越避向右遮移动莲;迈越姥小,财曲线惑沿横优轴越东向左铺移动世。棍是忆变异熟度参点数,标当语固定亡不变询时,股乱越大压,曲像线越当平阔分;嫌越拳小,简曲线概越尖墙峭。4.正态忧曲线尽下的伍面积件分布河有一炉定的湾规律今。常用己的两窑个区壳间:±1照.9均6算及±2古.5绸8忽的区骑间面卧积分往别占俊总面笑积(玻或总腥观察订例数祝)的95世%及99续%,如雕下图普所示丙:95纵%2.挂5%2.光5%-追1.慈96劳+含1.辛96选99址%-接2.呆58牧+嫌2.夜58碍0.败5%0.羽5%(二)标准葛正态茄分布(s奖ta芽nd奔ar鉴di北ze腿d坏no敏rm匹al商d帮is昨tr藏ib款ut橡io徒n)令-<富u<迫+吓用N(0,1)表示章标准护正态予分布(三)正态他分布护的应熄用制定御医学略参考鞭值范伟围(m虽ed避ic互al撒r馆ef写er谊en肉ce拨r巧an念ge削)许多鸭统计态方法掏的理蔑论基魔础参考坊值范吧围的刃制定正态画分布馅法母百分渣位数英法%909599单只有敢下限侧只有诸上限双侧P5~P95P2.剃5~P97刻.5P0.玩5~P99那.5单只有惜下限P10P5P1侧只有弱上限P90P95P99例息出生挖体重腥低于25欣00克为帜低体罪重儿泻。若表由某厘项研闻究得傻某地转婴儿柱出生留体重古均数针为32直00克,朽标准纯差为35偏0克,缘瑞估计袍该地不当年糊低体辰重儿乳所占滋的比勉例。补充晨题烂以谜下是10饮1名30严-4万9岁正槽常成涌年男浊子的摸血清电总胆纺固醇捷(mm撇ol弊/L)测铸定值絮的频仍数表忙,请掘据此妖资料:(1)选贱择适妖当的吼集中亚趋势险指标寺并计菠算之助;(2)选窄择适数当的谜离散勉程度舌指标储并计斑算之城;(3)求舰该地30缓-4查9岁健青康男箱子血附清总肚胆固荣醇的戚正常颈值范态围;器(4)估妄计该呈地30午-4团9岁健路康男旨子血泽清总跑胆固脏醇值绵小于4.痒50mm愿ol全/L的概部率。血清锈总胆蛙固醇2.挽5~3.易0~3.扣5~4.砌0~4.罢5~5.既0~5.芽5~6.楚0~6.真5~7.搜0~册7.错5合计频数f189232517962110危1fx2.禾752633遇.7瓣597之.7薪511充8.脆7589叠.2梨551睛.7愁537绩.513敲.57.续2547研8.装25fx27.像5684步.5浸012摄6.包5641拿5.站4456愈4.敲0646陈8.立5629予7.克5623暂4.卧3891情.1贺352撞.5年623虚42雾.3仇1第五范节允抽抽样误暖差与比区间茫估计一、稳均数炎的抽摔样误订差愿与标悟准误从样洋本获赌取有撇关总伍体信异息的股过程抵称为鄙统计亦推断(s佛ta洋ti忠st旷ic摊al歪i锐nf芬er先en膛ce节)。由个游体差当异产耐生的怖,抽乖样造蜡成的沿样本赶与样紫本、尸样本引与总单体相弊应统贫计指阁标之雪间的返差异救,称武为抽解样误村差(s悟am毅pl汗in日g拌er兼ro窑r)。标准修误(st营an新da盗rd斤e糠rr晃or签,高SE):捉样本乌统计泼量的轧标准滴差。均数隐的标幕准误币(SE圣M,遵):即样陵本均乘数的肆标准索差。样本纳观测骗值的貌标准惭差与稻样本浆均数径的标谁准误款的比歇较:1.标准极差与遗标准两误都源反映圈数据镜的离哑散性遭;2.标准慈差的寒大小拖反映惧各个做个体忽的观表测值X之间套的变匹异程度追(离摘散程奖度)呈,标板准误葡的大格小反蜓映各父个样达本均数春间括的变写异程弃度(扶离散捆程度愉),洪也反鄙映了辨样本价均数代晕表总贼体均队数的特可靠菊性。数理裙统计诸推出润:1.从正铸态总洞体N(膨,谦2)中兼,随还机抽岁取例秘数为n的样汗本,棕样本平均数徐也服秩从正裁态分撕布;盘即使刷从偏究态总计体随硬机抽辜样,洋当n足够徒大时的,谁也近增似正旨态分驾布;2.从均举数为形,恰标准疤差为堵的检正态安或偏率态总撇体,波抽取兽例数奴为n的样催本,丹样本排均数傅的总瞒体均妇数也半为土,标表准差驶用表示灭,则扣可译按下手式计疲算:二、t分布(一世)t分布筒的概伙念,睡即u分布滨。用S代替,隶得到t分布(二泊)t分布皆的图清形和立特征以0为中冬心,哭左右竟对称这的单扒峰分歌布;t分布睡曲线烂是一耐簇曲晌线,跑其形复态变波化与俭自由怀度的导大小跌有关顿。自由凶度越门小,企则t值越喝分散熟,曲肚线越喝低平纪;自由披度逐龙渐增俭大时叠,t分布搅逐渐仙逼近u分布屠;当爆=野时,t分布乏即为u分布毯。t分布终曲线峡下总并的面百积等汇于1,即t值落麦入区赏间(-踢,耻)舰内的颗概率挤为1。t值落去入任党一区蕉间马(t1,t2)内倘的概插率等嫌于该萍区间挖内曲品线和诱横坐曾标轴鼓所夹李的面绝积。附表2借t界值果表通仓式:单侧屈:P(t则-t,硬)=码缩慧,或P(t秃t,岛)=渴双侧:P(t川-t/史2,率)犹+P(t仿t/拿2,傲)=做图中冰非阴责影部看分面冒积的跌概率就为:P(-t/筐2,夜<t<毯t/龙2,便)=向1称-三、属总体券均数伯的估勤计参数而估计积是指加用样夹本指穴标值有估计宾总体谣指标胃值。包括拘点估溪计和赶区间合估计活。点估垮计:就是省用样拌本统枯计量浑直接或作为嫩总体群参数火的估桌计值殿。区间挪估计弟:即按认预先嗓给定正的概亡率(1-)确经定包恋含未贪知总路体参霸数的射可能醒范围艘。该针范围秘称为稼参数豪的可同信区虫间或冬置信西区间坝,叙预先洞给定功的概愚率称俗为可榜信度拒或置俗信度量,常仆取95红%或99刘%。可信腊区间狭的确救切含容义指漠的是悄:有1-耗的可头能认教为计限算出骄的可站信区接间包壶含了或总体哄参数提。总体餐均数袭可信券区间(c沿on肆fi颤de消nc押e筹in裁te眉rv法al溜)的计蛛算:1.未知粮:按t分布株。由于P(-t/袋2,t合救t/俊2,)=折1-,2.已知躬或袍未知习但n足够半大时烛:按u分布双侧素可信沈区间加为:()或箱()均数碎的可串信区择间与们参考箱值范悄围的饰区别来:1.意义权不同均数絮的可姓信区独间的引统计煎意义踢:(1)按称预先凝给定霉的概仔率,父确定尝的包坟含总颠体均列数的故可能劳范围堪,因停此它誉用于扩估计些总体引均数条。(2)可钥信度叮要高取,但咽精度积不能因下降秀。参考裤值范至围的休统计币意义警:“正锣常人兔”的印解剖寻、生值理、蹈生化穿某项雕指标抽的波铲动范独围,帜可以悔用于用判断池观察罚对象刺的某栋项指它标正位常与迎否。2.两者磨的计惠算公役式有夺差别策:可猜信区区间用劲了标炸准误盆,参华考值棉范围桂用了掩标准庸差。补充停题15挤2例麻按疹患跪儿病孔后血转清抗拉体滴兆度倒谈数的欧分布机如下医,试途作总分体几岛何均颤数的握点值乓估计援和95励%区间除估计康。15客2例麻基疹患伍儿病国后血饮清抗旱体滴银度倒客数的额分布滴度晓倒数1兄2猾4滥8肺16虽32恭64挺12桶8跪2朽56畏51胜2羞1线02赛4合计人腿数0右0愧1括7惯10昆31筑33莲4损2条2氧4蜓3浩1条1我52第六吊节SP仇SS演示Da胞ta则E晃di载to亮rVi凡ew璃erSy尤nt狗ax罩E衬di哈to知rSc训ri颈pt例2.饼1Vi慈ew蠢V兽ar掘ia背bl摔e:Vi共ew拆D渴at篮a:定义抛变量乎名变量民名最御长不发超过64个字墓节;首字孤符必摔须是设字母痛或汉筐字,不能遭以‘_’或‘.’结尾;变量妖名中婶不能尸有空议格或衬某些保特殊猪符号,如‘!’设‘巾?’蹦‘布*’猎;变量铃名不抚能与SP蔽SS的关读键字陵相同,如AL检L,哨AN延D,垄BY阅,E烂Q,朱GE庙,G刘T,柱LE糖,L黑T,茧NE骡,N今OT茂,O依R,虚TO泳,W桨IT器H等;对变毯量名杂英文玩字母腔的大赛小写剃不作顿区分.An挂al染yz雨e菊D斑es哀cr掉ip功ti逝ve圣S鲜ta晌ti佛st临ic举s借Fr拿eq妖ue山nc孙ie愿sVa租ri阔ab剪le状:尘xSt夸at犹is害ti抬cs商…Pe迫rc字en灯ti敏le屿V故al锯ue翼s:苏Qu魄ar贩ti潜le权s螺…Ce姨nt狠ra暖l填Te伯nd肤en瓜cy拜:记Me曲an购;蛋Me安di含an卖…Di劣sp伴er暴si茧on归:脉St雷d.妥d徐ev捎ia斯ti责on烦…Di捏st椒ri晚bu粥ti厉on股:余Sk铲ew垫ne升ss竿…Co倡nt坦in飞ueCh伴ar滔ts辰…Hi礼st倡og搂ra波m盟…Co初nt积in嗽ueFo具rm甜at摊…Or粪de蓝r运by时:投As伯ce关nd犁in帆g紧…Co检nt让in描ueOK频数钢分布幅分析:正态赛性检碧验:An娱al蛙yz傻e然N惨on区pa射ra百me炉tr餐ic唤T刑es海ts每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论