医学统计学之正态分布的概念与特征_第1页
医学统计学之正态分布的概念与特征_第2页
医学统计学之正态分布的概念与特征_第3页
医学统计学之正态分布的概念与特征_第4页
医学统计学之正态分布的概念与特征_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1统计的工作内容?P2实验设计 、收集资料、整理资料、分析资料2资料的类型P2-P3(1)计量资料:观察指标用定量的方法测定其数值的大小所得的资料。一般用度量衡单位表示。如身高、体重、浓度。(2)计数资料:(分类)疗效(3)等级分组资料3变异与同质的概念?P3(1) 变异:在临床治疗中,用同样的药物治疗病情相同的病人,疗效也不尽相同,即使在实验室里,动物与动物之间也有明显的差异,这种现象称为个体差异或者变异。(2) 同质:研究对象某一个或者几个属性相同称为同质,例如同种族、年龄、性别的健康人。4总体样本的概念?P3(1) 总体:是同质的个体所构成的全体。有限总体:研究单位是有限的。无限总体:研究单位是无限的。(2) 样本:从总体中随机抽取部分有代表性的观察单位。其实测值的集合。5误差的类型?P6(1) 系统误差(2) 随机测量误差(3) 抽样误差6概率的概念特征?P6概念:描写某一事件发生的可能性大小的一个量度。特征:(1)肯定发生的时间成为必然事件。概率为12)可能发生也可能不发生的事件称为随机事件或者偶然事件概率0-1(3) 概率小于等于0.05或者小于等于0.01事件成为小概率事件。7频率的概念?频率指样本的实际发生率。8,频率表的绘制步骤?P8-P9(1)求极差:最大值减最小值(2)确定组距分组:组距=极差除以10 (3)划计 (4)计数9描写集中与离散趋势的指标?集中趋势:算术均数、中位数、几何均数离散趋势:全距、四分位间距方差、标准差、变异系数10.频数分布表的用途?P10 (1)作为陈述资料的形式 ,可以替代原始的资料,便于进一步分析。 (2)便于观察资料的分布类型,医学研究中常见的资料分布类型可以分为对称分布和偏态分布两大类。 (3)便于发现资料中某些远离群体的特大或者特小的可疑值。 (4)当样本含量比较大时,可用各组段的频率作为概率的估计值。11医学参考值的范围的含义是什么?P22医学参考值的范围传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。其确切含义为从选择的参照总体上获得的所有检查结果,用统计方法建立百分位数界限时所得到的区间称为参考值范围。习惯上包含95%的参照总体的范围。12均数中位数两者的关系? 见笔记正态分布时:均数=中位数正偏态分布时:均数大于中位数 均数=中位数=众数负偏态分布时:均数小于中位数 13正态分布的主要特征?P20第一节 正态分布的概念和特征一、正态分布的概念由表1.1的频数表资料所绘制的直方图,图3.1(1)可以看出,高峰位于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图3.1(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。图3.1频数分布逐渐接近正态分布示意图为了应用方便,常对正态分布变量X作变量变换。(3.1)该变换使原来的正态分布转化为标准正态分布 (standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。二、正态分布的特征:1正态曲线(normal curve)在横轴上方均数处最高。2正态分布以均数为中心,左右对称。3正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用表示均数为,方差为的正态分布。用N(0,1)表示标准正态分布。4正态曲线下面积的分布有一定规律。 实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。查附表1应注意:表中曲线下面积为-到u的左侧累计面积;当已知、和X时先按式(3.1)求得u值,再查表,当、未知且样本含量n足够大时,可用样本均数和标准差S分别代替和,按式求得u值,再查表;曲线下对称于0的区间面积相等,如区间(-,-1.96)与区间(1.96,)的面积相等,曲线下横轴上的总面积为100%或1。正态分布曲线下有三个区间的面积应用较多,应熟记:标准正态分布时区间(-1,1)或正态分布时区间(-1,+1)的面积占总面积的68.27%;标准正态分布时区间(-1.96,1.96)或正态分布时区间(-1.96,+1.96)的面积占总面积的95%;标准正态分布时区间(-2.58,2.58)或正态分布时区间(-2.58,+2.58)的面积占总面积的99%。如图3.2所示。图3.2 正态曲线与标准正态曲线的面积分布14医学医学参考值的范围?P22范围:传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。参考值的范围?目的:a基于临床实践,着眼于个体。划分正常人与异常人的界限。B基于预防医学实践,着眼于人群。标准误与标准差的特点?(1)标准误特点:荡样本例数为n一定时,标准误与标准差成正比。(2)标准差的特点:当标准差一定时,标准误与样本含量n的平方根成反比。16.标准误的用途?P30-P31A衡量抽样误差的大小B估计总体均数的置信区间C用于假设检验样本均数的标准差可用于衡量抽样误差的大小。17置信区间的概念?概念:假设检验亦称显著性检验,是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。步骤:a建立假设和确定检验水准。b选择检验方法和计算检验统计量。c确定P值和做出统计推断的结论。18 t检验的注意事项?P41-P42A假设检验结论正确的前提。B检验的方法选用及适用条件。C双侧检验与单侧检验的选择。D假设检验的结论不能绝对化。E正确理解P值得统计意义。D假设检验和可信区间的区别19假设检验中的两种错误及判定方法?P42-P43三) 检验的两类错误 称 H0真而被拒绝的错误为第一类错误或弃真错误;称 H0假而被接受的错误为第二类错误或取伪错误。记 p(I)=p拒绝H0| H0真; P(II)=p 接受H0| H0假20两独立样本t检验的概念P37?两独立样本t检验又称成对T检验,它适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均属是否相等。21什么事方差齐性?P3922假设检验的基本步骤?基本步骤1、提出检验假设(又称无效假设,符号是H0)和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是由抽样误差引起的;H1:样本与总体或样本与样本间存在本质差异;预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作,通常取=0.05或=0.01。2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P,结论为按所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P,结论为按所取水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值23差分析对资料的要求?A每个个体的测量值相互独立B服从正态分布或近似服从正态分布。C总体的方差相等24方差分析的用途?用途:适用于多个平均值进行假设检验,以检验所得的多个平均值是否来自相同总体。25方差分析的基本思想?方差分析的计算公式?P4726方差分析的具体步骤?A提出检验假设,确定检验水准。Ho:u1=U2=U3,H1:U1、U2、U3不全相等 a=0.05B计算检验统计量F值C确定P值,做出推断结论。F=MS处理间/MS处理内27.单因素方差分析的公式P4728.相对数的概念?概念:相对数是两个有关的绝对数之比,也可以是两个统计指标值比,计算相对数的意义主要是把基数化作相等,便于相互比较。29.相对数常用的指标及其概念?(1)率:表示在一定范围内某种现象的发生数与可能发生的总数之比,说明某现象的强度或者频度。通常以百分率(%)千分率、万分率(/万)、十万分率(/十万)率=某事物或现象发生的实际数/某事物或现象发生的所有可能数X比例基数(2)构成比:表示某事物内部组成部分在整体中所占的比重构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位 X 100%(4) 相对比:即比值是两个有关指标值之比,说明一个指标是另一个指标的几倍或百分之几。相对比=甲指标/乙指标 或相对比=甲指标/乙指标X %甲乙两指标的性质可以相同也可以不同。如反映医院工作效率的门诊人次数与床位数之比,反映人口密度的人口数与土地面积之比。构成比的特点:A分子是分母的一部分,包含在分母中无单位。B 各部分构成比之和等于1,若四舍五入造成构成比之和不等于1,则应进行适当调整,使其等于1. C当事物内部某一部分的构成比发生变化时,其他各部分的构成比也会相应发生变化。30.相对数应注意的事项?事项:A计算相对数时观察单位数应足够大。分母大于等于30. B分析时构成比和率不能混淆。C几个率的平均率不一定等于其算数均值。D相对数的相互比较应注意可比性。31率的标准化及其意义?P60意义:率的标准化是为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响32.行和列表卡方检验的注意事项?P7633.相关? 是用来测量和描述两个变量间关系的统计技术。 是对两个变量在自然环境下观察。对变量没有控制有着操纵。33相关关系的特点?A关系的方向:相关可以分为两个基本类型:正相关和负相关B关系的形成:关系的形成形式分为线性和非线性。C关系的程度:测量了与特定相关形式的拟合程度,如线性相关测量了数据点与直线的匹配程度。34.相关分析的概念?预测:SAT与大学学习效果度:新的智力测验与标准智力测验、学习成绩和问题解决能力等关联。信度:一个测量工具根据其稳定而得到的测量结果的程度而决定是否可信。理论验证:理论的预测可以有两个变量的相关来检验。35皮尔逊相关系数?样本的系数用R来表示。(1) R的绝对值在-1和1之间(2) R的绝对值越接近1,两个变量的关联程度越强。(3) 正相关时R值在0和1之间这时一个变量增加,另一个变量也增加。负相关时,R值在-1和0之间,此时一个变量增加,另一个变量将减少。R无法解释两个变量间的因果关系(教堂数与犯罪数成正比受数据全距的影响(不应该向相关结果外推受一个或两个极端值有巨大影响,在判断相关有多好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论