




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学统计工作的基本步骤包括统计设计(调查设计和实验设计)、数据分析(收集数据、整理数据和分析数据)统计描述和统计推断(参数估计和假设检验)。统计推断:样本提供的信息用于推断总体特征,包括参数估计和假设检验。参数估计指的是利润样本信息用于估计总体参数,主要是点估计(样本统计量直接作为总体参数的估计值)和区间估计总体均值的范围根据预设的置信水平(1-)确定。假设检验:通过小概率反证法的逻辑推理来判断总体参数之间是否存在质的差异。可变数据可分为定性变量和定量变量。不同类型的变量可以转换,通常从高层次到低层次。数据根据其性质可分为测量数据、计数数据和等级数据。定量数据的统计描述1频率分布表和频率分布图是描述计量数据分布类型和分布特征的方法。离散定量变量的频率分布图可以用直条图来表示。2.使用频率分布表(图):描述数据的分布类型;(2)描述分布的集中和分散趋势;(3)便于发现一些大大小小的可疑值;(4)促进进一步的统计分析和处理;当样本量足够大时,以频率作为概率的估计值。3集中趋势和离散趋势是定量数据总体分布的两个重要指标。(1)描述浓度趋势的统计指标:平均值(算术平均值、几何平均值和中位数)、百分比(用于确定医学参考值范围的位置参数,P50为中位数)和模式。算术平均值:适用于对称分布数据,尤其是正态分布数据或近似正态分布数据;几何平均值:对数正态分布数据(频率表通常显示正峰值偏差分布)和几何级数;中位数:适用于各种分布数据,特别是非高峰分布数据,也适用于分布结束时值不确定的数据。(2)描述离散趋势的指标:范围、四分位间距、方差、标准差和变异系数。四分位间距:适用于各种分布的数据,尤其是非峰值分布的数据。中值和四分位数间距通常用来描述数据的集中趋势和分散趋势。方差和标准差:两者都适用于对称分布数据,尤其是正态分布数据或近似正态分布数据,均值和标准差往往结合起来描述数据的集中趋势和分散趋势;变异系数:主要用于比较变量之间的变异程度,当维度不同或平均值相差很大时。标准差的应用:表示变量分布的离散程度;(2)计算变异系数,结合平均数描述对称分布数据;标准误差根据样品含量计算。定性数据的统计描述定性数据的基础数据是绝对数字。为了描述一组定性数据的数据特征,通常需要计算相对数量。定性变量可以用频率分布表来描述。2常见的相对数类型:频率型、强度型和相对比率型指数。指示器频率指数肌力指数相对比较指数概念这大致反映了在某个时间发生概率每单位时间内现象出现的频率两个相关指标a和b的比率计算公式A/B有没有尺寸不是不管有没有价值范围【0,1】可以大于1无限的本质作为大样本的概率近似值分子式分母的一部分频率强度,即概率强度的近似值价值表示相对于一个单位b,有多少个单位Aa和b可以是绝对数、相对数和平均数。a和b的尺寸可以相同也可以不同。a和b不包含每个ot3.应注意相对数的应用:防止概念混淆,避免比率替代比率的错误现象;(2)在计算相对数时,分母应该有足够的数。如果案例数量少,相对数量会波动很大,应该使用绝对数量;正确计算频率(或强度)指标的总值。当需要组合分组数据来估计频率(或强度)时,每组频率的分子应相加作为组合估计的分子,每组的分母应相加作为组合估计的分母。(4)频率指数的解释应与人口和属性密切相关;(5)相对数之间的可比性:在比较不同时期的数据时,应注意观察对象是否同质,研究方法是否相同,观察时间是否一致,观察对象的内部结构是否一致,客观条件是否相同。正确的相对数统计推断:在随机抽样的情况下,从样本估计值推断总相对数时应考虑抽样误差,因此应进行参数估计和假设检验。医学人口数据的主要来源是日常工作记录(报告卡、卡片、书籍)、统计报告和人口调查(人口普查和抽样调查)。5描述人口特征的通用指标一般包括总人口和一些反映基本人口特征的指标。人口学的基本特征包括性别、年龄、文化、职业等。对人口结构最常用的描述是性别和年龄。人口统计学特征指数:老年人口系数、儿童人口系数、负担系数、年龄-年龄比、性别比。生育率的共同指标包括出生率、生育率和人口再生产指数。衡量生育率水平的统计指标:粗出生率、总生育率、特定年龄生育率和总生育率。衡量人口再生产的统计指标:自然增长率、粗再生率和净再生率。常见的死亡统计指标包括粗死亡率、特定年龄死亡率、婴儿死亡率、新生儿死亡率、围产期死亡率、特定死亡死亡率、某种疾病的死亡率和死因构成。8发病率统计数据主要来源于疾病报告和报表、医疗卫生工作记录和疾病专项调查数据。(1)标准化:在比较两个或多个比率时,为了消除内部成分的不同影响,采用统一的标准来校正(调整)两组或多组数据,比较方法称为。其目的是统一内部构成并消除混淆因素,使数据具有可比性。(2)应用标准化方法的注意事项:(1)标准化方法有广泛的应用。当某个分类变量在两组中的分布不同时,这两个分类变量成为两组的频率比较标准化的目的是消除混淆因素。(2)标准化后的标准化率不再反映当地当时的实际水平,而仅表示数据相互比较的相对水平。(3)标准化方法的本质是找到一个标准,使两个群体在一个共同的平台上自豪地进行比较。选择不同的标准,计算标准转换率也会不同,比较结果可能也不一样。因此,在报告比较结果时,必须说明选择的标准和原因。两个样本的标准化率为样本值,存在抽样误差。比较两个样本的标准化率,当样本含量较小时,还应进行假设检验。常用的动态序列分析指标包括:绝对增长、发展速度和增长速度、平均发展速度和平均增长速度。(1)绝对增长:指一定时期内事物增长的绝对值。它可分为累积增长(报告期指标与基准期指标之间的差异)和年度增长(报告期指标与前期指标之间的差异)。(2)发展速度和增长速度:都是统计表和图表是描述数据特征和呈现统计分析结果的重要工具。统计表结构标题,标题,行,数字和评论。12常用统计图的用法:图表:适用于相互独立的数据(数据分组清晰,不连续);(2) 100切片图和圆图适用于构成比数据;(3)线图适用于连续数据,以表达事物的动态变化(绝对差异);半对数图适用于连续数据来表示事物的发展速度(相对比率)。直方图用于描述连续变量的频率分布。散点图适用于二元数据,两个变量之间的相关性用点的排列趋势和密度来表示。公共概率分布1正态分布(连续随机变量的概率分布)(1)正态概率密度曲线的特征:关于x=的对称性;(2)概率密度函数的最大值是在x=处得到的,在x=处有一个拐点;(3)曲线下面积为1;正态分布有两个参数:位置参数(决定曲线在横轴上的位置)和变化参数(决定曲线的形状);1.64面积为90%,1.96面积为95%,2.58面积为99%。(2)Z变换和标准正态分布:对于服从正态分布N(,2)的任何随机变量,可以进行Z变换:Z=。转换后的Z值仍服从正态分布,其总体平均数为0,总体标准差为1,这称为标准正态分布,用N(0,1)表示。 (z)是标准正态分布中Z变量的累积面积,-Z面积,即较低的累积面积。(3)正态分布的应用:医学参考值范围的确定:指特定“正常”人群(特定人群,不包括对研究指标有影响的疾病和相关因素)的解剖、生理、生化指标和组织代谢物含量数据中大多数个体的值范围。习惯上使用该人群中95%的个体的某个医学指标的值范围作为该指标的医学参考值范围。方法:百分位数法:适用于任何分布类型的数据;正态分布方法。(2)质量控制图:如果某一波动仅仅是由个体差异或随机测量误差引起的,则观测结果服从正态分布。控制图中有7条水平线,中心线位于总平均值,警告限值位于2,控制限值位于3,还有两条位于 。(4)确定医学参考值的步骤:从“正常人”人群中取样,明确研究人群;(2)用统一、准确的方法确定相应的指标;(3)根据不同用途,选择合适的百分比限值,常用95%;(4)根据该指标的实际意义,确定单边范围还是双边范围?(5)根据该指标的分布情况,确定计算方法,常用的计算方法有正态分布法和百分位法。二项式分布:(1)它是离散随机变量的分布类型。如果每个观察对象的阳性结果的出现概率为,阴性结果的出现概率为(1-);此外,每个观察对象的结果彼此相反,因此,如果重复观察n个人,具有正结果x的人数的概率分布是二项式分布,其被记录为B(n,)。二项式分布的概率函数P(X)=(1-)n-x,=(2)适用条件:每个实验只有两个互斥的结果;(2)每个实验相互独立;成功事件的概率是恒定的。(3)分布特征:二项式分布的特征由二项式分布的参数和观测数n决定。模式分布特征:二项式分布的峰值在=n处或附近;当=0.5时,图形是对称的;当0.5时,分布是不对称的,对于相同的N,离0.5越远,对称性越差。对于相同的,随着n的增加,分布趋于对称。当n时,二项式分布趋于对称,只要不太接近0或1如果X服从二项分布B(n,),则X的总平均数为=n,总体方差为2=n(1-),总体标准差为=;如果阳性结果的频率被记录为:P=,采样率P的总体平均值为P=,总体方差为=,总体标准差为p=,p为频率P的标准差,也称为频率的标准误差,反映阳性频率的采样误差。(4)累积概率计算:二项分布的正出现次数最多为k的概率为:P(Xk)=1(2)正出现次数至少为k的概率是:P(Xk)=。泊松分布:是离散随机变量的分布类型,是二项式分布的特例,用于描述单位时间、空间、面积等罕见事件发生次数的概率分布。一般称为P(),是泊松分布的唯一参数。总平均值为=n。先决条件:互斥、独立和恒定。概率函数为:P(X)=e-,X为观察单元中罕见事件的数量,e=2.71828。(3)分布特征:泊松分布是非对称的,总体参数值越小,分布越偏斜; ,分布趋于对称。当20时,泊松分布数据可按正态分布处理。(1)泊松分布的总体平均数等于总体方差,即;(2)泊松分布的观测结果的可加性,即对于独立随机变量X1,x2.m首歌曲的XM服从泊松分布,它们的和也服从泊松分布,它们的均值是这m个随机变量的均值之和。4概率计算:如果罕见事件的总平均数为,则k以下事件发生的概率为:p(xk)=;至少k个出生的概率:P(Xk)=1-P(Xk-1)4三种常用分布之间的关系:二项分布与泊松分布的关系:当n大时,出现(或1-)的概率小,二项分布B(n,)与泊松分布P (n )相似;(2)二项式分布与正态分布的关系:当N较大时,不接近0或1(特别是当n和n(1-)都大于5时),二项式分布B(n,)接近正态分布N(n,N(1-);泊松分布与正态分布的关系:当20时,泊松分布是渐近正态分布N(,)。5二项分布和泊松分布的区别:(1)相似性:它们都是离散随机变量的常见分布;(2)差异:A有不同的值。服从二项式分布的随机变量有n 1个不同的值。泊松分布的随机变量的概率只有无穷大,即非负整数0,1,2.随机变量的概率是不同的:二项分布P(X=k)=泊松分布P(X=k)=e-;描述不同的随机变量。二项式分布描述了在n个独立的重复测试中某个结果出现次数的概率分布,其中在一个测试中只有两个相反结果中的一个出现。泊松分布描述在单位时间、面积、空间等范围内某些事件数量的概率分布。(3)联系:B(n,)泊松分布。参数估计1.随机抽样是在服从正态分布的人群中进行的。样本平均数的抽样分布特征如下:每个样本的平均数不一定等于总体平均数;(2)样本平均数量存在差异。(3)样本均值以总体均值为中心,中间多,两边少,左右基本对称,呈近似正态分布;(4)样本平均数之间的差异明显小于原始变量之间的差异。2标准误差:(1)均值标准差的理论值为=,总体标准差通常未知。它需要通过样本的标准差S来估计。均值的标准误差估计值为S=;(2)频率标准误差:如果随机变量为XB(n,),样本频率P=的总体概率为,标准误差为p=,频率标准误差的估计值为sp=(1) (2)增加样本含量可以减少样本误差。标准偏差的区别与联系差异:标准差S (): 含义:描述个体观察值的变化程度。标准偏差很小,平均值代表一组观测值。(2)应用:结合描述个体观察值的分布范围,常用于医学参考值范围的估计;(3)与氮的关系:氮越大,硫越稳定;标准误差S (): 含义:描述样本均值的变化程度和样本误差的大小。标准误差小,用样本均值推断总体均值是可靠的。(2)应用组合估计总体均值的可能范围,并对总体均值进行假设检验;(3)与n的关系:n越大,s越小。联系:两者都是描述变化程度的指标;(2)从S=我们知道S与S
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中班幼小衔接社交能力计划
- 2025年网络安全中级技能挑战模拟题及答案详解
- 物流仓储招标代理质量控制措施
- 物业品质管理部安全职责
- 鲁棒轨迹规划算法-洞察及研究
- 小学语文同步辅导复习计划
- 岩浆房形成演化-洞察及研究
- 安徽六安市第一中学2026届化学高三第一学期期末监测试题含解析
- 2025年新夫妻捐献财产协议书
- 2025年新混凝土工人协议书
- 2025年9月新版用工合同(合作协议书)范本(可规避风险)
- 人民调解员培训课件
- 血液透析学习汇报
- 2025重庆机场集团有限公司社会招聘202人考前自测高频考点模拟试题及完整答案详解1套
- 安徽省江南十校2025年物理高一下期末检测模拟试题含解析
- 培训钉钉课件
- 新建洞室储气库压缩空气储能系统的经济性及成本分析
- 砖厂职业危害管理制度
- 肝功能障碍患者的麻醉管理要点
- 2025年粮油仓储管理员(高级)职业技能鉴定考试练习题库(含答案)
- 【课件】新高三启动主题班会:启航高三逐梦未来
评论
0/150
提交评论