




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章是医学统计学的基本概念,梁,统计学:1。统计学:a研究数字数据的收集、分析、解释和表示的科学。(韦伯斯特国际词典)2。统计学:通过收集、分类、分析以获得可靠结果的方式处理数据变化的科学和艺术。简而言之,统计学是一门处理数据可变性的科学和艺术,包括收集、分析、解释和表达数据,目的是得出可靠的结论。1.引言:统计思维和方法已经渗透到医学研究和卫生决策中,与科研的总体设计、数据收集、整理、分析和最终结论密切相关。北京某医院的一位医生用“吴蓓散”治疗了107例胃溃疡出血,101例有效,有效率为94.4%,所以其他医生也必须为94.4%。多少钱?高还是低?(寻找置信区间),2。重庆某医院有一位老医
2、生用“冠心”治疗冠心病,对照组用西药治疗。观察结果如表所示,表明冠心比单纯西药更有效。(涉及统计学中的假设检验问题),2。1、医学统计工作的内容和数据类型。医学统计工作的内容:设计收集数据、整理数据、分析数据、设计。根据研究目的,制定研究方案的专业设计:统计设计:研究对象的选择(纳入和排除标准)、样本量和样本采集方法、实验组和对照组的分组原则、观察指标及其精度、试验过程中的质量控制、拟采用的统计分析方法等。收集数据,收集准确、完整、翔实的原始数据。数据来源包括特殊实验(实验)研究和流行病学调查等常规登记数据,如门诊病例和住院登记数据等卫生工作报告,对数据进行整理,有目的地处理收集到的原始数据,
3、使数据系统化、有组织化。为进一步进行统计分析和分类,检查数据的完整性和可靠性(如遗漏、逻辑检查、专业合理性、专业一致性检查)、分析数据、统计描述、统计分析、统计推断、参数估计、假设检验,并对分类后的数据进行一系列统计描述和统计推断,以阐明事物的特征和规律。2,数据类型(数据类型),两种类型:定量(测量,数值变量)数据,定性(计数,分类变量)数据,和定量(测量,数值变量)数据。通过定量测定,每个观察对象都有一个确切的值,通常有单位,但也有例外(如淋巴细胞转化率)。医学上:身高、体重、血压、血红蛋白值等。定性(计数、分类变量)数据,根据研究对象的某种特征进行分组,然后对获得的数据进行分组和计数。例
4、如:男性25例,女性35例,分类数据混乱:分组分类不相容:性别(男性25例,女性35例有效无效),多重分类:血型(A 10 B 5 AB 7 O 3),职业有序分类数据(等级数据):根据程度增加或减少例:癌症阶段:早期、中期和晚期。功效:治愈、改善、无效和死亡。幽门螺杆菌感染程度(-)、判断数据类型的标准:查看每个观察对象是否有一个确切的值,包括:测量无:计数数据可以从高电平转换到低电平(高精度到低精度),如血压值(正常和异常),观察单位观察个体个体,变量,定量数据测量数据,定性数据计数数据,单位;要素,统计学中的三个基本概念,(1)同质性和变异,(2)总体和样本,(3)参数和统计,(4)误差
5、,(5)频率和概率,(1)同质性和变异,(1)同质性:这意味着所研究的指标的影响因素在观察单位之间是相同的。例如,在研究儿童的成长和发展时,规定相同性别、年龄、地区和国籍的健康儿童是同质儿童。在研究目标条件下,具有相同性质的观测单元的研究特征是可变的。变量的观察结果就是变量值。2.变化:具有相同性质的同质物体的一个或几个特征值是不同的。同质和变异的例子例1调查2006年重庆市7岁男孩身高和体重的同质性:2006年重庆市7岁男孩的变异:身高和体重不同;实施例2研究抗高血压药物疗效的同质性:高血压患者,使用药物治疗的差异性:不同的疗效;(2)总体和样本:根据研究目的确定的整体(集合)同质研究对象分
6、为有限总体和无限总体,样本:从总体中随机选取的一些观察单位,有代表性的条件,足够数量的随机样本(样本内容),其分布与总体(成分)的分布相一致,随机抽样,为了保证样本的可靠性和代表性,有必要采用随机抽样的方法(在总体中每个个体都有相同的机会被抽取)。足量:样品的结构分布与总体分布特征一致。例如,研究重庆市7岁儿童的生长发育:男性107名,女性100名。样本应接近或接近107名男性和100名女性。(3)参数和统计:参数和统计,参数:总体统计指标,如总体平均值和标准偏差,分别以希腊文字母记录。固定常数、推断、统计:样本的统计指标,如样本均值和标准差,分别以拉丁字母记录。参数附近波动的随机变量。(4)
7、误差,误差:实际观测值与客观真值之间的差值,以及统计值与参数之间的差值。(1)系统误差(2)随机误差,(1)系统误差,是指在实际观察过程中,由于受试者、研究人员、仪器设备、研究方法、非实验因素等原因造成的具有一定趋势或规律性的误差。流行病学称之为偏见。特征:观测值系统地、定向地、周期性地偏离真实值。通过严格的实验设计和技术措施可以消除这种现象。(2)随机误差,消除上述误差后的剩余误差受许多不可控因素的影响。特点:不同方向的随机变化。随机测量误差提高操作者的熟练程度可以减少随机抽样误差:抽样统计与抽样引起的总体参数之间的差异。不可避免地,但有一定的分布规律,它可以被估计。(5)概率和频率概率和频
8、率,确定性现象:在一定条件下会发生或不会发生的现象。它的表现结果是两种事件:(1)必须发生的事情称为不可避免的事件;某些结果不会发生被称为不可能的事情。随机现象:在相同的条件下可能会出现两种或两种以上的结果,哪种结果会发生无法事先确定。性能结果称为随机事件。随机事件的特征:随机性;规律性:每次发生的概率是确定的。概率:随机事件的概率,用大写字母p表示,是一个稳定的值;值是0,1。不可避免的事件P=1不可能的事件P=0随机事件0 P 1 P 0.05(5)或P 0.01(1)被称为小概率事件(习惯),统计上认为不大可能发生。小概率事件,样本的实际发生率称为频率,具有波动性。在相同条件下,如果独立
9、重复测试n次,且事件a发生f次,则事件a的频率为f/n。频率与概率的关系:样本频率总是围绕概率波动。样本含量n越大,波动范围越小,频率越接近概率。频率,回顾:总体和样本,统计和参数,系统误差和抽样误差1。调查某个地方一个7岁男孩的身高。观察特定人群的脉搏率。观察特定人群的脉搏率。脉率定义为60次/分钟-100次/分钟,这是正常的,100次/分钟是不正常的。4.101名健康成年女性体检时的血清总胆固醇(毫摩尔/升)。5.1998年,某医院在市区随机调查了8589名60岁以上老年人。体检发现高血压患者2823人,高血压患病率为2823/8589100/%=32.87%。数据的统计描述,梁,统计描述
10、的意义。医疗工作中有许多数据。统计描述是处理和提炼这些数据,找出规律和预测未知。统计描述是最简洁有力的语言。概念:即使用几个统计指标来描述原始数据的特征,称为统计描述。测量数据的统计描述方法:(单变量)1。通过频率表2描述数据特征。用统计指标定量描述数据特征。描述测量数据的统计方法有两种:统计图;主要是频率表(图)统计指标;定量描述数据的特征;1.数值变量的频率分布;1.频率分布表频率分布表:将变量值分成不同的组,统计每组的情况。含义:一般理解每组变量的分布和规律。频率表编制实例:某城市某年120名12岁男孩身高(厘米)数据统计描述如下。142.3 156.6 142.7 145.7 138.
11、2 141.6 142.5 130.5 132.1 135.5 134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0 145.2 141.8 146.8 135.1 150.3 140.2 125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4 134.7 138.5 138.9 137.7 137.7 找出数据的范围:该范围是所有数据中最大的。这
12、个例子非常差:R=160.9-125.9=35厘米、2。分组(1)确定组数:频率表是为了简化数据,显示数据的分布规律,所以组数不能太多。它不能太少,太少会掩盖数据分布的规律。适当的分组数与观察值n的数目相关。当n为30时,它可以被分成5至6组。随着n的增加,分组适当增加。当样本较大时,通常取大约10组。(2)为了确定分组距离,一般采用等距分组。组距离=极限范围/组数在本例中,组距离=35/10=3.54。(3)确定各组的上下限:下限:各组的上限:各组终点的上限=下限。第一组必须包含最小值,它的下限通常取一个包含最小值的相对整洁的值。在本例中,最小值为125.9,第一组段的下限为125。它的上限
13、=125 4=129。每组不能重叠,每组是半开半闭区间。,3。用手工或计算机编制图纸。统计各组的数据频率,得到频率表。区段标记频率f频率(%)累计频率(1) (2) (3) (4) (5) 125-10.8-1129阳性43.3-5-133阳性97.5-14-137阳性和阳性28-23.3-42-141阳性和阳性35-29.2-77-145阳性和阳性27-22 104 149阳性1 11 9.2 115 153阳性4 3.3 119 153已婚育龄妇女的子女数量和幼儿的牙齿数量是离散的量,如0、1和2,它们被称为离散变量。4.频率和累计频率频率:频率表中各组频率之和等于案例总数n,将各组频率除以n得到的比值称为频率。累计频率:某一组和前一组的频率之和。累计频率:累计频率除以病例总数。(2)频率分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业车辆创新管理办法
- 会展材料使用管理办法
- 产业准入退出管理办法
- 企业安全经费管理办法
- 云南评审专家管理办法
- 会泽高中课堂管理办法
- 公办高校债务管理办法
- 乐山就业见习管理办法
- 丽水岗位设置管理办法
- 临沂食品质量管理办法
- 2025届湖北省路桥集团限公司校园招聘190人易考易错模拟试题(共500题)试卷后附参考答案
- 急性心力衰竭中国指南(2022-2024)解读
- 铝单板雨棚施工方案
- 《心脑血管疾病防治》课件
- 叠衣服课件小学生
- 【MOOC期末】《电子技术实习SPOC》(北京科技大学)期末慕课答案
- 特征值稳定性证明-洞察分析
- 智慧城市建设投标实施方案
- UL4703标准中文版-2020光伏线UL中文版标准
- 设备部班组安全培训
- 2024安置点生活垃圾清运合同书
评论
0/150
提交评论