科研数据的分析与处理.ppt_第1页
科研数据的分析与处理.ppt_第2页
科研数据的分析与处理.ppt_第3页
科研数据的分析与处理.ppt_第4页
科研数据的分析与处理.ppt_第5页
免费预览已结束,剩余72页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学研究中的医学研究数据整理与分析,李志春,新乡医学院公共卫生学院,医学研究数据整理与分析,第1节科研数据的检查与整理,第2节科研数据的描述,第3节统计分析方法的选择,第4节科研数据的综合分析,第5节统计分析结果的解释与表达:1 .检查物体;2.缺点和错误;3.数据排列;1.科学研究数据的审查;1.物体检查。首先,有必要确定被调查或研究的个人是否属于特定的调查对象或研究对象。在临床研究中,要特别注意疾病诊断和分类的正确性,这对于保证研究结果的正确性是非常必要的。由于多种原因,在一些问卷中经常可以看到缺失项目的存在,这严重影响了数据的完整性。通过检查发现研究数据中的错误也是必要的,并且应该仔细检

2、查研究数据。在精心的实验设计指导下获得的实验数据不应随意丢弃,否则实验结果的真实性和完整性将被破坏。可疑数据处理,在数据指数服从正态分布的前提下,可以用统计方法来检查个别“可疑值”是否应该丢弃。当n10时,“可用作丢弃可疑值的标准。当n10时,可以用Q检验、狄克逊检验或格拉布斯检验来检查测量值的一致性,从而判断是否消除可疑值。在对数据进行检查和核对后,有必要组织混沌数据进行统计计算和分析,即整理数据。3、数据整理、数据计算机管理、数据库选择、数据录入、数据验证和清理、数据处理(如编码、标准化、根据原始记录生成新的研究变量等。),数据最终锁定并进入分析,医学科研数据的整理和分析,第1节科研数据的

3、检查和整理第2节科研数据的描述第3节统计分析方法的选择第4节科研数据的综合分析第5节统计分析结果的解释和表达:1。统计指标2、统计表3、统计图、科研数据描述和表达部分2、(1)总量和相对指标、(2)平均指标、(3)变异指标、1。统计指标和统计表都在表中。编制统计表时,应遵循以下原则:1。专注、简单和清晰。也就是说,一个表只包含一个中心内容,这样人们可以一目了然,而不会覆盖所有内容。2.主谓分明,层次分明。统计表,统计指标,统计表,统计图,科研数据的描述和表达,医学科研数据的整理和分析,科研数据的检查和整理,科研数据的描述,统计分析方法的选择,科研数据的综合分析,统计分析结果的解释和表达,(1)

4、假设检验,(2)区间估计,(3)变量间关系的研究,(4)判别分析,(1)统计分析方法概述, 包括测量数据分布类型的假设检验、测量数据方差的假设检验、测量数据均值的假设检验、等级数据分布或位置的假设检验、两个属性之间的独立性检验以及两种方法判断结果的一致性检验。 (1)假设检验,(2)区间估计,概念:根据样本均值,根据一定的置信度计算出总体均值可能在的数值范围,称为总体均值的置信区间。方法:(1)u分布法(2)t分布法,n100(1-)%总体均值置信区间():(1)已知总体标准差,根据正态分布原理,计算公式为:(2)未知,N小,根据T分布原理计算;(3)未知,N足够大(如N1)一般情况下,考虑n

5、p和n(1-p)5。Pusp,(1)假设检验,(2)区间估计,(3)变量间关系的研究,(4)判别分析,(1)统计分析方法概述,(1)指标间自变量和因变量之间没有区别,(1)有线性相关分析,典型相关分析等。(2)研究多个变量的内部隶属关系,寻找降低变量维数的综合指标,常用的方法有主成分分析、因子分析和对应分析。(3)聚类分析用于研究多个变量或多个样本之间的相似性。(4)线性结构方程的协方差分析用于研究多变量之间的各种复杂关系。(3)变量之间关系的研究。(2)指标之间存在自变量和因变量。有线性回归分析、曲线回归分析、多项式回归分析、多元线性回归分析、概率模型回归分析、生存数据的参数模型回归分析、C

6、OX模型回归分析和对数线性模型分析。(3)变量之间关系的研究,(1)假设检验,(2)区间估计,(3)变量之间关系的研究,(4)判别分析根据一些明确分类的人群提供的信息,对未知个体的归因进行分类和判别。1.统计分析方法概述,分析数据类型,设计方案的数学统计条件,选择统计分析方法时要考虑的因素,2。选择假设检验方法进行数据测量,例如,为了了解城市和农村地区婴儿的营养状况是否存在差异,对婴儿的血红蛋白含量进行了测量,如下表所示。首先,有必要明确每次要分析的定性变量的数量。其次,有必要澄清定性变量的属性、列联表中的频率和数据收集方法。第三,统计数据的假设检验方法的选择。当一次只分析两个变量时,数据可以

7、分为22个表,2k个表和RC个表。常用的统计分析方法包括配对计数数据的皮尔逊2检验、修正2检验、麦克尼尔2检验、费希尔精确概率检验、秩和检验、Ridit分析、秩相关分析、典型相关分析、一般趋势和线性趋势检验、Kappa检验等。当被研究的定性变量的数量为3时,常用的统计分析方法包括加权2检验、Mantel-haenszel 2检验、logistic回归模型和对数线性模型。在计数数据分析过程中,钢筋混凝土表格数据的分析是一个难点,存在很多问题。根据二维列联表中两个分组变量的类型和分析目的,对钢筋混凝土表数据进行分类。由于钢筋混凝土表数据的不同类型和不同的分析目的,有不同的分析方法。钢筋混凝土表测试

8、方法的选择,双向无序钢筋混凝土表及其统计分析方法的选择,不同属性双向有序钢筋混凝土表及其统计分析方法的选择,钢筋混凝土表测试方法的选择,单向有序钢筋混凝土表的两个分组变量,其中一个是无序的(实验分组变量不同于药物);二是有序化(指数分组变量处理效果)。此时不宜使用2次试验分析数据,因为2次试验与“疗效”的顺序没有联系,所以应采用与“顺序”相关的秩和检验或Ridit分析。3、对钢筋混凝土表的检验方法的选择,对于钢筋混凝土表的两个分组变量具有双向顺序和不同的属性,如年龄组和某一疾病的发生程度,但具有不同的属性,则不适合使用2检验分析数据,因为2检验与两个变量的顺序之间没有联系,所以应使用与两个变量

9、的顺序相关的等级相关分析、典型相关分析或线性趋势检验。对钢筋混凝土表的检验方法的选择,以及钢筋混凝土表的两个分组变量具有双向顺序和相同的属性,如某一疾病的两种方法的诊断结果,都是有序的且具有相同的属性。在这一点上,本研究的目的是考察两种方法的结果是否一致,因此不适合选择一般的2检验分析数据,而应采用与两个变量的顺序相关的一致性检验或Kappa检验,也可以采用特殊的模型分析方法。钢筋混凝土表试验方法的选择、医学科研数据的整理与分析、第1节科研数据的检查与整理、第2节科研数据的描述、第3节统计分析方法的选择、第4节科研数据的综合分析、第5节统计分析结果的解释与表达。对于相同的统计数据,由于不同的研

10、究目的和不同的处理方法,可以从多个方面进行分析,这就是所谓的“综合分析”。通过对数据的综合分析,我们可以充分利用和挖掘出数据中包含的信息。第四节科研数据综合分析一名医生将20名失眠患者随机分为两组,一组服用安眠药,另一组服用安慰剂。研究者应该评估安眠药的催眠效果。失眠治疗前后的睡眠时间及其差异结果见统计分析表。平行组对照设计分析思路,实验组:治疗前后=差异同质性比较组间比较对照组:治疗前后=差异、治疗前是否平衡可比?两组治疗前的比较:每种药物有效吗?各组的治疗效果有什么不同吗?疗效差异的比较这个病例分析的三个步骤是相互关联的。平行组对照设计分析思路,实验组:治疗前后=组间差异同质性比较比较对照

11、组:治疗前后=差异、实施例一组胃癌患者先后接受两种酸分泌刺激剂治疗,然后分别测定其最大酸排出量(mEq/h),分析两种药物的疗效,如下表所示。配对数据t检验分析。当H0被拒绝而H1被接受时,差异在统计学上是显著的,其水平为=0.05。在用组胺治疗的胃癌患者的最大酸排出量和胃泌素五肽治疗后的最大酸排出量之间存在统计学上的显著差异。五肽胃泌素引起的最大酸位移是多少百分比?用组胺治疗的胃癌患者的最大酸产量比用五肽胃泌素治疗的患者高1.30 (95%置信区间:1.021.57) meq/h。两个测量值之间的回归分析表明,如果组胺引起的最大酸排出量增加1毫当量/小时,五肽胃泌素引起的平均酸排出量将增加0

12、.90毫当量/小时(95%置信区间:0.880.92),即五肽胃泌素引起的最大酸排出量仅增加组胺的90%。根据综合分析的结论,差异分析的配对T检验与回归分析相结合,以阐明变量的线性相关性,假设检验与区间估计相辅相成,使结论更丰富、更具体。研究辐射对嗜酸性粒细胞的影响。对于一组体重相近的同品系小鼠,采用完全随机抽样的方法选择11只小鼠,分别在注射肾上腺素前后测定嗜酸性粒细胞数两次,然后用一定剂量的放射线照射。24小时后,重复上述实验,每只小鼠有4个测量值。2.综合分析方法:1 .肾上腺素的单独作用在辐射暴露之前,测量嗜酸性粒细胞的数量(106个/升),然后注射一定剂量的肾上腺素,然后测量嗜酸性粒

13、细胞,综合分析,3。单独辐射照射的效果将是未注射肾上腺素时辐射照射前后的测量值,即根据自身对照设计的T检验(t=4.219,P0.01)。4.辐射会改变肾上腺素的作用吗?根据自身对照设计,用T检验照射前后的差异(t=0.849,P0.40)。综合分析,1 .辐射暴露后,小鼠血液中嗜酸性粒细胞减少;2.注射肾上腺素后,小鼠血液中的嗜酸性粒细胞减少。3.在照射后24小时内,肾上腺素降低小鼠嗜酸性粒细胞数量的效果和程度没有变化。结论,实施例7.2以下是对科研数据的一个相对完整的背景介绍:研究人员收集了103例冠心病患者和100例正常对照组的多项指标,组(g)、性别(X1)、年龄(X2)、高血压病史(

14、X3)、吸烟史(X4)、胆固醇含量(X5)、甘油三酯含量(X6)、低密度脂蛋白含量(X7)、密度脂蛋白含量(X8)、脂蛋白(X9)、载脂蛋白A1含量(X100) (1)为冠心病患者, 某一基因型(X12或X13)在不同水平时,7项血脂指标的均值和均值向量是否存在显著差异? (2)对于冠心病患者,分析“性别、吸烟史、高血压史和某一基因型(X12或X13)”对7项血脂指标均值和均值向量的影响是否有意义?(3)对于冠心病患者,在尽量排除“年龄、性别、吸烟史、高血压史、用药情况”等因素影响的前提下,分析某一基因型(X12或X13)出现不同水平时,7项血脂指标的平均值是否有显著差异?(4)对于冠心病患者

15、,尽量客观地评价7项血脂指标之间的内在联系。(5)对于冠心病患者,尽量客观地评价七项血脂指标之间的关系。(6)对于冠心病患者,假设疾病的严重程度可以通过七个血脂指标很好地反映出来。根据这七项血脂指标的数据,将其分为三组,以便对“轻、中、重”病情做出判断,并对不同疾病的患者采取不同的治疗方案。(7)利用正常人和冠心病患者的7项血脂指标的数据,建立了诊断疑似冠心病患者的方法。(8)利用正常人和冠心病人的所有数据,建立了筛选冠心病危险因素的方法,当每个危险因素取其值范围内的某个值时,可以预测某人患冠心病的概率。医学科研数据的整理与分析,第一节科研数据的检查与整理,第二节科研数据的描述,第三节统计分析方法的选择,第四节科研数据的综合分析,第五节统计分析结果的解释与表达,第五节统计分析结果的解释与表达。2.结论不能是绝对的。3.在解释统计分析的结果时,我们必须结合医学实践。(1)数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论