医学统计学附录 思考与练习95%答案_第1页
医学统计学附录 思考与练习95%答案_第2页
医学统计学附录 思考与练习95%答案_第3页
医学统计学附录 思考与练习95%答案_第4页
医学统计学附录 思考与练习95%答案_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、SPSS基本功能

Frequencies

Descriptives

广数据管理r描述性分析

Explore

{Crosstabs

S

P均数比较

S

S统计分析《一般线性模型

本相关与回归分析

能非参数检验

生存分析

图表分析:条图、直方图、饼图、线图、散

点图等

I输出管理:对输出结果复制、编辑等

统计资料的类型

资料类型「定量资料:用定量的方法获得的数值资料

J计数资料:按性质或类别分组后清点各组

个数

I等级资料:半定量资料

两组均「单样本设计t检验

"数1阕配对设计验验

正态分布^I成组设计t检验

定量

料三组及[完全随机设计方差分析

髓前随机区组设计方差分析

的^

计^重复测量方差分析

断q

(析因设计方差分析

r配对设计秩和检验

偏态分布,单样本设计秩和检验

I成组设计秩和检验

,定量资料

统计分析r统计描述一相对数

资料类型

〔等级资料

【卡方检验

(参教检验―>正态分布

假设检验I(等级资料

偏态分布资料

、非参数检验(分布类型未知

方差不齐,且不易变换达到齐性

、数据一端或两端不确定的资料

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验

依赖于特定的分布类型,比较的是总体参数

2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总

体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,

可适用于任何类型资料

参数检验

优点:资料信息利用充分;检验效能较高

缺点:对资料的要求高;适用范围有限

2.非参数检验

优点:适用范围广,可适用于任何类型的资料

缺点:检验效能低,易犯II型错误

凡适合参数检验的资料,应首选参数检验

对于符合参数检验条件者,采用非参数检验,其

检验效能低,易犯II型错误

第一章绪论

1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的

所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者

指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体

是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,

通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正

常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就

构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含

量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获

得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的

为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血

压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得

的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况

下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据

样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于时,统计学上习惯称该事件为小概率事件,其含义是该事件

发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,

它是进行统计推断的重要基础。

第二章调查研究设计

1.调查研究主要特点是什么?

调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观

存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

2.简述调查设计的基本内容。

①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定

调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。

3.试比较常用的四种概率抽样方法的优缺点。

(1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位

数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。

(2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于

样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总

体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。

但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,

否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这

样计算得到的抽样误差一般偏大。

(3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变

异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽

样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织

工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较

麻烦,实际工作中实施难度较大。

(4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量

一定时,其抽样误差一般大于单纯随机抽样的误差,。

4.常用的非概率抽样方法有哪些?

有偶遇抽样、立意抽样、定额抽样、雪球抽样等。

5.简述调查问题的顺序安排。

调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题在前,难答

题在后④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题⑤敏感问题一般放

在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形

式安排问题和给出指导语。

二、最佳选择题

1.实验性研究与观察性研究的根本区别在于

A.抽样方法不同

B.研究对象不同

C.是否设立对照组

D.假设检验方法不同

E.是否人为施加干预措施

2.以下抽样方法中不属于概率抽样的是

A.单纯随机抽样

B.系统抽样

C.整群抽样

D.分层抽样

E.雪球抽样

3.条件相同时,下列抽样方法中抽样误差最大的是

A.单纯随机抽样

B.系统抽样

C.分层抽样

D.整群抽样

E.无法直接比较

4,下列关于调查设计的叙述,正确的是

A.明确调查目的是调查研究最核心的问题

B.采用抽样调查还是普查是由该地区的经济水平决定的

C.调查设计出现缺陷时,可以通过相应的统计分析方法弥补

D.一旦制定了调查研究计划,在实际操作过程中,就不可改变

E.调查的质量控制主要在调查问卷设计阶段

5.为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机

抽取部分儿童进行调查,这种抽样方法属于

A.单纯随机抽样

B.分层抽样

C.系统抽样

D.整群抽样

E.多阶段抽样

6.某县有30万人口,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查,

调查对象应为

A.该县所有的已婚夫妻

B.该县所有的农村妇女

C.该县所有的育龄期妇女

D.该县所有的已婚妇女

E.该县所有已婚育龄期农村妇女

7.欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为

A.单纯随机抽样

B.整群抽样

C.分层抽样

D.典型调查

E.普查

8.普善是一种全面调查的方法,与抽样调查相比,叙述正确的是

A.确定普查观察单位非常简单

B.普查适于发病频率较低疾病的调查

C.普查不易获得反映平均水平的统计指标

D.因涉及面广普查可产生较大的抽样误差

E.普查更易统一调查技术,提高调查质量

9.以下五个问题中,最符合调查问卷设计要求的是

A.你一个月工资多少?

B.你一个月吃多少克盐?

C.你是否有婚外恋:①有②无

D.你和你的妈妈认为女孩几岁结婚比较好?

E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可

第三章实验研究设计

【思考与练习】

一、思考题

1.实验设计根据对象的不同可分为哪几类?

2.实验研究中,随机化的目的是什么?

3.什么是配对设计?它有何优缺点?

4.什么是交叉设计?它有何优缺点?

5.临床试验中使用安慰剂的目的是什么?

二、案例辨析题

“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗

的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,

无效4人,有效率达%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生

所中推广。该结论是否正确?如果不正确,请说明理由。

三、最佳选择题

1.实验设计的三个基本要素是

A.处理因素、实验效应、实验场所

B.处理因素、实验效应、受试对象

C.受试对象、研究人员、处理因素

D.受试对象、干扰因素、处理因素

E.处理因素、实验效应、研究人员

2.实验设计的三个基本原则是

A.随机化、对照、重复

B.随机化、对照、盲法

C.随机化、重复、盲法

D.均衡、对照、重复

E.盲法、对照、重复

3.实验组与对照组主要不同之处在于

A.处理因素

B.观察指标

C.抽样误差

D.观察时间

E.纳入、排除受试对象的标准

4.为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模

型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两

组幼猪的存活情况。该研究采用的是

A.空白对照

B.安慰剂对照

C.实验对照

D.标准对照

E.自身对照

5.观察指标应具有

A.灵敏性、特异性、准确度、精密度'客观性

B.灵敏性、变异性、准确度、精密度、客观性

C.灵敏性、特异性、变异性、均衡性、稳定性

D.特异性、准确度、稳定性、均衡性、客观性

E.灵敏性、变异性、准确度、精密度、均衡性

6.比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成

A.选择性偏倚

B.测量性偏倚

C.混杂性偏倚

D.信息偏倚

E.失访性偏倚

7.将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设

计方案是

A.随机区组设计

B.完全随机设计

C.析因设计

D.配对设计

E.交叉设计

8.在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对

照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本

试验中采用的控制偏倚的方法有

A.单盲、多中心

B.随机化、多中心

C.随机化、单盲

D.随机化、双盲双模拟

E.双盲双模拟、多中心

9.临床试验的统计分析应主要包括

A.可比性分析、疗效评价、安全性评价

B.可比性分析、优效性分析、劣效性分析

C.可比性分析、安全性评价、可行性分析

D.优效性分析、等效性分析、安全性评价

E.疗效评价、安全性评价、可行性分析

10.药品上市后应用阶段进行的临床试验属于

A.I期临床试验

B.II期临床试验

C.Ill期临床试验

D.IV临床试验

E.现场试验

四、综合分析题

1.欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8

只作为对照组。该分组方法是否正确?若不正确,请说明理由。

2.某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分

配到实验组和对照组,应如何分组?

3.某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并

欲分析两药联合应用是否更为有效。

(1)你认为该研究最好采用何种实验设计方案?并说明理由。

(2)请帮该研究者实现32只大鼠的随机分组。

【习题解析】

一、思考题

1.根据受试对象不同,实验可以分为动物实验、临床试验和现场试验三类。动物实验的受试

对象为动物,也可以是器官、细胞或血清等生物材料;临床试验的受试对象通常为患者,持续

时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是未患某种疾

病的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其

在人群中产生的预防效果。

2.实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比

组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。

3.配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同

处理组。用以配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、

性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。

配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、实验效率较高;其

缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,

配对的过程还可能延长实验时间。

4.交叉设计是一种特殊的自身对照设计。其中2?2交叉设计首先是将同质个体随机分为两组,

每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这样

每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。

交叉设计一般不适于具有自愈倾向或病程较短的疾病研究。

交叉设计的优点有:①节约样本含量;②能够控制个体差异和时间对处理因素的影响;③

在临床试验中同等地考虑了每个患者的利益。其缺点有:①处理时间不能太长;②当受试对象

的状态发生根本变化时,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,

就会造成数据缺失。

5.临床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,

还可控制疾病自然进程的影响,显示试验药物的效应。

二、案例辨析题

该结论不正确。

研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原

则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响,

不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅

纳入38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000

年至2006年,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,

不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。

三、最佳选择题

3A.

四、综合分析题

1.解:该分组方法不正确。

随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组

方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,

因此破坏了随机化原则。

2.解:先将6对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第18行最左

端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者序号为1,对应于A

组,随机数较大者序号为2,对应于B组。分配结果见表3-1。

表37配对设计的12只小鼠随机分组的结果

对子数123456

动物编号

随机数129688173165196902836075

序号122112121212

组别ABBAABABABAB

SPSS操作

数据录入:

打开SPSSDataEditor窗口,点击VariabIeView标签,定义要输入的变量number和

pair,再点击DataView标签,录入数据(见图37,图3-2)。

图3-1VariabIeView窗口内定义要输入的变量number和pair

图3-2DataView窗口内录入数据

分析:

Transform->RandomNumberGenerators

ActiveGeneratorInitialization

SetStartingPoint

FixedVaIue

Value:键入设定随机种子为

TransforCompute'"

TargetVaIuabIe:键入random

NumericExpression:(0,1)产生范围在0~1之间的伪随机数

0

Transform->RankCases-"

VariabIes(s):random

By:pair对每个对子中的两个伪随机数进行排序

S

注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中

用编程来完成本题。

File->New->Syntax,打开Syntax窗口,键入如下程序:

inputprogram.开始数据录入程序段

numerickbnnumberpair/random.

stringtreat(A1).

computek=2.处理组为2

computeb=6.对子数为6

computen=b*k.

loopnumber=1ton.

computepair=rnd((number-1)/k+.

endcase.

computek=lag(k).

endloop.

endfile.

endinputprogram.结束数据录入程序段

setseed.设定随机种子为

computerandom=uniform(1).产生范围在0~1之间的伪随机数

rankvariabIes=randombypair.对伪随机数排序

formatsrrandom.

compute根据伪随机数的序号进行分组

treat=substr("ABCDEFGHIJKLMN

n,rrandom,1).

Iistnumberpairtreat.结果中显示受试对象编号及被

分到的处理组

在Syntax窗口中选择RunTAII提交运行。

注:程序中的b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可

以用此程序来实现,仅需将k值设为处理组数,b值设为相应的区组数。

结果及解释

DataView窗口

图3-3SPSS编程实现受试对象随机分配结果

Output窗口

List

numberpairtreat

11A

21B

32A

42B

53B

63A

74A

84B

95B

105A

116B

126A

编程实现随机分配的结果见dataview窗口(图3-3)或output窗口。可以看出12只小鼠

被随机分配到A组和B组。在用此程序进行随机分组前,规定A组表示实验组,B组表示对照

组。则1,3,6,7,10,12号小鼠被分到实验组,2,4,5,8,9,11号小鼠被分到对照组。

3.解:

(1)该研究最好采用2义2析因设计的实验方案,如表3-2所示。因为析因设计不仅可以

检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可

分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。

表3-2MEL和TXL对32只大鼠血管紧张素影响的析因设计

TXL

MEL________________________________

(ffl)b,(不用)bz

(ffl)a,aibiaib2

(不用)a?a2bia2b2

(2)先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最

上端开始纵向连续取32个两位数字。对随机数字排序,事先规定,序号为r8的豚鼠分为A

组,序号为9~16的大鼠分为B组,序号为17~24的大鼠分为C组,序号为25~32的大鼠分为D

组,分配结果见表3-3。

表3-332只大鼠随机分组的结果

编号12345678910111213141516

随机数17367743282276683971355096938756

序号18251154221992071430282715

分组AADBAACCBCABDDDB

编号17181920212223242526272829303132

随机数72969464447617177629804056654396

序号21312917132323246261016181232

分组0DDCBCAACADBBCBD

SPSS操作

数据录入:

打开SPSSDataEditor窗口,点击VariabIeView标签,定义要输入的变量number,见

图3-4。再点击DataView标签,录入变量number的值,即从广32。

图3-4VariabIeView窗口内定义要输入的变量number

分析:

Transform->RandomNumberGenerators-"

ActiveGeneratorInitialization

SetStartingPoint

FixedVaIue

Value:键入设定随机种子为

s

TransforCompute""

TargetValuable:键入random

NumericExpression:(0,1)产生范围在0~1之间的伪随机数

s

Transform->RankCases…

VariabIes(s):random对伪随机数排序

0

Transform-►Recode—►IntoDifferentVariables,"

InputVariable^OutputVariable:Rrandom原变量名为伪随机数的序号Rrandom

OutputVariabIe

Name:键入treat新变量名为treat

点击〔Change

点击OldAndNewValues…

OldVaIue

Range:键入1through8

OutputvariabIesarestrings

NewVaIue

Value:键入ARrandom值为1~8时,treat值为A

Old>New:点击画|

OldValue

Range:键入9through16

NewVaIue

Value:键入BRrandom值为9~16时,treat值为B

Old>New:点击硒

OldValue

Range:键入17through24

NewVaIue

Value:键入CRrandom值为17~24时,treat值为C

Old》New:点击亚

01dVaIue

Range:键入25through32

NewVaIue

Value:键入DRrandom值为25~32时,treat值为D

Old>New:点击硒

[Pontinue

注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中

用编程来完成本题。

FileTNewTSyntax,打开Syntax窗口,键入如下程序:

inputprogram.开始数据录入程序段

numericnknumbergroup/random.

stringtreat(A1).

computen=32.受试对象总数为32

computek=4.4个处理组

Ioopnumber=1ton.

endcase.

computen=lag(n).

computek=lag(k).

endIoop.

endfile.

endinputprogram.结束数据录入程序段

computerandom=uniform(1).产生范围在0~1之间的伪随机数

setseed.设定随机种子为

rankvariabIes=random.对伪随机数排序

computegroup=trune((rrandom-1)*k/n).

formatsgroup.

compute根据伪随机数的序号进行分组

treat=substr("ABCDEFGHIJKLMN",group+1,1

).

Iistnumbertreat.结果中显示受试对象编号及被分到的处

理组

注:程序中的n(受试对象总数)、k(即处理组数)可根据实际情况赋予不同的值。

输出结果

DataView窗口(由于篇幅限制,仅列出前16例受试对象的分组情况)

图3-5SPSS编程实现受试对象随机分配结果

Output窗口

List

numbertreatnumberTreat

1D17C

2D18C

3B19B

4C20C

5D21B

6D22A

7B23C

8C24D

9D25C

10A26A

11D27B

12B28A

13C29A

14B30A

15A31B

16A32D

编程实现随机分配的结果见dataview窗口(图3-5)或output窗口。可以看出32只大鼠

被随机分配到A、B、C、D组。在用此程序进行随机分组前,事先规定A、B、C、D分别对应于

对照组、MEL组、TXL组和MEL+TXL组。从分配结果中可以看出:10,15,16,22,26,28,

29,30号大鼠被分到对照组;3,7,12,14,19,21,27,31号大鼠被分到MEL组;4,8,

13,17,18,20,23,25号大鼠被分到TXL组;1,2,5,6,9,11,24,32号大鼠被分到MEL+TXL

组。

第四章定量资料的统计描述

【习题解析】

一、思考题

1.均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势―不同点:

①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值

间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资

料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。

2.同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标

准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,

即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集

中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指

标来描述资料的集中趋势。

3.极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。

不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变

异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散

程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几

组计量单位不同或均数相差悬殊的正态分布资料的离散程度。

4.正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右

对称;③正态分布有两个参数,即位置参数〃和形态参数④正态曲线下的面积分布有

一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间(〃-2.58。,〃+2.58。)内的

面积为%;区间(〃-2.58cr,〃+2.58cr)内的面积为%。

5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下

面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正

态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从

正态分布的变量,应采用百分位数法制定医学参考值范围。

二、案例辨析题

统计描述时,常见错误是对定量资料的描述均采用均数、标准差T”正确做法是根据资

料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清总胆固醇的频

数分布图如下:

图4-1血清甘油三酯(TG)的频数分布

可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计

算中位数和四分位数间距,计算结果为:

集中趋势指标M=+X八…/2=(1.76+1.75)/2=1.755(mmol/L)

离散程度指标四分位数间距=^5-^5=2.10-1.34=0.76(mmol/L)

三、最佳选择题

1.B2.E3.B4.C5.D6.E7.A8.D9.D

四、综合分析题

1._解:输出结果

图4-4尿总碑的频数分布图

由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。

输出结果

图4-5尿总神对数的频数分布图

由图可见Igx分布近似对称,可认为燃煤型碑中毒患者尿总神含量近似服丛对数正态分

布。

(2)燃煤型碎中毒患者尿总碑的含量近似服丛对数正态分布,故应计算几何均数。

输出结果

结果中的Mean表示尿总硫对数值的均数为一,求其反对数,得到几何均数

G=0.0656(ng/L),

2.解:

(1)已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参考值范围。

下限:又—L96S=4.84—1.96X0.96=2.96(mmoI/L)

上限:X+1.96S=4.84+1.96x0.96=6.72(mmol/L)

该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为mmol/L~L。

(2)45~55岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,

查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和

总体标准差的点估计值。

3.25-4.84

Z.=------=----------=—1.00

1b0.96

»=4.=043

b0.96

查标准正态分布曲线下的面积表(附表2)得:

①(ZJ=①(一1.66)=0.0485

O(Z2)=1—0(-0.43)=1-0.3336=0.6664

D=O(Z2)-0>(Z,)=0.6664-0.0485=0.6179=61.79%

该市45~55岁健康男性居民中,血清总胆固醇在L~L范围内的比例为%。

(3)作标准化变换

7X—R3.80-4.84,

Z=-----=----------=-l.Onoo

(y0.96

查标准正态分布曲线下的面积表(附表2)得:

①(Z)=0)(—1.08)=0.1401=14.01%

该市45~55岁健康男性居民中,血清总胆固醇低于L所占的比例为%。

3.解:

输出结果

跟骨硬度指数

图4-8跟骨硬度指数的频数分布图

逢14-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百

分位数法,制定双侧95%参考值范围。

输出结果

Statistics

SI

N60708(Va1网10011012013010©

Missing0

PercentiI

es

即该地区30~35岁建康女性的SI的95%参考值范围为,。

第五章定性资料的统计描述

【习题解析】

一、思考题

1.①计算相对数应时有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单

位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该

分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内

部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。

2.率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,

用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事

物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现

象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。

3.如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算

标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间

接法。

4.常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均

增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相

对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比

发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明

事物在一定时期内逐年的平均增长程度。

5.①标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准

化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不

相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。②样本的标

准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设

检验。③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别

死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率

波动较大时,宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不

适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不

同引起的不可比性问题,标准化法难以解决。

二、案例辨析题

该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患

者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医

生犯了以构成比代替率的错误。

三、最佳选择题

1.B2.A3.D4.E5.D6.D7.C8.09.B

四、综合分析题

1.解:

表5-3经常吸烟与慢性阻塞性肺病(COPD)的关系

经常吸烟

分组调查人数-经常吸烟率(%)

是否

COPD患者356231125

非COPD患者479183296

COPD患者的经常吸烟率:231/356X100%=%

非C0PD患者经常吸烟率:183/479X100%=%

C0PD患者的经常吸烟率比非COPD患者高%

比值比(02=231x296=2989

125x183

还需进一步对0R作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸

烟与慢性阻塞性肺病(COPD)有一定的关系。

输出结果

2.解:

表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化

绝对增长量发展速度增长速度

年份符号死亡率--------------------------------------------------------

累计逐年定基比环比定基比环比

1998~ao——————

1999~ai

2000"a2

2001"a3

2002"a4

2003"a5

2004"a6

该病死亡率的平均发展速度7a/a。=538.5/160.5=0.79

该病死亡率的平均增长速度=平均发展速度-1=0.79-1=-0.21

3.解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg阳性率

的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标

化组的年龄别阳性率,采用直接法计算标准化阳性率。

表5-5直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率(%)

标准人口数-----------男--性-------------------------------女登性----------

年龄组原阳性率预期阳性数原阳性率预期阳性数

PiNRPiNR

0~1081

20~1473

40~1546

60"1408

合计5508(N)264(£NR)286(2乂口)

男性HBsAg标准化阳性率:p'=——X100%=4.79%

5508

女性HBsAg标准化阳性率:p'=——x100%=5.19%

5508

可见,经标准化后女性HBsAg阳性率高于男性。

输出结果

注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp

的和,得女性HBsAg标准化阳性率。

第六章总体均数的估计

【习题解析】

一、思考题

1.抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机

抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体

变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽

样误差大小的因素主要为样本含量和标准差。

2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在

差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样

本含量的增加,样本均数的变异范围逐渐缩小。

3.标准差与标准误的区别在于:①计算公式:标准差为S-,标准误为

V72-1

S

Sx=;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越

y/n

好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误

差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程

度,标准误用于描述均数的抽样误差大小。

标准差与标准误的联系:当样本量〃一定时,标准误随标准差的增加而增加,公式为:

4.数理统计的中心极限定理:从均数为〃,标准差为b的正态总体中进行独立随机抽样,

其样本均数服从均数为〃,标准差为o7的正态分布;即使是从非正态总体中进行独立

随机抽样,当样本含量逐渐增加时(〃250),其样本均数的分布逐渐逼近于均数为〃,标

准差为b/册的正态分布。。反越大,抽样误差越大,由样本均数估计总体均数的可靠性越

小。反之,越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。

计算总体均数置信区间的通式为:(又一L/22?,又当样本含量较大时,

例如〃>1(X),,分布近似标准正态分布,可用Z值代道/值,作为笃信区间的近似计算,

相应的置信度为(1—0)时,总体均数的置信区间为:(又—Za/2S.,N+Za/2SM)。

5.置信区间与医学参考值范围的区别见表67。

表6-1均数的置信区间与医学参考值范围的区别

区别均数的置信区间医学参考值范围

按一定的置信度(1-a)估计的总体均数大多数“正常人”的某项解剖、生理、

意义

所在的区间范围生化指标的波动范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论