SAS学习系列15 统计学基础知识Ⅱ-统计表,统计图_第1页
SAS学习系列15 统计学基础知识Ⅱ-统计表,统计图_第2页
SAS学习系列15 统计学基础知识Ⅱ-统计表,统计图_第3页
SAS学习系列15 统计学基础知识Ⅱ-统计表,统计图_第4页
SAS学习系列15 统计学基础知识Ⅱ-统计表,统计图_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

is.统计学基础知识n—统计表,统计图

(七)统计表

统计表和统计图都是表达统计资料的重要工具。

统计表,表达统计资料具体、明确,可以用来表达定性资料、

定量资料、混合型资料;

统计图,表达统计资料形象、生动,但只能要么表达定性资

料、要么表达定量资料。

一、表达定性资料的统计表

1.二维2X2表列联表(2个定性指标)

(1)完全随机设计

从全体对象中随机抽取n个个体,然后按属性A、B的两个分

类进行两两组合分成四格,得到相应的2X2的频数表。

哀3.1.1完全随机设计2X2表格式

属性例数

A属性B:Bz合计

A]abe

Cdf

合计ghn

两属性独立;HnA,B两属性不独立

(2)队列研究设计

若把全体研究对象按因素A(是否接触某危险因素)分为两组

(接触组、非接触组),再对每组的个体进行跟踪观察,并按因素

B(是否患病)分成两组(患病组、未患病组),得到的2义2表。

*3.1.3队列研究设计2X2表格式

(由因索果)

是否接触某____________例数

危险因素追踪结果:发病未发病合计

接触abe

非接触cdf

合计g一卜〃一

H。,接触组与非接触组的发病率相等:

H】;接触组与非接触组的发病率不等

(3)病例-对照研究设计

若把全体研究对象按因素B(是否患某病)分成两组(病例

组、对照组),再对每组中的个体进行回顾性调查,并按因素A

(是否接触某危险因素)分成两组,得到的2X2表。

»3.1.4病例-对照研究设计2X2衰格式

(由果索因)

回顾接触某危例数

险因索的历史事前状态,病例对照合计

接触3be

非接触cdf

合计ghn

H。:病例组与对照组接触某危险因素的比例相同,

石,病例组与对照组接触某危险因素的比例不同

(4)配对研究设计

n个受试对象(或一组样品)分别用甲乙两种检测方法进行检

测,并按测定结果(阳性+,阴性-)分类计数,即按“都为阳性,

一阳一阴,一阴一阳,都为阴性”四种情况分别计数,得到的2X2

表。

*3-1.2配对设计2X2表格式

例数

甲法

乙法:+—合计

+abe

—Cdf

合计ghn

Ho,b=c;H3:b^c8甲、乙法指甲、乙法浏定的结果

2X2列联表,都可以作相关分析(两属性是否有相关关系)、

独立性检验(或两总体率之间差异的显著性检验,用Fisher精确检

验);

2X2队列研究设计,常需要先计算相对危险度RR(=af/ce),

并做假设检验:Ho:RR=1;Hi:RR=O.做该检验需要用Mantel-

Haenszel/?统计量(U统计量)。

2X2队列研究设计和2X2病例.对照研究设计,可由经验

Logistic变换公式计算Zi统计量,进而做U检验。

2义2配对研究设计,检验两种检测方法之间有无显著性差别。

2.二维RXC列联表(R,C22)

(1)双向无序RXC表

表3.2.1某地6094人按2种血型划分的结果表3.2.2心律失常种类与心肌粳塞部位的关系

ABO人数缓慢心梗塞例数

律失常

血暨MN血型:MNMN合计种类部位;下壁前攀翼后鹭心内瞋下合计

O431490902182?案性过缓872118

A3884108001598被动心律11002

B4955879502032房室阻滞631111

AB137179325641束支阻滞1161018

合计1451165629776094合计16274249

破动心律的全称为祓动性交界性心律

(2)单向有序RXC表

表3.2.33种药物疗效的观察结果表3.2.4患者痰液中SB含■与病型的关系

例数曜皎例数

疗效-------------------------------细胞-----------------------------------

药物:ABC合计含最病型:A型B型C型D型合计

治愈154120035311

显效4991573十257519

好转315045126H953320

无效5222451卅622010

合计1008585270合计1715171160

SB代表嗜酸细胞

(3)双向有序属性不同RXC表

«315眼晶状体混注度与年龄之关系表3.2.6腌门密度与矽肺期次之美杀

晶状体眼数肺门密患者例数

混浊程度年龄:20〜30〜40〜合计度级别矽肺期次;1期I期・期合计

+215131148494+431650

++671011282961889617301

卅4463132239招147255141

合计3262954081029合计24516978492

(4)双向有序属性相同RXC表

表3.2.8学生文化课与体育课成编之关崇

两法检查宜受收埼运动的符合情况

*3.27文化课学生人数

对比法冠心病患者数成绩体育:不及格及格良好优秀合计

测定结果核章法1正常成弱异常合计不及格478322

正常582363及格556.7415150

城弱142750良好103212817187

舁常891734优秀6913836

合计675327147计2510422343395

适用的分析、检验方法:

表3.2.9列酸衰的分类及其适用的统计分析方法

变量的统计性质及其专业属性列联表分类列联表的编号适用的统计分析方法

X、Y皆为名义变量且属性不同双向无序表表3.2.(1;2)"检验.Fisher精确检验

X、丫之一名义变量且属性不同单向有序表表3,2,(314)帙和检验・CPD、Ridit分析

X、Y皆为有序变量且属性不同双向有序表表3.2.(5;6)相关分析.线性趋势检验

X、Y皆为有序变量且喝性相同双向有序表表3.2.(7:8)一致性检验,特殊模型分析

各神列联表资料几乎都可运用对数线性模型和logistic回归模型来分析

双向无序RXC表,所选用的统计方法应当与分组变量各水平

的先后顺序或取值大小无关,仅与表中总频数、各行的合计、各列

的合计有关。符合这些要求的方法有Pearson的拟合优度检验/检

验、基于似然函数(或端的分解)导出的似然比32检验、对数线性

模型、SAS的FREQ过程步进行Fisher精确检验。

单向有序RXC表,所选用的统计方法应当与有序的那个分组

变量各水平的先后顺序或取值大小有关。显然,通常的力2检验已无

能为力,应考虑把有序变量当作半定量指标在计算中加以考虑的方

法:秩和检验、Ridit检验、CPD分析、有序变量的Logistic回归模

型、有序变量的对数线性模型。

双向有序属性不同RXC表,当把两个属性看成地位平等的相

互关系时,常需要考虑它们之间是否存在线性关系,即需要对资料

进行相关分析(Spearman秩相关分析、典型相关分析);若把一个

属性当成自变量,另一个属性当成因变量,常需要考察它们之间是

否存在直线变化趋势,即需要对资料进行线性趋势检验(U检验、

力?检验:“利用回归思想产生的与线性回归有关的/分量和偏离

线性回归的72分量”)。

双向有序属性相同RXC表,两个分组变量都是“测定结

果”,且档次划分也相同(有序)。对这种资料,研究者关心的不

是两变量之间是否存在相关性或线性趋势,而是这两种测定结果的

一致性如何。适合采用一致性检验:K叩pa检验。特别地,如表

3.2.8,研究者可能更关心:文化课成绩与体育锻炼达标的等级之间

是否呈现某种特殊的变化趋势(直线趋势模型,即主对角线上的频

数占大多数,之外的频数之和趋于0),可以用前面线性趋势检

验、或一些特殊模型:对称模型、条件对称模型、对角线模型。

注:有时候若想要更多的挖掘RXC表的统计信息,还可以对

RXC表进行分割,得到若干2X2表做进一步研究。

3.高维列联表(变量个数23)

例如,下面是三维列联表:

表3.3.Z收缩压出)、血中胆固辞与心脏病之关系

是否患有冠心病胆固的含量(mmcl/L)例数

(Y)(A)(B),<127127〜147〜>166合计

有<5.18233,412

5.18〜32038

5.70〜8116631

26.73712111141

无<5.181171214722307

5.18〜85984320246

5.70-1192096843439

N6.7367994633245

合计4085552241421329

处理高维列联表资料的方法,借助统计软件有Logistic回归模型

(只能分析自变量对因变量的影响)、对数线性模型(可分析全部

变量及其交互作用对列联表中格网格上理论频数之对数的影响);

也可以将高维列联表压缩为二维列联表再进行处理。

4.具有重复测量设计的定性资料(做方差分析)

(1)单因素重复测量资料•:

表10-1心室早搏病人在用药前后的心率

药物0)按猜人⑴

旃人可

测量值平均值千方和

(01:用药节2:A前3:C西4:B前

和(Z)匕

19467906731879.5025914

25752695523358.2513739

38174697329774.2522127

48259717228471.0020430

56765747227869.5019374

67872807230275.5021852

787751067434285.5029906

88268765928571.2520605

99074828032681.5026700

按茹物0)

测量值和%718.00606.00717.00624.002665

平均值寓)

79.7867.3379.6769.3374.03

平方,同)

58336.0041284.0058275.0043752.00201647

药物水平数。=4,每组观察例数«=9,观察值总个数N=axn=36

方差分析的总思想:

将总变异分解为:个体间(betweensubjects)变异与个体内的变

异。其中个体内变异是与重复因素有关的变量。

(2)双因素重复测量资料

表10-4某药两种不同剂型在血中的浓度(监/加)

剂型受试者________________服药后测定时间(一__________________

⑴“1(1力)2(2/03(4〃)4(6/1)5(8ft)

9.7354.6155.9146.8147.56214.62

5.5050.8779.9062.3755.03253.67

7.9623.4364.1056.0045.15196.64

2.3718.6573.1076.0560.80230.97

2.3755.2493.3565.4762.37278.80

6.5032.0873.4576.2760.23248.53

8.34132.1102.097.8392.83433.10

1.805.4085.8073.9560.14227.09

Tij44.57372.38627.61554.75484.112083.42

14.6629.0048.8852.2431.65176.43

片0.8425.0053.8044.2532.38156.27

剂0.6817.3464.5661.6055.80199.98

型2.1414.1069.7766.6554.43207.09

2.3053.4073.8362.0057.31248.84

-

Z=26.1725.8545.8053.2547.95179.02

2.4553.3058.8057.8071.10243.45

1.5844.0030.3070.2067.06213.14

T?i30.82261.99445.74467.99417.681624.22

Tj75.39634.371073.351022.74901.793707.64

5=(9.73)2+(54.61):+...+(30.30)2+(70.20)2=238012.38

方差分析总思想:

将总变异分解为:对象间(betweensubjects)变异与对象内

(withinsubject)变异,其中对象内变异是与重复因素有关的变量。

二、定量资料的统计表

1.随机区组设计一元定量资料

表2不同药物作用后小白鼠肉瘤重量(g)

肉瘤重量

rv州

“并3:A药B药C药

10.820.650.51

20.730.540.23

30.430.340.28

40.410.210.31

50.680.430.24

适合做方差分析,事先需要检验正态性和方差齐性(若不满足则

要数据变换和非参数检验)。

2.含一个协变量的随机区组设计一元定量资料

表26.1牡蛎在不同温度和位置上的生长数据

•»重复数厂即(x为初始体重,y为最后体重)。

位置.b2,3.4.

trt-不产X。产X,产X。产

1(入口底部)“27232632.0.36633.0.37726831.0,

2(入口顶部)“28633.8.26.8.31.7,26.5.30.7.26.8.30.4,

3(出口底部).28.6.35222.4.29.1.23.2.289,24.4.302

4(出口顶部).29.3.35.0.21.8.27.030336.4.243305

5(附近中部),20424.6.19.6.23425.1.30318.L21.8.

初始体重X是协变量,适合做一元协方差分析(若含有多个协

变量,则要做多元协方差分析)。

3.拉丁方设计一元定量资料

4X4拉丁方设计:

表1不同中药组测得的血凝时间

中药代号(血潟时间(s))

白兔编号

试踊序号:1234

1C(85)0(102)A(90)B(IOO)

2D(108)A(88)B(110)C(80)

3A(95)B(98)C(82)D(110)

4B(105)C(78)D(104)A(92)

注:拉丁方要求分组数和处理数相同,在每行每列各种处理都

出现且仅出现一次。

既要控制系统误差且试验动物的数量又较少,则常采用拉丁方

设计(处理数不能太多,一般以4〜10个为宜)。

基本要求:(1)必须是三个因素(分组、处理、结果)的实

验,且三个因素的水平数相等(若三因素的水平数略有不同,应以

主要处理因素的水平数为主,其它两因素的水平数可进行适当调

整);(2)三因素间是相互独立的,均无交互作用;(3)各行、

列、字母所得实验数据的方差齐。

4.配对交叉设计一元定量资料

示例:两阶段交叉设计

表4A、B两种药物影响下的体重下降量(物

体重下降量蚓体重下降量四

组别受试者号・组别受试者号・

前4周后4周前4周后4周

AB16.129-0.454BA34.4492.043

22.4970.90854.9441.816

44.3130.45470.4540.136

64.5402.72490.2271.271

81.4981.135101.5891.271

118.1724.313120.1361.589

当试验中涉及到一个具有2水平的试验因素,这两个水平要先后

作用于同一个受试对象,并且这两个水平要么在条件相近的同一对

受试者中交叉实施,就称为配对二阶段交叉设计;要么在两组受试

者中交叉实施,就称为成组二阶段交叉设计。

可以考察一个具有两水平的试验因素和两个受试对象组因素

(即个体差异、测定顺序)对观测结果的影响:试验因素的两个水

平在两组受试对象中施加的顺序呈交叉状;对于每一个受试者而

言,均有一个“洗脱期”,从而消除“携带效应”的影响。

另外,还有三阶段交叉设计、3X3交叉设计(将三种处理或药

物分三个时期先后给予同一个受试者,观察受试者接受每种处理后

的反应;处理A、B、C施加的顺序共有6种排列方式,即ABC、

ACB、BAC、BCA、CAB、CBA,故至少要将受试者一分为6个组,

每组中至少要有一位受试者)。

5.析因设计

析因设计(factorialdesign)是一种多因素的交叉分组设计。它

不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互

作用。两个或多个因素如存在交互作用,表示各因素不是各自独立

的,而是一个因素的水平有改变时,另一个或几个因素的效应也相

应有所改变;反之,如不存在交互作用,表示各因素具有独立性,

一个因素的水平有所改变时不影响其他因素的效应。

2X2X2析因设计

A?^2^1^2A2B2C]A2B2C2

2X2X2=8种处理

表3.9不同饲料喂养猪的平均日增重量(kg)

A]B[C]A]BCARC1A】B2c2AzBCA班©A2B2GA2B2C2合计

0.550.770.510.480.730.840.670.42

0.540.600.570.610.700.620.600.60

0.740.580.680.590.590.670.630.64

0.710.740.660.620.610.660.660.48

0.620.610.430.490.690.760.610.55

0.580.570.500.490.540.730.570.48

0.560.720.580.520.700.630.670.54

0.510.790.650.490.610.610.710.49

素J然。

(网4.815.384.584.295.175.525.12

1X2294033.67642.67682.32573.37293.85403.2914

6.裂区试验设计

先将每一区组按第一因素的处理数划分小区(称为主区),在

主区里随机安排主处理,然后在每个主处理里按第二因素的处理数

再划分小区(称为副区),在副区里随机徘列副处理。

区组

主处理A副处理BT4T

IIImA

A,B,29283289

B:373231100

18141749

B3

17161548

1019095286

%BI28292582

31282988

13131036

B3

B413121237

2858276243

A3B】30272683

B,3128319

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论