ChSAS基本统计过程二freq.ppt_第1页
ChSAS基本统计过程二freq.ppt_第2页
ChSAS基本统计过程二freq.ppt_第3页
ChSAS基本统计过程二freq.ppt_第4页
ChSAS基本统计过程二freq.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于计数资料的统计推断,最为常用的是 FREQ过程。 FREQ过程可以用于两个目的:一是描述分析,产生频数表和列联表,可简洁地描述数据;二是统计推断,产生各种统计量,可分析变量间的关系。 该过程主要由下列语句控制: PROC FREQ TABLES request(s) ; WEIGHT variable; 该过程PROC FREQ语句是必需的,其它语句都是可选的。,第五章 计数资料的统计描述与推断,PROC FREQ ; 这里的options常用的有 Data=SAS-data-set,指定输入数据集名,若省略,则用最近建立的数据集。,2. TABLES request(s) ; TABLES语句是该过程中非常重要的一条语句。在一个PROC FREQ过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中的每个变量都生成一个单向频数表; 如果tables语句没有任何说明选项(options),FREQ对tables语句中规定的变量的每个水平将计算频数、累计频数、占总频数的百分数及累计百分数。,在TABLES语句中,用request(s)指定制表要求。这里,可以是用*连接起来的一个变量或多个变量。在一个TABLES语句中可以给出任意多个制表要求。 例如: 。Tables a; 对指定变量a产生一个单向频数表; 。Tables a*b; 产生以b为列、a为行的二维列联表; 。Tables a*b*c; 产生以c列、b为行、a为分层的三维列联表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(b c);等价于tables a*b a*c; 。Tables (a b)*(c d);等价于tables a*c a*d b*c b*d; 。Tables (a b c)*d;等价于tables a*d b*d c*d;,2) 在TABLES语句的斜杠(/)后面可以使用如下选项: CHISQ:要求进行卡方检验(Chi-Square Test) Fisher:要求对大于22的表进行Fisher的精确检验; Agree:做配对卡方检验; ALPHA=p:确定置信区间的水平是100(1-p)%的置信区间,默认p=0.05; ALL:要求所有由CHISQ、MEASURES和CMH选项给出的检验和度量; NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER。,3. WEIGHT variable; 通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句时,每个观测对频数计数的贡献为这个观测对应的权数变量的值。 。如果资料是最原始的形式,通常情况下不需要此语句; 。如果资料是以频数的形式出现,则需要该语句。,Data a; Input row col f; Cards; 1 1 74 1 2 51 2 1 56 2 2 19 ; Run;,四格表资料,建立SAS数据集,行变量row,列变量col,行列交叉对应的频数f,row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | -+-+-+ 2 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | -+-+-+ Total 2 2 4 50.00 50.00 100.00,row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 74 | 51 | 125 | 37.00 | 25.50 | 62.50 | 59.20 | 40.80 | | 56.92 | 72.86 | -+-+-+ 2 | 56 | 19 | 75 | 28.00 | 9.50 | 37.50 | 74.67 | 25.33 | | 43.08 | 27.14 | -+-+-+ Total 130 70 200 65.00 35.00 100.00,Proc freq data=a; Tables row*col; Weight f; Run; 产生结果如下:,Proc freq data=a; Tables row*col; Run; 产生结果如下:,无weight语句,可见,有无weight语句对结果产生很大的差异,对于该资料,由于是频数资料,因此一定要加上weight语句。,例4-8:频数表的编制 某年某地149名成人脉博资料(次/分)的测定数据如下:试作频数表。 58 64 68 72 81 81 68 63 72 94 79 65 94 79 83 71 58 75 65 68 68 83 91 68 73 72 56 53 60 70 68 65 60 79 62 73 88 80 70 63 83 73 68 67 65 103 74 64 70 94 79 57 53 75 83 58 69 67 86 79 69 81 75 75 74 57 68 68 71 77 70 95 54 68 66 48 75 70 89 104 79 59 71 67 95 77 68 59 60 72 97 77 86 77 87 75 55 83 68 75 57 93 74 56 79 72 66 68 79 61 60 85 79 58 97 68 79 72 71 88 54 71 94 68 60 83 74 80 71 71 52 63 73 78 86 70 84 82 72 61 68 88 94 72 84 75 83 96 81 为了编制频数表并作频数分析,首先需要建立一个数据集,将所有的数据进行分组,然后在此基础上调用相应的SAS过程(FREQ过程)来达到我们的目的。 下面给出相应的程序:,建立SAS数据集 Data ex49; Input x ; Cards; 58 64 68 72 81 81 68 63 72 94 79 65 94 79 83 71 58 75 65 68 68 83 91 68 73 72 56 53 60 70 68 65 60 79 62 73 88 80 70 63 83 73 68 67 65 103 74 64 70 94 79 57 53 75 83 58 69 67 86 79 69 81 75 75 74 57 68 68 71 77 70 95 54 68 66 48 75 70 89 104 79 59 71 67 95 77 68 59 60 72 97 77 86 77 87 75 55 83 68 75 57 93 74 56 79 72 66 68 79 61 60 85 79 58 97 68 79 72 71 88 54 71 94 68 60 83 74 80 71 71 52 63 73 78 86 70 84 82 72 61 68 88 94 72 84 75 83 96 81 ; Run;,Data ex491; Set ex49; grp=int(x-45)/5)*5+45; Run;,int()取整函数 int(1.7)=1 int(5.2)=5 int(0.4)=0,确定起始分组和组距: 组距:5, 起始分组:45 - 50 grp=int(x-45)/5)*5+45; 语句将每一个脉搏值进行分组,例如脉搏82,被分入 grp=int(82-45)/5)*5+45=int(7.4)*5+45=80,即80-85组内。,提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后,在FREQ过程中对原始变量x应用分组格式即可。,利用表达式对 数据进行分组,分组 频数 百分比 累积频数 累积百分比 Cumulative Cumulative Grp Frequency Percent Frequency Percent - 45 1 0.67 1 0.67 50 5 3.36 6 4.03 55 12 8.05 18 12.08 60 13 8.72 31 20.81 65 27 18.12 58 38.93 70 29 19.46 87 58.39 75 23 15.44 110 73.83 80 16 10.74 126 84.56 85 9 6.04 135 90.60 90 7 4.70 142 95.30 95 5 3.36 147 98.66 100 2 1.34 149 100.00,Proc freq data=ex491; Tables grp; Run;,对分组变量grp进行频数分析, 产生以下结果:,Proc gchart data=ex491; /*调用gchart过程*/ hbar x /space=0 /*生成直方图,直条间无空隙*/ midpoints=47.5 to 102.5 by 5 /*直条对应的组中值*/ freq cfreq percent cpercent ; /*输出统计量*/ Run;,如果要将上面的频数表以频数图的形式表达出来,可以使用如下程序:,关于gchart过程,感兴趣的同学可以在SAS命令框里输入“help gchart”并回车得到帮助。,例4-9 某研究人员收集了婴儿的相关资料,试进行描述性分析,分析内容,一维表 小孩腹泻发生比例是多少? 发生次数怎样? 分娩方式:手术产和顺产比例分别是多少? 喂养方式构成?(母乳、牛奶、混合) 交叉表 不同喂养方式的腹泻发生率怎样? 分娩方式 与喂养方式有无关联?,建立SAS数据集 通过excel直接导入SAS,注意第一行为SAS变量名 将数据保存在txt文本文件中,通过infile读入 Data a; infile c:aa.txt; Input no fx fxcs tz fm wy nl jy; label no =编号 fx =小孩腹泻 fxcs=腹泻次数 tz =小孩体重 fm =分娩方式 wy =喂养方式 nl =母亲年龄 jy =教育程度; Run;,/*分析程序*/ /*列出腹泻、腹泻次数、分娩方式、喂养方式的频数表*/ Proc freq data=a; table fx fxcs fm wy; Run; /*列出腹泻患者中,腹泻次数发生频数表*/ Proc freq data=a; table fxcs; where fx=1; Run; /*列出喂养方式与腹泻发生的交叉频数表*/ /*列出分娩方式与喂养方式的交叉频数表,并进行卡方检验*/ Proc freq data=a; table wy*fx ; table fm*wy/chisq; Run;,结果,略,例4-10. 用抗凝剂与不用抗凝剂治疗急性心肌梗塞的疗效比较,结果如下表:,请比较两种治疗方法的生存情况是否相同?,DATA ex410; INPUT g1 g2 f; CARDS; 1 1 74 1 2 51 2 1 56 2 2 19 ;,PROC FREQ DATA=ex410; TABLES g1*g2/chisq Fisher; WEIGHT f; RUN;,首先建立需要的SAS数据集,调用FREQ过程,g1*g2要求生成二维表,chisq选项要求做卡方检验,fisher选项要求做fisher精确检验(注意对于四格表该选项可以省略);由于是频数资料,因此 加上weight语句并给出频数变量f。,g1(行变量) g2(列变量) Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 74 | 51 | 125 | 37.00 | 25.50 | 62.50 | 59.20 | 40.80 | | 56.92 | 72.86 | -+-+-+ 2 | 56 | 19 | 75 | 28.00 | 9.50 | 37.50 | 74.67 | 25.33 | | 43.08 | 27.14 | -+-+-+ Total 130 70 200 65.00 35.00 100.00,频数 百分比 行百分比 列百分比,每一个格子中四个数据的含义,Statistics for Table of g1 by g2 统计量 自由度 统计量的值 p值 Statistic DF Value Prob - Chi-Square 1 4.9289 0.0264 Likelihood Ratio Chi-Square 1 5.0529 0.0246 Continuity Adj. Chi-Square 1 4.2725 0.0387 Mantel-Haenszel Chi-Square 1 4.9043 0.0268 Phi Coefficient -0.1570 Contingency Coefficient 0.1551 Cramers V -0.1570,Chisq

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论