




已阅读5页,还剩54页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS软件介绍,一、概述,SAS系统全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。,SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。BASESAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。,启动SAS,二、初识SAS,启动后,出现如图的SAS运行界面,它象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗口,并有菜单条、工具栏、状态栏等。SAS有三个最重要的子窗口:程序窗口(PROGRAMEDITOR)、运行记录窗口(LOG)、输出窗口(OUTPUT)。,ProgramEditor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的。要运行程序,只要用鼠标单击工具栏的提交(Submit)图标,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。,Editor窗口,Log窗口,运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。,Log窗口,出错原因:数据行末尾加了分号,三、SAS程序的基本结构,SAS程序由语句组成,语句用分号结束。语句一般由特定的关键词开始,语句中可包含变量名、运算符等,它们以空格分隔。SAS对语句所占的行数无限制,一个语句可占多行,同样,多个语句也可占一行。,SAS中的变量及数据集名称由英文字母、数字、下划线组成,第一个字符必须是字母或下划线,名字最多用8个字符,大写字母和小写字母不区分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一个名字,而class-1(不能有减号)、abit(不能有空格)、serial#(不能有特殊字符)、Documents(超长)等不是合法的名字。,四、SAS中的命名,程序步分为两种,一种叫数据步(datastep),一种叫过程步(procstep),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务。比如下面的例子:,五、SAS中的程序步,dataaaaa;建立数据集,数据集名称为aaaainputx;数据集中有一个变量xcards;提示以下录入的为数据12345注意数据行末尾不要加分号;procprint;“输出”过程varx;要求输出变量xrun;程序结束要加上run语句才能运行,数据步均以DATA语句开始,用于创建和处理数据集。数据步中常用的语句如下表:表2数据步的常用语句,六、数据步基本结构,下面是几个例子:Data语句:Dataabc;INPUT语句:Inputxyz;/*输入变量x,y,z*/Inputx1-x10;/*输入10个变量x1到x10*/Inputx$y;/*输入变量x,y,符号$指明x为字符变量,表示数据是连续读入*/,七、SAS程序的过程步,通俗地说,SAS程序的过程步就是用于实现各种统计分析功能的SAS命令,我们只需要按照其格式调用它们。过程步总是以一个proc语句开始,后面紧跟着过程步名。如procprint;/*打印输出过程*/,八、数据集的引用,如有一数据集已建立好,下次要使用时可以使用set语句来引用,如:datadef;setabc;将abc数据集内容复制到def数据集中。run;,九、从excel导入数据,将预先录入在excel中的数据集导入到sas中:File-importdata-选择microsoftexcel97or2000(*.xls),next下一步:浏览确认excel数据集的位置,在临时数据集work中为导入的数据集起名,例如abc,完成后按finish,Log窗口会有提示导入成功,导入数据集的注意事项,被引用的Excel数据集此时必须保证关闭状态才能被引用,否则会出错。被引用的Excel数据集内尽量使用英文的变量名,否则容易出错。,计量资料的统计描述,Univariate、Means过程,理论回顾,计量资料的统计描述(频数表,直方(条)图,统计指标)正态分布资料偏峰分布资料M(P25P75),某地120名18岁35岁健康男性居民血清铁含量(mol/L),实例分析,变量类型?,资料分布?,定量变量,1.根据专业知识2.绘制直方图或频数表3.统计学检验(正态性),datat;inputx;*是行保持标记符;cards;7.428.6523.0221.6124.6614.1816.52;Run;,SAS程序:建立数据集,SAS程序:计算统计指标,绘制直方图,procunivariatedata=t;*调用univariate过程;varx;*对变量x进行分析;HISTOGRAMx/MIDPOINTS=7TO29BY2;*绘制直方图;run;,运行结果(graph窗口),均数,标准差,方差,变异系数,中位数,极差,四分位数间距,未校正平方和,校正平方和,偏度系数,峰度系数,运行结果(output窗口),运行结果(output窗口),Means过程,Procmeansmeanstdminmax;Varx;Run;可限定输出常用的指标,定性资料的统计描述,FREQ过程,现有一份预防医学专业61名学生的个人资料,包括年级(grade)、性别(sex)和个人是否拥有电脑(pc)等等信息,试用一维表描述性别比例,用二维表描述不同性别学生拥有个人电脑的情况。,SAS程序:,procfreq;tablessex;/*一维表*/run;procfreq;tablessex*pc;/*二维表*/run;,置信区间,Tinv函数以及赋值语句,总体均数的可信区间,t分布法SAS函数:TINVt=TINV(p,df)可求t分位数的函数,p是从-到当前t分位数位置的面积。df=n-1(自由度)当p0.5,求出来的t为正数。,t,0,-,p,例:随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w)和身高(h),求:学生身高的95%置信区间。,f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162,dataa;inputsex$agewh;cards;f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160F1660165m1765175f1861162;,procmeans;varh;Outputout=bmean=meanstd=sn=n;/*把均数,标准差,样本含量存放在数据集b中,方便下面写赋值语句计算置信区间*/datac;setb;t=tinv(0.975,n-1);/*也可使用t=tinv(0.025,n-1);但此时计算出来的t界值为负数。*/yl=mean-t*s/sqrt(n);/*可信区间的下限*/y2=mean+t*s/sqrt(n);/*可信区间的上限*/procprint;run;,t检验,ttest过程,t检验1.单样本t检验2.配对t检验3.两个独立样本的t检验,一、单样本资料的t检验,目的:根据样本均数推断其总体均数是否与已知总体均数0相等与0的比较。应用条件:独立性正态性,例1,某镇痛新药在药厂投入量产,已知该药的生产技术标准为:每片药中平均有效药物含量为40.4mg。为评价生产质量是否达标,现抽测10片药物,结果为:41.3,40.8,38.7,42.7,43.0,38.6,42.7,39.5,42.1,42.1,问该厂是否达到生产要求?,dataaa;inputa;cards;41.340.838.742.743.038.642.739.542.142.1;,数据步,procttestH0=40.4;vara;run;,过程步,本例t=1.41,双侧检验p=0.1917,按a=0.05水准,不拒绝H0,差别无统计学意义,尚不认为该厂生产质量不达标。,二、配对资料t检验,资料类型:两个同质对象接受不同处理;同一受试对象分别接受不同的处理,同一受试对象处理前后。条件:差值d服从正态分布,例2,数据步,dataaa;inputx1x2;cards;0.940.921.021.011.141.111.231.221.311.321.411.421.531.511.611.611.721.721.811.821.931.932.022.04;,procttest;pairedx1*x2;run;,过程步,本例t0.771,P=0.4569,在=0.05水平上不能拒绝H0,差别没有统计学意义,尚不能认为两法测定结果不同。,两个独立样本的t检验,应用条件:(1)观察值之间是独立的;(2)每组观察值来自正态分布的总体;(3)两个独立组的方差相等。,例3:,dataaa;inputxgroup;cards;241361251141261341231201151191142182202152222242212252272232procunivariate
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年建筑施工安全操作与防护考试题库
- 2025年专升本艺术概论考试模拟卷:艺术批评理论与实践艺术批评与社会发展
- 2025年古筝演奏技能考核试卷:古筝演奏技巧与音乐表达试题
- 2025年地理信息技术应用在初中学业水平考试中的模拟试题及答案解析
- 2025年高压电工操作技能模拟考试题库实战指南
- 2025年初中地理环境与人类活动模拟试题及详细答案
- 2025年中学教师资格《综合素质》教育教学能力重点难点解析试卷
- 2025年瑜伽教练资格证考试题库:瑜伽教练教学方法创新与教学资源开发试题
- 初中地理模拟卷(2025年):地理环境演变与土地利用试题
- 2025年辅导员选拔考试题库:校园文化建设案例创新与实践试题集
- 小学生睡眠管理课件
- 2025-2030中国电线电缆行业市场发展分析及前景预测与投资发展战略研究报告
- 下载家长会课件的方法
- 内蒙古自治区部分学校2024-2025学年高三下学期二模地理试题(原卷版+解析版)
- 教研项目合同协议
- 云南省昆明地区2025届小升初模拟数学测试卷含解析
- 济南水务集团有限公司招聘笔试真题2024
- 委托设计框架合同协议
- 风险化学品事故应急预案
- 《电工电子技术基础》高职全套教学课件
- 众辰变频器z2400t-15gy-1说明书
评论
0/150
提交评论