




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS统计软件在化学教育上的应用摘要 综合报道了世界上优秀统计软件SAS系统的特点,。在简述操作及编程入门至四环的基础上,例举了两个典型的化学教育研究中使用SAS系统进行数据分析的实例,旨在打通化学工作者在使用计算机高级语言编程中的障碍,以推广SAS系统在化学教育和科研中的应用。关键词:SAS系统 数据分析 化学教育 主成分分析 统计软件 随着计算机应用和网络的发展,进入新世纪,人类迎来了信息时代。数据采掘和信息融合(Data Mining and Data Fusion)已成为当今信息科学一个新的热点。化学这门以实验为基础的既古老又年轻的科学,恰恰又是一门信息量极大的科学。化学科学和化学教育在其漫长的发展历史中积存了浩如烟海的各种数据。因此,如何进行数据采掘亦或数据分析就成为现代化学工作者面临的一个重要任务。本文将要介绍的世界优秀统计软件SAS系统(StatisticalAnalysis System),在其数据采掘亦或数据分析方面具有卓越的功能,尤其是在极为重要的多元数据分析方面,比目前较为流行的MATLAB软件中的统计函数工具箱要丰富的多。它完全可以帮助化学工作者完成教育和科研中需要完成的复杂数据分析任务。考虑到当前化学工作者计算机应用现状,该软件在化学界应用至今仍较少,结合笔者近年来在化学教育和科研工作中使用SAS软件的经验和体会撰写本文,旨在推荐这一软件,推广SAS系统在化学教育上的应用,提高化学工作者计算机水平。1 SAS系统操作入门11显示管理系统在windows环境下启动SAS系统后,就进入SAS显示管理系统。主要包括3个窗口。程序编辑(PROGRAM EDITOR,简称PRG)窗口、记录(LOG)窗口和输出(OUTPUT)窗口。启动SAS后,只显示前两个窗口,只有在系统运行某个程序过程,输出窗口才显示出来。程序窗口用于编辑SAS程序。当程序编好提交执行(单击工具行run图标即可)后,LOG窗口显示出执行的语句和执行中获得的信息,包括程序执行完成情况、变量的个数、CPU运行的时间等。若程序有错,则指出错误的地方及错误信息,并用红色字体显示。在OUTPUT窗口则显示SAS程序执行所输出的结果。1.2 SAS系统操作使用特点SAS系统操作使用最大的特点就是十分简单。在视窗界面下,输入几个简单语句就可以完成其它搞基语言如QBASIC、FORTRAN、C语言需要几十甚至上百个语句才能完成的复杂的数据分析过程。这是因为几个函数语句命令就可完成复杂的运算任务。2 SAS编程入门SAS程序由两个程序步组成。一个是建立数据集,用以讲数据输入到SAS系统,这一程序步称之为数据步(DATA步)。另一个是调用各种事先已编好的置于SAS程序库中的程序(称SAS过程),处理和分析数据集中的数据,这一程序步称之为过程步(PROC步)。2.1 SAS程序数据步(DATA步)在SAS程序窗口下,直接输入数据,即可方便地建立一个SAS数据集。其基本语句形式是:DATA name;INPUT variables;CARDS;data line;RUN;DATA name语句的功能是指明将要建立的数据集的名称(name),可以使不超过8个字符的字符串,但第一个字符必须是英文字母。INPUT variables语句的功能是指明数据集中变量的名称。与其它高级语言一样,变量可以是数值型变量,也可以是非数值型变量,但要在变量名称后空一格并写上,“$”号以指明为非数值型变量。CARDS语句的功能是表示后面将具体给出数据,数据输入完毕,一定要另起一行打入分号“;”,表示数据输入结束。RUN语句表示数据步(DATA步)语句结束(若下面还有PROC步,RUN语句可以省略)。2.2 SAS程序过程步(PROC步)在SAS程序窗口下,编辑过程步(PROC步)的基本语句形式是:PROC SAS过程名选择项;VAR variables;OUTPUT OUT=SASdata set keyword=name;RUN;PROC SAS过程名选择项语句的功能是指定所需要调用的SAS过程及通过选项指明设计的统计量名称。SAS系统用于数据分析处理的过程涉及所有的统计方法,计八大类44个SAS过程。VAR variables语句的功能是定义分析变量。OUTPUT OUT 语句的功能是将过程结果输出到新的数据集中,作为数据处理的输入。3 SAS系统在化学教育数据分析中的应用举例例1 某理工专业班(51)期末的普通化学考试成绩如下:43 66 76 88 48 67 76 89 49 68 77 90 51 68 78 92 53 69 79 83 55 58 70 94 57 71 80 97 60 72 81 62 62 72 82 63 73 82 63 74 83 64 74 84 65 74 85 65 75 86 87.试对全班成绩作描述性统计分析(包括平均分、标准差、方差、变异系数、偏度和峰度)SAS程序如下:data exma 1;input x ;cards;43 66 76 88 48 67 76 89 49 68 77 9086 87;Proc univariate plot normal;Run;程序说明:如果数据中每一行有多于二组观测值,可在“INPUT variables”后加“ ”,表明指针不换行依次读入各组观测值。proc univariate过程表示计算描述性统计量,程序运行结果:Mean(平均分):72.157;Std Deviation(标准偏差);12.724;g1(Skewness,偏度):-0.2254;S2(Variance,方差):161.895;CV(Coeff variation,变异系数):17.634;g2(Kurtosis,峰度):-0.490.结果解释:偏度是度量数据分布是否偏向某一侧的统计指标。对于正态分布,因对称分布,g1=0.本例g1(Skewness,偏度):-0.54,等于负值,且数值不大(g2也不大),说明基本符合正态分布,但向左微偏。因此总的分析来看,本次普通化学考试质量较高,能反映了学生的实际成绩。例2 用主成分分析方法考察研究学生普通化学学习与高等数学、普通物理学习情况的相互关系。有代表性地挑选某年级10名学生,其某阶段数学(x1)、物理(x2)、化学(x3)成绩已知(见程序中的数据集)。SAS程序如下:Data exma 2;Input x1 x2 x3 ;Cards;65 59 58 58 74 6981 77 83 86 77 8074 78 76 87 82 8981 71 81 80 69 6578 74 74 69 66 68;Proc princomp cov;Var X1-X3Run;程序说明:proc princomp cov语句表示从协方差矩阵出发作主成分分析。这里因为个变的度量单位(即分数)一致。否则应从相关矩阵出发作主成分分析。程序运行结果:均值向量: x=(75.9 72.7 74.3)特征值、主成分累计贡献率及正交化特征向量: Prin1 prin2 prin3 X1 0.612843 -0.766647 0.191509X2 0.422203 0.522539 0.740742X3 0.667958 0.373103 -0.6439151 =180.791013 0.8197 0.81972 =33.200551 0.1505 0.9702 2 =6.575103 0.0298 1.0000 结果解释:由程序运行结果可知,前两个主成分已包括原始变量总信息量的97,因此取前两个主成分即可:y1=0.612843x1+0.422203x2+0.667958x3 y2= 0.766647x1+0.522539x2+0.373103x3第一主成分y1是学生的数学(x1)、物理(x2)和化学(x3)三门课程的加权和,其中化学和数学的权重相近,且都比物理的权重大。当一名学生y1较大,可以推断他的三门课程基本上平行发展,因此这个主成分是学生综合能力亦或智力因子的反映,数学学习的好坏影响化学成绩。第二主成分y2的表达式中数学前的系数为负数,物理、化学前的系数均为正数。当一个学生的y2值较大,意味着物理、化学成绩较高,而数学成绩却不高,考虑到物理、化学成绩中实验内容部分成绩比重高达35一40,因此这个主成分是学生实验动手能力亦或实践能力因子的反映。可见通过主成分分析,在尽量减少原始数据中信息损失的前提下,用少数几个主成分可以把隐含在变量之间的关系揭示出来,并合理解释原始变量之间的相关性,是一种应用十分广泛的多元数据分析方法。其实不仅对化学教育研究,现有大部分化学计量学算法SAS系统也能实现,化学工作者完全可以通过学习掌握这一数据分析工具。参考文献:1范金城,梅长林数据分析M北京:科学出版社,20023523842高惠璇实用统计方法与SAS系统M北京:北京大学出版社200133l一36l3 肖厚贞.庾名槐.XIAO
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度村后备干部选拔考试复习资料(含答案)
- 2025智能设备代理合同范本
- 德阳党校招聘考试试卷及答案
- 出入境工作人员安全培训课件
- 出入仓安全生产培训课件
- 大一体育课桥牌考试题及答案
- “粮食银行”诞生记
- 冲床安全操作规程
- 2025凭样品购销合同
- 冰雪路面安全驾驶培训课件
- 通信技术的现状与发展
- 水稻全程机械化栽培技术
- 北京师大附中市级名校2026届中考适应性考试语文试题含解析
- 2025年秋季学期初中学校全面工作安排(含各周重点工作安排)
- 2025年山西省教师职称考试(理论知识)复习题及答案(新课标)-山西教师
- 心理学基础(第2版) 课件 第2章 心理发展
- 2025年小学语文教师招聘考试测试卷及参考答案(共三套)
- 电气设备维护与检测收费标准
- 2025年美团民宿违规试题
- 系统性红斑狼疮眼部表现
- 药物多靶点联合治疗-洞察及研究
评论
0/150
提交评论