




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、r 与sas 的集成在统计学教学中的应用研究 引言随着电子计算机技术的发展,统计分析理论与实践已离不开计算机,使统计分析在精度和效率上得到了惊人的提高。因此专门用来进行数据统计分析分析的统计分析软件也越来越多,比如sas,r,spss,excel等,而sas与r是其中最为主流的两种。大学校园里普遍使用的统计分析软件便是sas与r,这两种软件给学生、老师和学校带来极大方便的同时,也暴露了各自的不足。针对于sas软件,学校认为,购买正版sas软件的价格太高了,给学校经费造成巨大压力,再者软件更新很快,意味着这种巨大的经费投入是长期的。因此,很多学校迫于经费的压力,根本没有使用正版软件,而是使用所谓
2、破解版等盗版软件。同时学生和老师认为,因为盗版软件会缺失正版软件中一些重要的应用模块,这就会影响学生以及老师们的学习和研究,同时盗版软件大多数含有病毒,这也将给学校硬件和软件设备均带来很大的威胁,导致学校中的设备总是会出现不能正常使用的情况,这也间接地影响着老师和学生的研究学习。针对r软件,它并非专门的统计分析软件,因此在运用于统计分析时,并没有sas那么详细的结果,以及准确的验证工具。面对学生、老师和学校反馈的这些问题的影响愈来愈深,不得不让我们去思考这些问题产生的原因及采取的对策。本文从使用者的角度出发,结合大学中这两种软件的使用情况,分别从学生、老师和学校三个方面对这两种软件使用问题的一
3、些反馈进行了分析,并提出了解决这些问题的对策集成。根据sas与r两者各自的优缺点,对两者软件进行集成,便可很大程度解决这两种统计分析软件使用中的问题。本文列举了4种可行的集成方案,并说明了优缺点,为以后的统计分析软件的集成研究提供了一些理论依据。1 软件特点分析sas与r都是应用很广泛的统计分析软件,因此这两种软件的种种弊端很早就已经暴露出来了,但是为什么仍迟迟得不到解决呢?因为它们的那些问题均是源自软件本身的特点,只要软件本身不改变,那些问题也就无法消除。本文从学生、教师、学校等三个方面对这两种统计分析软件使用问题的反馈出发对这两种统计分析软件的特点进行研究与分析。1.1 sas软件的特点(
4、1)需要购买正版软件,成本高。sas是非开源软件,是商业软件,所以是需要付费的,并且价格十分昂贵。同时作为一种软件,它的更新速度是很快的,因此版本换的很快,每一次版本的更换又需要支付费用,这就造成使用正版sas的成本是很高的。(2)灵活方便、功能齐全。sas的宗旨是为所有需要进行数据处理、数据分析的非计算机人员提供一种易学易用,完整可靠的软件系统。操用方便:用户把要解决的问题用sas语言表达出来,组成sas程序,提交sas系统即可。执行的情况和输出结果都在屏幕上显示出来。灵活:sas系统提供很多语句及选项供用户灵活地使用某种统计方法。功能齐全:sas系统提供的二十多个模块可供用户根据实际需要灵
5、活地选择使用。(3)编程能力强、简洁易学。sas语言是sas系统的基础,是用户与系统对话的工具。该语言的特点是用户不必告诉sas“怎样做”,只需告诉它你要“做什么”就行了。(4)处理与分析任意组合。sas程序的结构由两个基本步骤任意组合而成。data步用于对数据的加工处理;proc步用于分析数据和编写报告。(5)适用性强、应用面广。sas系统适用于初学者或有经验的用户;能满足从事行政、管理、分析、编辑等部门人员对信息需求的用户。sas系统可用来解决自然科学和社会科学各个领域的各种问题。1.2 r软件的特点(1)r 是自由软件。也就是说,它不会向你收取任何费用,但是它的能力不会比任何同类型投入成
6、千上万美元价值不菲的商业软件差。从功能相似的角度来说,r 和matlab 最像的。(2)r是一个全面的统计研究平台,提供了各式各样的数据分析技术。几乎任何类型的数据分析工作皆可在r中完成。并且通过r 你可以和全球一流的统计计算方面的专家合作讨论,它是全世界统计学家思维的最大集中。当你加入了r 的邮件列表,每天都会收到五六十份关于r 的资讯邮件。(3)r是一个可进行交互数据分析和探索的强大平台。因为r是可进行交互数据的强大平台,因此在r软件中任意的一个分析步骤的结果均可以被轻松保存、操作,并作为进一步分析的输入,这使得r语言的操作性极强。(4)r 和其他编程语言/数据库之间有很好的接口。r可以轻
7、松地从各种类型的数据源导入数据,包括本文文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同时可以输出并写入到这些系统中。代码整合的时候感觉r 为你提供了一系列对象,你用其他语言只要调用这些对象就可以了。这对数据整合工作非常有用。(5)r拥有顶尖水准的制图功能。无论多么复杂的数据,r都可以将它们可视化,r拥有最全面且最强大的可视化这一系列可用功能。(6)r可运行与多种平台上,包括windows、unix、linux等。因为自由开源软件具有零成本或低廉的成本的特点,十分有利于优质资源的开发与共享,因此自由开源软件在各个领域的应用已成为主流趋势。因此在操作系统上也将会是百花齐放,像linux这
8、种开源操作系统普及率将会越来越高,这时候具备多平台运行能力的r将具备极大的优势。1.3 为什么r与sas要集成很多人在比较 r、sas、spss 等统计软件时,总是偏向某一种软件而对其他软件一味地指责。笔者认为,竞争可以带来技术的创新与进步,但是任何一款软件都不可能集所有优点于一身,能够包治百病,满足所有用户各种各样的需求,所以软件之间的合作对使用者而言更有意义,也是势在必行。对于r与sas这两种统计分析软件来说,它们有各自的优势,也有各自的问题,竞争促进创新,合作才能带来双赢,因此两者的集成能融合各自的优势解决各自的问题,从而更能满足使用者的各种需求。1.4 可行的r与sas集成方案及其优缺
9、点(1)通过 sas/iml 在sas里面提交r代码。sas/iml 9.22 推出了一个新功能:用户可以在 iml 里面执行 r 代码,r 和 sas 的数据也可以相互交换。该种集成方案的优点有:因为r代码本质上是在r里运行,所以全面支持r的各种模型和函数;这种集成方案支持32位或64位的windows、linux操作系统;这种集成方案在数据交换、错误捕获等方面表现不错,并且支持sas format。同时该种集成方案的缺点有:需要购买 sas/iml(9.22版本或更高版本),成本高。(2)通过 sas model manager 将r模型导出生成的pmml文件翻译成sas代码。predic
10、tive model markup language(pmml)是由数据挖掘小组(data mining group,dmg)牵头,众软件厂商共同研究制定的一套用于表示模型的标记语言,目的是为了在不同软件产品之间实现模型的共享。这种集成方案的优点有:可以将生成的sas代码快速集成到各种基于sas开发的应用系统中;可以将r模型和sas模型进行预测性能方面的比较;可以对r模型和sas模型进行性能监测。同时这种集成方案的缺点有:需要购买 sas model manager(12.1版本),成本高;sas model manager目前也仅支持几种常用的pmml模型。(3)通过宏 proc_r 实现在
11、sas里面提交r代码。proc_r 于2012年发表在 journal of statistical software 上,是一位华人 wei xin 在美国罗氏制药公司工作期间发表的,是使用了管道技术以批处理的方式执行r代码。这种集成方案的优点有:因为r代码本质上是在r里运行,所以全面支持r的各种模型和函数;不需要购买 sas/iml,成本低。这种集成方案的缺点有:只支持 windows 系统,但是使用者如果有一定编程功底,可以将源代码改造成linux可用的版本;数据交换通过 csv 文件实现,可能不支持 sas format;这种集成方案在错误捕获等方面略弱。(4)将r生成的神经网络和决策
12、树模型翻译成sas代码。用 r 建神经网络模型,然后将模型翻译成 sas 语言格式的评分代码,并在sas 里对新数据进行预测。这种集成方案的优点有:可以将生成的sas代码快速集成到各种基于sas开发的应用系统中;这种集成方案在windows和linux操作系统上都是可行的;不需要购买sas/iml或者sas/em,成本低。这种集成方案的缺点有:这种集成方案目前只支持神经网络和决策树模型,应用范围相对较窄;这种集成方案是无法处理自变量取值缺失的情况。2 结论本文从学生、老师和学校三个方面对sas与r两种统计分析软件的问题以及特点进行了分析,并提出了有效解决两种软件各自问题的对策集成。软件各自出现
13、的问题来自各自软件的特点,集成综合两种统计分析软件的优点,可解决两种软件各自在使用中出现的问题,研究结果给以后统计分析软件的集成研究提供了理论参考依据。针对学生,老师以及学校需求的多样性特点,列举出了4种可行的集成方案,各高校可根据学校的实际情况,选择合适的集成方案以达到学校的实际需求。c29c91afe4ced1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afedd1b6c87d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe
14、4ced1b6c8795ad29c91af95ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9d1b6c8795ad9c91afe4ced1b6c8795a1afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afc91fe4ced1d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6cd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af8795ad
15、9c91fe4ced1d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c87d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af5d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afad9c91fe4ced1b6c8795ad29c91afb6c8795ad29c91afb6c8795ad29c91afd1b6c8795ad9c91afe4ced1b
16、6c8795ad91afe4ced1b6d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91affe4ced1b6c8795ad29c91afc8795ad9c91fe4ced1b6c8795ad29c91afd1b6c8795ad9c91afed1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8d1b6c8795ad9c91afe4ced1d91
17、afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afc91fe4ced1d1b6c871afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afc91fe4ced1d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6cd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af8795ad9c91fe4ced1d1b6c8795ad9c91afe4ced1b6
18、c8795ad91afe4ced1b6c87d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af5d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afad9c91fe4ced1b6c8795ad29c91afb6c8795ad29c91afb6c8795ad29c91afd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6d1b6c8795ad9c91a
19、fe4ced1b6c8795ad91afe4ced1b6c8791afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afc91fe4ced1d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6cd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af8795ad9c91fe4ced1d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c87d1b6c87
20、95ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af5d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afad9c91fe4ced1b6c8795ad29c91afb6c8795ad29c91afb6c8795ad29c91afd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c
21、8795ad9c91d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91affe4ced1b6c8795ad29c91afc8795ad9c91fe4ced1b6c8795ad29c91afd1b6c8795ad9c91afed1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8d1b6c8795ad9c91afe4ced15ad9c91d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced
22、1b6c8795ad29c91affe4ced1b6c8795ad29c91afc8795ad9c91fe4ced1b6c8795ad29c91afd1b6c8795ad9c91afed1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8d1b6c8795ad9c91afe4ced195ad9c91afe4ced1b6c8795ad91afe4ced1b6cd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af8795ad9c91fe4ced1d1b6c8
23、795ad9c91afe4ced1b6c8795ad91afe4ced1b6c87d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af5d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91afad9c91fe4ced1b6c8795ad29c91afb6c8795ad29c91afb6c8795ad29c91afd1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced
24、1b6d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91affe4ced1b6c8795ad29c91afc8795ad9c91fe4ced1b6c8795ad29c91afd1b6c8795ad9c91afed1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8d1b6c8795ad9c91afe4ced1b6c8795ad91afe4ced1b6c8795ad9c91fe4ced1b6c8795ad29c91af795ad9c91fe4ced1b6c8795add1b6c8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 集团放养厂出租合同协议
- 食堂bot合作模式合同协议
- 门禁采购协议书范本
- 面包糕点店铺转让合同协议
- 门店装修投产合同协议
- 露营床垫出租合同协议
- 鞋模具加工合同协议
- 集体土地承租合同协议
- 门窗销售合同协议模板
- 集装箱合同协议模板
- 对接焊缝角焊缝的构造和计算
- 山东春季高考土建专业2023年高考题
- 材料力学(刘鸿文版)学习通课后章节答案期末考试题库2023年
- 滞期费速遣费的计算
- 省级特色专业安徽省高等学校质量工程项目进展报告
- 电镀铬作业指导书
- 先导化合物的优化和结构修饰药物化学专家讲座
- 并购重组试题
- 在线音乐网站设计论文
- 发动机机械-01.1cm5a4g63维修手册
- 国家开放大学《行政组织学》形考1-5标准答案
评论
0/150
提交评论