R语言与统计分析.pptx_第1页
R语言与统计分析.pptx_第2页
R语言与统计分析.pptx_第3页
R语言与统计分析.pptx_第4页
R语言与统计分析.pptx_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

R语言与统计分析 2 什么是R TheRProjectforStatisticalComputing 主页 https www r project org GettingStartedRisafreesoftwareenvironmentforstatisticalcomputingandgraphics ItcompilesandrunsonawidevarietyofUNIXplatforms WindowsandMacOS TodownloadR pleasechooseyourpreferredCRANmirror IfyouhavequestionsaboutRlikehowtodownloadandinstallthesoftware orwhatthelicensetermsare pleasereadouranswerstofrequentlyaskedquestionsbeforeyousendanemail 3 简史 R语言是从S统计绘图语言演变而来 可看作S的 方言 S语言上世纪70年代诞生于贝尔实验室 由RickBecker JohnChambers AllanWilks开发 基于S语言开发的商业软件Splus 可以方便的编写函数 建立模型 具有良好的扩展性 在国外学术界应用很广 1995年由新西兰Auckland大学统计系的RobertGentleman和RossIhaka 基于S语言的源代码 编写了能执行S语言的软件 并将该软件的源代码全部公开 这就是R软件 其命令统称为R语言 R与统计简介 很多人都把R作为一个统计系统来使用 我们倾向于把它当作环境 使得经典和现代统计技术在其中得到应用 一部分语句和程序已经被内建在基本的R语言环境中 但是更多的是以包的形式提供的 由8个包是随着R一同提供的 称作标准包 其它的可以通过CRAN的成员网站获得 通过http cran r project org 通过R可以使用绝大多数的经典或者最新的统计方法 不过用户需要花一些功夫来找出这种方法 R与其他主流的统计系统在本质上有一个很重要的不同 在R中 统计分析通常由一系列的步骤完成 同时将交互的结果存储在对象中 所以 尽管SAS和SPSS在一个回归或者判别分析中会给出丰富的输出结果 R只是给出一个最小的输出 而将结果保存在一个适当的对象中由R函数进行后续查询 5 R源程序 R社区 R核心团队 R刊物 R书籍 R会议 R主页UserGroups 中文社区 统计之都 国际 useR 中国 COS ChatOpenShare 上百种 包括统计编程 统计模型 数据分析 统计图示 以及forBioinformatics TheRJournal Volume4 2 June2012 20位 牛津大学 AT T实验室等 累计更新了95个版本1997年959K 2013年 24M 6 R的特点 多领域的统计资源目前在R网站上约有2400个程序包 涵盖了基础统计学 社会学 经济学 生态学 空间分析 系统发育分析 生物信息学等诸多方面 跨平台R可在多种操作系统下运行 如Windows MacOS 多种Linux和UNIX等 命令行驱动R即时解释 输入命令 即可获得相应的结果 7 为什么选择R 丰富的资源涵盖了多种行业数据分析中几乎所有的方法 良好的扩展性十分方便得编写函数和程序包 跨平台 可以胜任复杂的数据分析 绘制精美的图形 完备的帮助系统每个函数都有统一格式的帮助 运行实例 GNU软件免费 软件本身及程序包的源代码公开 8 R与其他统计软件比较 SAS 速度快 有大量统计分析模块 可扩展性稍差 昂贵 SPSS 复杂的用户图形界面 简单易学 但编程十分困难 Splus 运行S语言 具有复杂的界面 与R完全兼容 昂贵 9 R的缺点 用户需要对命令熟悉与代码打交道 需要记住常用命令 占用内存所有的数据处理在内存中进行 不适于处理超大规模的数据 运行速度稍慢即时编译 约相当于C语言的1 20 相比点击鼠标进行操作 R仍能够大大提高效率 10 CRAN TheComprehensiveRArchiveNetwork简称CRAN 由世界几十个镜像网站组成网络 提供下载安装程序和相应软件包 各镜像更新频率一般为1 2天推荐镜像 中国的镜像 数学所http ftp ctex org mirrors CRAN 即时更新的CRAN源http cran r project org 11 Windows下载和安装R CRAN Binaries Windows base 12 R登陆界面 Windows版 菜单栏 快捷按钮 控制台 光标 等待输入 13 图5RGui的File菜单 14 图6RGui的Edit菜单 15 RGui的Packages菜单 16 图8RGui的Help菜单 17 R程序包 RPackages 程序包是什么 R程序包是多个函数的集合 具有详细的说明和示例 Window下的R程序包是经过编译的zip包 每个程序包包含R函数 数据 帮助文件 描述文件等 为什么要安装程序包 R程序包是R功能扩展 特定的分析功能 需要用相应的程序包实现 例如 系统发育分析 常用到ape程序包 群落生态学vegan包等 18 常用R程序包 I 19 常用R程序包 II 20 常用R程序包 III 21 vegan包页面 三种平台上的程序包 22 R程序包 一般Cran提供三种版本的安装包 开发的版本 发行版 以前的版本 下载发行的版本比较安全稳定 23 安装程序包的方法 1直接用R上菜单里面的快捷键选择镜像后安装 2用函数install packages 如果已经连接到互联网 在括号中输入要安装的程序包名称 选择镜像后 程序将自动下载并安装程序包 例如 要安装picante包 在控制台中输入install packages picante 3安装本地zip包路径 Packages installpackagesfromlocalfiles选择本地磁盘上存储zip包的文件夹 24 程序包使用 程序包的中函数 都要先导入 再使用 因此导入程序包是第一步 在控制台中输入如下命令 程序包内的函数的用法与R内置的基本函数用法一样 library BayesFactor 25 查看程序包帮助文件 BayesFactor程序包内部都有哪些函数 分别有什么功能 查询程序包内容最常用的方法 1菜单帮助 Html帮助2查看pdf帮助文档 26 查看函数的帮助文件 函数的默认值是什么 怎么使用 使用时需要注意什么问题 需要查询函数的帮助 1 t test2RGui Help Htmlhelp3apropos t test 4help t test 5help search t test 6查看R包pdf手册 27 图11R帮助文件的内容与格式 28 帮助文件的内容 lm stats 函数名及所在包FittingLinearModels 标题Description 函数描述Usage 默认选项Arguments 参数Details 详情Author s 作者References 参考文献Examples 举例 29 练习一安装R并导入程序包 1 安装R软件 熟悉菜单2 安装程序包ISwR3 调用程序包 查看程序包的帮助library ISwR 30 练习二看看R能干什么 抽取1000个服从正态分布的随机数e rnorm 1000 0 1 赋值 或者 生成一个简单的向量x 1 1000 1000做一个简单的运算y sin 2 pi x e 数和向量之间的加减乘除 绘图plot x y 数据的读入 txt文件读入 csv文件读入存为 txt文件write table data file data1 txt row names F quote F 存为 csv文件write csv data file data1 txt row names F quote F R数据的保存与加载save data2 file data2 Rdata rm data2 load data2 Rdata read table file header TRUE sep read csv file header TRUE sep quote dec fill TRUE comment char setwd D R语言与统计分析课程课件 data read csv beer csv na strings header T sep write table data file data1 txt row names F quote F data2 read table data1 txt header TRUE write csv data2 file data2 csv row names F save data2 file data2 Rdata rm data2 load data2 Rdata print data2 objects 被用来显示目前存储在R中的对象的名字 而当前存储的所有对象的组合被称为workspace 清除对象可以使用rm命令 所有在一个R任务中被创建的对象都可以在文件中被永久保存 并在其它的R任务中被使用 在每个R任务结束时用户都有机会保存当前有效的所有对象 如果用户这样做的话 对象将被写入当前目录一个名为 RData Note3 当R被再次启动时R会从这个文件中再载入workspace 同时相关的命令记录也被载入 Ifyourdatasetdidnothaveaheader Rhasprovidedsomeattributesforit namely V1 V2 V3 V4 and V5 data read csv beer csv na strings header F sep data read csv beer csv na strings header F sep col names B1B2B3B4 read table和read csv的用法总结Theseparatorsymbol TheheaderargumentisalwayssetatTRUE whichindicatesthatthefirstlineofthefilebeingreadcontainstheheaderwiththevariablenames ThefillargumentisalsosetasTRUE whichmeansthatifrowshaveunequallength blankfieldswillbeaddedimplicitly read table file header FALSE sep quote dec row names col names as is stringsAsFactors na strings NA colClasses NA nrows 1 skip 0 check names TRUE fill blank lines skip strip white FALSE blank lines skip TRUE comment char allowEscapes FALSE flush FALSE stringsAsFactors default stringsAsFactors fileEncoding encoding unknown text col name c t3 t4 read csv andread csv2 Theread csv andread csv2 functionsarefrequentlyusedtoreadspreadsheetssavedwiththeextension csvorCommaSeparatedValues Asdescribedbefore read csv andread csv2 haveanotherseparatorsymbol fortheformerthisisacomma whereasthelatterusesasemicolon RememberthatbothfunctionshavetheheaderandfillargumentssetasTRUE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论