R语言的流行病学应用 课件 第1章 R语言简介_第1页
R语言的流行病学应用 课件 第1章 R语言简介_第2页
R语言的流行病学应用 课件 第1章 R语言简介_第3页
R语言的流行病学应用 课件 第1章 R语言简介_第4页
R语言的流行病学应用 课件 第1章 R语言简介_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章R语言简介1.1概述1.5更新R-base、程序包和RStudio1.2前期准备1.6获取帮助1.3使用RStudio:极简入门1.7练习案例1.4程序包的管理1.8小结1.1概述1.1概述1.1.1R语言是什么R语言是一种用于统计分析和数据可视化的编程语言与环境,由RCoreTeam开发,并由RFoundation提供支持和维护服务。R语言由统计学家RossIhaka和RobertGentleman于1993年在新西兰奥克兰大学开发,其设计灵感源自JohnChambers等人在贝尔实验室(原AT&T)开发的S语言R语言发展成熟、简单易用,具备高效的数据处理和存储能力、用于数组计算的运算符、用于数据分析和展示的图形设施,支持屏幕显示和打印输出,现已被数据挖掘者、生物信息学家和统计学家广泛应用于数据处理与分析。截至2025年5月,R语言在TIOBE(TheImportanceofBeingEarnest)指数(衡量编程语言流行度的指标)中排在第12位。1.1概述1.1.1R语言是什么“环境”一词意味着R语言是一个经过完整规划且连贯一致的系统,它可以通过大量的扩展包来增加可用的代码和文档。这与其他数据分析软件不同,后者通常由众多非常具体但不灵活的功能积累而成。部分数据分析软件只能执行特定的预定义任务,而不能根据用户需求进行定制。相比之下,R语言允许用户通过编写代码来定义新函数,从而根据自己的需求定制分析过程。R语言发行版附带了基础软件包,而通过CRAN(ComprehensiveRArchiveNetwork)还可以获取更多可用的软件包,这些软件包涵盖了广泛的现代统计学领域。R语言以源代码形式提供免费软件,并遵循自由软件基金会的GNU通用公共许可证条款。它可以在UNIX系统及其类似系统(包括FreeBSD和Linux)、Windows系统和macOS系统上编译与运行。1.1概述1.1.1R语言是什么R语言可以通过不同的用户界面来运行和编辑,这些界面提供了不同的特点和优势。除了R语言默认的命令行界面,还有多种第三方用户界面可供选择。RStudio是最受欢迎的R语言集成开发环境之一,相比于默认的命令行界面,它更适合复杂的项目开发和管理;Jupyter提供了笔记本界面,便于展示和分享分析结果与过程;VisualStudioCode则可以通过安装扩展来支持R语言,具有丰富的编程辅助功能。这些用户界面都可以帮助用户更高效地使用R语言进行数据分析和可视化,用户可以根据自己的需求和喜好来选择合适的用户界面。1.1概述1.1.2为什么选择R语言ThebestthingaboutRisthatitwasdevelopedbystatisticians.——BoCowgillR语言是为统计分析而生的编程语言。R语言拥有许多特质,使其成为高校师生、统计学家、生物信息学家,以及任何希望轻松、高效分析数据的人群的理想选择。免费且开源。任何人都可以下载、使用、修改、共享R语言,并为R语言及其扩展包的开发做出贡献,而没有任何成本与限制。丰富的数据结构,如向量、矩阵、列表、数据框和因子。这些数据结构允许用户以一致且高效的方式存储和操作不同类型的数据。还可以对它们执行各种操作,如索引、取子集、排序、聚合和连接。1.1概述1.1.2为什么选择R语言灵活的语法。R语言允许用户编写富有表现力且简洁的代码。可以使用运算符、函数、循环、条件语句和其他结构创建复杂的表达式与算法,还可以编写函数。大量的扩展包,可扩展R语言的功能并为各领域提供专门的函数。例如,可以使用forecast包进行时间序列预测,或者使用survival包进生存分析。轻松创建并导出高质量的图形。可以使用graphics内置包快速创建基本图形,如散点图、直方图、箱线图和条形图;也可以使用ggplot2扩展包创建可灵活定制的图形,通过设置标题、标签、图例、颜色和其他选项进行图形自定义。还可以将图形导出为多种格式的文件,如.pdf、.png、.tiff等。1.1概述1.1.2为什么选择R语言与其他语言和软件的集成能力强。用户可以在R语言中调用其他语言的函数或库,或者访问、操作来自其他统计分析软件的数据。例如,可以使用reticulate包调用Python函数;也可以使用foreign包读取SPSS的.sav文件、Stata的.dta文件等其他来源的数据文件。活跃的用户和开发者社区,为R语言发展做出贡献并提供支持和资源。许多在线教程、书籍、课程、博客、论坛都可以帮助用户学习和提高R语言技能,用户还可以在StackOverflow等平台上提问并得到其他R语言用户的回答。1.2前期准备1.2前期准备在开始使用R语言探索数据之前,需要将其安装到计算机上。RStudio是一个功能强大且用户友好的集成开发环境(IntegratedDevelopmentEnvironment,IDE),可以轻松地创建、编辑、调试和运行R语言脚本,并管理项目。1.2.1下载并安装R语言安装R语言需要遵循以下步骤:(1)访问CRAN官网。(2)在CRAN主页中,选择适用于操作系统(Linux、macOS或Windows)的链接。1.2前期准备以下是不同操作系统的安装步骤:Windows系统:单击“DownloadRforWindows”链接。单击“base”链接或“installRforthefirsttime”链接。单击“DownloadR-X.Y.ZforWindows”链接(X.Y.Z代表R语言的当前最新版本),并保存.exe文件。运行.exe文件并按照安装说明进行操作。1.2前期准备macOS系统:单击“DownloadRformacOS”链接。单击“Latestrelease”下包含R语言最新版本的文件链接,并保存.pkg文件。运行.pkg文件并按照安装说明进行操作。Linux系统:按快捷键“Ctrl+Alt+T”或在应用程序启动器中搜索“Terminal”来打开终端窗口。在终端窗口中使用相应代码安装R-base(演示)。运行代码后,将出现确认提示,使用“Y”或“y”来回答“Yes”。1.2前期准备1.2.2下载并安装RStudioRStudioIDE有两种不同的选择,即RStudioDesktop和RStudioServer,二者均提供了开源版和商业版。RStudioDesktop是在本地计算机上运行的RStudioIDE,无须设置和维护远程服务器,对于个人使用更加方便;RStudioServer是在远程服务器上运行并通过浏览器访问的RStudioIDE版本,在需要团队内部协作、资源共享或处理大型数据集、执行计算密集型任务时更加有用。安装R语言后,进行开源版RStudioDesktop的安装。(1)访问DownloadRStudio官网。(2)下滑页面至“AllInstallersandTarballs”部分,单击适用于操作系统的链接。1.2前期准备Windows系统:单击RStudio的Windows版本链接并保存.exe文件。运行.exe文件并按照安装说明进行操作。macOS系统:单击RStudio的macOS版本链接并保存.dmg文件。打开.dmg文件并将RStudio图标拖曳到“应用程序”文件夹中。Linux系统:按快捷键“Ctrl+Alt+T”或在应用程序启动器中搜索“Terminal”来打开终端窗口。在终端窗口中使用相应命令下载并安装gdebi包(演示)。运行命令后,将出现安装确认提示,使用“Y”或“y”来回答“Yes”。在终端窗口中使用相应命令安装.deb包(演示)。1.3使用RStudio:极简入门1.3使用RStudio:极简入门1.3.1RStudio界面导览RStudio界面由4个子窗口组成(演示)。(1)“编辑器”窗口:用于创建、运行和保存脚本,也用于查看数据集。(2)“控制台”窗口:用于输入和执行单个命令,并查看结果。当在“编辑器”窗口中运行脚本时,其输出也将出现在“控制台”窗口中。(3)“环境”窗口:“Environment”选项卡用于显示当前可用的数据集和对象;“History”选项卡用于显示以前运行的命令;“Connection”选项卡用于提供有关连接的信息等。1.3使用RStudio:极简入门1.3.1RStudio界面导览RStudio界面由4个子窗口组成(演示)。(4)“打印、查看器、包和帮助”窗口:用于显示工作路径中的文件和文件夹、R语言生成的图形、帮助文档等。在RStudio菜单栏中,通过选择“Help”→“CheatSheets”选项,可以获取关于RStudio界面更为详细的介绍、输入与运行脚本的快捷键,以及更多常用功能的快速参考指南。1.3使用RStudio:极简入门1.3.2创建R语言项目.Rproj文件是RStudio项目的文件,用于在RStudio中定义项目数据,它包含与当前工作相关的所有文件和设置,如脚本文件、数据文件和输出文件等。当在RStudio中打开.Rproj文件时,它会自动将工作目录设置为项目目录,并恢复项目的先前会话(如果可用),这可以轻松地在不同项目之间切换并继续上次的工作。RStudio项目还具有许多实用功能,如程序包的构建和管理,这些功能有助于高效管理工作。1.3使用RStudio:极简入门1.3.2创建R语言项目以下是在RStudio中创建.Rproj文件的步骤。(1)启动RStudio,选择“File”→“NewProject”选项。(2)在弹出的NewProject”对话框中,选择“NewDirectory”选项,在新目录中创建新项目,或者选择“ExistingDirectory”选项,在现有目录中创建新项目。(3)如果选择“NewDirectory”选项,则请为新目录设置名称并单击“Browse”按钮选择其位置。如果选择“ExistingDirectory”选项,则请单击“Browse”按钮并导航至要在其中创建新项目的目录(演示)。(4)单击“CreateProject”按钮创建新项目。1.3使用RStudio:极简入门1.3.3创建R语言脚本创建新项目后,在这个新项目中创建R语言脚本。(1)创建完项目后,RStudio将自动打开新项目。也可以通过选择“File”→“OpenProject”选项,在弹出的对话框中导航至test.Rproj文件夹并打开该项目。(2)选择“File”→“NewFile”→“RScript”选项,在“编辑器”窗口中打开一个新的、空白的脚本。(3)在“编辑器”窗口中键入或粘贴代码。(4)选择“File”→“Save”选项,弹出对话框,在test.Rproj文件夹目录中为脚本设置保存名称和位置。新脚本现在已保存在test.Rproj项目中。1.4程序包的管理1.4程序包的管理程序包(package)就像一个个工具箱,可以使用它来创造惊人的作品。但需要先学习一些基本技能:程序包的安装、加载、卸载与删除。1.4.1安装程序包程序包是预创建的函数、数据和已编译代码的集合,它可被视为一个工具箱,其中包含用于特定任务或主题的有用工具。安装程序包是向R语言中添加新功能的方式,就像在手机或计算机上安装应用程序一样,只需要安装一次,就可以随时使用已安装的程序包。1.4程序包的管理1.4.1安装程序包以下是5种常见的程序包安装方法。(1)通过CRAN及其镜像等安装程序包(演示)。(2)通过Bioconductor安装程序包。有些程序包仅能通过Bioconductor安装(演示)。(3)通过GitHub安装程序包(演示)。(4)从本地安装程序包。安装dplyr包,需要预先下载dplyr包的压缩文件,再运行相应命令(演示)。(5)使用RStudio安装程序包。

如安装dplyr包,可选择“Tools”→“InstallPackages”选项,弹出“InstallPackages”对话框。在“Installfrom”下拉列表中选择“Repository(CRAN)”选项,在“Packages”文本框中输入“dplyr”,保留“Installdependencies”复选框的勾选状态,单击“Install”按钮。1.4程序包的管理1.4.2加载程序包安装程序包后,需要对其进行加载,之后才能使用其中的函数、数据和已编译代码(演示)。1.4.3卸载与删除程序包当不同程序包之间存在冲突的函数时,需要卸载可疑的程序包进行调试(演示)。detach()使指定程序包中的函数和数据在当前会话中不再可用。但该程序包仍然安装在系统中,并且可以使用library()再次加载程序包。如果需将指定程序包从系统中完全删除,则需要使用remove.packages()(演示)。运行相应命令后,dplyr程序包将不再可用,除非使用install.packages()等函数再次安装它。1.4.4其他实用函数(演示)1.4程序包的管理1.4.5安装程序包的常见问题与解决方案在安装程序包时可能遇到错误或警告,致使无法正常使用所需的程序包。1.package'xxx'isnotavailableforthisversionofR造成这一警告的常见原因包括:(1)程序包名称拼写错误。程序包名称(包括字母大小写)需与官方名称保持完全一致。(2)程序包与当前R语言版本不兼容(演示)。(3)当前程序包在CRAN中不可用。虽然CRAN是程序包的主要存储库,但也有一些程序包并不在CRAN中发布。如果试图安装的程序包在CRAN中不可用,则需指定不同的存储库(有些程序包仅能通过Bioconductor安装),或者下载该程序包的压缩文件后从本地安装程序包。1.4程序包的管理1.4.5安装程序包的常见问题与解决方案2.installationofpackage'xxx'hadnon-zeroexitstatus这一警告仅提示了指定程序包未能安装,但原因十分复杂,在不同操作系统中也可能存在差异。常见原因包括:(1)依赖项不可用。检查控制台输出是否提示“dependencies‘yyy’,‘zzz’arenotavailable”。这种情况通常发生在使用旧版本的R-base时,此时需要根据提示安装依赖项,即安装xxx程序包所需的yyy与zzz程序包,而且很可能需要为其安装指定的兼容版本。1.4程序包的管理1.4.5安装程序包的常见问题与解决方案2.installationofpackage'xxx'hadnon-zeroexitstatus(2)更新依赖项受阻。检查控制台输出是否提示“namespace‘yyy’x.y.zisbeingloaded,but>=x.y.zisrequired”。如果提示,则表明安装当前程序包需要对依赖的程序包进行更新,但由于依赖的程序包已被加载,因此更新失败。此时需要先使用“detach("package:yyy",unload=TRUE)”将依赖项暂时卸载,再尝试进行xxx程序包的安装。更简单的解决方法是先直接重启R软件,再尝试进行xxx程序包的安装。1.4程序包的管理1.4.5安装程序包的常见问题与解决方案2.installationofpackage'xxx'hadnon-zeroexitstatus(3)缺少Rtools或版本不正确。检查控制台输出是否提示“Warninginsystem(cmd):‘make’notfound”。如果提示,则表明make.exe未安装或未包含在系统的PATH中。对于Windows用户,若要从源代码构建和编译程序包(即具有.tar.gz后缀的压缩文件),则需要安装Rtools来实现。此时,需要访问cran.r-project网站获取并安装与R-base版本对应的Rtools。安装Rtools后,可以在cmd中使用“echo%PATH%”查看make.exe是否已添加到PATH中。1.5更新R-base、程序包和RStudio1.5更新R-base、程序包和RStudio保持最新版本的R-base、程序包RStudio,有助于提高R语言环境的稳定性、性能和安全性。1.5.1更新R-base和程序包由于R语言在不断更新版本,用户下载并安装R-base后,需要对其版本进行更新。以Rversion4.2.1为例,在R语言的版本编号规则中,第一个数字4表示主要版本,第二个数字2表示次要版本,而第三个数字1表示补丁级别。当R语言从一个补丁级别升级到下一个补丁级别时,如从4.2.1升级到4.2.2,更改通常非常小,此时可继续使用当前已安装的程序包,而无须执行额外操作。然而,当R语言从一个次要版本升级到下一个次要版本的,如从4.2.3升级到4.3.0,除了R语言自带的基础程序包,其他程序包通常均需要更新至最新版本。1.5更新R-base、程序包和RStudio1.5.1更新R-base和程序包对于Windows、macOS和Linux系统,更新R-base和程序包存在差别。1.Windows系统(演示)installr::updateR()将一站式地完成以下操作:查找、下载并安装最新版本的R语言;将旧版本R语言中安装的程序包复制到新版本R语言中对应的程序包安装目录下;对于可以在CRAN中获取的程序包,根据新版本的需要进行更新。1.5更新R-base、程序包和RStudio1.5.1更新R-base和程序包2.macOS系统推荐的方法是在手动更新R-base后,通过RStudio进行程序包的更新。(1)按照下载并安装R软件的指引,完成最新版本的R-base的安装。(2)启动或重启RStudio,它将自动使用R语言的更新版本;也可以使用R.Version()来检查当前版本。(3)在RStudio菜单栏中,选择“Tools”→“CheckforPackageUpdates”选项,在弹出的对话框中勾选“SelectAll”复选框,单击“InstallUpdates”按钮完成更新。1.5更新R-base、程序包和RStudio1.5.1更新R-base和程序包3.Linux系统(1)按快捷键“Ctrl+Alt+T”或在应用程序启动器中搜索“Terminal”来打开终端窗口。(2)在终端窗口中运行相应命令,将CRAN库添加到系统的源列表中(演示)。(3)在终端窗口中运行相应命令,将CRANGPG密钥添加到系统中,以验证CRAN库的身份(演示)。(4)在终端窗口中运行相应命令,更新Ubuntu系统中的可用软件包列表(演示)。(5)在终端窗口中运行相应命令,安装或更新R语言(演示)。(6)在终端窗口中运行“R--version”来验证R语言是否已经更新。1.5更新R-base、程序包和RStudio1.5.2更新RStudio1.Windows与macOS系统(1)打开RStudio,在菜单栏中选择“Help”→“CheckforUpdates”选项,如果有可用的更新,则请按照提示下载并安装最新版本的RStudio,也可进入RStudio官网直接下载最新版本。(2)退出并重启RStudio,以完成更新过程。2.Linux系统(1)按快捷键“Ctrl+Alt+T”或在应用程序启动器中搜索“Terminal”来打开终端窗口。(2)在终端窗口中运行相应命令,将RStudio库添加到系统的源列表中(演示)。1.5更新R-base、程序包和RStudio1.5.2更新RStudio2.Linux系统(3)在终端窗口中运行相应命令,将RStudioGPG密钥添加到系统中,以验证Rstudio库的身份(演示)。(4)在终端窗口中运行相应命令,更新Ubuntu系统中的可用程序包列表(演示)。(5)在终端窗口中运行相应命令,更新RStudio(演示)。(6)打开RStudio,选择“Help”→“AboutRStudio”选项打开版本信息窗口,检查显示的版本号是否与官网最新的版本号一致,以验证是否已更新。1.6获取帮助1.6获取帮助学习R语言具有一定的挑战性,在使用过程中可能遇到各种各样的问题和错误,但是目前已有多种资源和工具可用来帮助用户提高R语言的使用技能。1.6.1查看说明文档了解某函数包含哪些参数,或者如何设定参数的值,可以使用R语言提供的用于获取帮助的基础函数。例如,运行“?function_name”或“help(”function_name“)”可以查阅该函数的说明文档(演示)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论