




已阅读5页,还剩190页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计软件和R语言 装了R没有 一个广泛接受的统计定义为 统计是用以收集数据 分析数据和由数据得出结论的一组概念 原则和方法 这个定义决定了统计的命运 和数学及音乐不同 统计不能欣赏自己 它不为实际服务就没有存在必要统计必须为各个领域服务统计必须和数据打交道因此 统计必须和计算机结合 搞 理论统计 是否用不着动手搞数据呢 如果倒退几十年 就可以 如果没有应用背景 文章没人要 基金无人给 现在一些人即使瞎编也要编出一个应用背景来 纯理论统计存在吗 统计和计算机 现代生活已离不开计算机了 但最早使用计算机的是统计 最初的计算机仅仅是为科学计算而建造的 大型计算机的最早一批用户就包含统计 而现在统计仍然是进行数字计算最多的用户 统计和计算机 计算机现在早已脱离了仅有计算功能的单一模式 而成为百姓生活的一部分 计算机的使用 也从过去必须学会计算机语言到只需要 傻瓜式 地点击鼠标 结果也从单纯的数字输出到包括漂亮的表格和图形的各种形式 统计软件 统计软件的发展 也使得统计从统计学家的圈内游戏变成了大众的游戏 只要输入数据 点几下鼠标 做一些选项 马上就得到令人惊叹的漂亮结果了 统计软件 是否傻瓜式的统计软件使用可以代替统计课程了 当然不是 数据的整理和识别 方法的选用 计算机输出结果的理解都不象使用傻瓜相机那样简单可靠 统计软件的问题 诸如法律和医学的软件都有不少警告 不时提醒你去咨询专家 这是注意饭碗的律师和大夫的高明之处 但统计软件则不那么负责 只要数据格式无误 方法不矛盾而且不用零作为除数就一定给你结果 而且没有任何警告 可能统计学家缺乏商业头脑 统计软件的问题 另外 统计软件输出的结果太多 即使是同样的方法 不同软件输出的内容还不一样 有时同样的内容名称也不一样 这就使得使用者大伤脑筋 即使统计学家也不一定能解释所有的输出 因此 就应该特别留神 明白自己是在干什么 不要在得到一堆毫无意义的垃圾之后还沾沾自喜 datatest inputx cards 1231760run procunivariatefreqnormal run 随意键入几行SAS语句和5个数目 得到下面结果 一共50多个数目 你能够解释多少 你需要多少 TheSASSystem15 33Friday September12 20031UnivariateProcedureVariable XMomentsQuantiles Def 5 N5SumWgts5100 Max6099 60Mean16 6Sum8375 Q31795 60StdDev25 12568Variance631 350 Med390 60Skewness1 899804Kurtosis3 56305725 Q1210 1USS3903CSS2525 20 Min15 1CV151 3595StdMean11 236551 1T Mean 01 477322Pr T 0 2136Range59Num 05Num 05Q3 Q115M Sign 2 5Pr M 0 0625Mode1SgnRank7 5Pr S 0 0625W Normal0 726472Pr W0 0197ExtremesLowestObsHighestObs1 1 1 1 2 2 2 2 3 3 3 3 17 4 17 4 60 5 60 5 FrequencyTablePercentsPercentsValueCountCellCumValueCountCellCum1120 020 017120 080 02120 040 060120 0100 03120 060 0 原始的5个数目清楚 还是这50多个数目清楚 这些输出都有意义吗 实际上 对于一个统计数据 如果选择 傻瓜 软件适合该数据的选项的全部输出 那么 其中可能包含 很多 甚至多数 没有意义的结果 比如SPSS中的对数线性模型 非参数检验中的多重相关样本的检验等等 各种回归中的适合正态样本的检验 而且 这些众多的输出 给了那些诸如检验中的 少数服从多数 的 创新者 以似是而非的 论据 许多 傻瓜 软件的输出找不到确切数学背景 只有使用编程软件才能够核对其真实意义 统计软件的种类 统计软件的种类很多 有些功能齐全 有些价格便宜 有些容易操作 有些需要更多的实践才能掌握 还有些是专门的软件 只处理某一类统计问题 最常见有几种 统计软件的种类 SPSS 这是一个很受欢迎的统计软件 它容易操作 输出漂亮 功能齐全 价格合理 对于非统计工作者是很好的选择 统计软件的种类 Excel 严格说来不是统计软件 但作为数据表格软件 必然有一定统计计算功能 注意 多数装Office时没有装数据分析的功能 画图功能都具备 虽然不好看 对于简单分析 Excel还算方便 但随着问题的深入 就不那么 傻瓜 需要很麻烦地使用函数 甚至根本没有相应的方法了 统计软件的种类 SAS 这是功能非常齐全的软件 美国政府政策倾斜 权威性 许多美国公司使用 价格不菲 每年交费 即使赠送 条件苛刻SAS公司傲慢无礼尽管现在已经尽量 傻瓜化 仍然需要一定的训练才可以进入 对于基本统计课程则不那么方便 统计软件的种类 S plus 这是统计学家喜爱的软件 功能齐全 图形漂亮有不断加入的各个方向统计学家编写的统计软件包 也可以自己加入算法 强大而又方便的编程功能 使得研究人员可以编制自己的程序来实现自己的理论和方法 它也在进行 傻瓜化 以争取顾客 但主要以其方便的编程为顾客所青睐 在R软件之前是统计学家的首选软件 但是对于不会编程者 不那么 傻瓜 统计软件的种类 R软件 免费的 志愿者管理的软件 其编程语言与S plus所基于的S语言一样 编程方便 语言灵活 图形功能强大有不断加入的各个方向统计学家编写的统计软件包 也可以自己加入自己算法的软件包 从网上可以不断更新和增加有关的软件包 数据和程序 可以使用其他软件编制的程序 可以通过网上服务把程序变成机器语言这是发展最快的软件 受到世界上统计师生的欢迎 是用户量增加最快的统计软件 对于一般非统计工作者来说 主要问题是它没有 傻瓜化 后面对R语言还要专门介绍 其他有关软件 Minitab 这个软件是很方便的功能强大而又齐全的软件 也已经 傻瓜化 在我国用的不如SPSS与SAS那么普遍 Statistica 也是功能强大而齐全的 傻瓜化 的软件 在我国用的也不如SAS与SPSS那么普遍 Eviews 这是一个主要处理回归和时间序列的软件 Systat 已经被SPSS购买而消失GAUSS 这是一个很好用的统计软件 许多搞经济的喜欢它 主要也是编程功能强大 目前在我国使用的人不多 其他有关软件 MATLAB 这也是应用于各个领域的以编程为主的软件 在工程上应用广泛 编程类似于S和R 但是统计方法不多 FORTRAN 这是应用于各个领域的历史很长的非常优秀的编程软件 功能强大 有大量数学软件包及一定的统计软件包 计算速度比前面介绍的都快得多 但需要编程和编译 操作不那么容易 C C 是许多软件 诸如SAS的基础 但没有软件包 编程不方便 使用傻瓜软件的问题 无法任意取出计算过程中产生的任何中间结果 只能输出软件规定的输出 无法在中间插入任何算法 无法实现软件所没有的计算 无法实现任何方法或计算方面的创新 是输入输出皆有限制的黑盒子 用语句的任何计算 即使1 1 2 都需类似八股文的 花架子 搞统计是否不需要学习编程语言 可以不学习 如果你 搞纯粹数学推导的 只搞 理论 不面对数据 不用计算机觉得岁数太大 学不会 非傻瓜 的计算不想有创新 仅使用现成方法套用想永远依赖会编程的学生或别的什么人 但如果你要创新 你需要反复试验你的新方法需要用各种数据来检验你的新方法需要把你的方法和老方法进行比较需要介绍自己的新方法使用编程语言不可避免 没有任何别的选择 现代统计学家都自己编程 比如 Brockwell Davis 时间序列 Bruce Gao 小波分析 Bickel etal 非线性回归 Hastie 广义可加模型 Silverman 非参数密度估计 McCullagh Nelder 广义线性模型 Hardell Marron 范剑青 非参数回归 Diggle etal 纵向数据 毫无例外 没有任何新的重要统计方法是利用诸如SAS或SPSS等傻瓜软件产生的 多数SAS或SPSS等的新统计方法软件包 是改写统计学家通过自己编程所发展的方法而来的 在美国 很难想象一个统计学研究生不会使用编程语言 使用什么软件编程呢 SAS SPSS Minitab等也有程序 但很难学 不好记 也没有任何普遍性和规律性 而S S plus R Matlab Gauss Fortran C C Pascal Basic等语言有很多共性 容易举一反三 有些具有统计软件包 对统计学家则很方便 特别是S plus软件 R软件和Gauss软件 使用编程软件容易吗 以R软件为例 非常好学 极易入门基本功能简单 和写公式一样能在一个小时学会基本运算语句在一天内学会编写函数 子程序 和利用软件包 往往困难的反而是统计内容本身 SAS专家很难实现下面并非复杂的运算 考虑60个观测值的回归 其中X和Y 2 3X1 2X2 e随机产生 X1来自U 10 20 X2来自U 5 8 e来自N 0 1 n 60 回归20次 每一次回归之后把x15的值在目前的基础上加0 1个原始的x15值 输出残差e5和矩阵P X X X 1X 的第5个对角线元素h5的值 并分别点出这20个h5和e5的散点图于一张图中 计算这20个h5和e5的相关系数 而对于R或者S plus 初学者可很快用下面几行来解决 不用任何软件包 x1 rnorm 60 10 20 x2 runif 60 8 5 x cbind 1 x1 x2 y 2 3 x1 2 x2 rnorm 60 h NULL e h i 1 while i 20 P x solve t x x t x h c h diag P 5 e c e y P y 5 x 5 1 x 5 1 x1 5 0 1 i i 1 par mfrow c 1 2 plot h plot e cor h e 结果为 它们的相关系数为 0 9486753 R 语言 软件 R免费R资源公开 不是黑盒子 也不是吝啬鬼 R可以在UNIX Windows和Macintosh运行 R有优秀的内在帮助系统 R有优秀的画图功能学生能够轻松地转到商业支持的S Plus程序 如果需要使用商业软件 R语言有一个强大的 容易学习的语法 有许多内在的统计函数 通过用户自编程序 R语言很容易延伸和扩大 它就是这样成长的 R是计算机编程语言 类似于UNIX语言 C语言 Pascal Gauss语言等 对于熟练的编程者 它将觉得该语言比其他语言更熟悉 而对计算机初学者 学习R语言使得学习下一步的其他编程不那么困难 那些傻瓜软件 SAS SPSS等 语言的语法则完全不同 R的缺点 不如S Plus在编辑输出的画图那样好没有商业支持 但有网上支持 需要编程 不傻瓜 R的历史 S语言在1980年代后期在AT它是一个由志愿者组成的工作努力的国际团队 R里面有什么 Packages 每个都有大量数据和可以读写修改的函数 程序 baseTheRbasepackagebootBootstrapR S Plus Functions Canty classFunctionsforclassificationclusterFunctionsforclustering byRousseeuwetal ctestClassicalTestsedaExploratoryDataAnalysisforeignReaddatastoredbyMinitab SAS SPSS gridTheGridGraphicsPackageKernSmoothFunctionsforkernelsmoothingforWand Jones 1995 latticeLatticeGraphicslqsResistantRegressionandCovarianceEstimationMASSMainLibraryofVenablesandRipley sMASSmethodsFormalMethodsandClassesmgcvMultiplesmoothingparameterestimationandGAMsbyGCV Packages 继续 modregModernRegression SmoothingandLocalMethodsmvaClassicalMultivariateAnalysisnlmeLinearandnonlinearmixedeffectsmodelsnlsNonlinearregressionnnetFeed forwardneuralnetworksandmultinomiallog linearmodelsrpartRecursivepartitioningspatialfunctionsforkrigingandpointpatternanalysissplinesRegressionSplineFunctionsandClassesstepfunStepFunctions includingEmpiricalDistributionssurvivalSurvivalanalysis includingpenalisedlikelihood tcltkInterfacetoTcl TktoolsToolsforPackageDevelopmentandAdministrationtsTimeseriesfunctions 所有这些Packages都是在basepackage上添加的 Base包含所有固有的应用和数据而其他的packages包含各统计学家自己发展的方法和数据 希望你是下一个加盟这些packages的作者之一 赋值和运算 z rnorm 1000000 4 0 1 median z 可以用 y w简单数学运算有 等等 序列和向量 z seq 1 10 length 100 z seq 1 10 len 100 z seq 10 1 1 z 10 1x rep 3 1 3 x rep 3 5 1 3 x 1 344555x rep c 1 10 c 4 5 w c 1 3 x z w 3 分布和产生随机数 正态分布 pnorm 1 2 2 1 dnorm 1 2 2 1 qnorm 7 2 1 rnorm 10 0 1 rnorm 10 t分布 pt 1 2 1 dt 1 2 2 qt 7 1 rt 10 1 此外还有指数分布 F分布 卡方 分布 Beta分布 二项分布 Cauchy分布 Gamma分布 几何分布 超几何分布 对数正态分布 Logistic分布 负二项分布 Poisson分布 均匀分布 Weibull分布 Willcoxon分布等变元可以是向量 向量运算 x rep 0 10 z 1 3 x z 1 1231231231Warningmessage longerobjectlengthisnotamultipleofshorterobjectlengthin x zx z 1 0000000000Warningmessage longerobjectlengthisnotamultipleofshorterobjectlengthin x zrev x z c nocat has nine tails z 1 nocat 1 TRUE 向量名字和append x 1 3 names x LETTERS 1 3 xABC123append x runif 3 after 2 ABC1 00000002 00000000 31079870 75051490 57522263 0000000 向量赋值 z 1 5z 7 8 z 1 12345NA8z NULLz c 1 3 5 1 3 z 1 1NA2NA3rnorm 10 c 2 5 z c 1 3 去掉第1 3元素 z length z 4 length z 最后五个元素 向量的大小次序 z sample 1 100 10 z 比较sample 1 100 10 rep T 1 75682842172196346947order z 1 56384102917z order z 1 17212834424768697596sort z 1 17212834424768697596which z max z 给出下标 Matrix x matrix runif 20 4 5 x 1 2 3 4 5 1 0 79836780 046076010 045553230 85944830 73089500 2 0 65598510 795622220 029482700 14533640 79552838 3 0 67591710 561931470 482866530 24199310 56069988 4 0 11837010 806526270 494051670 65231370 08345406 x matrix 1 20 4 5 x 1 2 3 4 5 1 1591317 2 26101418 3 37111519 4 48121620 x matrix 1 20 4 5 byrow T x 1 2 3 4 5 1 12345 2 678910 3 1112131415 4 1617181920 一些简单函数 max min length mean median fivenum quantile unique sd var range rep diff sort order sum cumsum prod cumprod rev print sample seq exp pi 矩阵的行和列 子集 nrow x ncol x dim x 行列数目x matrix rnorm 24 4 6 x c 2 1 第2和第1行x c 1 3 第1和第3列x 2 1 第 2 1 元素x x 1 0 1 第1列大于0的元素sum x 1 0 第1列大于0的元素的个数sum x 1 0 第1列不大于0的元素的个数x c 1 3 没有第1 3列的x x 2 c 1 3 没有第2行 第1 3列的x 矩阵 向量的 子集 x x 1 0unique x 矩阵的转置和逆矩阵 x matrix runif 9 3 3 x 1 2 3 1 0 67476520 99547310 7524502 2 0 30901990 23901410 2472961 3 0 51026750 95155050 6082803t x 1 2 3 1 0 67476520 30901990 5102675 2 0 99547310 23901410 9515505 3 0 75245020 24729610 6082803solve x solve a b 可以解ax b方程 1 2 3 1 12 31329315 1258199 082300 2 8 4597253 6278988 989864 3 23 563034 18 363808 20 037986 警告 计算机中的0是什么 x solve x 1 2 3 1 1 000000e 00 9 454243e 17 3 911801e 16 2 5 494737e 161 000000e 003 248270e 16 3 3 018419e 161 804980e 151 000000e 00要用线性代数的知识来判断诸如有多少非零特征根等问题 假定v是特征值组成的向量 不能用诸如sum v 0 等方法来判断非零特征根的数目 Matrix Array x array runif 20 c 4 5 x 1 2 3 4 5 1 0 54743060 23623560 6870071070 40369980 5255839 2 0 82343630 49227110 9605545640 47049760 1327870 3 0 18611510 84616550 3905234240 22025750 4057607 4 0 81175210 53759460 0045058450 48215670 7644741is matrix x 1 TRUEx 1 2 x 1 x 2 dim x 得到维数 4 5 Array x array runif 24 c 4 3 2 is matrix x 可由dim x 得到维数 4 3 2 1 FALSEx 1 1 2 3 1 0 35126150 72706110 009055522 2 0 14449650 25276730 697977027 3 0 66581760 66385420 773747542 4 0 42584360 41689400 634235148 2 1 2 3 1 0 36641520 96334970 5628006 2 0 34666450 50368300 1542986 3 0 45525530 12897750 8423017 4 0 10748990 38414630 7648297 Array的子集 x array 1 24 c 4 3 2 x c 1 3 1 1 2 3 1 159 2 3711 2 1 2 3 1 131721 2 151923 矩阵乘法及行列运算 x matrix 1 30 5 6 y matrix rnorm 20 4 5 y x 1 2 3 4 5 6 1 3 231808 8 13791204 13 044017 17 950121 22 856225 27 762330 2 14 072030 39 33640851 64 600787 89 865165 115 129543 140 393921 3 1 750057 0 027647831 6947613 4171705 1395786 861987 4 5 8624129 7806421813 69887217 61710321 53533325 453563apply x 1 mean 1 13 514 515 516 517 5apply x 2 sum 1 15406590115140apply x 2 prod 1 120302403603601860480637560017100720 Array的维运算 x array 1 24 c 4 3 2 apply x 1 mean 1 11121314apply x 1 2 sum 1 2 3 1 142230 2 162432 3 182634 4 202836apply x c 1 3 prod 1 2 1 454641 2 1205544 3 2316555 4 3847680 矩阵与向量之间的运算 sweep x 1 1 5 1 2 3 4 5 6 1 1611162126 2 41424344454 3 92439546984 4 1636567696116 5 255075100125150 x 1 5sweep x 2 1 6 1 2 3 4 5 6 1 2814202632 2 3915212733 3 41016222834 4 51117232935 5 61218243036 Array和矩阵 向量 array之间的运算 z array 1 24 c 2 3 4 注意排列次序 z 1 1 2 3 1 135 2 246 2 1 2 3 1 7911 2 81012 3 1 2 3 1 131517 2 141618 4 1 2 3 1 192123 2 202224 Array和矩阵 向量 array之间的运算 sweep z 1 1 2 1 1 2 3 1 024 2 024 2 1 2 3 1 6810 2 6810 3 1 2 3 1 121416 2 121416 4 1 2 3 1 182022 2 182022 Array和矩阵 向量 array之间的运算 sweep z c 1 2 matrix 1 6 2 3 1 1 2 3 1 000 2 000 2 1 2 3 1 666 2 666 3 1 2 3 1 121212 2 121212 4 1 2 3 1 181818 2 181818 外积 产生矩阵或array outer 1 2 rep 1 2 1 2 1 11 2 22outer 1 2 matrix rep 1 6 3 2 1 1 2 3 1 111 2 222 2 1 2 3 1 111 2 222 List setofobjects list可以是任何对象的集合 包括lists z list 1 3 Tom c 1 2 a list R letters 1 5 w hi z 1 z 2 z T z T a2 z T 3 z T wattributes z 属性 names 1 Tom attributes matrix 1 6 2 3 dim 1 23 矩阵 array及其维名字 x matrix 1 12 nrow 3 dimnames list c I II III paste X 1 4 sep X1X2X3X4I14710II25811III36912y array 1 12 c 3 2 2 dimnames list c I II III paste X 1 2sep paste Y 1 2 sep Y1X1X2I14II25III36 Y2X1X2I710II811III912 data frame x matrix 1 6 2 3 x as data frame x xV1V2V311352246x V2 1 34x V2 1 34attributes x names 1 V1 V2 V3 row names 1 1 2 class 1 data frame data frame names x c TOYOTA GM HUNDA row names x c 2001 2002 xTOYOTAGMHUNDA20011352002246x GM 1 34 data frame attach x GM 1 34detach x GMError Object GM notfound 直接手工输入和编辑数据 直接敲入 x c 1 2 7 8 或者x scan 1278 以 Enter 两次来结束 fix x 通过编辑修改数据 CategoricaldataAsurveyaskspeopleiftheysmokeornot ThedataisYes No No Yes Yesx c Yes No No Yes Yes table x xfactor x Barplot Suppose agroupof25peoplearesurveyedastotheirbeer drinkingpreference Thecategorieswere 1 Domesticcan 2 Domesticbottle 3 Microbrewand 4 import Therawdatais3411343313212123231111431beer scan 3411343313212123231111431barplot beer thisisn tcorrectbarplot table beer Yes callwithsummarizeddatabarplot table beer length beer dividebynforproportiontable beer length beer CEOsalaries Suppose CEOyearlycompensationsaresampledandthefollowingarefound inmillions Thisisbeforebeingindictedforcookingthebooks 12 4525083140 25sals scan readinwithscan12 4525083140 25mean sals var sals sd sals median sals fivenum sals min lowerhinge Median upperhinge maxsummary sals data c 10 17 18 25 28 28 summary data quantile data 25 quantile data c 25 75 sort sals fivenum sals summary sals mean sals trim 1 10 mean sals trim 2 10 IQR sals Mad median Xi median X 1 4826 mad sals median abs sals median sals withoutmedian abs sals median sals 1 4826 Stem and leafChartsSupposeyouhavetheboxscoreofabasketballgameandthefollowingpointspergameforplayersonbothteams2316231412413200062831144825scores scan 2316231412413200062831144825apropos stem apropos returnsacharactervectorgivingthenamesofallobjectsinthesearchlistmatching what 如 apropos stem 1 stem system system file system time 参看find stem stem scores stem scores scale 2 Thesalariescouldbeplacedintobroadcategoriesof0 1million 1 5millionandover5million TodothisusingRoneusesthecut functionandthetable function Supposethesalariesareagain12 452508314 25Andwewanttobreakthatdataintotheintervals 0 1 1 5 5 50 sals c 12 4 5 2 50 8 3 1 4 25 enterdatacats cut sals breaks c 0 1 5 max sals thebreakscats viewthevaluestable cats organizelevels cats c poor rich rollinginit table cats Histograms Supposethetop25rankedmoviesmadethefollowinggrossreceiptsforaweek429 628 219 613 713 07 83 42 01 91 00 70 40 40 30 30 30 30 30 20 20 20 10 10 10 10 1x scan 29 628 219 613 713 07 83 42 01 91 00 70 40 40 30 30 30 30 30 20 20 20 10 10 10 10 1hist x frequencieshist x probability TRUE proportions orprobabilities rug jitter x addtickmarkshist x breaks 10 10breaks orjusthist x 10 hist x breaks c 0 1 2 3 4 5 10 20 max x breaks FrequencyPolygons x c 314 289 282 279 275 267 266 265 256 250 249 211 161 tmp hist x storetheresultslines c min tmp breaks tmp mids max tmp breaks c 0 tmp counts 0 type l data faithful attach faithful makeeruptionsvisiblehist eruptions 15 prob T proportions notfrequencieslines density eruptions linesmakesacurve defaultbandwidth Handlingbivariatecategoricaldata PersonSmokesamountofStudying1Ylessthan5hours2N5 10hours3N5 10hours4Ymorethan10hours5Nmorethan10hours6Ylessthan5hours7Y5 10hours8Ylessthan5hours9Nmorethan5hours10Y5 10hours smokes c Y N N Y N Y Y Y N Y amount c 1 2 2 3 3 1 2 1 3 2 table smokes amount tmp table smokes amount storethetableoptions digits 3 onlyprint3decimalplacesprop table tmp 1 therowssumto1nowprop table tmp 2 thecolumnssumto1nowReally sweep x margin margin table x margin prop table tmp amount allthenumberssumto1options digits 7 restorethenumberofdigits Plottingtabulardatabarplot table smokes amount barplot table amount smokes smokes factor smokes fornamesbarplot table smokes amount beside TRUE legend text T barplot table amount smokes main table amount smokes beside TRUE legend text c lessthan5 5 10 morethan10 categoricalvs numerical Asimpleexamplemightbeinadrugtest whereyouhavedata insuitableunits foranexperimentalgroupandforacontrolgroup experimental 5551371111989control 1184595105410 x c 5 5 5 13 7 11 11 9 8 9 y c 11 8 4 5 9 5 10 5 4 10 boxplot x y amount scan 55513711119891184595105410category scan 11111111112222222222boxplot amount category notethetilde 从文本文件输入ASCII码数据 x scan f book 1 txt 这是按照文本一行一行读入的数据如果原先是4 5矩阵形式 则加用x matrix x 4 5 byrow T 或直接用x matrix scan f book 1 txt 4 5 b T 如果原先是4 5有名字的data frame形式 则用x read table f book ww txt header T xGMVWHUNDA19931231994678 控制语句 x NULL for iin1 5 x cbind x i 2 i 1 x NULL while i0 y xelsey x 10i 1 x rnorm 1 repeat x x rnorm 1 if x 3 break i i 1 print c i x 怎么调出Packages来使用 Packages libraries敲library 就知道有什么libraries了 缺省library是base 比如要进入mass 就敲 library mass 每个library都有许多数据在每个library敲data 就知道有什么数据了比如敲data Titanic 就调出数据Titanic来了 注意 R语言对大小写敏感 解释后面语句的意思 n 1200 x runif n 10 x matrix x n 10 x1 x 1 5 4 1p x1 8 1 x1 2x2 1 x 6 10 p z cbind x1 x2 ss function z nu NULL pattern NULLz0 as matrix z id 1 repeat if id 100 0 print id z1 sweep z0 2 z0 1 pattern rbind pattern z0 1 z2 apply z1 1 prod z0 z0 z2 1 nu c nu sum z2 if sum nu n breakif is matrix z0 F nu c nu 1 pattern rbind pattern z0 id id 1break id id 1 list pattern pattern number nu id id R 语言画图 x 0 18plot x x pch x col x points x 18 x pch x matplot x cbind x 18 x 画图 spring data frame compression c 41 39 43 53 42 48 47 46 distance c 120 114 132 157 122 144 137 141 attach spring Hooke slaw f 5ks plot distance compression plot compression distance 画图 par mfrow c 2 2 准备画2 2的4个图plot compression distance main Hooke sLaw 只有标题的图plot compression distance main Hooke sLaw xlab x ylab y 标题 x y标记identify compression distance 标出点号码plot compression distance main Hooke sLaw 只有标题的图text 46 120 f 1 2 k s 在指定位写入文字plot compression distance main Hooke sLaw 只有标题的图text locator 2 Iamhere 在点击的两个位置写入文字 画图 library mass data Animals attach Animals plot body brain plot sqrt body sqrt brain plot body 0 1 brain 0 1 plot log body log brain 画图 原始数据 par mfrow c 1 1 pch 1 plot body brain xlim c 0 6000 text x body y brain labels row names Animals adj 0 adj 0impliesleftadjustedtext 画图 几个点 plot body c 1 3 8 brain c 1 3 8 xlim c 0 200 text x body c 1 3 8 y brain c 1 3 8 labels row names Animals c 1 3 8 adj 0 画图 对数变换后 Par cex 0 7 mex 0 7 character cex margin mex expansionplot log body log brain text x log body y log brain labels row names Animals adj 1 5 adj 0impliesleftadjustedtext 画图 按照次序 plot log body log brain identify log body log brain row names Animals 画图 plot 1 1 xlim c 1 7 5 ylim c 0 5 type n Donotplotpointspoints 1 7 rep 4 5 7 cex 1 7 col 1 7 pch 0 6 text 1 7 rep 3 5 7 labels paste 0 6 letters 1 7 cex 1 7 col 1 7 画图 继续 points 1 7 rep 2 7 pch 0 6 7 Plotsymbols7to13text 1 7 0 25 rep 2 7 paste 0 6 7 Labelwithsymbolnumberpoints 1 7 rep 1 7 pch 0 6 14 Plotsymbols14to20text 1 7 0 25 rep 1 7 paste 0 6 14 Labelswithsymbolnumber 写函数 中位数和均值的比值函数用该函数计算一万个 均值为1的 指数分布的中位数和均值的比median mean ratio function x return median x mean x z rexp 10000 median mean ratio z 函数 函数之例 中位数和均值的比值函数用该函数计算一万个 均值为1的 指数分布的中位数和均值的比median mean ratio function x return median x mean x z rexp 10000 median mean ratio z 在函数中的 中间 可以有多个语句 语句之间用换行或分号 分开 函数的编辑 fix median mean ratio 这时会出现一个记事本编辑器编辑并试图存了之后如果发生错误 不会存 往往会让你编辑改过但有语法错误的fix 如果还使用fix median mean ratio 则是编辑以前的版本 函数 函数可以有缺省值 例如Expo function y x 2 z y x z y seq 0 1 length 100 plot y Expo y type l 函数可以不写return 这时最后一个值为return的值 为了输出多个值最好使用list 颜色画图函数 view colours function plot
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 等级考试都有哪几道题及答案
- 田径片段教学考试题及答案
- 装修企业如何管理办法
- 贷款新校区管理办法
- 苏泊尔融资管理办法
- 贷款产品限额管理办法
- 视频监控巡检管理办法
- 中办乡村振兴管理办法
- 组集体资产管理办法
- 专业用户投诉管理办法
- 纪念抗战胜利80周年1
- 物业客服管理知识培训课件
- 2026届广东省广州市高三上学期8月调研考试语文试题(含答案)
- 2025海南省老干部服务管理中心招聘事业编制人员6人(第1号)考试备考题库及答案解析
- 江苏省南通市如皋市2025-2026学年高三上学期开学考试数学试卷
- 2025年高一语文开学第一课指导课件
- 居民体重管理核心知识课件
- 2025年事业单位工勤技能-河北-河北计算机操作员二级(技师)历年参考题库含答案解析(5套)
- 2025-2026学年湘教版(2024)初中数学八年级上册教学计划及进度表
- 2025年江西省公安机关人民警察特殊职位招录考试(网络安全)历年参考题库含答案详解(5卷)
- 2025至2030中国公安行业发展趋势分析与未来投资战略咨询研究报告
评论
0/150
提交评论