统计应用软体StatisticalComputationsandAnaly.ppt_第1页
统计应用软体StatisticalComputationsandAnaly.ppt_第2页
统计应用软体StatisticalComputationsandAnaly.ppt_第3页
统计应用软体StatisticalComputationsandAnaly.ppt_第4页
统计应用软体StatisticalComputationsandAnaly.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

統計應用軟體 Statistical Computations and Analysis,台大農藝系生物統計組 劉力瑜,課程大剛,授課對象: 大三以上及研究生 先修科目: 生物統計學(或統計學)與試驗設計學 課程首頁: .tw/lyliu/compstat/index.html 評分標準: (Mostly weekly) homework (40%) Midterm (30%) Final project (30%),授課教師,劉力瑜 TEL: 02-33664792 E-mail: .tw Office: 五號館 (生工系館) 二樓 202 室 Office Hour: Monday through Friday 12AM-1PM,注意事項,指定作業必須在規定日期當天下課前繳交, 逾期除依校規請假 (國立臺灣大學學生請假辦法), 一律不予接受, 該次作業則以零分計算。 作業與報告用 LaTEX 打字佔成績之 50% 兩次最低分的作業將不列入總成績計算,相關規定,.tw/lyliu/compstat/syllabus.html,上課前的準備,前往課程網頁下載當天上課之powerpoint檔 .tw/lyliu/compstat/handout.html 隨時查閱課程網站以獲知最新公告訊息,學長姐的建議,“我未上過試驗設計, 這方面完全不懂, 學期後半段上起來很吃力” “很後悔沒有善加利用老師的 office hour” “統計與程式必需要多加練習才會熟練, 希望交作業的次數可以多一點”,課程內容,Installation / Introduction to R Installation / Introduction to LaTeX / cwTeX Writing Report with LaTeX Basic Statistical Concepts Probability and Distributions Descriptive Statistics and Graphics Hypotheses Testing Tests for Central Tendency Tests for Dispersion,Analysis of Variance Post Hoc Tests Variable Transformation Completely Randomized Design (CRD) Randomized Complete Block Design (RCBD) Latin Square Design (LSD) Cross-Over Design Balanced Incomplete Block Design (BIBD) Nonparametric Methods,Introduction to R,What is R?,R 並非專用統計軟體, 而是可用來執行統計分析的環境: 匯入適當的 package (套件) 應用套件內提供之 function (函式) Packages 由許多熱心人士編寫並免費提供學術使用。 You can make your own contribution in the future.,R的優缺點,優點: 免費軟體 完善的說明文件與討論區 漂亮的圖型介面 程式容易根據使用者需求做修改 缺點: 並無 user friendly 之使用者介面 需詳知函式名稱與程式編寫邏輯 說明文件與討論區使用英文,下載與安裝,Step 1: 下載R程式 .tw/bin/windows/base/ 下載目前最新版本 R-2.4.1-win32.exe,執行,Step 2: 執行 R-2.4.1-win32.exe 安裝完成後, 執行桌面上的截徑:,中文版本,如何切換至英文版本?,Step 1: 在R的截徑上按滑鼠右鍵, 選取“內容” 。,如何切換至英文版本?,Step 2: “目標” 欄位最後(雙引號之後)加入: LANGUAGE=en 再按“確定” 。,離開 R,Method 1: File - Exit Method 2: q() Method 3: R 視窗上方,起始套件,當 R 啟動時, 有 7 個常用之 packages 會自動載入: base: 基本函式 (IO, 敘述統計, etc.) stats: 常用統計分析 (t.test, anova, etc.) methods: 定義 classes of objects utils: 基本程式編寫工具 graphics: 基本繪圖工具 grDevices:基本繪圖介面 datasets: 數據範例,使用介面 File 檔案,匯入已存在的檔案 (不開啟編輯視窗),編輯新程式或文件,編輯已存在的程式或文件,顯示已存在的檔案內容(無法編輯),變更工作環境 預設: “C:/Program Files/R/R-2.4.1“, Example: 0302_File_example.r,使用介面 Edit 編輯,清除工作視窗畫面,使用介面 Misc 其它,中斷正在執行的工作 (ESC),立即顯示結果與否,顯示工作環境下的物件; ls( ),移除工作環境下的物件; rm(list=ls(all=T) ),使用介面 - Packages,在目前工作環境中載入套件library(package),設定下載 package 的網站(Taipei, etc.),設定下載 package 的搜尋範圍 (cran, etc.),package 網路安裝,package 本機安裝(已下載),package 更新 (已安裝之package),使用介面 Windows / Help,Windows: 視窗排列方式 Help: Getting help from R ?command and help(command): 查詢特定命令 (名稱已知且package已載入) 的使用 apropos(“keyword ”): 已載入 package 中含有keyword字串的所有函數 Search help: 查詢未知名稱的命令(package未載入但已安裝) help.search(“keyword ”) : 廣義搜尋,R Console,R 的提示符號: 與 +,“” 為提示符號; 當提示符號出現時表示R正在待命中, 可以隨時鍵入下一個命令。當提示符號為“+”時, 表示程式正在執行中,或在等待未完成的指令。例如: (1.36 + 0.7 + ) 按“ESC”可強制退出未完成的工作。 可利用鍵盤上下鍵重複輸入指令或做小幅度修改,利用R進行簡單計算, 2 + 3 1 5 sqrt(3/4)/(1/3-2/pi2) 1 6.626513 exp(3.72) 1 41.26439 sin(pi); log(10); log2(10); log10(10),指定變數名稱,名稱 = 物件 或 名稱 物件 可由英文字母、數字、英文句點(.)組成。 英文大小寫有所區別 (ab 與 Ab 可分別代表不同變數) 。 變數名稱須起始於英文字母。 有些英文單字具有特殊意義,不能當做變數名稱: return, break, if, TRUE, FALSE, (T, F).,R 物件 (object),單一變數:,Some Simple Examples,單一數值或字元: x1 = 3.0 x2 = “NTU” x3 = TRUE 計算結果: y1 = exp(3.72) y2 = y1*3 其它: out = lm(yx+z) y = NA,R 物件 (object),複合物件: 由數個單一變數組成 向量: c() 所有變數需為同類型或NA 若vector內的變數為數字, 亦可藉由“:”,“seq”等產生 c(5,7,3,9,NA) c(1:10) = 1, 2, 3, 4, , 10 seq(0.1,1,0.1) = 0.1, 0.2, 0.3, , 1.0 矩陣: matrix(x,r,c,) 所有變數需為同類型或NA matrix(NA,3,5) = 3x5矩陣, 每一元素為NA matrix(1:12,3,4) = 3x4矩陣, 元素為?,R 物件 (object),其它複合物件: list data.frame high dimensional array,R 函式 (function),R是由 “變數” 與 “函式” 組成。前面幾張 slide 已用的 function: c, lm, seq, matrix, exp, etc. 基本語法: funcname(參數) 查詢function的使用方法: help or ? Example: ?lm # help(lm),Help Menu,Description Usage Arguments Details Value References See Also Examples,apropos,apropos(“matrix”),只查閱函式的參數時, args(“matrix”) 參數分為必要與非必要兩種 順序不對調時, 參數名稱可不給定: matrix(x, 3, 2) 順序對調時參數命稱必須指定: matrix(nrow=3, ncol=2, data=x),R 函式 (function),函數也可由使用者自行定義 my.add my.add(1:3) 1 4 5 6 本課程將會陸續介紹生物統計學與試驗設計學常用的函數。,常用統計函式,中央趨勢: mean(x) # 樣本均值 median(x) # 樣本中位數 quantile(x,p) # 樣本 100p% 百分位數 變異程度: range(x) # 最小值與最大值 var(x) # 樣本變方 sd(x) # 樣本標準差 兩變數的相關程度: cov(x,y) # 樣本共變方 cor(x,y) # 樣本相關係數,常用統計函式,常用function列表: “Statistical Computing and Graphics Course Notes” by Frank E. Harrell, p 32-39. /doc/contrib/Harrell-statcomp-notes.pdf,資料輸入: c,輸入少量資料最簡單的方法: c function. Example: 西元 1861 1870 年間重大的科學發現或發明數: 3 0 2 0 3 2 3 6 1 2 nod = c(3, 0, 2, 0, 3, 2, 3, 6, 1, 2) nod 1 3 0 2 0 3 2 3 6 1 2,資料輸入: c,前述指令指定一組數據給名為 nod 之變數; 以 “=” 或 “-” 進行指定的工作。 指定變數 nod 後, 其數值不會自動出現在螢幕上; 在提示符號後輸入變數名稱, 才會顯示其數值。 螢幕顯示 1 3 0 2 0 3 2 3 6 1 2 表示此變數為一向量(vector)。,Data is a vector!,資料是以“向量”或“矩陣”型態組成, 元素可用其相對位置做為指標: length(x) # how many elements x2 # the 2nd element x1:5 # the first 5 elements xc(1,2,5) # specific elements xx3 # all greater than 3 xx 2 which(x=5) # which indices are equal to 5 c(x,48,49,51,50,49) # append values to x,Example, nod2 1 0 nod-4 1 3 0 2 3 2 3 6 1 2 nodc(1,2,5) 1 3 0 3 nodnod 1 1 3 2 3 2 3 6 2 which(nod 1) 1 1 3 5 6 7 8 10,Matrix operation is similar!, y2 = matrix(c(1:10), nrow = 2, ncol = 5) y22,1 y21, y2,4 y2,-2 z2 = matrix(c(11:25), nrow = 3, ncol = 5) rbind(y2,z2) cbind(y2,z2) # error cbind(t(y2),t(z2),變數名稱列指標, 行指標,Example,測量基因 AC002378 表現量 12 次結果如下(on log2 scale) 0.66, 0.51, 1.12, 0.83, 0.91, 0.50 0.41, 0.57, -0.17, 0.50, 0.22, 0.71 (1) 求最大值與最小值 (2) 計算樣本均值與標準差 (3) 有多少觀測值 0.5 ?,Example,測量基因 AC002378 表現量 12 次結果如下(on log2 scale) 0.66, 0.51, 1.12, NA, 0.91, 0.50 0.41, 0.57, -0.17, 0.50, 0.22, 0.71 (1) 求最大值與最小值 (2) 計算樣本均值與標準差 (3) 有多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论