版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
迴 歸 分 析相關係數(Correlation)
描述兩個變數X、Y之間的線性相關Example:data1中的身高及體重
2如何量化這樣的線性關係呢?Correlation!Linearcorrelation!相關係數(Correlation)
Bydefinition,thecorrelationbetweenXandYisItsestimate,Pearson’scorrelationcoefficient3相關係數(Correlation)
r>o:positivelycorrelatedr<0:negativelycorrelatedr=0:nolinearcorrelationr=0不代表、Y之間沒有關係,有可能只是他們之間的關係不是線性的→畫圖還是必要的4相關係數(Correlation)
R程式:cor(x,y,method=c("pearson","kendall","spearman")))x:數值向量或是矩陣y:數值向量,當x是矩陣的時候,可以不需輸入5相關係數(Correlation)
若想進一步檢定vs.檢定統計量95%confidenceinterval:6相關係數(Correlation)
7所以身高與體重有統計顯著的正相關Practice8請畫出在Surgicaldata中,liver與clot的散佈圖。請問由圖中,可以看出liver與clot的關係嗎?請計算liver與clot的相關係數。請檢定liver與clot之相關係數是否為0。
Q:除了看相關性的強度,能不能看彼此如何影響?Regression!LinearRegressionStep1:
血壓的分布,該分布是否男女有別;Step2:血壓是否和體重有線性相關;Step3:該線性關係如何描述;Step4:如何描述血壓和體重、性別、等等的關係。Y:responsevariable,dependentvariable(say,bp)X:covariate,explanatoryvariable,independentvariable(say,weight)9LinearRegressionQ:howdoesX
affectY?Canwefitalineinthescatterplot?Infact,weshouldsay,where
iscallederror,
isnormalwithzeromeanandvariance
2.10Regression
model-simplelinearregression
11直線上的點是估的,叫fittedvalues,這是已知體重X之後,期望的血壓值,是期望值,故人稱regresstowardthemean;這和觀察值不同,有samplingvariationEstimatecoefficientsHowtofind(intercept)and(slope)?LeastSquares!Minimizeresidualsumofsquares
Takederivative12“residual”isthedifferencebetweenfittedandobservedvalues;Y軸的差EstimatecoefficientsRearrangetheterms,getnormalequationsSolvingthenormalequations,wegetestimates13AretheseLSEgood?Aretheyunbiased?Standarderrorsoftheseestimates?14UnbiasedAretheseLSEgood?Instatistics,toask“Aretheseestimatesgood?”isthesameasasking“Aretheyclosetothetruevalues?”Theyaregoodinthesensethattheyareunbiased.Theyarebestlinearunbiasedestimators(BLUE)Gauss-Markovtheorem:Undertheconditionsofregressionmodel(mean,constantvariance,uncorrelatederrors),theleastsquaresestimatorsareunbiasedandhaveminimumvarianceamongallunbiasedlinearestimators.15EstimationofvariancecanbeestimatedbyTherefore16LinearregressionusingRR程式:lm(formula,data,...)formula:y~x,其中y是response,x是covariate
173.943=70.8432/17.9663Linearregression18LinearregressionMeaningfulwhenestimatingbpwith120kg?notreally,outsidetherangeofthedata,dangerousextrapolationRegressiondoesnotimplycausality.ItsimplyreflectstheregressionrelationbetweenX(weight)andY(bp).ThisregressiondoesnotsayXcausesY.Canweusebptopredictweight?yes,ifweightisthevariableofinterest19Practice想知道在Surgicaldata中,clot如何影響liver,請建立liver與clot之迴歸模式。如何解釋此模型呢?請問clot對liver的影響是顯著的嗎?20Homework想知道在Surgicaldata中,enzyme如何影響SVtime,請建立enzyme與SVtime之迴歸模式。如何解釋此模型呢?請問enzyme對SVtime的影響是顯著的嗎?21Howgoodistheregression?Howgooddoesthelineexplainallthevariationiny?Howgooddoesthefittedcorrelationof(X,Y)explainY?因為定義判斷係數(coefficientofdetermination):
Pearson’scorrelationcoefficientInsimplelinearregression,22totaldeviationinresponsesaroundthegrandmeandeviationofobservationsaroundfittedlinedeviationoffittedvaluesaroundthegrandmeanSSTOSSESSRpercentageofvariationexplainedbyregressionlineExample
23R2=0.4149AVOVAtableofregression
24SSESSRPractice在Surgicaldata中,模式為liver~clot請問在此模型中,判斷係數為多少25Diagnostics26基本假設:殘差平均為0,相差變異數相同,殘差之間不相關看看殘差的分佈情況看殘差和index的關係(應該要沒關係)殘差應該要和fittedvalue無關殘差應該要與解釋變數無關DiagnosticsIf…27Randomlyscatteredaroundzero!Fromminustopositive!Modelmaynotbeproper.Timeeffect?(Ifx=time)Linearity有問題試試polynomial或transformX?Constantvar有問題;若X值大則var大;試試加別的X或是weightedLS?Example
28Q-Qplot如果殘差服從常態分配,那麼除了它的長條圖像常態之外,它的排名的值和實際母體同排名的值像不像呢?Thequantileoftheresidualversusthenormalquantile:29OrderedStudentdizedResiduals,Q(quantiles)Rank/total(cumulativeprob.)c.p.FindzwhereP(Z
z)=c.p.Usemodifiedc.p.*=(rank-0.375)/(n+0.25)getz*s.t.P(Z
z*)=c.p.*
Qc.p.zc.p.*
z*-1.881/6=17%-0.9710%-1.28-1.332/6=33%-0.4326%-0.64-0.9
3/6=50%042%-0.20.34/6=67%0.4358%0.20.75/6=83%0.9774%0.641.76/6=100%inf90%1.28將殘差標準化,再排序,第2/6(=0.33)分位的quantile是-1.33即P(ei
-1.33)=2/6算出排序的名次對常態來說,第2/6(=0.33)分位的quantile是-0.43;即P(Z
-0.43)=2/6=33%對常態來說第0.26分位的quantile是-0.64;即P(Z
-0.64)=26%PlotthesetwocolumnsQ-QplotIfclosetoaX=Ystraightline,thenresidualsclosetonormality!R程式:qqnorm(model1$”residuals”)30殘差中排名4/6的殘差值和N(0,1)中累積機率為4/6的值Q-Qplot
31YisrightskewedYisleftskewedDiagnosticsinR
32Diagnostics33Practice在Surgicaldata中,模式為liver~clot請問此模式符合迴歸的假設嗎?34MultiplelinearregressionExtensionofSLR,includingmorethanonepredictorsinthemodel35Linear?Linear?Difference?MultiplelinearregressionModel::regressioncoefficients:observeddataareindependent
Inmatrixform36Multiplelinearregression哪些term可以放到X中呢?Predictors:如例子中的weight,age,sexTransformationsofpredictorsPolynomials:andDummyvariablesandfactorsIn
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026新疆博尔塔拉州博乐市博报文化传媒有限责任公司招聘2人备考题库参考答案详解
- 2026山东艺术学院招聘9人备考题库及答案详解(新)
- 安徽省2026届高三地理下学期3月考试三
- 模具工安全宣教考核试卷含答案
- 2026年工装配件行业分析报告及未来发展趋势报告
- 水生植物栽培工保密水平考核试卷含答案
- 2026贵州黔西南州贞丰坎贝尔医院招聘3人备考题库含答案详解
- 摊铺机操作工安全应急模拟考核试卷含答案
- 2026江苏扬州市兴业劳务派遣有限公司招聘3人备考题库及答案详解(考点梳理)
- 2026重庆市建设监理协会招聘备考题库及完整答案详解一套
- 热点主题作文写作指导:“喜欢做”与“应该做”(审题指导与例文)
- 政务服务工作汇报课件
- T-GDWHA 0020-2025 一体化泵闸设计制造安装及验收规范
- 涉台教育主题班会课件
- 肠内营养管路维护与护理
- 教师职业技能训练教学课件
- JG/T 418-2013塑料模板
- T/CGAS 025-2023城镇燃气系统智能化评价规范
- 2025-2030年牛仔服装行业市场深度调研及发展趋势与投资战略研究报告
- (高清版)DGJ 08-98-2014 机动车停车场(库)环境保护设计规程
- 超星尔雅学习通《美的历程:美学导论(中国社会科学院)》2025章节测试附答案
评论
0/150
提交评论