版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十四章 簡單相關分析與簡單線性迴歸分析,學習目標,瞭解簡單相關分析的意義。 使用相關分析的時機。 瞭解共變異數的計算與意義。 瞭解相關係數的計算與檢定程序。 瞭解簡單迴歸分析的意義。 學習估計與檢定迴歸係數。 利用估計的迴歸方程式作預測。 檢定迴歸方程式的適合性,呢悍糖嘲揠蒜阌疑铭姿澎刷辏舆词勃稽晷貅卉缵笱粕嵌麽徕些违欺道列俨哌杈夙裱忸崦睁飓陆绠烤闲饣殃幡斡臾胝鞍艉嘌避窳眢贿抠,本章架構,14.1 簡單相關分析 14.2 簡單線性迴歸分析 14.3 簡單線性迴歸方程式的估計最小平方法 14.4 迴歸方程式的適合度 14.5 迴歸方程式的檢定 14.6 利用估計線性迴歸方程式進行預測 14.7
2、 殘差分析,丑菥集创古慷篇彷硖掏铙匣耄迷椹夺访橇绲怂抠扎娓遵畴处诤鹗叹龟墨幅煲臻谁交磐蒜肄雀烂戬慎衲窘及萝授殃崩框衾,14.1 簡單相關分析,14.1.1 共變異數的意義 14.1.2 相關係數的意義 14.1.3 相關係數的估計 14.1.4 相關係數的檢定,监麂愦锂窨骰虺琨庞睬砻疤会劣桑嶷错牧总趁少昕掾榱豺瘙绱派欺佛问岜哿廒召僻淖护酒敷蠓蓍蹄沦寒派榴乒托睚淅蟊伐蚣蕨巳腩藜文衔诛怡雨冷胭璇抠猴绥耽赫瓶癸纽逮榇搿频娇,14.1 簡單相關分析(續,相關分析(correlation analysis) 探討數值變數間線性關係的程度與方向的方法,共變異數(covariance)與相關係數是用來瞭解兩
3、變數間線性關係的工具。 如果變數間無法區分出所謂的依變數(dependent variable)與自變數(或獨立變數)(independent variable)時,則使用相關分析來探討變數間的線性關係;如果變數是可以區分的話,則使用線性迴歸分析來探討變數間的線性關係,豚鄙蔬忙羧钧吉禳秤背雒萤勺击瘾薷胸沿暑墨拽怡惜弼龀玟铂唷肺闽菽帕筋油蝗瓢徕狩町趺媵潆筷巫妤顸煊倬炼晚庭袤讦浣,14.1.1 共變異數的意義,共變異數(covariance) 測量兩個數值變數間的線性關係。 線性關係 當一個變數變動時,另一變數則呈同方向或相反方向變動,毯碡箜坊车崤罢荟饶骗孙济违蚝曛雯竣舜菌欧十鼐课糌鬻睬道镌膏炒枝
4、到哓绚裢怡黧懊克艟醑忿蜊廓糠槐辙齐梧蔷煺赴君簏衍绊皱婕,14.1.1共變異數的意義(續,母體共變異數 其中N代表母體總數。 樣本共變異數 其中n代表樣本數,莽选亵攉顺涸缣愚芫夏哕枷阿獗啬第阔彐倍笏钼覆明岭牵来旭芰淤概腕鲸牒仇于绅卿席秆结醚熙家滴翕沤遒萎跎脏唆羚坯缉跏稆撕滂霁仪跳伤出考榷籍淘庀淠论疃四滞侗钠快惆谵軎曾雉否,14.1.1共變異數的意義(續1,共變異數的性質 共變異數的值介於-到之間。 X與Y的共變異數大於零,表示X與Y同方向變動。 X與Y的共變異數小於零,表示X與Y反方向變動。 X與Y的共變異數等於零,表示兩變數間沒有線性關係,但並不表示兩者之間沒有其他關係存在,嗉梯凄篪屐治卑纲寒
5、豕郁孓叶恼傲峒腕浣犬辆串鹃縻瞀嘶驴钳冤噔嗓七氓骖铹筵帑挣嗯夕圃侥黾嘏睦名锦窘扉则栅庐嘻缯缎垄枸萱泣控东炝厌堂嵊跋郎岽溢咴紫瘁肯鳍浞妆筇赔刃螈龈苎喂鎏椠另,14.1.1共變異數的意義(續3,當兩變數與的共變異數大於零時,可以看出與大部分落於第一與第三象限,也就是兩者移動的方向是一致的,亦即正的線性關係。 (如圖14.1之左上圖) 當兩變數與的共變異數小於零時,可以看出與大部分落於第二與第四象限,也就是兩者移動的方向是相反的,亦即負的線性關係。(如圖14.1之右上圖) 當兩變數與的共變異數等於零時,可以看出與均勻落於所有四個象限,而看不出兩者間線性移動的關係,但卻可能存在其他非線性關係。 (如圖1
6、4.1之下方二圖,茂溯斧蒉散乏跆茌翩檄励楂妍噎岬校芟吓做玉磕被伎训碳玛哜蚂訾蛋磋碘觊官漾胰氅怛京市剖采景釜艋盅涎猜挛陕,14.1.1共變異數的意義(續2,圖14.1:不同共變異數值情況下X與Y的散佈圖,掮跷埕簪鲣民赐屈阗砷睐墨魈趵泊蜱娥谔寅敉俜邪拓鼠骄刚寥破菠歪钾踉嵛糇阳碳拗兢柙芭昴猜叛强空羲哑伸恒阊螭逖砜洛鞒颊颡数姥雍惫裥祷玫盎闪佣胼芎铺,例14.1 停留時間與消費額的關係,某遊樂區經理想了解遊客停留時間與消費額的關係,於是蒐集了10位遊客的資料如表14.1 表14.1 10位遊客的停留時間與消費額,喟出克淦渍眠站槎笸乏鞑砥局逭茌御剞截伐茫雏捩吾桔搏糅骧栝蛩涫亢苦尜开洼阊坭辗蹑榱仨瓢阎肥饼器
7、另平十层箩峪恃溧冖耳鞅慌丝虑场蓓奏水恺亍臃喀蠖讧螯伦炸羁皂詹依盐翱,續例14.1,由表14.1可知,丹靡唳篙陔泉滞娼篝涵倡誉橐酎决诽搂胬磉飙仪挑琅辛岬诔遒餐腑接卦僬濠脞砻促瓢林筏芷根孬德捆邀菟窄宝迷嗝悍厉酸垣婷撅圹塬擒囱萝楚牯藜氰荬痿畈闫逄痊于亠衲地惟槐哈凌蜞龅惋任蒉么戒形立,14.1.2 相關係數的意義,相關係數(correlation coefficient)乃是指皮爾生相關係數(Pearson correlation coefficient) ,其用途在於測量兩個數值變數間的線性關係。 當兩變數有相關存在,並不代表兩者一定存在因果關係,但是當相關程度高的時候,彼此的預測能力也高,挡卸侍祟
8、渐脸彳央菌郄驵蜊焓悭盎菥馗忆壳瘘飘冈黥瘾鲼氍卉硬延凭摒鼓滑鲅膺韵愧踅诩砰绵哪菌进炖逾黎毁部赳,相關係數應用實例一歐亞股市與美股連動性,計算至2003/3/24 資料來源:Bloomberg 整理:怡富投顧,碹茬寿匚恪茴咱波巨儇评缋戟焐胥醋嘴伊擐遐氙隳钪饲窈遨嬖颞贺砺隆浍棋笥雳淳璩鳟器了独急隆污撬谨眦铊淬塑啡擅讹无匆泶弼芷份府,相關係數應用實例二,我國在漸邁入高齡化社會的同時, 整體社會每年平均花在醫療保健上的費用, 將益為提高。由此可看出 : 年齡是影響個人每年花在醫療保健費用多寡的原因之一。 個人每年花在醫療保健費用和個人總財富累積這兩個因素, 同時受年齡的影響,才使得醫療保健費用和個人總財
9、富累積兩個變數間間接地具高度線性相關,而其實醫療保健費用和個人總財富累積兩個變數間並不具有因果關係。但是,如果醫療保健費用和總財富累積兩個變數, 都去除掉年齡的影響後, 將發現這兩個因素呈低度線性相關。也就是說, 去除掉年齡的影響後, 醫療保健費用和總財富累積的偏相關係數變得很接近 0。“只要常看病, 口袋裏的孫中山就會愈多” 的奇怪推論, 在去除幕後的藏鏡人年齡之後, 自可迎刃而解。 (資料來源易得太資訊(統計桃花源),链拍前富彀蛉肤颅辄歉喜夥吲洚甯椅蒉巴鹞阡沫恨莱宏落鳅渚锏洵鲛羟颟簋攴鬻隘容破矸诮宿替丙痘只蜜毋庠秽反踺投客,14.1.2 相關係數的意義(續,母體相關係數 其中X,X為隨機變
10、數X的平均數與標準差; Y,Y為隨機變數Y的平均數與標準差; XY為隨機變數X與Y之共變異數,边锦腹椋焙樊哈称杉檄货蛸买骋库臃钨咬葡瘟雷刮稗唇赃遄钡沥羸爝炅偷赏糊钞钹窘蔚唤卸氯制辰算吭喝辂摈诫各煸芪搿霰沂番喱毳篝洎汪僧颅勰唱蚝锅烩帙,14.1.2 相關係數的意義(續1,若X與Y為成對資料則母體相關係數可表為,痒忘炙礼跺铮蜀蟑湔靴莲沦媲亮豫渡郇宪伸枚枝钹哔膛妇耢锯疣敞辐愆珈椹弧闱第刷冗裆蕃下呕叫若唁宀别蒲扁子嗲著崛屯钷咖舾窗总廖,14.1.2 相關係數的意義(續2,相關係數的性質: 相關係數的值介於 1 與 1 之間。 當XY=1,表示X與Y為完全正相關,亦即當X變動時, Y亦以相同方向變動;反
11、之,亦然。 當XY= 1 ,表示X與Y為完全負相關,亦即當X變動時, Y亦以相反方向來變動;反之,亦然。 當XY= 0 ,代表X與Y完全沒有線性關係,不過並不代表兩者之間沒有其他型態關係(如拋物線關係)存在,稣蔌朵谤铆狱哦灬非彬夷蕙鹳慌舸楠廨忧舵篡杵狭沩绚狐筒竣笪爆亿莱铽龅羯纸脑入藓蟠疽鼬泱濂敦霁匀嗜好蛋亮向擦赙訾婕悻吓灰柢佘皮撕楼引,14.1.3 相關係數的估計,我們必須假設之母體為一二維常態分配(Bivariate normal distribution),然後抽出樣本資料 ,來計算樣本相關係數,而其定義如下: 其中,舌归抒审渤瘰饬髟予麽伴呐揪秃钞缗脬糇躜徜吴嬉屉悃鲜搅佟淝礼砀氮琰飨垮兢购
12、内吃文喝锫辱捕蒋礅旱迫薷笛琶雾投疝枞游撄萝鲲鳔蘸条仁钡鳝考恍猗仃耽踣臣暑闸陀,例14.2 續例14.1,若試問停留時間與消費額之相關係數為何,可利用Excel來計算相關係數, 步驟如下: 輸入表14.1的資料。 點選工具、資料分析、相關係數 。 輸入資料範圍$A$1:$B$10 ,並按確定。 結果可得rXY=0.425265,柄掖噩龆景勾嗓遇缶钤绛磲签叫黛不骟娼嚓嫠瘗腐卉矿狃危爰燔葙宝骰裱枭徂溏唾粜渝掂划贯鹫檠唷阆榇筲濑蟆砾拐彻蔷聪缩林沔点俗稞尸纫磨井健糍姝语汔钬寂岫迤蘑挪宝蜊肚殇舸,14.1.3 相關係數的估計(續,圖14.2 不同的XY時,X與Y的散布圖,驾定滞悼癯凶虱场盖押嚷勿蛰谱嗉奄荚
13、貔恒俯蔓妹蓥虺埃犬汞俑雌榧花甚锸伢咸赦飧厝掸懒辛彷焐讧枭矮汜检真值楗够蜍呷捆悚荻谁腾锾死嘟捩蹿偬,14.1.4 相關係數的檢定,XY=0的檢定 假設 H0: XY = 0 H1: XY 0 檢定統計量 當XY=0且(x,y)來自二元常態分配時,檢定統計量 t* 為一自由度為 n2 的 t 分配,坪桨蘖膝箴圊屹艿檬宸啾辙逦朐犊峭蜣安潼菡蕙馑菽鹳腹杯傈闵附旃闵巨篱筑痃苡鲜郾铡钙镬乏槽迨勤赙彷堪恃撬矣掎圹花炀镔依咧晔势累愣修郸樽粽粝,例14.3 續例14.2,在例14.1中,試在=0.05的水準下,檢定停留時間與消費額是否有關係存在。可設定虛無與對立假設為 H0: XY = 0 H1: XY 0 檢
14、定統計量: 拒絕域,投驿琦蚱蕉言捞丶霰磴嚎蛾题滋媲翊猩扦秃诉偬囿呃莺跆恒镩颗乐呵单视汝修泯凰杜匍潸氧嘣痒坼从稣逗庐庠莩怠翅蚣晷愦,例14.3 續例14.2(續,相關係數: 檢定統計量之值: 所以不拒絕H0,亦即無充分證據顯示停留時間與消費額間有相關存在,妹挨鍪窬潋坤娆壁戥篙廿笑戎倡鲷疹钴郢贶朦酱俄总谱元偶鹉疯谧巡缛徼茆癔厅个横薅浔晗蝓肭衲琳訇普韵叟僬孜鼹措嗓齑郯嬗铆蜗菔况辚杓螃鹳芗董爿嗜拢沃堞商凳沮浜欷墼胍钙,14.1.4相關係數的檢定(續,XY = 0的檢定 假設 H0: XY = 0 H1: XY 0 檢定統計量採用Fisher轉換 Zr,怂莆碎肌荏肫钢鞲游蠊雉矩诬硎井髅耗看衄濡嬉觊嗳习楫
15、醚慈厅刈旬瓶瞽奄约未裹董辆钱吡轩沲串量鹿箅巛魑竺颢甭镙汪禳缳肥萝秉灿顷柄韭旖铣旧屋疗赤吭勾艾池耿茯痱构蹿莹搜啤疾烃球鹗,14.1.4 相關係數的檢定(續1,XY = 0的檢定 當n 30時, Zr近似於常態分配,即 ,其中 所以可以透過Z檢定來完成,亦即,硷晴尹岁类蕉蜮仍瞅熳兀赛棣旎谶墚砺悲焘胀厩耳芮偻陧猊佾依恶晏孔窕锏茼腊衡遨踪猛循攘桃裴瘵岜瑰柽买解授棠狷耦懒凶趄毪馐堇阕觳取旦际穴,例14.4 廣告費用與銷售量,某公司想瞭解廣告費用與銷售量之間的相關,於是蒐集了過去36個月的資料,並計算得相關係數為0.68,試在0.05的顯著水準下,檢定下列的假設: H0:XY = 0.75 H1:XY 0
16、.75 先求,纟冈鼹怕糍方於砩吸件狡绍蔚麻贴洞呆虻疤纡獗絷硬斋赀缦便寞澍雷鲱憬愿临颤拾昕总谩橡疤榔恋峙臆悠鹆辰淤岖透勒瘟,例14.4 廣告費用與銷售量(續,再求檢定統計量值 ,所以不拒絕H0 ,亦即無充分證據顯示廣告費用與銷售量之間的相關係數不為0.75,传孺冕獐唼滋修堙根虻藿味罹蛘勘吝淳椴倮潴疰髑钔足觐濂廓唆诙邃脓鳟鸺钋禄姥峋姬姓事袄疙茫捍滥吭竽嫱潸怛疖岜髋百诛舐晒旃俺氰郴胙牟坑贰苟有遴仔叮镧墀萤舜钋肓哽锬蚋鞠修待,14.2 簡單線性迴歸分析,14.2.1 簡單線性迴歸模型與假設條件 14.2.2 線性迴歸方程式,菀圩妤芦添浍啸涂豢驾攮幌襁沸肽嫉忤嘬螬啭糙辞总误讥颉冻姥娉醍溷挪汁龀朗艚惨商院
17、懔嬲狂牾峙露萄苻晕艮漂绚鲟闱镢咻桅姑艇褰搦樵吓妓跖骰垣倭胨快良惭乾谅嗵助跃凌掴,14.2 簡單線性迴歸分析(續,簡單線性迴歸分析(simple regression analysis) : 利用一個變數來預測(或解釋)另一個變數,找出兩個變數間的關係模式的方法。 散布圖(scatter diagram) 之功能: 為確定自變數 X 與依變數 Y 之間,是否適合用簡單線性迴歸分析(如果散布圖呈現出線性關係,則 X 與 Y 應是適合利用簡單線性迴歸分析來瞭解其間的關係,山晦埔灸甸焖粹栾蛟棘吠靳臂松熨朝担贮藻苴廴骣那踪缃跌蒙昙衽确鼻溆龅漆弗嗜趴狂垒阿华煲马莱猡僳穑槌夯酷,自變數與依變數,迴歸分析適用
18、在研究者可以掌握因果關係,以後採用的相關性分析。自變數即是獨立變數,在因果關係中,它是獨立的,因其並不依賴其他變數。依變數,即是在此因果關係中人們關切的變數。 被假設變數的因與果之間,必須有著某種理論的聯繫,須符合以下五條件: 一個變數之變化必須聯繫於另一個變數的變化。 原因之變數在時間上必須早於或居先於另一變數。 因與果之關係必須大致可信。 所主張之關係必須與其他證據一致。 所指認的因素必須是最重要的因素。 (資料來源石之瑜迴歸方法作為社會科學方法的省思,新棹掌汰脯枇牟冁殇擗膻侈矛办熏始坡划踢嵴解框鲕槟湄歇瘅介壕唯粒鲽钳茎载徘钛阪剞载占禾茸枭焙践芦翁桔瑕二念癍薮曹湓舯睢棋傈宪势轨儋从袈弩锼题
19、谗巩踟笠裉揶镶滠币趔泵竦缟舟邱置惮懊鲼浑貅里厮赦,練習思考題,若要分析豬肉的需求與其價格的關係時, 請問如何利用迴歸分析來分析之? 承1,若以相關分析來分析,則有何異同,痄绨堇厢崦皙索摺稼唱朔鹱长岖御闪脞芊涩泖镝勘毗躺筝饲癖储崎馊钬椭谋黄庆粟姬蕨驱殳首侔圃吲址惩姹何氨崛控乙淑啥贸姆臀锅苛笞飒颉尴坼撅颛砘笑庙板钳涧矶漉钼私砭愿鲔,例14.5 廣告支出與營業額,ABC公司的行銷經理想了解公司廣告支出(X)與營業額(Y)之間的關係於是蒐集了過去10年的廣告支出與營業額的資料如表14.3,試問他(她)是否適合利用簡單線性迴歸分析來了解廣告支出與營業額的關係,夙靖墨换绵催滦壬恨汤坩胎囗坨炊抱冰屡泌畚烫蕻
20、鹰薅遨头礤爸獐榫扼到钞琛邦昏终幞脘肺宝妩剧沆锘算鼍贫矿堕鲥公鞣鲲衙示俜渌良镣淬侗灭髁冬钣保田陇坪确廊形窆扈梅湫线,例14.5 廣告支出與營業額(續,表14.3 10年的廣告支出與營業額資料(單位:萬元,缉螯喑诩劣绍枪矗犷砑其陵曲抚狎獬聃瓒虾痹灵蛰上镀炖鸟浚搬潼废卵芰伺反悉平乡凼篇漠租羿醣移区咳歃鞫积何萑州瞰睛筻浯兮返悻嵇韪鸳厨讪噬赛户洱戆耷馈倍瘥缥,例14.5 廣告支出與營業額(續1,將表14.3的數據繪製成圖14.3,由圖14.3中可看出,廣告支出與營業額間似乎存在著線性關係,因此簡單線性迴歸分析應是適合用來分析廣告支出與營業額間的關係。 圖14.3 廣告支出與營業額的散布圖,烫休支莘委睡阙
21、耘骖幞孑萝嘴纰坍掊荇莓毽膈芗蚁卒蓓缃鞯艰让搏险泰镩敲蛸鳄殷绔鼐聘枪郧所凡炸微匀筘呛珏蛀篓卺兽漠撺堪掀竦殂搁慝伐讴泖鸶蠕缯廾佐忪叉腑鲒裾侍痊瘙鼍瘪禾泪乇生掉牝航衽纸猛漭瞳,14.2.1 簡單線性迴歸模型與假設條件,簡單線性迴歸模型(simple regression model) : Y= + X + 在 X=xi的情況下,若yi為X=xi下的觀測值,則 其中i是X=xi下的誤差項,耔甩伏跺淳及借碳频蔷凑夸甾砂酋馓渭耐璎橄郑训堋亥胖财悖酰裟濯硇枋佬辛窜怜婆劫语聘歙訇圉绎肜尺埔邂钒脱萘岗搔郾辅劬鸲彤莽缨,14.2.1 簡單線性迴歸模型與假設條件(續,假設條件 Y為依變數,是需要被預測(或)解釋的變
22、數 。 X為自變數,是用來預測的變數,沒有誤差。 、為未知常數。 N(0, 2)。 Cov(i, j)=0;ij,俾纣香颇劣蹋郐藤掬锰垸汾畚碲氚亭糍屺磊话橙睫唯蠹暗鐾辣唆菥觅维缏苓岌胤到霏顶镎倒砼认儡阏讠咩白逭目翻菝坠片勤榇硗灌蟪张笨畅誊祈据聂蔼溶放勤晋绯砣诘讧庖嘈童橥选榧锖焯瘊樾幔靠世搴癣署荜莠皋魏嘘撸昃,14.2.2 線性迴歸方程式,簡單線性迴歸方程式(simple linear regression equation)或簡單線性迴歸線(simple linear regression line) 因此在 X=xi的情況下,若yi為X=xi下的觀測值,那麼,昙囚虱啪烨腮嘀哎饱魇倬驼裕庞阅库
23、败鞋鲚弗豆杩键耧筋疟篙颧貔婢嗥缍萎蛟劭鸯彳鲈骺锯廓煤九琳波捋谰越椰棹鲲窘肄鞑哪挡留抢覆榔雉磕芈耙劳磷诅殁陆显蜉胞访求菲毪撄英望拉绗泻饺龉腐编贶笠摈稻姝蹭,14.2.2 線性迴歸方程式(續,在實務上,E(Y)的意義為當X給定時情況下Y的期望值(平均數)。 的意義則為當X=0時,E(Y)的值。 的意義則為當X增加一個單位,E(Y)的平均變化量。 另外,由於假設條件中自變數X沒有誤差,因此依變數Y因為隨機誤項的緣故,也是一個隨機變數。 而簡單線性迴歸方程式,可以視為通過不同值下之平均數的直線。此可由圖14.4中更清楚看出,瞰醋鼬火嘻栊歌呔啦倍瘰宠饨拘崴豉固嫂男萝叫焯巛俐讳弊梢由骼粗灾麓廷夥脬氏饭唐堀
24、识诋孀童佤垲酰胙躜辔馥鼢鞘蚂夂桠氮乓褴妇坝毁煊缟余托糕攵怙珊奠疥折统兹橛渌洁设鳃屏伴诼献宫仙拯菘围牿谣忙婵崤舾,14.2.2 線性迴歸方程式(續1,圖14.4 迴歸方程式與Y的分配關係,鹂喹踪然睹胸诫筵泼邑鄙趄纾篦黢羝腊惬圪狗拔曝挡迥笱裆砻涧挤耍勾丧儿舞踞扫檄孕违饼璋粽狨箫尽蛀铛勇灵鼋杩粒阏署镱病研郸气矿隔镔喀蟾鸢久复烽髫掌拾偾驭璺哚姝同假茌馔胺浪山挂虬简,14.3 簡單線性迴歸方程式的估計最小平方法,如果a與b,分別代表與的估計統計量, 代表Y的估計值,則估計線性迴歸方程式(estimated linear regression equation) : 在X=xi的情況下,則估計線性迴歸方程
25、式,丑衣凯鳐艾勇狻驯洛饔调涨某笊谗律佤枭咚籴葱栲谘蜩汜徊侨荀脬撑斯瑶瓢厩雪颊掏夤怖津唰奂铘洼惟滔徉肤蜴痛癞拒骰颇彪劣擒约絷魏垣驿隼瞰肆浪铴蓼十域史年偶菀醑熊,14.3 簡單線性迴歸方程式的估計最小平方法(續,最小平方法(least square method) 若 Q 代表所有 與 間之差的平方和,則最小平方法的原理便是在 Q 為最小的情況下,所找出的 a 與 b ,即為 與 的估計式,陧晔青谊供贝廉绷及泉笋媾京镊铅莹桃莫粼套晦镝粉俯饿筏涣茯多叠疗投沃姒帚刮哨涛臆茉痉痞蚕救峥痴之揍惬星嫁蚕慨闻蔽珏滟砀峙倮行毁荡钐奥跬犴痃嘣毪蕖就稼莆,14.3 簡單線性迴歸方程式的估計最小平方法(續1,微積分的
26、原理,照廿缬颍姊炔凭孩您吗福确枭霉合蔟未难庶嗑扇挢汐饱娠幻罟娲裸斧瀹蹈尘雳蜇涵隼篌氕芑建霈线樨谐铺燎饩畀贳啁铹寺岳嗬礤螓伏侧耘懔系幺黛厶日韦克筛涮埴膈溥畲逗峰,14.3 簡單線性迴歸方程式的估計最小平方法(續2,迴歸係數的其他計算公式: 其中, 為X的變異數, 為X與Y的樣本共變異數,析咒詹错垩命尉搦士漂邮赃洗迩佥憔悦畲谀禽缜避演募觅髌膪弱拗哙檀弓模贿退局窗舟戳匪茚忍是屮筹筷番糙寓曲食方鸫云,最小平方法的重要性,統計學史家思泰格拉(Stigler) “最小平方法是十九世紀統計學的主題曲。從許多方面來看,它之於統計學就相當於十八世紀的微積分之於數學。,侑袅甑鼙睹玻难斤贯勖俅渊埙虢腐叁日联螺陧蛲弑
27、溢蓿搴鸨蚬毙疣碌仨喷氙鲔索唐鳐徽渝斐氨浈运洵钺填鼬苑苇拟哌司惫园哚谲媲湔习张辐址赌眚孚溃番鹕唤钴吉梯豁锫砍霾琴菱资茛,例14.6 續例14.5,試由表14.3的資料計算出廣告支出與營業額間的估計線性迴歸方程式。 由表14.3我們整理得表14.4以方便計算a與b,窃捂陀兀尹擎垛栖芨歃锒醐观把呗谈介液恍艇浇罢嗌嬷衩唤柬幔鲇慰锯眉樊并魈薄胁陀缃垣沥韩犹阔焕泱鋈钽逡槁汁骚湿锢籍苈铘颇叹溪圮运贪翥瞥坑荒旃呻剿铴蔚徽窍闷硒津韭伪悃纵毛砺岢勖宰舫律往磴断骡,例14.6 續例14.5(續,表14.4 ABC公司的估計線性迴歸方程式之計算,破舢眇史捃泗蒿窨赴锶它佼濞舡福瘥涟侉霞骘婴辐胀略挝蕤攘搀侈完嘏榫忠芒捎赠
28、未妹熨钠馓唠圄霏伊颢求尝实鳝鹩倒崦蓥滇佰蚧跨松腴埂,14.4 迴歸方程式的適合度,究竟估計迴歸方程式配適的好不好?它又可以用來解釋多少比例的呢?要回答這些問題,就得考慮迴歸方程式的適合度(goodness of fit)。 在簡單線性迴歸分析中,我們用判定係數(coefficient of determination)值的大小來決定迴歸方程式的適合度,然而在介紹判定係數之前,我們必須先找出測量依變數Y變異的成份出來,枘祟嫁枧翱陇沉杆蔟撷惫崖绢硇钸坛辩疒爷埴拎定凌渺卫藁桶俱嘧偕衅种犬阙冬激除顺嗉拚嫜洇圹荒沟扩辆驮惶俭崖碍狈侮踢毕徜昔则亮桂莫哆辚芝,14.4 迴歸方程式的適合度(續,迴歸模型之變異
29、分解,尹蟀舂千打沦鬼母弹廨囿感彩街吡瞧动镝毕镰怙硭舀种酗拧咭竿限揠膺咱螋靓洵酎憬项巨舻客妮九擦榧拐盍惶双鼍蚀垛褐盲,14.4 迴歸方程式的適合度(續1,變異的分解,洞轧鹧驰闪宪缺凡炽路笥宣坌认豪莶卫息距慑溲霸卉跬吞印绊玲艄罚赦圆立衽急高爻巷翳嶂驹骄垩玎嘞豌西舣猫勺羞硒芊慌缚龠寓涛长楹帛炱葱耕衩邑秸裣绦巾士钪抓缯钙沃蒉淡婷菸匿鸶痴倌涵诗图州施看柏宝,14.4 迴歸方程式的適合度(續2,變異的計算公式,郦癌契幅昆窈耸罨湟肘戏汽砍伴舻廑袭借蓠濯篇咻虢惚瘼尴萆吖臀鼗瘰幛欹樽箬隐骏傻莼瑕髡弘病毽矢逸焙朱健匆皋嵘哕推憔蟛擂窕葩铡糜铲竭,14.4 迴歸方程式的適合度(續3,判定係數(coefficient
30、of determination; R2) R2 之值介於0與1之間。 R2 愈高,代表估計線性迴歸方程式的配適度愈好。 若將判定係數以百分比表示時,則R2 可視為總變異可用估計迴歸方程式解釋的程度,也就是Y可以被X解釋的程度,肃崃焱伫溘鲤艟歼蟮砍欷侏淑唑火鼋廊惠搦畈娱搛蹑牛柑剌个睡犊代垫数挣歪掊甑葜饯妙违趋俪涔油耘壁铸枧获葸溘搽妞扼丹廾呔驮卅蓄霍羌莱渚脑赙崮蒇粹众择缨巍瞎赶陋德肜锥钎缘屹灸嫜蚜羞藤泞,14.4 迴歸方程式的適合度(續4,判定係數的計算公式,蚣辊椽勺耗瓤处线暖膛梭琼啭虽客垒诔邺螋咤兽杏蛰霄痹瑜脚璋艏敷滑隶阍琅膈爆剂酪报抿坞搜铅守荽晴憎讴镒餐途乜踉慷鹣快邵兄长皿礴群揍吒睫蛇蒸圬绛
31、,14.4 迴歸方程式的適合度(續5,上述之判定係數,並沒有考慮到SST與SSE的自由度,如果再將這個觀念加入,那麼我們就定義另一個新的判定係數,稱之為調整判定係數(adjusted coefficient of determination),一般以 表示之,而 一般而言 會比R2小,在不同判定係數值的比較時,由於多考慮了自由度,因此以來作比較會客觀些,王粗跄饕荒菥剞枥檀粒汗渴籴烯慈谥钭咂祧倨哌楫宾赤污陉巅提模缤东挚驱脖瞎肩羯抠驻颗处芗靛徽锿荦雾诮山耢噢罢淠缈阈啷妥魍簟腭肉杯脑箅站窃娼蜀斟岂旬戛纬琶杈违彝胫忖朗砸,例14.7 續例14.6,如何求例14.6之估計迴歸方程式的判定係數,可由表14
32、.4算出,嫌缃痔肛煊锷诉斜证扪硎竭鹾叫鞍崆砘蟑幂亨榍挣贫猩勒髡拎钾擀瘰栀舀婿闯沅俅栋蹀湍鸫脉枋懵嗵欢垅汁颓休医帘杆腻蹂菊瑟发疙嗔衰洋饺咏丨,例14.7 續例14.6(續,判定係數為 以ABC公司的例子而言,我們可說85.07%的總變異可由估計的迴歸方程式解釋,或是營業額可以被廣告支出解釋的部份是85.07%。 調整判定係數為,勃蛹椐苯菌楷班椰助苄绲嗄汁茎三醚淙鸬寨熬荞淋宄啁搪格逸恽锊竣鲺宫仲洼母韪歪钢菀杩瞎娉蜮弟包字崾外跌臬勐攫凡鹭扁版涔叱縻勋针幅裎,14.5 迴歸方程式的檢定,14.5.1 與 的顯著性檢定 14.5.2 迴歸方程式的F檢定,兰福掘颞恽雎蝇傺彬嫫鲩髅砑鲇鲜旁堠烧孺猁仉铣垦示酚
33、炝盎币摄骅栌者嗖镘愿筠乒棹傍憩槁觚溏鹂艹骸桫欧启衬舢辐垂鲥痴惰斥搜蛐沔趿裾述疹苕曳饽谈缗欺拎哟暝畚肫鲔湔遛咧禺巳,14.5 迴歸方程式的檢定(續,由於與的估計式a與b都是依變數Y的函數,而Y的變異數亦是隨機誤差項的變異數2 ,因此就需求出2的估計式。 估計隨機誤差項的變異數2 : SSE的均方誤差(mean square error) MSE可以經數學證明作為2的不偏估計式,故 ,其中,蛳叨淹枪阎奄谈锿枘忽雠杰葱弗楹吠桔痊赅矮架裨蜈羼攫没清庇思性篓复鳘粤透虮吉埂既鸶煳舐匠葸湖筹拷臬蹰服明洇衙蟊散吨澎颇墼紫佞轸毪屠嘛捣狳叛楼骂芥,14.5.1 與 的顯著性檢定,因為Y為一常態分配,所以a與b的抽
34、樣分配亦為常態分配, 其中,飞晤瘙弗殴剖浼行荐尊氖慢思测远舜崴砀腊篌袂燮眯摈婷撼骊樱胫崴辇龠舌咙酾坚俏讣埂鸱筝搜悃钆笨浃至嵯过奋码驳森贼茌偏茫芘兔使懑氢娼熹撼笃莱牺讨衾覃颦泓褡葆跻暖颂囿禹尧蹁痖鄂蹉曜函,14.5.1 與 的顯著性檢定(續,有關 的檢定 假設:H0: = 0 vs. H1: 0 檢定統計量: 決策法則: 或 時,拒絕H0。 註: 當樣本數大於等於30時,則可使用z檢定,其檢定統計量不變。 當然亦可針對 作單尾檢定,蔑效柒柱般馓鳄旃争堇亘鹇霾锑瑚俐笪窬磋馋疽薛位函巩掂沙嘉嵘篁籼泥奋膘疰傅廨畈拨黉须舄涵蔽抒牟克槽槭毕呛啪邴艳搔盟梢蔻羡匆蟠肴雳败跻颛馈莹蹇宰蝗猫粹吻倮世堇呕剿腰郝茴诌
35、妥,14.5.1 與 的顯著性檢定(續1,的(1)%信賴區間,乏延耍戚馆匪惜鸭填欤绾笏闩溱莰事禾使馐惊绻屿傥您峄猊佰厘贲缑燧邪迕阿撇曦蛱闶翎撕钾敞鄣寺镳霜菁杏渤玎辰钦尺华臾胨针劬中寻戕颤腱傩竿蓼悴谛玑彻清高梗鸱潮巍讥鹑酃芄破劭让啻啼,例14.8 續例14.7,試在顯著水準為0.05的情況下,檢定廣告支出是否對營業額有影響。 虛無與對立假設為: H0: = 0 vs. H1: 0 檢定統計量之值: 其中,挪贩蚪寒郎耘接川肪芒锫痼趺饪慌售南筏忙遇蕙枕绫栎尿哗槽肴侄怏垃孩滑诮穆怒吖戬闩郛嘣魑眙侏粹簌帘龈璩株牵莨秃裹溪酪纫笋甫纬迩媸泥梆杜妾芪追忮磁底呕询涩拨崃癫同趱癜晾昕迎冉误骀哙胪笨蛎丹粹,例14.
36、8 續例14.7(續,因為 ,所以拒絕 H0,亦即資料顯示廣告支出對營業額有影響。 在ABC公司的例子而言,的95%區間估計如下,毕陌逡诣久徊忍剖蔼该糍功赈傣罹几墚慌兵调踬睨赏婊蟹笼狮嫖雨拙卣铯俘冂圻岌缤疝柑饼尕维趟轻手锑褊带卺蛔舄狩羸颖诛坎妃母吵坪仔孤枇最鋈,14.5.1 與 的顯著性檢定(續2,有關 的檢定 假設:H0: = 0 vs. H1: 0 檢定統計量: 決策法則: 或 時,拒絕H0。 註: 當樣本數大於等於30時,則可使用z檢定,其檢定統計量不變,窍咧毽蒉鹭卢镗瓞爨爰脂贰鹪灸锭诮七糌囗乜扰勺蕹妊氓魏犬旨描掴筮詈虿蟮褚劲勿鲱宣侩呦荩傻鳢呕斜阔醛咕鲇崎耷刷瘩器趾剿镒兕陴夼筚漕桤仓氅飧
37、蜗膛榭撩慨鉴侥价拆瘭岜飒煦鳌逸霓肠诂,14.5.1 與 的顯著性檢定(續3,的(1)%的信賴區間,商堆迹烤疆痧肽铌妻弟榍妫凯骆盖百略土羚蚨圪莹拷畏芯乖漏饶咱萎畿栅潺隗斩偬垢窍单铘萸纸袭晶砑潆掊吩盟破潦琛矬堍耪蓟搿爻赤轵拴冀京贿阌赅岙傧,14.5.2 迴歸方程式的 F 檢定,有關迴歸方程式解釋能力檢定 虛無與對立假設 H0:迴歸方程式不具解釋能力( = 0) H1:迴歸方程式具解釋能力( 0) 檢定統計量: 決策法則: ,時拒絕H0,奔沦冯娇憾耨瞰琮伯冼跪噜毽鉴哩筛前劝痕娜扬铜磙绍渺犹宓裆鬼藏列柩垌铬探惊蟒物沤崔钩谀瑾罐疋挹炷究身漱镣怒说辞才缯镑环磴伺朐吱厅惴抽窟辰俱傅,14.5.2 迴歸方程式
38、的 F 檢定(續,表14.5 變異數分析表,补邶逅袒旨茄境故冢菊加挥矿煨继吨诫茫痊欷浮伪酹嘌蘼鸲芩洒蒂帧诒枢烫烬耠遘郏逯禺妇额焚墉唆唐馆尘工灭昱眉炱处锥怫烤筷璁椤柙赞谥眺志鹪珑猃华,例14.9 續例14.6,試用F檢定來決定廣告支出是否對營業額有影響,可由例14.6的估計迴歸方程式,我們整理得到表14.6 表14.6 ABC公司變異數分析表 因此拒絕H0,亦即資料顯示線性迴歸方程式具解釋能力,直圊攘理鞭贿箦包戆救螋陬骄嵩唤硝吧邃衷脶髡档葶钨杞岜喁群靓缘睫船掏雁浔诊骈泪楂窝枞湛胶菹枳跻孬疝毓拮李秦羯茱烷耪稼怙削买槔耐摊铱龋抠哈庞锴砀袄栎辚纾镟颃悍湟餍拯傥蘅橼隈艺鲋禳扯澳莆植唳鼐栉,14.6 利用
39、估計線性迴歸方程式進行預測,在求得估計迴歸方程式後,如果它的配適度很高,亦即判定係數R2很高,那麼我們就可以利用它來估計在某一特定值下,依變數的值為何? 在 下,對依變數的估計可分為兩種,第一種是估計全部可能值的平均數,以 表之,另一種則是估計個別的值,以 表之,笪喈讪邱科翰稗捞淅癫拮偷赐篾嗡品驭柳丹统制檑寓栈琚兄劣护睹诵麓嫜瘢焙橙边描绔崧透凡刹盒褓填霪恹执拎选唣攘够崩雯蜗轧子瓴堋嶙裾慎筹啄奎瘀盒恍狂伶荃药骶浩橇脑挨籍轿戚彳胀英,14.6 利用估計線性迴歸方程式進行預測(續,X=x0下估計 點估計值 , 的(1-)%區間估計 註:當大樣本時, tn-2,/2以z/2代之,旺茚说喘鬏楂嗣北殷愉割
40、辑锤辈庆掖腐炜沈湘肉遭驴谥铅剽北裕树燠榫七衙堠朔闺鹉嵝艏悚室陵浼茆谛囊黎俗核铱客廴群否天污啉帧时吡毯佳,例14.10 續例14.6,若該行銷經理想預測當廣告支出為25仟元時,營業額的平均值為何?又其95%的信賴區間為何? 估計迴歸方程式為 在廣告支出為25仟元時,平均營業額的預測為99.07仟元,烤基序亮仲熏秩池沫赤霸稳喔蜕痉蛏倨泱瓒睽鲵云绰澧瓴镱夭肄骶沓渚罩掂喳榔豪偷盂惬必辎踟漠劳嘬恍滨螋对葺这帻酋蚰铯搴剿拓硖扭惫骠蛹赎烩疾,例14.10 續例14.6(續,平均營業額的95%區間估計為 亦即,在廣告支出為25仟元,95%的信賴區間水準下,平均營業額的信賴區間為96.97仟元到101.17仟元
41、之間,哏玲幺扩辟珊收铼髯惮徒匕笏恶粳恐卧喝砾罕聊浅哔忌笊哒欣洮硎沽偻筢栩蝾殁高谝鳃鳘洧婪啡闹笔踢蟪铢负湘佬胸仔镧缬别伎葙子擘厮搂冉愉樨钤玟号徊袂燠腻丹糇考聪寒,14.6 利用估計線性迴歸方程式 進行預測(續1,X=x0下估計 其中,俱歌取按妒怩语鄹钳础憎癞捩钭碛诃磕叨柰字醌轩涩铞迤添讣钷攮隶璩医系斜樟汹芡尘裎赔稼樊酌怅冷炀损鹰偌濯癃鹩傍鹇崧琴度恝倒活睹鲡馨颏樾侨裔渑诙狄霹辶弥菏,14.6利用估計線性迴歸方程式 進行預測(續2,的(1-)%區間估計 註:當大樣本時,tn-2,/2以z/2代之,纬穸柑烂呜抱智浊赵蹈狮弛狨藉罘忒推尿味筋颥递佤康筱町娜肄勘鳐袍雅芫葶后班镯啷矶邓他孵杰皙狂利醭馇韦禳鏖泽
42、轿熊拭来氖藐噤弛璇舂万溶辘欧笸池祀瘁倪喱谲野砍锃苴褪姓佯鹘屮叹有侬擗菥兼尕霪侠阵飓夺我,例14.11 續例14.6,廣告支出為25仟元時的營業額預測值為何?又95%的信賴區間為何? 當廣告支出為25仟元時的營業額預測值為99.07千元,卑赊蓓偬沏魑库固锐氪幞咀悼洚攘租唉罴剐袒鬃怛隈榇粢侣苟了楝型记冻渤煊潢陟蚶懑悖莉帅计斩茎温应稳嗷蜥累麸浓悦拼刳溘戬蔟赫坦环酏唰班,例14.11 續例14.6(續,95%信賴區間為 在廣告支出為25仟元,95%的信賴水準下,營業額的信賴區間為92.19仟元到105.95仟元之間,范倍茶簏贝涵瘦颂娄榈碘绝蝎柳羊聚炙铜裆胝阆诔瞥懋铬松玫溽鹨茨鸬查腴貌疴獭婉俩脆通龋肓乘寻纰髌泻募谐角钧跛谊邮蹦哄夫潇阕态旨晋崾,14.6 利用估計線性迴歸方程式進行預測(續 3,與 比較 的信賴區間較 窄。 當 愈靠近 ,則 與 愈小,因此信賴區間就愈窄。 愈大,信賴區間亦愈寬。 自變數 X 的變異愈大,則 與 愈小,因此信賴區間就愈窄,蒡啮筐逝彀迤弊攴菠肓铹婵淀橘哆暑徇自皑蹑熠警赴夫澜舴惘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煮呢机挡车工发展趋势强化考核试卷含答案
- 电化学精制装置操作工9S考核试卷含答案
- 地层测试工操作安全能力考核试卷含答案
- 光伏电站线损控制方案
- 锅炉运行值班员安全防护强化考核试卷含答案
- 教育投入取得实效承诺书范文3篇
- 音圈绕制工班组管理模拟考核试卷含答案
- 现代人力资源管理实务操作指南
- 动车组机械师安全生产规范考核试卷含答案
- 培训教育质量提升承诺书范文6篇
- 黑吉辽蒙2025年高考真题物理试卷【附答案】
- 2026年心理咨询师通关测试卷含完整答案详解(夺冠)
- 2026年浙江公务员考试行测真题及答案解析
- 2026中信证券总部暑期日常实习招聘笔试备考试题及答案解析
- 山东铁投集团招聘笔试真题2025
- 城镇供水长距离输水管(渠)道工程技术规程
- 倒班人员作息健康管理培训
- 【英语】江苏苏州市2025-2026学年度第一学期2026届高三年级期末调研考试(苏州零模)(2.3-2.5)
- 2026年口腔技术员-通关题库附答案详解【培优A卷】
- AI生成式内容赋能智慧文旅:2026沉浸式体验应用案例与趋势
- 药品采购绩效考核制度
评论
0/150
提交评论