版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
相關與迴歸Chapter10學習目標為成對數據繪製散佈圖。計算相關係數。檢定這項假設H0:ρ=0。計算迴歸直線的方程式。計算決定係數。計算估計的標準誤。求出預測區間。10-1
散佈圖與相關散佈圖(scatterplot)是把獨立變數x和依變數y配成有序對(x,y),然後把每一對看做是二維平面上的一點,再描點繪圖。例題10-1租車公司例題10-1租車公司(解答)例題10-2缺席次數與期末成績例題10-2缺席次數與期末成績(解答)例題10-3年齡與財產例題10-3年齡與財產(解答)根據正式定義,母體相關係數(populationcorrelationcoefficient)
ρ
就是用所有母體內可能的成對數據(x,y)計算出來的相關係數。相關根據樣本數據計算的線性相關係數(linearcorrelationcoefficient)度量兩屬量變數間某種線性關係的強度與方向。樣本相關係數的符號是r。圖10-6相關係數與散佈圖之間的關係相關係數的假設樣本是隨機樣本。成對數據大約落在一條直線上,而且以區間或是比例尺度取得數據。兩變數是某種雙變量常態分配。(這意味著對於任意已知的x,y的分配是常態的;而且對於任意已知的y,x的分配是常態的。)線性相關係數r的公式其中n是成對數據的個數。程序表求出線性相關係數步驟1製作一張如下所示的表格。步驟2把變數x的數字放在標示為x的那一行,把變數y的數字放在標示為y的那一行。將同一列的x和y乘起來,放在標示為xy的那一行。每一個x取平方,放在標示為
x2的那一行。每一個y取平方,放在標示為y2的那一行。為每一行計算總和。步驟3代入公式,計算r的數值。其中n是成對(同一列的x和y是一對)數據的個數。例題10-4租車公司例題10-4租車公司(解答)例題10-4租車公司(解答)例題10-4租車公司(解答)例題10-5缺席次數與期末成績例題10-5缺席次數與期末成績(解答)例題10-5缺席次數與期末成績(解答)例題10-6年齡與財產例題10-6年齡與財產(解答)例題10-6年齡與財產(解答)檢定線性相關係數顯著性的假設1.數據是屬量的,而且來自某一種隨機樣本。2.數據的散佈圖顯示某種近似的線性關係。3.數據裡無離群值。4.變數x和y必須來自某種常態分配的母體。相關係數t
檢定的公式其中自由度是n−2,其中n是成對數據(x,y)的個數。例題10-7例題10-7
(解答)例題10-7
(解答)例題10-8例題10-8
(解答)變數間可能的關係當虛無假設在某一個α
值被拒絕的時候,會存在以下五種可能性:1.變數間有一種直接的因果關係。也就是說,x引起y。比如說,有水植物才會長大,中毒才身亡,或是熱讓冰熔化。2.變數間有一種逆向的因果關係。也就是說,y引起x。比如說,假設某一位研究員相信喝太多咖啡會造成緊張,但是研究員卻沒有想到可能是相反的情況。也就是說,極度緊張的人想要喝咖啡減輕緊張的程度。3.變數間的關係可能是因為同時受到第三個變數的影響。比如說,如果有一位統計學家把死亡人數和溺死人數以及暑假每天喝幾罐汽水相關起來,他可能會發現某種顯著的關係。不過,汽水並不會造成死亡,因為兩個變數可能都和高溫以及溼度有關。變數間可能的關係4.許多變數之間有各種複雜關係。比如說,有一位研究員可能發現學生的成績和高中成績有顯著的關係。但也可能和其他變數有關,例如智商、念書時數、父母的影響、動機、年齡以及老師。5.有關係可能是因為巧合。比如說,某一位研究員可能在運動人數和犯罪人數之間發現一種顯著關係。但是由一般常識可知任何這兩種數字之間的關係一定是因為巧合。觀念應用10-1煞車距離在一項速度控制的研究,發現制定交通規則的最主要理由其實是為了車流效率和降低發生危險的風險。有一個領域曾經是研究的重點,就是各種速度下的煞車距離。使用以下的數據回答問題。假設MPH會被用來預測煞車距離。觀念應用10-1煞車距離1.上述兩個變數中,哪一個是獨立變數?2.哪一個是依變數?3.獨立變數是哪一種變數?4.依變數是哪一種變數?5.為數據建構一張散佈圖。6.兩變數之間有某種線性關係嗎?7.改變獨立變數的數字間的距離,再畫一張散佈圖。此關係看起來有不一樣嗎?8.關係是正的還是負的?9.可以用MPH準確預測煞車距離嗎?10.舉出幾個影響煞車距離的變數。11.計算相關係數r。12.在α=0.05之下,相關係數r顯著嗎?10-2
迴歸最適線最適線最適線迴歸線y'=a+bx的公式其中α
是y'截距,而b是迴歸線的斜率。求出相關係數與迴歸線方程式步驟1製作表格,如步驟2所示。步驟2求出xy、x2
和y2。將這些值放在適當的行內並且加總每一行。步驟3當r是顯著的,代入公式為迴歸方程式y'=a+bx求出a和b的數值。例題10-9租車公司例題10-9租車公司(解答)例題10-9租車公司(解答)例題10-9租車公司(解答)例題10-10缺席次數與期末成績例題10-10缺席次數與期末成績(解答)例題10-10缺席次數與期末成績(解答)正確迴歸預測的假設1.樣本是隨機樣本。2.針對獨立變數x的任意特定值,依變數y的值必須是依著迴歸線呈現常態分配的。詳見圖10-16(a)。3.針對獨立變數x的任意特定值,每一個依變數的標準差必須一致。詳見圖10-16(b)。圖10-16預測的假設例題10-11租車公司例題10-11租車公司(解答)觀念應用10-2再次探討煞車距離在一項速度與煞車距離的研究,研究員透過測量煞車痕跡尋求一種方法估計車禍前人們的車速。這一項研究的一種領域是在各種速度下需要多少距離才能讓車子完全停下來。使用以下的表格回答問題。假設MPH是被用來預測煞車距離。觀念應用10-2再次探討煞車距離1.求出迴歸線方程式。2.由迴歸線斜率可知道哪些關於MPH和煞車距離之間的事?3.當MPH
=45的時候,煞車距離是多少?4.當MPH=100的時候,煞車距離是多少?5.評論在數據範圍外的預測。10-3
決定係數與估計的標準誤迴歸模型的各種變異殘差圖殘差圖決定係數(coefficientofdetermination)是一種用迴歸線與獨立變數可以解釋多少比例依變數變異的測度。決定係數的符號是r2。決定係數無決定係數1.00-r2估計的標準誤(standarderroroftheestimate),記作sest,是觀察到的y值關於預測值y'的標準差。估計的標準誤公式是求出估計的標準誤步驟1製作如下所示的表格。步驟2針對每一個x值,求出預測值y',並且把結果放在標示為y'的那一行。步驟3針對每一個y值,減去y‘,並且把結果放在標示為y−y'的那一行。步驟4把步驟3的每一個數字取平方,並且把結果的數字放在標示為(y−y')2
的那一行。步驟5求出(y−y')2
這一行的總和。步驟6代入公式,並且求出sest。例題10-12影印機維修費用例題10-12影印機維修費用(解答)例題10-12影印機維修費用(解答)例題10-12影印機維修費用(解答)求出估計標準誤的另一種方法步驟1製作如下所示的表格。步驟2把x值放在第一行(標示為x),把y值放在第二行(標示為y)。求出同一列x和y的乘積,並且把結果放在第三行(標示為xy)。針對每一個值取平方,並且把結果放在第四行(標示為y2)。步驟3求出y、xy以及y2
這三行的總和。步驟4找到迴歸方程式的a和b,代入公式並計算之。例題10-13例題10-13
(解答)例題10-13
(解答)y'的預測區間公式自由度是d.f.=n
−2。求出獨立變數某特定值的預測區間步驟1求出Σx、Σx2
和。步驟2求出特定x值的y'。步驟3求出sest。步驟4代入公式並且計算之。自由度是d.f.=n
−2。例題10-14例題10-14
(解答)例題10-14
(解答)例題10-14
(解答)觀念應用10-3解讀簡單線性迴歸1.這兩個變數朝同一個方向改變嗎?2.哪一個數字測量預測線和真實數值之間的距離?3.哪一個數字是迴歸線的斜率?4.哪一個數字是迴歸線的y截距?5.可以在表格求出哪一個臨界值?6.哪一個數字是犯型I錯誤的允許風險?7.哪一個數字測量迴歸可解釋的變異?8.哪一個數字測量數據點在迴歸線四周的散佈程度?9.虛無假設為何?10.為了知道是否應該拒絕虛無假設,會和臨界值比較哪一個數字?11.虛無假設應該被拒絕嗎?觀念應用10-3解讀簡單線性迴歸結語真實世界的變數間有太多關係了。決定是不是有某種線性關係的方法是使用已知的統計技術:相關與迴歸。一般是使用相關係數測量線性關係的強度與方向。它的值介於−1和+1之間。相關係數的值愈接近−1或是+1,變數間的線性關係強度愈強。如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- LY/T 1963-2025澳洲坚果栽培技术与质量要求
- 手术室护理质量管理体系
- 早产儿护理的注意事项及常见问题
- 提成返款协议书
- 床底空间收纳规划协议
- 维修工安全考试题及答案
- 煤矿贯彻落实反三违工作专项行动方案宣贯解读课件
- 土木工程(结构)题库及答案
- 液氢能效提升改造可行性研究方案
- 石家庄市护士招聘考试题库及答案
- 公安保密培训课件教学
- 2024年房屋买卖合同示范文本
- 眼科医院护理部主任竞聘报告
- 涂料配方优化及实验报告案例分析
- 苏科版七年级数学下册期末核心考点练习卷(含解析)
- 2025年全国同等学力申硕考试(生物学)历年参考题库含答案详解(5卷)
- 湖南省株洲市名校2026届中考联考数学试题含解析
- 实测实量仪器操作使用专题培训
- 冬季防治高血压课件
- 面部徒手整容培训课件
- 数字电子技术课件 3.4.2.1二进制译码器
评论
0/150
提交评论