《统计分析》PPT课件.ppt_第1页
《统计分析》PPT课件.ppt_第2页
《统计分析》PPT课件.ppt_第3页
《统计分析》PPT课件.ppt_第4页
《统计分析》PPT课件.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

統計分析,1,統計分析,統計分析包含:統計推論-由樣本觀察值得到母體的特性,分為估計與檢定。統計建模-針對試驗的資料,發展出一統計模式,以解釋變數間的關係或作預測。,統計分析,2,統計推論,樣本,估計之母體,實際母體,統計推論必產生差異,稱為抽樣誤差;抽樣誤差的大小與樣本數有關。,統計分析,3,檢定與估計,統計推論分為檢定與估計估計是估計母體特性的代表值,如,估計平均數、比例檢定是對一假說作真偽判斷,統計分析,4,統計估計,在一信心水準下,根據資料估計某一參數值可能的範圍通常估計平均數,發生率。例:以95%的信心水準,估計大學生起薪在2.50.3萬以95%的信心水準,估計支持率30%,誤差0.3%,統計分析,5,民調:319大突破逾半民眾存疑2005.03.09中國時報(註六),六成九的國人知道陳義雄被指涉嫌,但這些人當中五成一的人存疑,只有二成六相信警方說法。本次調查於八日晚間進行,以台灣地區住宅電話簿為抽樣清冊,共成功訪問七百三十五位成人。在九成五的信心水準下,抽樣誤差為正負三點七個百分點。,統計分析,6,誤差的大小與樣本數有關,樣本數為735時,計算得在九成五的信心水準下,抽樣誤差為3.7%。樣本數為4,713時,計算得在九成五的信心水準下,抽樣誤差為2%。(註七)人數增加時,誤差下降。,統計分析,7,邏輯推論,丟骰子10次,有8次出現6點,是機運或是假骰子?要如何辯護?大前提:如果是一均勻骰子,得到超過8次6點的機率是0.000019小前提:如今10次,有8次出現6點判斷:顯然此骰子不是一均勻骰子,統計分析,8,統計檢定,例:甲在10次考試中,有8次成績都比乙好,是機運或是甲的程度比乙好?,假說:H0:甲=乙vs.H1:甲乙根據資料計算:若甲=乙,有超過8次成績都比乙好的機率只有0.1%。上列的機率在檢定上稱為p-值或顯著值判斷甲顯然不等於乙。此判斷錯誤的機會小於1%。,統計分析,9,一般檢定的步驟,建立假說(虛無假說及對立假說)根據資料算出顯著機率(p-值)若顯著機率值太小,如p-值0.05,則判斷虛無假說不可能,結論為對立的假說是顯著的,統計分析,10,檢定的顯著p-值,不顯著的情況,顯著的情況,統計分析,11,例:維生素是否可預防感冒,400人隨機分為二組一組服用維生素,另一組服用安慰劑(對照組)經過一個冬季,統計二組患感冒比例實驗組有15%,對照組有25%,統計分析,12,檢定,Hypothesis:二組患感冒比例相同在比例相同下,計算的p-值小於0.0001如果比例相同,得到此資料的機會有0.0001否定二組患感冒比例相同服用維生素的一組比例較低結論是服用維生素對預防感冒顯然有效,統計分析,13,例:檢定五種廣告效應的差異,為了研究廣告對產品質感的影響,30個受試者隨機地被分配到5個試驗群,每一個試驗群接受一單獨的關於原子筆廣告。受試者看完廣告後,均拿到相同形式的原子筆,評估當他們購買像這樣原子筆所期望的價格。,資料圖,統計分析,14,廣告效應是否有差異?,虛無假說定為五種廣告效應相等由資料計算得顯著的p-值是0.0001(參考SAS統計軟體得到的報表)結論是五種廣告效應有明顯的不同,在統計上說“有顯著差異”(significantdifference),統計分析,15,其它檢定之例,消基會檢測食品防腐劑是否超出標準:hypothesis為不超出標準,在等於標準下計算的p-值,若p-值0.05,則認定食品防腐劑顯然超出標準。研究學歷高低是否影響工作滿意度:hypothesis定為學歷與工作滿意度無關,在無關的情況下計算p-值,若p-值0時,Y與X1有正關係,10時,有負關係。項目包含未在考慮的變因,統計分析,20,線性模式中係數之意義,月薪=24260+670(年資)+4025(教育程度)其中教育程度是以1表大學以上學歷,0表高中以下學歷對同教育程度的人,年資增加1,平均月薪增加670元對同年資的人,大學以上學歷者比高中以下者,平均月薪增加4025元,統計分析,21,多項時藉用指標變數的模式,若教育程度分為四項,另設定三個指標變數,統計分析,22,指標變數係數之意義,月薪=24260+670(年資)+4025(E1)+3000(E2)+2000(E3)對同年資的人,大學以上比小學以下學歷者,平均月薪增加4025元對同年資的人,高中比小學以下學歷者,平均月薪增加3000元對同年資的人,國中比小學以下學歷者,平均月薪增加2000元,統計分析,23,可由線性模式找出影響因素,模式:Y=0+1X1+2X2+pXp+檢定線性模式的係數,若Xi值的係數是顯著的,則Xi對Y的影響是顯著的。可使用逐步迴歸法將所有可能影響Y的因素Xi逐一地加入模式中,重複篩選,找出最可能影響的因素。,統計分析,24,特殊模式,兩個自變數含交互作用項的模式;如:E(Y)=0+1X1+2X2+3X1X2多項式迴歸式;如:E(Y)=0+1X1+2X12轉換變數迴歸式;如:Y=0X1轉換成線性模式ln(Y)=ln(0)+1ln(X),統計分析,25,變數轉換,在許多時候,將資料經過特殊的函數轉換,可以找到更適合資料的模式線性轉換:y=a+bx例:成績標準化,華氏溫度與攝氏溫度次方的轉換:y=axb例:成績開根號以10對數的轉換:y=log(x),統計分析,26,變數轉換的影響,線性轉換通常不會改變原資料的分佈型態次方或對數的轉換會改變分佈的形態。,原資料分佈,對數轉換後分佈,統計分析,27,邏輯迴歸模式Logisticregressionmodel,邏輯迴歸模式為一非線性模式,可預測某現象發生之機率,當研究的對象限於二種或少數的幾個項目時,無法使用線性模式,而使用邏輯迴歸模式範例:研究有心血管疾病的因素,研究的對象分為有或沒有預測下雨機率,研究的對象是會下雨分為有或沒有研究已婚婦女選擇就業的因素,研究的對象分為就業或不就業金融機構研究影響個人信用狀況的因素,統計分析,28,簡易邏輯迴歸模式,以某一變因(X)預估事件發生的機率資料的反應變數(Y)只有二種可能的結果,通常以y=1表示發生及y=0表示未發生。定義:勝算odds=勝負機率之比基本原理:假設ln(勝算)對X有線性關係註:ln是自然對數,統計分析,29,例:由程式經驗預估完成工作的機率,經驗愈多者,完成工作的機率愈大,但無法以一線性關係表示,改以S-曲線預測較合理,參考下圖。,統計分析,30,原始資料與估計機率圖,統計分析,31,邏輯迴歸估計式,由邏輯迴歸之最大概似估計得到z=-3.0597+0.1615(經驗月數),此為S-曲線,統計分析,32,(1)預估成功率:有一年工作經驗者,估計有24.6%機率完成,勝算0.326有二年工作經驗者,估計有69.4%機率完成,勝算2.262(2)可由係數估計勝算比,勝算比=exp(0.1615)=1.175.實值意義:工作經驗每增加一個月,完成工作之勝算是原來的1.175倍。,由經歷估計成功率,統計分析,33,時間序列,長時間對某一現象觀察的資料記錄是為時間序列政府機關、公司機構保留的記錄,長期累積下來是為一有研究價值的資料未來經濟預測、營運的決策,或投資的選擇通常靠分析時間序列資料,統計分析,34,時間序列模式,時間序列的資料非獨立資料,相鄰兩筆資料間互相影響,此稱之為自相關通常時間序列資料的建模必須考慮自相關以下的模式考慮前一時間的影響Yt=a+bYt-1+t,t指時間Yt=a+bXt-1+t,統計

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论