第三章统计资料的呈现统计图表PPT课件_第1页
第三章统计资料的呈现统计图表PPT课件_第2页
第三章统计资料的呈现统计图表PPT课件_第3页
第三章统计资料的呈现统计图表PPT课件_第4页
第三章统计资料的呈现统计图表PPT课件_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-,1,第三章敘述統計(II):統計量法,-,2,學習目標,介紹常用的統計量數來表達資料的特性。學習集中趨勢的統計量數。學習位置的統計量數。學習分散程度的統計量數。學習如何建立全方位的統計圖盒鬚圖。學習形狀的統計量數有偏度與峰度。學習如何計算分組資料。認識謝比雪夫不等式與經驗法則。學習Z分數的應用。洞悉平均數、變異數及標準差的重要性質。,-,3,本章架構,3.1集中趨勢統計量數3.2位置統計量數3.3分散程度統計量數3.4全方位的統計圖盒鬚圖3.5形狀統計量數3.6分組資料的統計量數3.7謝比雪夫不等式與經驗法則3.8z分數的應用3.9樣本平均數、樣本變異數及樣本標準差的重要性質,-,4,3.1集中趨勢統計量數(又稱位置統計量數),3.1.1平均數(mean)3.1.2中位數(median)3.1.3眾數(mode)3.1.4百分位數(percentile),-,5,3.1集中趨勢統計量數(續),所謂集中趨勢統計量數是以一個數值來描述樣本資料中,那一個分數或數值是最具代表性,或集中在那個中心位置故又稱位置統計量數。最常見的集中量數有三種,即眾數(Mode)、中位數(Median)、和算術平均數(Mean),到底用那一個集中量數和資料衡量尺度以及研究之目的有關。,-,6,3.1.1平均數,平均數(mean)為所有數值總和除以所有數值的個數(即算數平均),當資料是屬量資料時適用。母體平均數():樣本平均數():註:唯一值;:非唯一值xi=N;xi=n,-,7,例3.1:平均數,若全班12位學生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤,試求其母體平均數?若以上資料為抽自全班60位同學的樣本觀察值,則其樣本平均數為何?解:,-,8,例:平均數,已知樣本資料2,3,5,10,15,若其中有所誤植,15應為85才正確,問平均數有何變化?解:根據誤植的資料,則樣本平均數為(2+3+5+10+15)/15=7;若將15改為85,則樣本平均值變為21,為原值的三倍。由上例可以知道平均數對於極端值(如上例中之85)的敏感度很強,這是採用平均數作為集中趨勢統計量數應特別留意之處。為此,我們介紹中位數來克服這樣的疑慮。,-,9,平均數易於數學計算之特性,例如兩組樣本資料的個數與平均數分別為n1和n2及和,則將兩組資料合併後的樣本平均數為註:平均數具有如此的功能,但中位數和眾數則無法同理得知,也就是說,兩組資料合併後的中位數和眾數都無法以一關係式來直接代表。,-,10,例:平均數,例:設有A,B,C三班學生人數分別為N1=50,N2=48,N3=52,今在某次統計學期中考平均成績分別為1=80,2=76,3=85,試求出此三班統計學期中考總平均成績解:=80.45,-,11,修正平均數,調查大學生每周上網時數,今隨機抽取n16學生其資料如下:4,5,6,8,9,10,12,14,15,15,15,16,17,18,20,26求平均數求5修正平均數Sol:(1)=13.125(2)修正平均數=12.86註:求修正平均數前需先將原資料排序,-,12,離差,離差:如資料Xi在右邊如資料Xi在左邊離差和:,-,13,平均數性質,Xi=n;Xi=N(Xi-)離差值(Xi-)=0min(Xi-A)2A=易受離群值(outlier)影響,可用修正平均數改善。(極端值(extremevalue)變數變換:Y=aX+b=a+b平均數有算術平均數、幾何平均數及調和平均數,其中以算術平均數最簡易且適合代數運算,故往後探討平均數以算術平均數為主。,-,14,3.1.2中位數,中位數(median)將資料由小到大(或由大到小)順序排列後,位於中心的數值稱之,通常以Me表示,當資料是屬量資料時適用。計算方法將資料由小到大排序寫成x(1),x(2),x(n),-,15,續例3.1,求12位學生的體重之中位數?解:全班12位學生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤。將12位學生的體重由小到大排序如下:35,38,39,40,42,43,46,48,50,51,54,54,因為n=12為偶數,故中位數為排序第六和第七位數值的平均,即註:Min|xi-A|A=Me(中位數),-,16,3.1.3眾數,眾數(mode):指資料中出現次數最多的數或分組名稱則稱此為眾數以Mo表示。當數據或名稱各只出現一次時,眾數便不存在,但因次數可能相同,故眾數可能不唯一。屬質資料的集中趨勢統計量數,用眾數表示最為適當。註:眾數與中位數一樣,僅考慮其中幾個數值,故不適合代數運算,但平均則否。,-,17,例3.5眾數,例:擲一公正的骰子10次,其點數分別為3、6、2、6、1、4、6、5、3、5,求其眾數?解:點數的出現次數分別為點數1:1次、點數2:1次、點數3:2次、點數4:1次、點數5:2次、點數6:3次,故眾數M0=6。例:血型資料:A型(21),B型(5),O型(12),AB型(2),其它血型(1)M0=A型,-,18,例,例:某科技大學管理學院院長欲瞭解所屬各碩士班的報名情形,得知資料如下:財金系250人,企管系308人,資管系169人,保險系145人,會計系178人,休閒系134人,問那一碩士班最為熱門?解:各碩士班乃屬質資料,故以眾數代表最為合適,即表示眾數為企管系,報名人數最多,是為某一年度最熱門的碩士班。,-,19,集中趨勢統計量數的比較,當資料是對稱分配時,則平均數、中位數及眾數三者皆相等。當數據是屬量資料時,則適用平均數或中位數。若為屬質資料時,則應以眾數為最佳選擇。以極端值而言,平均數受其影響最為明顯,相較之下,中位數與眾數則對極端值不敏感。平均數易於作數學運算,但中位數與眾數則不易達成某些簡單的數學運算目的。,-,20,平均數、中位數及眾數三者之關係,單峰右偏:MoMe單峰左偏:0,單峰右偏(2)10,眾數中位數平均數,-,62,圖左偏資料,3.4.1偏度(續3)10,高狹峰(2)21,-,76,圖1謝比雪夫不等式之圖示,3.6.1謝比雪夫不等式(續),-,77,續例2.1您的統計成績如何?,某校抽樣50位同學的統計學期中考成績,將資料以十位數為枝、個位數為葉繪製有序枝葉圖,如圖3.10所示。圖3.10統計學期中考成績的有序枝葉圖,-,78,續例2.1謝比雪夫不等式,就例2.1之五十筆樣本資料(上頁,試問有多少比例的觀察值落於樣本平均數左右兩個樣本標準差的區間內?解:根據謝比雪夫不等式的結論,則至少有75%的資料落於該區間內。本例中,我們可以實際瞭解真正的情形。首先計算,所以s=15.38因為k=2,故,實際計數後得知有的資料落於該區間內。,-,79,3.6.2經驗法則,經驗法則(empiricalrule):當資料呈現對稱分配或鐘形分配時,則約有68%的資料落在平均數左右一個標準差的區間內。約有95%的資料落在平均數左右二個標準差的區間內。約有99.7%的資料落在平均數左右三個標準差的區間內。數學式:P(|X|k)68%,k=195%,k=299.7%,k=3,-,80,3.6.2經驗法則(續3),圖鐘形分布曲線下之面積,-,81,經驗法則的應用,根據經驗法則吾人可預測共同基金的報酬率分布情況:平均報酬率加上兩個標準差大約是最佳狀況時的報酬率;平均報酬率剪去兩個標準差大約是最差狀況時的報酬率。換言之,四個標準差大約是最好與最壞時的差距。,-,82,續例2.1經驗法則,例2.1資料呈鐘形分配試,依驗證相關的結論。解:在的區間有33個數據,占33/50=66%。在的區間有49個數據,占49/50=98%。在的區間有50個數據,占50/50=100%。以上三個比例和經驗法則的結論都非常接近,因為資料具有近似對稱分配的性質。,-,83,謝比雪夫不等式與經驗法則,例:自某大學四年級N=1080學生,測驗智力測驗,得其IQ分數(X)之平均數()=120,標準差()=8。假設資料呈鐘形分布時,試回答下列問題。(1)試利用謝比雪夫定理求出分數108132區間至少有多少人?(2)試利用經驗法則求區間a,b內約有1026個學生?(3)設依此成績學校給予IQ分數前27名學生獎金做為鼓勵,試問最低分數為多少?,-,84,-,85,-,86,-,87,3.7Z分數的應用(平均數與標準差之應用),z分數(z-score)代表任一觀測值(x)與平均數間的距離有幾個標準差的意義。母體的z分數樣本的z分數註:(i)z分數沒有單位(ii)若資料Xi呈鐘形分布時則轉為Z分數亦為鐘形分布(iii)若資料Xi呈鐘形分布時,可以Z分數比較資料排序(iv)z分數通常被稱為標準化值(standardizedvalue)(v)zi=2表xi在右邊2倍處zj=-1.5表xj在左邊1.5倍處,-,88,Z分數的性質,定理:Z=(X-)/Sxor(X-x)/x(1)zi=0(2)z=0,=0(zi-)=0or(zi-x)=0(3)變異數:Sz2=1,z2=1(4)母體:Zi2=N樣本:Zi2=n1註:(i)若資料呈鐘形分布經轉換成Z分數時,當|Zi|3,則Xi為離群值。(ii)若資料為任意分佈時,當XiQ3+1.5IQR,則Xi為離群值。,-,89,Z分數的性質,註:(iii)資料呈鐘形分布P(|Z|k)=0.68,k=1=0.95,k=2=0.99,k=3(iv)資料為任意分佈時P(|Z|k)1-1/k2,k1(v)資料呈鐘形分布當Zi=-1,則Xi=P16當Zi=1,則Xi=P84,-,90,Z分數的應用,隨機抽出n5個樣本並轉換成Z分數,其分別為Z1=1.4,Z2=-0.8,Z3=-1.2,Z4=1.6(1)試問Z5之值為何?(2)若=30,S=3,試問x5之值為何?(3)求Zi2之值解:(1)Zi=0Z5=-1(2)Z5=(X5-)/sX5=27(3)因為此為樣本資料Zi2=4,-,91,例:統計學成績進步抑或退步?,小明在班上的統計學期中考成績65分,全班的平均是62分,標準差5分;另其期末考成績為76

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论