让数字会说话三f_第1页
让数字会说话三f_第2页
让数字会说话三f_第3页
让数字会说话三f_第4页
让数字会说话三f_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

描述統計 Descriptive Statistics,量化研究法二統計原理與分析技術,第2章,2,描述統計概說,描述統計的定義一套用以整理、描述、解釋資料的系統方法與統計技術數據從初始狀態(raw data)成為可被理解的統計量數(statistic)的一套操作程序透過統計量數來描述大量資料,並作為彼此溝通的共同符號語言,3,量化數據的處理,統計圖表運用次數分配表來整理並描繪變數數值分佈情形利用統計圖表來表現出數據的特性與分佈情形描述統計量統計量(statistic):由樣本所獲得的原始資料所計算推導出的統計量數當統計量由樣本所獲得的數據計算得出,是描述樣本數據特性的最佳指標,通常以英文字母表示,例如 與s。 當統計量由母體數據,描述統計所產生的量數稱為參數或母數(parameter),用以描述母體數據的分佈特性,通常以希臘字母表示,例如與。,4,次數分配,功能提供原始資料的基本資訊作為資料檢查的判讀工具提供統計技術選擇與如何分析的線索傳統作法將原始資料進行初步分類以人工劃記方式編碼(coding),具有類別、次數、累積次數、百分比等訊息的次數分配表基本欄位變項數值(value):位置於左側數值次數(frequencies):位置於右側,5,以人工劃記所製作的次數分配表,6,SPSS製作的次數分配表,7,分組次數分配表,組數以10至20組之間為宜,組距則以2、5、10三個可將10整除的因數為宜。組數越多表格越大,但是資訊較豐富,組數越少表格越精簡,但遺失的資訊較多。,8,次數分配各相關名詞,次數分配(frequency distribution): 由某個變項各數值(各組)的次數所組成的分配,如前表的第一欄。相對次數分配(relative frequency distribution): 由某個變項各數值(各組)的次數除以總數(稱為相對次數)所組成的分配。如果把相對次數乘以100%,即為百分比分配,如前表的第二欄。有效百分比分配(valid percentage frequency distribution): 由某個變項各數值(各組)次數除以扣除遺漏值的次數乘以100後的分配,如前表的第三欄。(在沒有遺漏值的情況下,有效百分比分配等於百分比分配)累積次數分配(cumulative frequency distribution): 由某個變項各數值(各組)的次數往上或往下累計所組成的分配。累積相對次數分配(cumulative relative frequency distribution): 由某個變項各數值(各組)的次數除以總數,以往上或往下累計所組成的分配。如果把相對次數乘以100%後再累計,即為累積百分比分配,如前表的第四欄。,9,集中量數,集中量數(measures of central location)用以描述一組數據或一個分配集中點的統計量數一個能夠描述數據的共同落點的指標。常用的集中量數有平均數、中位數及眾數,10,平均數,平均數(mean;以M表示)取某一變項的所有數值的總和除以觀察值個數所得到的值因為是將數據直接以數學算式來計算平均值,又稱為算術平均數(arithmetic mean)。母體資料得出的平均數需以希臘字表示樣本資料得出的平均數以表示,11,中位數,中位數(median;或以Mdn表示)又稱為中數、百分等級為50的百分位數(P50)或第二四分位數(Q2; second quartile)。 將某一個變項的數據依大至小或由小至大排列,取位居最中間、或能夠均勻對分全體觀察值的分數在中位數之上與之下,各有50%的觀察值。,50、55、60、60、60、65、66、70、90,50、55、60、60、60、65、66、70、90 、95,62.5,12,眾數,眾數(mode;或以Mo表示)一組分數中,出現次數最多的一個分數一組數據中最典型(typical)的數值或次數分配最高點所對應的分數是各集中量數當中,最容易辨認的量數一個分配有兩個分數具有相同的最高次數,此時即出現了雙眾數,稱為雙峰分配(bimodal distribution),50、55、60、60、60、65、66、70、90,13,集中量數的特性與優缺點比較,14,三種集中量數與分配形狀的關係,15,變異量數,變異量數(measures of variation)或離散量數用來描述觀察值在某一個變項上的分數分散情形的統計量描述統計中,集中量數必須搭配變異量數,才能反應一組數據的分佈特徵常用的變異量數包括全距、四分差、變異數及標準差,16,全距,全距(range)一組分數中最大值(Xmax)與最小值(Xmin)之差是一群分數變異情形最粗略的指標全距容易計算,適用性高,可以應用在名義變項與順序變項,來求出變項當中類別的多寡。缺點是不精確也不穩定,無法反應一個分配的每個數值的狀態。,17,四分差,四分差(semi-interquartile range; QR)是一組數據當中的第三四分位數(區隔高分端的前25%的分數,簡稱Q3)與第一四分位數(區隔低分端的後25%的分數,簡稱Q1)距離的一半中間百分之五十的樣本分數差距的二分之一,18,離均差與平方和,離均差一組數據中,各分數與平均數的距離,通常以小寫的x來表示當離均差為正值時,表示分數落在平均數的右方離均差為負值時,表示分數落在平均數的左方平均數是每一個分數加總後的平均值,為一組分數的重心位置離均差平方和(sum of squares; SS) SS的概念可以類比為面積的概念,表示分數與平均數變異的面積和,deviation score= x =(X - ),19,變異數以或MS(mean square)表示為平均化的離均差平方和 標準差變異數的開方,以表示。標準差或變異數越大者,表示該分配的變異情形較大。,20,變異數的不偏估計數(unbiaed estimator),標準差與變異數的不偏估計數的主要差別在於分母項為N-1而非原來的N N-1稱為自由度(degree of freedom;df),表示一組分數當中,可以自由變動的分數的個數。在離均差的計算上,自由度為樣本數減1,表示在N個觀察值中,只有N-1個數字可以自由運用於離均差的計算。,21,變異係數,變異係數(coefficient of variation)可去除單位對於變異量數放大作用 變異係數(coefficient of variation)來去除單位對於變異量數放大作用 CV值是把標準差除以平均數,是一個沒有單位的比值,也稱為相對差或相對差異係數(coefficient of relative variability) 變異係數是用來反應各變項變異狀況的良好指標,22,變異量數的特性與優缺點比較,23,偏態,描述一個變項的對稱性(symmetry)的量數稱為偏態係數 不對稱的資料稱為偏態資料,依其方向可分為負偏(negatively skewed)(或左偏,即左側具有偏離值)、正偏(positively skewed)(或右偏,即右側具有偏離值)與對稱(symmetrical)三種情形,24,三級動差(m3)可反應偏態情形,25,地板與天花板效應,地板效應(floor effect)指數據多數集中在偏低的一端,但在高分端則有極端值,分數不容易突破低分端,但會往高分端延伸,彷彿有一個地板(或真的存在一個低分限制條件)阻擋了數據往低分移動。由於地板阻隔作用,地板效應常伴隨正偏態現象。 天花板效應(ceiling effect)則與負偏態有關,是指數據多數集中在偏高的一端,但在低分端則有極端值,分數不容易突破高分端,彷彿有一個天花板(或真的存在一個高分限制條件)阻擋了數據往高分移動。,26,峰度,是指一個次數分配集中部份的陡峭程度。兩個分配都是對稱的單峰鐘型曲線時,並不一定具有一樣的平坦或陡峭形態(峰度)。一個對稱的鐘型分配,變項的數值會集中於眾數所在位置,如果集中於眾數附近的分數多,分散於兩側的分數少,將形成高狹峰(leptokurtic)的分配當集中於眾數附近的分數較少,兩側分數多,則形成低闊峰(platykurtic)。在常態分配時的理想峰度稱為常態峰(mesokurtic)。,27,g2係數為標準分數取四次方後的平均值。值得注意的是公式中減3,目的在使g2係數在常態分配時維持為0的數值,以利判別使用。 小樣本時,g2也非不偏估計數,因此求樣本的峰度時多以來計算峰度。隨著樣本數的擴大,g2與數值逐漸接近而無差異。,28,偏態與峰度係數的特性,偏態與峰度係數是一種標準分數的概念,因此不受分配變異程度的影響而可相互比較 偏態與峰度係數具有標準分數的特性,因此均以0為常態值,也就是說,當g1與g2(或不偏估計係數)為0或接近0之時,次數分配可以說是一個對稱、不偏的常態峰分配 偏態與峰度係數在正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论