《贰资料描述》PPT课件.ppt_第1页
《贰资料描述》PPT课件.ppt_第2页
《贰资料描述》PPT课件.ppt_第3页
《贰资料描述》PPT课件.ppt_第4页
《贰资料描述》PPT课件.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/1/30,公共管理與政治學研究方法研討班,1,贰 资料描述,陈陆辉 特聘研究员兼主任 政治大学选举研究中心 美国密西根州大政治学博士,2019/1/30,公共管理與政治學研究方法研討班,2,主题,一 何谓统计 二 次数分配表 三 中央趋势/集中趋势 四 离散程度 参考王德育第三章与第四章,2019/1/30,公共管理與政治學研究方法研討班,3,一 、何谓统计,1.描述统计(descriptive statistics) 将所观察到研究对象(母体)的相关信息加以归纳整理。 2.推论统计(inferential statistics) 以既有观察所得数据,来推论超出观察范围的对象。 信赖区间 confident interval 假设检定hypothesis testing,2019/1/30,公共管理與政治學研究方法研討班,4,二 次数分配表,在社会科学研究的资料中,通常以類別资料为主。 因此,在描述数据分布时,以次数分配表呈现是一个不错的方式。,2019/1/30,公共管理與政治學研究方法研討班,5,台灣民眾對兩岸經貿交流對總體經濟影響評估,2019/1/30,公共管理與政治學研究方法研討班,6,表3-2 民众对民进党过去一年来表现的评价(未合并资料),2019/1/30,公共管理與政治學研究方法研討班,7,累积次数分布,累积次数分布 累计该类别以及比该类别的数值还低的所有观察值的次数分布总数 百分位 percentile rank /累计相对次数分布 一个观察值的百分位,系指所有等于以及小于该观察值的所有观察值,累计后的相对次数分布。,2019/1/30,公共管理與政治學研究方法研討班,8,表3-3 民众对民进党过去一年来表现的评价(合并后资料),2019/1/30,公共管理與政治學研究方法研討班,9,用图形呈现数据,除了我们用次数分配表来呈现资料之外,我们可以用图形来加以表现。 用圆饼图(pie chart)、长条图(bar chart)来呈现類別数据 用直方图(histogram)来表现包括等距数据以及等比数据的数字数据。,2019/1/30,公共管理與政治學研究方法研討班,10,图3-1 2000年总统选举不同省籍背景选民支持对象长条图,2019/1/30,公共管理與政治學研究方法研討班,11,图3-2 2000年总统大选三位主要候选人得票百分比的圆饼图,2019/1/30,公共管理與政治學研究方法研討班,12,圖3-3 民眾對兩岸關係預期長條圖,2019/1/30,公共管理與政治學研究方法研討班,13,圖3-4 民眾對美國好惡程度分佈的直方圖,2019/1/30,公共管理與政治學研究方法研討班,14,樣本增加,分佈的變化,當樣本逐漸增加(至無限大),分佈曲線愈區平滑。,2019/1/30,公共管理與政治學研究方法研討班,15,各種分佈型態:鐘型,2019/1/30,公共管理與政治學研究方法研討班,16,各種分佈型態:U型,2019/1/30,公共管理與政治學研究方法研討班,17,偏度(skewness),(一)正偏/右偏 (二)負偏/左偏,2019/1/30,公共管理與政治學研究方法研討班,18,(一)正偏/右偏,2019/1/30,公共管理與政治學研究方法研討班,19,(二)負偏/左偏,2019/1/30,公共管理與政治學研究方法研討班,20,三 中央趋势,平均數(mean),2019/1/30,公共管理與政治學研究方法研討班,21,平均数的特性,各观察值与平均数间的差之总和等于零。 各观察值与平均数之差的平方总和最小。 易受极端值影响。 離差(deviation) 最小平方法(least square),2019/1/30,公共管理與政治學研究方法研討班,22,中位数(median),找寻一个变量中位数的方式是: 先将我们蒐集到的资料由小到大排序, 找出位于该数据中间的位置, 也就是运用累积相对次数0.50那个位置, 即为中位数所在的位置。,2019/1/30,公共管理與政治學研究方法研討班,23,找寻中位数,若是N是奇数,则中位数所在的位置是第(N+1)/2位,该数之值即为中位数 1,2,3,4,5 若是N是偶数,则中位数之值即取第(N+1)/2位的前后两个数再加以平均 1,2,3,4,4,5,2019/1/30,公共管理與政治學研究方法研討班,24,數字資料中尋找中位數的方式,2019/1/30,公共管理與政治學研究方法研討班,25,類別資料中尋找中位數的方式,2019/1/30,公共管理與政治學研究方法研討班,26,中位数的特性,为 中之最小,其中,A为任意常数。所以,就绝对离差之和而言,中位数与所有观察值的绝对离差之和为最小。 中位数不易受极端值的影响。 可惜的是,相对于平均数,中位数不易进行代数计算,所以在過去的统计分析应用机会较少。,2019/1/30,公共管理與政治學研究方法研討班,27,众数(mode),是指 观察值中出现次数最多的那一个数值 找表二與表三的眾數,2019/1/30,公共管理與政治學研究方法研討班,28,表三,2019/1/30,公共管理與政治學研究方法研討班,29,表二,2019/1/30,公共管理與政治學研究方法研討班,30,眾數的特性,適合各種類型資料 眾數的數量:單峰、雙峰、多峰 常態分佈下中央趨勢的位置,2019/1/30,公共管理與政治學研究方法研討班,31,鐘型分佈的中央趨勢,2019/1/30,公共管理與政治學研究方法研討班,32,二、正偏/右偏 的中央趨勢變化,2019/1/30,公共管理與政治學研究方法研討班,33,三、負偏/左偏的中央趨勢變化,2019/1/30,公共管理與政治學研究方法研討班,34,雙峰分佈,2019/1/30,公共管理與政治學研究方法研討班,35,描述資料的變異程度,2019/1/30,公共管理與政治學研究方法研討班,36,討論,中央趨勢是否一致? 兩筆資料的差異 如何描述兩筆資料的變異程度,2019/1/30,公共管理與政治學研究方法研討班,37,四 离散程度,全距(range,R) 四分位距(inter-quartile range,IQR) 平均绝对离差(mean absolute deviation ,MAD) 变异数(variance) 标准差(standard deviation) 离散系数(coefficient of variation,CV)。 以下一一介紹,2019/1/30,公共管理與政治學研究方法研討班,38,全距(range,R),观察值中的最大值 观察值中的最小值 = R 全距的优点为计算简便,不过,它的两个缺点是: 不够敏感 易受极端值影响,2019/1/30,公共管理與政治學研究方法研討班,39,用全距觀察三筆資料,2019/1/30,公共管理與政治學研究方法研討班,40,四分位距(inter-quartile range,IQR),將資料中的第3四分位數 (在全體資料的累積相對百分比為75%者,或是第75百分位數) 減去資料中的第1四分位數 (在全體資料的累積相對百分比為25%者,或是第25百分位數), 所得到的差距,就是四分位距。,2019/1/30,公共管理與政治學研究方法研討班,41,四分位距(IQR)分佈圖,2019/1/30,公共管理與政治學研究方法研討班,42,箱型圖的分佈,2019/1/30,公共管理與政治學研究方法研討班,43,离差(deviation),平均數的一個特性就是各觀察值與平均數間的差(也就是所謂的離差)的總何等於零,也就是: = 0 所以,我們可以運用平方或是取絕對值的方式,將離差的量留下。,2019/1/30,公共管理與政治學研究方法研討班,44,平均绝对离差(mean absolute deviation ,MAD),2019/1/30,公共管理與政治學研究方法研討班,45,变异数(variance),2019/1/30,公共管理與政治學研究方法研討班,46,變異數的性質,變異數一定為正數,若是變異數為零,則表示觀察值間沒有變異情況鞏固領導中心與離心離德 計算變異數會考慮所有觀察值,適合演算以及統計推論工作 缺點是: 因為平方了所有離差,所以, 單位變成了平方解釋較為困難,2019/1/30,公共管理與政治學研究方法研討班,47,标准差(standard deviation),標準差通常落在最小以及最大的絕對離差之間 它使用的是原單位,解釋起來較變異數為佳,2019/1/30,公共管理與政治學研究方法研討班,48,(離差)平方和:sum of squares,2019/1/30,公共管理與政治學研究方法研討班,49,比較兩組資料分佈的離散程度,第一組:0,4,4,5,7,10 第二組:0,0,1,9,10,10 平均數:5,全距:10 請計算兩組的標準差 直觀 國民黨責任區得票分佈 數據的離散程度大小與選票分佈的集散程度,2019/1/30,公共管理與政治學研究方法研討班,50,標準差的特性,大於等於0 等於0時的意義 很大時的意義 母體與樣本計算的標準差公式差異 當單位變化,標準差也會跟著變化,2019/1/30,公共管理與政治學研究方法研討班,51,典型詮釋標準差的方法,2019/1/30,公共管理與政治學研究方法研討班,52,标准常态分布图,当观察值为常态分布时,在平均数的 正负一个标准差的区间之内,涵盖了68%的所有观察值 正负两个标准差的区间之内,包括了95%的所有观察值, 正负三个标准差的区间之内,包括了99.7%的所有观察值。,2019/1/30,公共管理與政治學研究方法研討班,53,离散系数(coefficient of variation,CV),它的测量方式就是将变量的标准差除以平均数,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论