定量分析方法第5章-2014年_第1页
定量分析方法第5章-2014年_第2页
定量分析方法第5章-2014年_第3页
定量分析方法第5章-2014年_第4页
定量分析方法第5章-2014年_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章统计数据的整理与显示第一节数据的预处理第二节品质数据的整理与显示第三节数值型数据的整理与显示第一节数据的预处理数据的审核数据的筛选数据的排序数据的审核

(原始数据)审核数据准确性的方法逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定距和定比数据的审核数据的审核

(第二手数据)适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要时效性审核应尽可能使用最新的统计数据确认是否必要做进一步的加工整理数据的筛选对审核过程中发现的错误应尽可能予以纠正当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出数据的排序

(要点)按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成(SPSS--rankcases,sortcases)数据的排序的方法

定类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分定距和定比数据的排序递增排序:设一组数据为X1,X2,…,XN,递增排序后可表示为:X(1)<X(2)<…<X(N)递减排序可表示为:X(1)>X(2)>…>X(N)第二节品质数据的整理与显示定类数据的整理与显示定序数据的整理与显示定类数据的整理与显示

(基本问题)要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的对定类数据和定序数据主要是做分类整理对定距数据和定比数据则主要是做分组整理适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据定类数据的整理与显示定类数据的整理

(基本过程)列出各类别计算各类别的频数制作频数分布表用图形显示数据

定类数据的整理

(可计算的指标)1.频数:落在各类别中的数据个数2.比例:某一类别数据占全部数据的比值3.百分比:将对比的基数作为100而计算的比值4.比率:不同类别数值的比值定类数据整理—频数分布表

(实例)【例5.1】为研究咖啡市场的状况,一家广告公司在某城市随机抽取4662人就广告问题做了问卷调查,其中的一个问题是“您比较喜欢哪个牌子得咖啡?”

1.AA;2.BB;3.CC;4.DD;5.EE;6.FF。Samples-coffee.sav可以通过原始数据得频数分布表得到表5-1喜欢的咖啡品牌的频数表定类数据的图示—条形图

(条形图的制作)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图定类数据的图示—条形图

(由SPSS绘制的条形图)定类数据的图示—圆形图

(圆形图的制作)也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的。定类数据的图示—圆形图

(由SPSS绘制的圆形图)定类数据的图示—环形图

(环形图的制作)环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于进行比较研究环形图可用于展示定类和定序的数据品质数据的图示—环形图

(由Excel绘制的环形图)8%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

图5-3甲乙两城市家庭对住房状况的评价定序数据的整理与显示定序数据的整理

(可计算的指标)1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率(百分比)逐级累加定序数据频数分布表

(实例)【例5.2】在一项关于组织知识管理问题的研究中,研究人员调查了168位在政府部门和企业工作的员工,其中的一个问题是:“您通过书籍、期刊报纸等传统媒介获取信息和知识的频率如何

?1.经常;2.偶尔;3.很少;4.从来没有表5-2通过传统媒介获取信息的频数分布表第三节数值型数据的整理与显示数据的分组数值型数据的图示频数分布的类型频数分布表的编制编制频数分布表的步骤确定组数编制频数分布表的步骤确定组距计算频数编制表格分组方法分组方法等距分组异距分组单变量值分组组距分组单变量值分组

(要点)将一个变量值作为一组适合于离散变量适合于变量值较少的情况频数分布表的编制

(实例)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例5.3】某政府机构每月接待外宾人数如下(单位:个)。试采用单变量值对数据进行分组。

单变量值分组表

(实例)表5-4某政府机构每月接待人数人数(个)频数(人)人数(个)频数(人)人数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112组距分组

(要点)将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组~~~~~组距分组

(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即

组距=(最大值-最小值)÷组数根据分组整理成频数分布表

组距分组

(几个概念)下限:一个组的最小值上限:一个组的最大值组距:上限与下限之差组中值:下限与上限之间的中点值下限值+上限值2组中值=等距分组表

(上下组限重叠)表5-5某机构接待人数分组表按人数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100等距分组表

(上下组限间断)表5-6某机构接待人数分组表按人数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100等距分组表

(使用开口组)表5-7某机构接待人数分组表按人数分组频数(人)频率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合计50100组距分组与不等距分组

(在表现频数分布上的差异)等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况分组技巧组距一般选择5,10的倍数组距的确定要根据实际情况,力求使分布平滑可以先用窄间距分类,然后适当放宽间距间距太小,频数分布会显得凌乱或不规则,间距太大,会损失大量信息。虽然有确定分组数的公式,但最佳决定要依据常识和频数表的使用目的。分组技巧还可以使用不等距分组,即使用不同宽度的间距,让某些特殊的间距比别的间距宽或者使用开放间距(会带来很多麻烦)39.2%11.6%36.3%26.3%37.1%15.3%27.3%23.5%13.3%28.126.327.135.123.026.131.036.327.322.833.425.621.646.87.116.826.946.644.358.133.113.427.833.422.142.733.036.320.79.326.329.939.45.324.317.818.237.121.617.512.323.637.237.125.127.128.827.833.626.528.326.924.841.033.619.343.728.219.983.647.14.89.739.532.322.415.126.326.129.214.314.621.637.937.124.910.020.711.822.936.046.121.513.3例5.4下列数据是某城市教育委员会的选举中,93个普查区合格选民实际参加选举的比例:表5-8数据按5%的间距分类时的频数分布间距频数f间距频数f0.0-4.9145.0-49.945.0-9.9450.0-54.9010.0-14.9955.0-59.9115.0-19.9860.0-64.9020.0-24.91665.0-69.9025.0-29.92370.0-74.9030.0-34.9875.0-79.9035.0-39.91480.0-84.9140.0-44.9493分布不太规则表5-9数据按10%的间距分类时的频数分布间距频数f0.0-9.9510.0-19.91720.0-29.93930.0-39.92240.0-49.9850.0-59.9160.0-69.9070.0-79.9080.0-89.9193分布较平滑表5-10数据按20%的间距分类时的频数分布间距频数f0.0-19.92220.0-39.96140.0-59.9960.0-79.9080.0-99.9193有些含糊不清组距分组

(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即

组距=(最大值-最小值)÷组数根据分组整理成频数分布表

数值型数据的图示分组数据—直方图

(直方图的制作)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)分组数据—直方图

(直方图的绘制)频数(人)1512963105110115120125130135140月接待人数(个)图5-5某机构接待人数直方图我一眼就看出来了,大多数的日子接待人数在120-125之间!分组数据—直方图

(直方图与条形图的区别)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列分组数据—折线图

(折线图的制作)折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的1512963105110115120125130135140接待人数(个)频数(人)分组数据—折线图

(折线图的绘制)图5-6机构接待人数折线图时间序列数据—线图

(实例)【例5.5】已知1991~1998年我国城乡居民家庭的人均收入数据如表5-11。试绘制线图¥

表5-111991~1998年城乡居民家庭人均收入年份城镇居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.0时间序列数据

(由SPSS绘制的线图先定义日期definedates然后timeseries—sequencecharts)SPSS做图表示定量变量常用的图形:

直方图、盒型图、茎叶图、散点图直方图

对于一个定量变量,比如某个地区(地区1)学校高三男生的身高;有163个度量。Spss选项:Graphs-Histogram。横坐标是身高区间,而纵坐标为各种身高区间的身高的频数。图5-8交互式直方图interactive盒型图比直方图简单一些的是盒形图(boxplot,又称箱图).盒子的中间横线是数据的中位数(median).即数据中占据中间位子的数,即数据中有一半大于中位数(在其之上),另一半小于中位数(在其之下)。

Spss选项:Graphs-Boxplot图5-9茎叶图(stem-and-leafplots)茎叶图既展示了分布形状又有原始数据。SPSS选项:Analyze-DescriptiveStatistics-Explore。其中茎叶图中茎的单位为10cm,而叶子为个位。地区1高三男生高度Stem-and-LeafPlot

Frequency

Stem&Leaf

9.00

15.001223344

17.00

15.55666667778899999

20.00

16.01112222223333333444

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论