统计学 第2章 单变量统计描述分析_第1页
统计学 第2章 单变量统计描述分析_第2页
统计学 第2章 单变量统计描述分析_第3页
统计学 第2章 单变量统计描述分析_第4页
统计学 第2章 单变量统计描述分析_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章单变量统计描述分析,第一节分布统计表统计图第二节集中趋势测量法第三节离散趋势测量法,第一节分布统计表统计图,分布:变量的各个取值出现的次数(频数)或频次(频率),称为频数或频次分布常用统计表和统计图来表示分布。,分布:变量的各个取值出现的次数(频数)或频次(频率),称为频数或频次分布常用统计表和统计图来表示分布。,一、数据的计量尺度统计数据是对客观现象计量的结果。按照对事物计量的精确程度,可将所采用的计量尺度由低级到高级分为四个层次:定类尺度(NominalLevel)定序尺度(OrdinalLevel)定距尺度(IntervalLevel)定比尺度(RatioLevel),(一)定类尺度(列名尺度):按照事物的某种属性对其进行平行的分类或分组。例1:人口的性别(男、女);企业的所有制性质(国有、股份、民营等)特点:1.定类尺度只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同,顺序可以任意改变;2.对定类尺度的计量结果,可以且只能计算每一类别中各元素个体出现的频数(frequency)。注意:对事物进行分类时,必须符合穷尽和互斥要求。,(二)定序尺度(顺序尺度):是对事物之间等级或顺序差别的一种测度。例2:产品等级(一等品、二等品)考试成绩(优、良、中、可、差)特点:1.不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序);2.无法测出类别之间的准确差值,因此该尺度的计量结果只能排序,不能进行算术运算。,(三)定距尺度(间隔尺度):是对事物类别或次序之间间距的测度。例3:100分制考试成绩;摄氏温度对不同地区温度的测量特点:1.不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少;2.定距尺度通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值;3.计量结果可以进行加减运算(加减运算有意义);4.“0”是测量尺度上的一个测量点,并不代表“没有”,(四)定比尺度(比率尺度):是能够测算两个测度值之间比值的一种计量尺度。例4:电视收看时长;职工月收入;距离、重量特点:1.与定距尺度属于同一层次,计量结果也表现为数值;2.除了具有其他三种计量尺度的全部特点外,还具有可计算两个测度值之间比值的特点;3.“0”表示“没有”,即它有一固定的绝对“零点”,因此它可进行加、减、乘、除运算(而定距尺度只可进行加减运算),(四)定比尺度,1.高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但反之不行;2.可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来。指出下面变量的测量尺度:学生住址距学校的距离;学生某门课的一次测验成绩(5分制);学生的出生地;按年级分类的高校学生每周学生学习的小时数,二、统计表(频数分布表、百分比分布表),制作统计表的要求1.要有表号、表头、标识行、主体行、表尾2.表的两端不封口3.简单明了,中间不画线4.百分比分布表要有样本单位总数一般用得比较多的是百分比分布表,因为百分比分布表可以还原成频数分布表,统计表,家庭结构的频次分布(地,2010.6),表头,标识行,主体行,源自,表尾,(表2-1),不同类型变量的取值特点及统计表特点,不同类型变量的取值特点,统计表(频数分布表、百分比分布表),怎么样制作统计表?定类变量定序变量定距/定比变量,各类变量所对应统计表的特点定类变量百分比统计表中最后要注明统计总数。变量的取值次序可根据需要调整。定序变量定序变量的取值有大小次序之分,应保留其变化趋势,不要打乱。,定距变量离散型定距变量的制表方法与定序变量的制表方法相同。将连续型定距变量的变量值分为若干区间或组,然后统计每个组内的频次或百分数组距式分组。,定距变量分组的注意问题,1.等距分组与非等距分组:一般采用等距分组,有时非等距分组更能反映现象的本质。,2.组数:,3.决定分点的精度:分组点的小数点精确位数比原统计资料高一位。,标明组界:根据分组要求得到的分组点,其精度与原始数据相同,前后分组点不连续。真实组界:将标明组界的精度提高一位,使前后分组点连续。,例:设一统计资料中变量年龄的取值范围为18岁,按2岁一组,写出标明组界和真实组界。,问题:真实组距是否违反变量值必须互斥的原则?注意:只有定距变量的统计表存在分组问题!规定:组限重迭的组距式分组各组不包括它的上限,例:100个同龄儿童的身高统计(单位:米),表2-5,步骤1:收集数据,写成数据表。步骤2:找出数据中最大值L,最小值S。步骤3:根据表2-4取合适的分组数。此处K=10。步骤4:计算组距h=(LS)K。结果比原始数据多精确小数点后一位。,步骤5:根据组距h和分点精度比原统计数据高一位的原则,将数据分组。步骤6:计算各组的中心值bi。bi=(第i组真实下界值第i组真实上界值)2步骤7:作频次分布表。,统计表的特点不需要文字叙述就能反映出资料的特性及资料间的关系。有较高的精确性,但不直观。,表2-6,统计表的特点不需要文字叙述就能反映出资料的特性及资料间的关系。有较高的精确性,但不直观。,三、统计图,例:考察马萨诸塞州NewBedford地方法庭判决的72犯人在服完刑一年到两年半的时间里是否又因新的罪行被判决。结果24个犯了新罪,而剩下的48个在数据收集时还没有。,33%,67%,33%,67%,图2-1,图2-2,统计图(分布图)定类变量:圆瓣图(圆饼图);条形图圆瓣图:用圆形代表现象的总体,用圆瓣代表现象中一种情况,其大小代表变量取值在总体中所占的百分数。条形图:用长条的高度来表示资料类别的次数或百分数。一般画成等宽长条。若变量是定类变量,则长条排列次序可以任意,条形离散。,条形图优点:易于显示每一变量的观测值。条形图缺点:不易显示总的观测数。图2-4不易于显示第一类外的其它类观测数,且变量值越多,等高不等宽的条形图越复杂。注意:上述条形图的值都是从0开始,然而有时也不是这样。,思考:怎样为两个分类变量作图?例:马萨诸塞州NewBedford地方法庭的法官RobertKane在马萨诸塞州大学RobertP.Waxler教授鼓励下,让在他的法庭上被判罪的犯人选择进监狱或上由Robert教授教的文学课。印地安那大学的Roger教授跟踪调查了选择听课的32人,发现以后又有6人犯了新罪;而选择去监狱的40人中,18人在被释放后又犯了新罪。(来源:TheNewYorkTimes,Oct.6,1993),罪犯数(人),文学课监狱,(2)定序变量:条形图(长条按序排列,条形可以离散,也可以紧挨)。(3)定距变量:直方图;折线图。直方图:由紧挨着的长条组成,但长条的宽度有意义。以长条的宽度表示组距,条形的长度表示频次密度或相对频次密度(频率密度),长条的面积来表示频次或相对频次。,频次密度=,相对频次密度=,注意:直方图仅适用于定距变量。当变量取值是等距分组时,直方图和条形图在本质上是相同的;但在非等距分组的情况下,直方图和条形图完全不同,尤其应该注意。,(1)定类变量:饼形图;条形图。(2)定序变量:条形图(长条按序排列,条形可以离散,也可以紧挨)。(3)定距(分组)变量:直方图;折线图。直方图:由紧挨着的长条组成,但长条的宽度有意义。以长条的宽度表示组距,条形的长度表示频次密度或相对频次密度(频率密度),长条的面积来表示频次或相对频次。,表2-4一星

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论