




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用统计学与SPSS统计软件的运用,主讲人:郑康宁 班级:旅游1001-1003,人力1001-1006 课程邮箱: 邮箱密码:bf123456 上课时间:2012年3月2728日,第三章 样本数据特征的初步分析,3.1样本数据结构的基本特征:频次与频率 3.1.1频次与频率的基本概念 同一个数据(样本值)出现的次数(频次)。 如果样本数据集合中的数据总个数是n,那么,某个样本值出现的频率,可以表示为:,3.1样本数据结构的基本特征:频次与频率,3.1样本数据结构的基本特征:频次与频率,3.1.2观察样本数据基本特征(频次与频率)的图形方法 1、表示频次与频率的饼图(Pie Chart) 2、表示频次与频率的条形图,3.1样本数据结构的基本特征:频次与频率,3.1.3样本数据的基本特征的延伸:累积频率,3.1样本数据结构的基本特征:频次与频率,3.1.3样本数据的基本特征的延伸:累积频率,3.1样本数据结构的基本特征:频次与频率,3.2观察刻度级样本数据结构的茎叶图与直方图方法,3.2.1茎叶图的概念与做法 1、茎叶图的基本概念与适用范围 茎-叶的基本含义是,按照某个一致的规则,把所有的样本值分成“茎节”和“叶”两个部分。“茎节”在左,“叶”在右。“茎节”、“叶”之间,用小数点隔开。 例如,845,8是“茎节”,45是“叶”,其表达方式是“茎节.叶”“8.45”。 例如,845,84是“茎节”,5是“叶”,其表达方式是“茎节.叶”“84.5”。,3.2观察刻度级样本数据结构的茎叶图与直方图方法,适用于刻度级数据: 刻度级数据(比率级数据和间距级数据) 顺序级数据 作用:展示刻度级数据的频率结构,3.2观察刻度级样本数据结构的茎叶图与直方图方法,3.2观察刻度级样本数据结构的茎叶图与直方图方法,茎节的宽度:茎节的宽度“10”. 茎节的长度:每个茎节所允许覆盖的“叶”的数字范围的“最大值-最小值+1”. 左图茎节的长度“9-0+1” 右图茎节的长度“4-0+1”,3.2观察刻度级样本数据结构的茎叶图与直方图方法,3.2.2直方图的概念与作法 1、直方图的基本概念 直方图法是从总体中随机抽取样本,将从样本中获得的数据进行整理后,用一系列等宽的矩形来表示数据。宽度表示数据范围的间隔,高度表示在给定间隔内的数据的数目,变化的高度表示数据分布的情况。通过对数据分布形态与相对位置的研究,可以掌握过程的波动情况。,3.2观察刻度级样本数据结构的茎叶图与直方图方法,2、直方图的作图步骤 某班男生身高为例,3.2观察刻度级样本数据结构的茎叶图与直方图方法,直方图的作图步骤如下: 第一步,收集数据。 第二步,确定分组的组数和组距。 例3.2.1,教材78,3.2观察刻度级样本数据结构的茎叶图与直方图方法,注意:分组时,若组数取得太多,每组内出现的数据个数很少,甚至为零,作出的直方图过于分散或呈现锯齿状;若组数取得很少,则数据会集中在少数组中,而掩盖了数据的差异。所以分组组数取得太多或太少都不合适。,3.2观察刻度级样本数据结构的茎叶图与直方图方法,第三步,确定各组界限。第一组的上下界限为(数据中最小值)(区间长度/2),第一组的上限就是第二组的下限,第二组的上限为第二组下限加上(区间长度),其它以此类推。 第一组为160.5/2,第二组为(160.5/2)+0.5.,3.2观察刻度级样本数据结构的茎叶图与直方图方法,第四步,制作频数分布表。各组频数填好后检查一下其总数是否与数据总数相符,避免重复或遗漏。 第五步,画直方图。 以横坐标表示质量特性,纵坐标为频数,在横轴上标明各组距为底,频数为高,画出一系列的直方柱,就成了直方图。,3.2观察刻度级样本数据结构的茎叶图与直方图方法,条形图与直方图: 条形图不对数据进行分组 直方图需要对数据进行分组,3.3样本数据的位置特征:对数据中心的描述,3.3.1样本众数 定义1:样本数据出现频次最高的那个样本值,称为样本众数。在一般情况下,“样本众数”被简称为“众数”。 如果样本数据集合中“频次最高的样本值”只有一个,则称此样本值为单一众数,简称为众数。当样本数据集合中,有多个“频次最高的样本值”时,则这些样本值就都是该数据集合的众数。此时的众数,称为“复众数”。 广义上说,众数的概念适用于所有测度级别的样本数据,但对于初步表达样本数据集合的“中心”位置而言,序次级以上的数据集合的众数,更有效一些。,3.3样本数据的位置特征:对数据中心的描述,定义2:对于刻度级的样本数据集合,在对数据的等区间分组的直方图中,最高的矩形所示的数据区间,称为该数据集合的众数区间,简称为众数。众数区间也有单一众数与复众数之分。,3.3样本数据的位置特征:对数据中心的描述,3.3.2样本的中位数 将一组数据按大小顺序排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。,3.3样本数据的位置特征:对数据中心的描述,3.3样本数据的位置特征:对数据中心的描述,注意 当样本容量为奇数时,样本中位数适用于顺序级以上的样本数据集合。 当样本容量为偶数时,样本中位数仅适用于刻度级以上的样本数据集合。,3.3样本数据的位置特征:对数据中心的描述,3.3.3样本均值 仅适用于刻度级别的数据(比率级数据和间距级数据),3.4样本数据的离散特征,3.4.1对样本数据离散特征的点状描述:极值、四分点与百分位点 1、极大值与极小值 将样本数据从大到小进行排列,位于序列第一的数据是极小值,位于序列最后一个的数据为极大值。,3.4样本数据的离散特征,2、下四分点和上四分点 通过四分位数基本能看出整个样本数据的分布情况,左偏,右偏,对称? 下四分点把排序后的样本数据集合分成了左右两部分,使左边部分包含25%的样本总个数,右边部分包含75%的样本总个数。 上四分点把排序后的样本数据集合分成了左右两部分,使左边部分包含75%的样本总个数,右边部分包含25%的样本总个数。 上、下四分点在一定意义上反映了样本数据的离散情况。,3.4样本数据的离散特征,3.4样本数据的离散特征,3.4样本数据的离散特征,3.4样本数据的离散特征,3、上下百分位点 下十分点把排序后的样本数据集合分成了左右两部分,使左边部分包含10%的样本总个数,右边部分包含90%的样本总个数。 上十分点把排序后的样本数据集合分成了左右两部分,使左边部分包含90%的样本总个数,右边部分包含10%的样本总个数。,3.4样本数据的离散特征,3.4.2对样本数据离散特征的区间描述:极差、四分位距与离差,3.4样本数据的离散特征,3.4样本数据的离散特征,3.4.3离散状况的统计描述1:样本方差,3.4样本数据的离散特征,3.4.3离散状况的统计描述2:变异系数 标准差包括了度量单位的影响,只有剔除度量单位的影响后,标准差之间的比较才有意义。,3.5样本数据特征的综合表达: 箱形图,3.5.1箱形图的基本构造 箱形图由一个矩形和向外延伸的细线组成,箱形图的结构示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 滑雪教练入职考试试题及答案
- 本科内科考试试题及答案
- 公务员日语测试题及答案
- 济南焊工证考试试题及答案
- 口译短语考试试题及答案
- 检索与利用考试试题及答案
- 广东省揭阳市揭东区2021-2022学年高一下学期期末 化学含答案
- 辽宁省锦州市2023-2024学年高一上学期期末考政治含解析
- 浙江省丽水市2022-2023学年高二上学期1月期末生物无答案
- 全国各省中考相关考点分析,中考专题复习生物清单07生物及其与环境的关系(原卷版)
- 三年级下第五单元课件
- 富血小板血浆(PRP)临床实践与病例分享课件
- 高考志愿填报师资格新版考试题及答案
- 化妆品合伙人协议书模板
- 2024-2025学年全国中学生天文知识竞赛考试题库(含答案)
- 农产品包装设计合同
- 巨量引擎信息流广告(初级)认证理论试题库资料(含答案)
- 建筑幕墙安装工程安全施工施工工艺技术
- CJT 306-2009 建设事业非接触式CPU卡芯片技术要求
- 情绪调节的认知神经机制
- 供货方案及供货计划(2篇)
评论
0/150
提交评论