




已阅读5页,还剩106页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章定量数据的统计描述 统计学 2 结构体系 定量数据的频数分布 定量数据的图形描述 定量数据的特征数字 数据的预处理 3 数据审核 数据筛选 数据排序 第一节数据的预处理 4 一 数据审核 完整性审核检查应调查的个体是否有遗漏 所有的调查项目是否填写齐全 原始数据审核 准确性审核检查数据是否真实反映客观实际情况 内容是否符合实际 数据是否有错误 是否存在异常值 5 对于通过其他渠道取得的二手数据 应着重审核数据的适用性和时效性 应弄清楚数据的来源以及有关的背景材料 以便确定这些数据是否符合分析研究的需要 对于时效性较强的问题 如果所取得的数据过于滞后 就可能失去研究的意义 6 二 数据筛选 将某些不符合要求的数据或有明显错误的数据予以剔除 数据筛选 将符合某种特定条件的数据筛选出来 根据需要找出符合特定条件的某类数据 7 表中是8名学生4门课程的考试成绩数据 单位 分 试找出统计学成绩等于75分的学生 英语成绩最高的前三名学生 四门课程成绩都大于70分的学生 注意 满足多项条件时 数据清单上面至少留出三行作为条件区域 8 用Excel进行数据筛选的操作步骤 第一步 选择 数据 菜单 并选择 筛选 命令 如果要筛选出满足给定的条件的数据 可使用 自动筛选 命令 这时会在第一行出现下拉箭头 用鼠标点击箭头 9 第二步 在下拉箭头方框内选择要筛选出的数据 比如 要筛选出统计学成绩为75分的学生 选择75 单击 确定 即可 10 第三步 要筛选出英语成绩最高的前三名学生 可选择 前10个 并在对话框中输入数据3 单击 确定 即可 11 第四步 如果要筛选出四门课程成绩都大于70分的学生 由于设定的条件比较多 需要使用 高级筛选 命令 使用高级筛选时 必须建立条件区域 这时需要在数据清单上面至少留出三行作为条件区域 然后在 列表区域 中选中要筛选的数据清单 在 条件区域 中选择匹配的条件 12 三 数据排序 数据排序 按一定顺序将数据排列 以便研究者通过浏览数据发现一些明显的特征或趋势 找到解决问题的线索 排序有助于对数据进行检查纠错 以及为重新归类或分组等提供依据在某些场合下 排序本身就是分析的目的之一排序可以借助计算机来完成 13 定性数据的排序字母型 排序有升序降序之分 但习惯上用升序汉字型 可按汉字的首位拼音字母排列 也可按笔画排序定量数据的排序递增排序 设一组数据为X1 X2 XN 递增排序后可表示为 X 1 X 2 X N 14 第二节定量数据的频数分布 频数分布是统计资料整理过程中经常使用的一种方法 通过编制频数分布 可以使资料的表现形式更加紧凑 综合信息的体现更加突出 根据统计研究的需要 将原始数据按照某种标准分成不同的组别 分组后的数据称为分组数据 数据分组 数据经分组后再计算出各组中数据出现的频数 形成频数分布表 频数分布 15 数据分组方法 16 单变量值分组 将一个变量值作为一组适合于离散变量适合于变量值较少的情况 17 单变量值分组的频数分布表 18 组距分组 将全部变量值依次划分为若干个区间 将变量值的一个区间作为一组适合于连续变量或变量值较多的情况遵循 不重不漏 的原则可采用等距分组或不等距分组 19 组距分组的几个概念 下限 一个组的最小值上限 一个组的最大值组距 上限与下限之差组中值 下限与上限之间的中点值 下限 上限 组中值 20 21 手工编制数据频数分布 步骤 一 对原始数据进行排序 找出其中的最大和最小的数 表3 1中 max 9 5 min 0 7 二 确定组数 组数的确定需要考虑观察值变化的范围 使既定的分组能把各项数据都包括进来 组数在5 20为宜 数据规模比较小 分成5组即可 本例 分为5组 22 三 确定组距可根据全部数据的最大值和最小值及所分的组数来确定 组距的近似计算公式 通过计算 组距可能是整数或带有小数 可对求得的组距进行修饰 把组距取成整数 本例中 计算的组距值为1 76 可近似取2 23 四 确定组限组限 组距两端的数值 组限的确定要做到每一个观察值都能划分到相应的组别中 而且仅能划分到一个组中 第一组的下限要比最小的观察值小 最后一组的上限要比最大的观察值大 本例中 组限为0 2 2 4 4 6 6 8 8 10 24 五 按组归类统计将各个观察值按组别进行归类汇总 记录各个组观察值总共发生的次数 本例 0 2组的数据有4个 2 4组的数据有13个 4 6组的数据有16个 6 8组的数据有14个 8 10组的数据有3个 25 六 编制表格 将分组 每组频数用表格形式展示出来 得到频数分布表 本例的频数分布表 26 用Excel制作频数分布表 1 数据分析直方图 2 frequency函数 27 1 数据分析直方图 第一步 在接收区域输入上限值 28 第二步 工具 数据分析 直方图 29 第三步 选择 输入区域 和 接收区域 30 1 2 3 4 选择与接受区域相邻近的单元格区域 作为频数分布表输出的区域 选择统计函数中的Frequency函数 在对话框Date array后输入数据区域 在Bins array后输入接受区域 同时按下Ctrl Shift Enter组合键 即得到频数分布表 2 frequency函数 31 频率 各个组中的频数与所有组频数之和的比率 频率 32 本例中 各组的频率为 33 频数分布的累积量 将各组的频数逐级累加起来得到的频数 累积频数 将各组的频率逐级累加起来 累积频率 频数分布的累积量包括大于制累积量和小于制累积量 大于制累积量是大于某个组下限值的频数 率 之和 小于制累积量是小于某个组上限值的频数 率 之和 34 大于某个组下限值 小于某个组上限值 35 第三节定量数据的图形描述 直方图 折线图与曲线图 累积频数分布图 茎叶图 时间序列数据图示 线图 四 一 二 三 多变量数据的图示 五 36 直方图 用水平轴表示数据资料 用纵轴表示频数或频率 用长条形的宽和高分别表示组距和频数 率 本例中 频数资料制作的频数分布直方图 一 直方图 折线图与曲线图 37 本例中 频率资料制作的频率分布直方图 38 在直方图的基础上 可以绘制折线图 把直方图中各长条形顶端的中点用线段顺次连接起来 本例中 频数资料制作的频数分布折线图 插入 图表 自定义类型 两轴线柱图 39 用一条光滑的曲线近似描绘折线 就得到曲线图 本例中 频数资料制作的频数分布曲线图 40 二 累积频数分布图 累积频数分布折线图 累积频数分布曲线图 累积频数分布折线图 由累积分布资料制作的折线图 绘制累积频数分布折线图 横坐标采用原来的分组 纵坐标为各组的累积频数 41 本例中 由累积频数分布资料制作的累积频数分布折线图 42 在累积折线图的基础上 用一条光滑的曲线近似描绘累积折线 得到的图形为累积频数分布曲线图 插入 图表 自定义类型 平滑直线图 43 Spss软件介绍 一 SPSSforWindows的启动与退出 Runthetutorial 运行自学指导 Typeindata 选用数据类型 Runanexistingquery 运行一个已经存在的问题 CreatenewqueryusingDatebaseWizard 用数据库捕获技术建立一个新问题 Openanexistingdatasource 打开一个已经存在的数据源 Openanothertypeoffile 打开其它类型的文件 44 二 SPSSforWindows的菜单命令 File文件操作Edit数据编辑View观察 视图 Data建立数据与数据整理Transform变量变换 Analyze统计分析Graphs作图Utilities实用程序Window视窗控制Help在线帮助 辅助说明 45 数据编辑窗 DataEditor 1 数据编辑窗主要功能 建立新数据文件 编辑和显示已有数据文件 注意 一次只能打开一个数据编辑窗口 2 数据编辑窗的组成 数据窗口 DataView 录入数据变量窗口 VariableView 定义变量 46 定义变量 变量名 Name 变量值标签 Values 变量类型 Type 缺失值 Missing 变量宽度 Width 数据列宽 Columns 保留小数位数 Decimals 对齐方式 Align 变量标签 Label 度量类型 Measure 47 变量的类型 Type 数值型变量 Numeric 1234 56加显逗号的数值型变量 Comma 1 234 563位加点数值型变量 Dot 1 234 56科学记数法 Scientificnotation 1 23456E 03日期型变量 Date 货币型变量 Dollar 1 234 56自定义类型 Customcurrency 字符型变量 String 48 Spss数据的录入与保存 第一步 选择 variableview 进入变量编辑窗口 49 第二步 选择 Dateview 录入数据 50 运用Spss制作频数分布表 51 4 spss做频数分布表 第一步 Transform RecodeintoDifferentVariables 52 第二步 将时间选入 InputVariable OutputVariable 在OutputVariable对话框中命名为按时间分组 点击 change 53 第三步 点击 OldandNewValues 54 第四步 在OldValue中选择 Range 输入数值 0 through 2 在NewValue中选择 Value 并输入 2 点击 Add 以此类推输入所有组距 55 第五步 选择 Analyze 菜单中的 DescriptiveStatistics 点击 Frequencies 进入主对话框 56 将 按时间分组 选入 Variable s 中 选中 Displayfrenquencytables 57 58 59 运用Spss制作频数分布直方图 60 第五步 选择 Analyze 菜单中的 DescriptiveStatistics 点击 Frequencies 进入主对话框 61 62 63 64 65 三 茎叶图 茎叶图 由茎和叶两部分构成 图形由数字组成 用来反映原始数据分布的图形 茎叶图类似于横置的直方图 与直方图相比 茎叶图既能给出数据的分布状况 又能给出每一个原始数值 即保留了原始数据的信息 在应用方面 直方图通常适用于大批量数据 茎叶图通常适用于小批量数据 66 茎叶图的分类 67 1 基本茎叶图 绘制基本茎叶图 把一个数字分成两部分 以数据的高位数值作为树茎 叶上只保留该数值的最后一个数字 茎在左 叶在右 茎叶间用竖线隔开 把数据的茎按从小到大的顺序纵向排列 再在每个数据的茎后面列出叶 68 制作茎叶图的好处 整理资料时 不需要做准备工作 排序 分组 比较省时方便 茎叶图同时具有频数分布和直方图的功能 如例题中观察值在80到90之间的频数为4 90到100之间的频数为7 茎叶图基本保留了原始资料的信息 茎叶图的还原能力强 69 2 扩展茎叶图 对基本茎叶图 如觉得叶的部分过于浓密 可适当地把茎叶图拉长 扩展茎叶图 树茎 树叶 4 875 1342 8 9 10 数据个数 13 43 48 11 013 32 12 03 2 8 857 9 1043 66567788 10 96 11 此扩展方式把每个茎对应的叶一分为二 茎部带 号表明叶的取值范围为0 4 带 号的取值范围为5 9 70 3 混合茎叶图 同时显示两组或多组样本资料 可制作混合茎叶图 A B 制作混合茎叶图 将两组数据的茎合放在一起 把叶部分分别放在茎的两边 71 制作混合茎叶图 将两组数据的茎合放在一起 把叶部分分别放在茎的两边 72 用SPSS生成茎叶图 第一步 选择 Analyze 菜单中的 DescriptiveStatistics 点击 Explore 进入主对话框 73 第二步 在主对话框中将变量选入 Variable s 点击 Plots 在对话框中选择 Stem and leaf 点击 Continue 回到主对话框 点击 OK 74 每根茎上叶子的频数 茎 叶 每片叶代表一个数据 75 排序后 例题 用spss验证 76 四 时间序列数据的图示 线图 Excel 例 我国1991 2003年城乡居民家庭的人均收入数据 单位 元 如右表 试绘制线图 在不同时间上取得的数值型数据 时间序列数据 线图 lineplot 用于反映现象随时间变化的特征 77 用Excel绘制线图 第一步 选择 插入 菜单中的 图表 弹出对话框 在对话框的标准类型中选择折线图 在 子图表类型 下选择 数据点折线图 点击 下一步 78 第二步 弹出对话框 在数据区域选择数据 或输入 A 1 C 14 在 系列产生在 处选择 列 点击 完成 79 绘制的线图 80 散点图 五 多变量数据的图示 气泡图 雷达图 当两个或两个以上变量时 81 一 散点图 用坐标横轴代表变量x 纵轴代表变量y 每组数据 xi yj 在坐标系中用一个点表示 n组数据在坐标系中形成的n个点称为散点 由坐标及散点形成的二维数据图称为散点图 散点图 用二维坐标展示两个变量之间关系的一种图形 82 例 小麦的单位面积产量与降雨量和温度等有一定的关系 为了解它们之间的关系形态 收集到如下数据 试绘制小麦产量与降雨量的散点图 并分析它们之间的关系 83 用Excel生成散点图 选中数据 选择 插入 菜单中的 图表 进入主对话框 84 用SPSS生成散点图 第一步 选择 Graphs 菜单中的 LegacyDialogs 并选择 Scatter Dot 进入主对话框 第二步 在出现的对话框中选择 SimpleScatter 点击 Define 进入主对话框 85 第三步 在主对话中将产量选入 Y轴 Y 将降雨量选入 X轴 X 点击 OK 86 数据绘制的散点图 通过散点图得出 小麦产量与降雨量之间具有明显的线性关系 随着降雨量的增多 产量随之增加 87 二 气泡图 与散点图类似 绘制时将一个变量放在横轴 另一个变量放在纵轴 而第三变量则用气泡的大小来表示 气泡图 用于展示三个变量之间的关系 88 例 小麦的单位面积产量与降雨量和温度等有一定的关系 为了解它们之间的关系形态 收集到如下数据 试绘制小麦产量与温度 降雨量的气泡图 89 用Excel生成气泡图 第一步 选择 插入 菜单中的 图表 弹出对话框 在对话框的标准类型中选择气泡图 在 子图表类型 下选择 气泡图 点击 下一步 90 第二步 弹出对话框 在数据区域选择数据 在 系列产生在 处选择 列 点击 完成 91 绘制的气泡图 随着温度升高 降雨量增多 小麦产量也在提高 92 设有n组样本S1 S2 Sn 每个样本测得P个变量X1 X2 XP 要绘制这P个变量的雷达图 其具体做法是 先做一个圆 然后将圆P等分 得到P个点 令这P个点分别对应P个变量 在将这P个点与圆心连线 得到P个辐射状的半径 这P个半径分别作为P个变量的坐标轴 每个变量值的大小由半径上的点到圆心的距离表示 将同一样本的值在P个坐标上的点连线 这样 n个样本形成的n个多边形就是一个雷达图 三 雷达图 雷达图 显示多个变量的常用图示方法 也称为蜘蛛图 93 94 例 2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如下表所示 试绘制雷达图 2003年城乡居民家庭人均消费支出构成 95 用Excel生成雷达图 第一步 选择 插入 菜单中的 图表 弹出对话框 在对话框的标准类型中选择雷达图 在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 济南市2024-2025学年八年级上学期语文期中模拟试卷
- 电解铝电解车间QC课件
- 电脑绣花设计知识培训班课件
- 高能量姿势课件
- 高考成语使用课件
- 电脑无法显示课件页面问题
- revit工程师考试及答案
- pets考试试题及答案
- 湖南省郴州市永兴县三校联考2023-2024学年四年级上学期期中科学试题(含答案)
- 电站典型故障课件
- 2025年度制造业员工劳动合同范本
- 2025制衣厂生产合作协议范本
- 无纺布行业知识培训总结
- 2025年秋季教导处工作计划-深耕细作教研路笃行不怠启新程
- 中国象棋教学课件
- 2024象山县辅警招聘考试真题
- 党建品牌创新活动创新路径与实践探索
- 2025年保山辅警考试题库(附答案)
- 合同基础知识培训课件教学
- 福建省泉州市晋江市2024-2025学年七年级(下)期末语文试卷(含解析)
- 冀教版四年级下学期英语阅读理解专项精选练习
评论
0/150
提交评论