




免费预览已结束,剩余68页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
变量及数据描述 个体 搜集数据的实体 变量 统计学中因观测所得数据具有变异性的特点而称为变量 简言之 变量是具有变异性的数据 观测值 对某一特定个体得到的测量值集合为一个观测值 几个概念 26家公司的财务状况 个体 变量 24家饭馆的状况 变量 个体 观测值 CompanyLogo 一 变量 理解变量的意义和作用变量是形成理论框架的基础 CompanyLogo 一 什么是变量 变量是指任何具有不同数值的事物 变量是概念的一种类型 是通过对概念的具体化而转换来的 变量在不同的情况下有不同的状态或者属性 这反映了概念的可变动性 说明了现象在规模 重量 密度 速度等方面的变化情况 或者现象在程度差异上的变化方式 如产量 矿工率 动机 性别 年龄等 CompanyLogo 产量生产部门的某一位工人 每分钟生产一个小机械 而另一个工人每分钟做出两个 第三位工人每分钟生产三个 另外 也有可能同意个工人 这一分钟生产三个 下一分钟就生产四个 因此小机械的产量会有不同的数值 因此称为变量 CompanyLogo 旷课率今天可能有三位同学没来上课 下次可能就有六位 再下次可能一位也没有 因此 理论上旷课率变量的范围为0 1 CompanyLogo 动机学生在课堂上的学习动机不同 有高有低 等级如何测量 可能从高到底的不同程度 这也是变量 CompanyLogo 举例 你的年龄收入家庭人口学历业余读书时间是否考研等 公司规模工资水平产品质量销售收入职工满意度广告投放成本等 血压体温身高体重血色素水平 世界上任何事物都是可以测量的 只要你能找到合适的量尺 CompanyLogo 二 变量的数学类型 四种 变量在运算中的作用 一 因变量 二 自变量 三 中介变量 四 插入变量 CompanyLogo 1 因变量 1 什么是因变量 dependentvariable 是研究者主要关心的变量 是主要变量 举例 一位管理者担心已经过市场测试的销售量不如预期 最近国家关心北京市房屋的空置率 学生关心学习成绩 一位总裁担心员工的忠诚度 试问 银行总裁希望提高银行职员的绩效表现 因变量 CompanyLogo 2 自变量 1 什么是自变量 independentvariable 以正向或负向方式影响因变量的变量 举例自变量和因变量同时存在 自变量每增加一个单位 因变量也会随之增加或者减少 新产品成功公司股价广告投放量利润 CompanyLogo 三 变量的测量尺度 变量是可以观察和量度 测量 的 概念转换为变量形式之后就可以进入科学研究的领域 测量尺度 定类尺度定序尺度定距尺度定比尺度 根据不同的测量尺度 量尺 CompanyLogo 定类尺度是一种研究者可将对象或时间分派到确定种类或全体的量尺 如性别 国籍举例 您的性别您的国别您的血型您的专业等编码 man 1 women 2 1 定类尺度 CompanyLogo 2 定序尺度 定序尺度不仅具有分类功能 而且可以标注出不同类别的差异 可以将这些类别加以排序 划分等级 请将下列五种工作特性依据您所认为的重要性加以排序 最重要的项目威 此重要的为2 依次类推 将重要性按1 5加以排列 工作特性1 与他人交流2 使用不同技术3 从头到尾完成任务4 服务他人5 工作独立性 重要等级 CompanyLogo 再举例 您选择学校的指标进行排序 1 学校名气 2 专业设置 3 学校的位置 4 学校所在城市 5 学费的高低 6 就业率等 CompanyLogo 3 定距尺度 定距尺度 间隔尺度 能够衡量尺度中两点之间的距离 CompanyLogo 当以个题项来测量一个变量时 便可采用五点尺度 然后可将各项目的评分加总 如下面的李克特量表 请依据下面的量尺 回答每一项叙述 并圈选最能表述您感觉的数字 CompanyLogo 4 定比尺度不仅可以测量量表中点与点之间的差距 也能评估差异之间的比重 如年龄 收入 体重 身高等 4 定比尺度 CompanyLogo 四 变量的类型与数学运算类型 二 数据 数据是为描述和解释搜集 分析和汇总的事实和数字 数据是变量的表达方式 用于特定研究而搜集的所有数据成为研究的数据集 如表1 25家公司的数据集 五 分类型数据与数量型数据 分类型数据 离散数据 归属于某一类别的数据可以用名义尺度度量也可以用顺序尺度度量分类数据的统计方法是有限的 数量型数据 连续数据 使用数量表示大小或多少的数据数量数据的统计方法可选择较多 六 截面数据与时间序列数据 截面数据 面板数据 在相同或者近似相同的时间点上搜集的数据 时间序列数据 在不同时期搜集的数据 CD在18个月内的销售情况 练习 1 这个数据文件哪是个体 有多少个个体 这个数据文件哪是变量 有多少变量 哪些是分类变量 哪些是数量变量 每个变量使用的是那些测量尺度 2 人民日报的订户调查征询了46个有关订户的特征和兴趣问题 指出下列每一个问题提供的是分类数据还是数量数据 并指每一个变量的测量尺度 您的年龄您的性别您什么时候第一次读人民日报 高中 大学 职业生涯初期 职业生涯末期您在现在的工作或者职位上工作多久了您下一次打算购买何种类型的车 有9个选项 轿车 跑车 SUV等等 二 数据分布的特征及分布形状 利用图表展示数据 可以对数据的形状和分布特征个有个大致的了解 但要全面地了解数据分布的特征 还要找数据分布特征的各个代表值 统计描述的指标 统计描述指标体系 汽车重量的直方图 数据分布特征从三个方面进行测度和描述 第一 分布的集中趋势 反映各数据向中心靠拢或聚集的程度 第二 分布的离散程度 反应各数据远离其中心值的趋势 第三 分布形状 反应数据的偏态和峰态 1 集中趋势的度量 A1 众数mode A2 中位数median 分位数A3 均数mean A4 几何平均数geometricmean A1 分类数据 众数 一组数据中出现次数最多的变量值 用M0表示 一般情况下只有数据量较大时 众数才有意义 主要用于测度分类数据 有时也会用来测度有序和数值型数据举例 以某类产品品牌为例众数是位置代表值 具有明显的集中趋势点 众数示意图 c 双众数 d 无众数 a M0 b M0 A2 有序数据 中位数和分位数 中位数 一组数据中处于中间位置的数 用Me表示中位数适宜于测量有序数据和数值型数据 但不适合测量分类数据 中位数的计算 对所有数据进行排序 当数据量为奇数时 取中间数为中位数 当数据量为偶数时 取最中间两位数的平均数为中位数 数据量为100 是偶数 所以应取排序后第50位数和第51位数的平均值作为中位数 第50位数是3 第51位数也是3 所以中位数为3 中位数的位置 其中n为数据个数 n 1 2 举例 在某城市中随机抽取9个家庭 调查得到每个家庭的人均收入数据如下 请计算人均收入的中位数 1500750780108085096020001250163066075078085096010801250150016302000 说明 中位数是一个位置的代表值 其特点是不受极端值的影响 在研究收入分配是很有用 四分位数 中位数是从中间点将全部数据等分为两部分 与中位数类似的还有四分位数 十分位数和百分位数等 他们分别是用3个点 9个点和99个点将数据4等分 10等分和100等分后各分位点上的值 四份位数也称四分位点 它是一组数据排序后处于25 和75 位置上的点 QL25 QU75 四分位数位置的确定 QL位置 QU位置 4 n 4 3n 如果位置是整数 就是该位置对应的值 如果是在0 5的位置 则取该位置两侧数的平均数 举例 9个家庭的收入情况如下 75078085096010801250150016302000 计算人均收入的四分位数解 根据上面的计算方法QL位置 2 25QL 780 850 780 X0 25 797 5 元 QU位置 QU n 4 9 4 A3 数值型数据 平均数 均值是一组数据相加后除以数据的个数得到的结果 是集中趋势的最重要的测度值 主要适宜数值型数据 不适用于定类数据和有序数据 均值是根据全部标志值得到的 有些极其极端的值要么剔除 要么不用算术平均 均数 简单平均数 加权平均数 几何平均数 计算公式 众数 中位数 均值的比较 1 众数是一组数据分布的峰值 它是一种位置的代表值 不受极端值的影响 缺点是不唯一众数主要适合于作为分类数据的集中趋势测度值 众数 中位数 均值的比较 2 中位数是一组数据中间位置上的代表值不受极端值的影响主要是用于顺序数据的集中趋势测度值 众数 中位数 均值的比较 3 均值是利用了全部数据信息 它具有优良的数学性质 是实际中应用最广泛的集中趋势测度值 缺点是受极端值的影响 对于偏态分布的数据 均值得代表性极差 只适合于数值型数据总结 对于分类数据 只适合计算众数 不适合中位数和均值 而顺序数据 只适合计算众数和中位数 不能计算均值 而数值型数据适合用均值 也可用众数 中位数 2 离散趋势的度量 数据远离其中心值的程度A1 极差或全距Range 四分位差A2 方差Variance 标准差std deviationA3 离散系数coefficientofvariation A1 极差与四分位差 1 极差 一组数据的最大与最小值之差 用R表示计算公式 R 最大值 最小值极差是描述数据离散程度的最简单的测度值因为只用了一组数据 不能准确地描述出数据的分散程度 A1 极差与四分位差 2 四分位差 也称内距 它是上四分位数与下四分位数之差 用Qd表示计算公式 Qd QU QL四分位差反映了其中50 的数据的离散程度 其数值越小说明数据越集中 反之越分散 主要用于顺序数据的离散程度 不适合分类数据 可以计算数值型数据 A2 方差与标准差 方差是各变量值与其均值离差平方的平均数 它是测度数值型数据离散程度的最主要方法 标准差又叫均方差 是总体各单位标志值对平均数离差的算术平均的平方根 标准差是进行离散趋势分析时用的最多 最重要的指标 它对现象的稳定程度有敏感的反应力 总体方差与标准差计算公式 1 未分组的总体方差 标准差 平方根 2 分组的总体方差 标准差 平方根 样本方差与标准差计算公式 未分组数据的标准差 方差 标准差两边乘方 计算 分组数据的标准差 方差 标准差两边乘方 的计算 1 fi 自由度 fi A3 离散系数 coefficientofvariation 极差 方差 标准差因为变量水平高低与计量单位不同 对离散程度测度值有影响需要计算离散系数 变异系数 是一组数据的标准差与其相应的均值之比 是测度数据离散程度的相对指标 公式 离散系数 标准差 平均值离散系数值与离散程度成正比 3 分布形状 偏态和峰态的测度 测量数据分布的形状是否对称 偏斜程度及分布的扁平程度等 偏态及测度 当SK 0时 分布对称当SK 0 正偏或右偏当SK 0 负偏或左偏 组中值 3 峰态及测度 测度峰态的统计量叫峰态系数 计作K是对数据分布是平峰或尖峰的测度 当K 3时 是标准的正态分布 峰态系数 K3 为尖峰分布 尖锋分布 平锋分布 本章总结 集中趋势 众数 中位数 平均数 离散趋势 异众比率 四分位差 极差 平均差 方差标准差 离散系数 分布形状 偏态系数 峰态系数 数据分布特征 演示与练习 用数据库 cars sav练习一 对10名成年人和10名幼儿的身高进行抽样调查 结果如下 要求 1 如果比较成年组和幼年组的身高差异 你会采用什么统计量 为什么 2 比较分析哪一组的身高差异大 练习二 一家汽车零售店的10名销售人员5月份销售的汽车数量 单位 台 排序后如下 24710101012121415请问 1 计算汽车销量的众数 中位数和平均数 2 根据定义公式计算四分位数 3 计算销售量的标准差 4 说明汽车销售量分布的特征 练习三 华尔街日报提供了消费者购买诸如独户住宅 汽油 互联网服务 报税服务等方面的费用 典型样本数据如下 A计算平均数 中位数 众数B计算上四分数与下四分位数的位置及数值 SPSS的相应功能 相应功能均集中在 Analyze DescriptiveStatistics Frequencies Descriptive Explore Ratio 如果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建东南标准认证中心有限公司福建东南质量技术培训中心有限公选聘2人笔试历年参考题库附带答案详解
- 2025年甘肃省定西市安才人力资源有限公司招聘16人笔试历年参考题库附带答案详解
- 2025江苏苏州高新区狮山商务创新区招聘13人考前自测高频考点模拟试题及答案详解(名师系列)
- 2025江苏省地质局所属事业单位江苏省地质调查研究院招聘13人考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025年上海市现代流通学校公开招聘工作人员模拟试卷及参考答案详解1套
- 2025湖南永州市教育局直属学校(单位)招聘教师46人考前自测高频考点模拟试题及答案详解1套
- 2025年福建省宁德市霞浦县国资与金融服务中心招聘6人模拟试卷附答案详解(模拟题)
- 2025国网经济技术研究院有限公司第二批高校毕业生录用人选的考前自测高频考点模拟试题(含答案详解)
- 2025辽宁沈阳市东北大学非教师岗位招聘25人模拟试卷(含答案详解)
- 2025春季内蒙古建投国电准格尔旗能源有限公司校园招聘模拟试卷及答案详解(历年真题)
- 前端Vue3项目实战教程
- 智算中心高性能计算系统设计方案
- 中央八项规定精神应知应会测试题有答案【夺分金卷】附答案详解
- 2025年茅台酒厂考试试题及答案
- (20250731)房屋市政工程基孔肯雅热、登革热防控检查(自查)表
- 新媒体渠道管理办法
- 2025年浙江省人事考试工作(4月26日事业单位笔试)笔试历年典型考题及考点剖析附带答案详解
- (医疗质量及标准)JCI医院评审标准(第四版)版
- 机械加工工艺与工具知识测试试卷
- 沈阳停车收费管理办法
- 2025版小学语文新课程标准
评论
0/150
提交评论