版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章:数据类型与描述统计第四章:数据类型与描述统计第一节:数据的类型数据的计量尺度: 1、定类尺度 2、定序尺度 3、定距尺度 4、定比尺度定类尺度n(类别尺度、列名尺度是最粗略、计量层次最低的尺度;n只能区别事物是同类或不同类;n必须符合穷尽和互斥的要求。n 例:0表示女性,1表示男性定序尺度n(顺序尺度),是对事物之间等级差或顺序差别的一种测度;n不仅有类别,这些类别之间是可以比较的;n不能进行加减乘除运算。n 例:一等品、二等品、三等品n 小学、初中、高中、大学及以上n 非常不同意、不同意、中立、赞同、非常同意定距尺度n(间隔尺度),不仅区分类型和排序,而且可以准确地指出类别之间的差距
2、是多少;n通常可以使用自然或度量衡单位作为计量尺度;n定距尺度的计量结果表现为数值;n可以进行加减运算。n 例:考试成绩相差10分n 今天武汉的温度比广州的温度低6摄氏度定比尺度n(比率尺度),与定距尺度属于同一层次,一般可不作区分,计量结果也表现为数值;n要求有一个绝对固定的“零点”;n可以进行加减乘除运算。n 例:甲月薪3000,乙月薪1000,甲为乙的三倍数据的类型一)n定性数据品质数据):包括定类数据和定序数据。不能用数值表示,其结果表现为类别。n定量数据数量数据):包括定距数据和定比数据。能够用数值来表现,反映数量特征。数据的类型二)n截面数据cross-sectional data
3、):在相同或近似的时间点上收集的数据,如2019年我国各地区的GDP数据;n时间序列数据time series data):在不同时间上收集的数据,如1990年到2019年湖北省的GDP数据;n面板数据Panel data):综合了截面数据和时间序列数据。变量的类型n定类变量n定序变量n数字变量离散变量、连续变量)n 多数情况下,变量指的是数字变量。第二节:指标和指数统计指标 包括总量指标、相对指标、平均指标总量指标:反映总体规模,如人口总数、GDP。相对指标:经济增长率、股价指数。平均指标:人均消费水平、某股票的10日均价统计指数n广义:凡是能够说明现象变动的相对数都是指数;如计划完成相对数
4、n狭义:用来表明不能直接相加和不能直接对比的现象在不同时期的变动程度。如价格指数统计指数的分类n反映对象范围的不同:个体指数、总指数;n按性质不同:数量指标指数产量指数)、质量指标指数劳动生产率指数)n按所采用基期的不同:定基指数、环比指数n按研究的目的不同:动态指数、静态指数。统计图表n统计表:总标题、行标题、列标题、数字资料。(例)n统计图:条形图、饼图、线图、直方图、雷达图。(例)第三节第三节: :描述统计描述统计Topicsn集中趋势的度量nMean(均值),median(中位数),mode众数)n离散的度量nRange变动幅度),variance and standard devia
5、tion标准差),coefficient of variation离散系数)n外形n对称与不对称描述统计 集中趋势集中趋势均值均值中位数中位数众数众数几何平均数几何平均数 描述统计描述统计 离散程度离散程度 方差方差 标准差标准差离散系数离散系数均值 (算术平均)n数据的算术均值n样本均值n总体均值112niinXXXXXnn112NiiNXXXXNN样本规模总体规模n度量集中趋势的最常用变量n受到异常值的影响 0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 均值均值 = 5均值均值 = 6(continued)中位数n主要用于测度定序数据
6、的集中趋势n不受异常值的影响n n n在一个排好序的数列中,中位数就是这个序列中间的数值:n若N为奇数,中位数就是中间那个数的数值n若N为偶数,中位数就是中间那两个数的平均值0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 中位数中位数= 5中位数中位数 = 5众数众数的值就是出现次数最多的数值不受异常数据的影响可用于数字型和定类型数据可能没有众数也可能有多个众数0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数众数 = 90 1 2 3 4 5 6无众数无众数221NiiXNn是离散程度的最重要的度量指标n反映的是对
7、均值的离散程度n样本方差: n总体方差:2211niiXXSn方差标准差n是最重要的分散程度度量指标是最重要的分散程度度量指标n表示对均值的分散程度表示对均值的分散程度n与原始数据是同一量纲与原始数据是同一量纲n样本标准差样本标准差:n总体标准差总体标准差:211niiXXSn21NiiXN标准差比较标准差比较均值均值 = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21Data BData A均值均值 = 15.5 s = .925811 12 13 14 15 16 17 18 19 20 21均值均值 = 15.5 s = 4.57Data CCoefficient of Variation变异系数)n考察现对离散程度n一般用百分比表示(%)n表示相对于均值的离散情况n比较不同度量单位多组数据的离散程度n 100%SCVX离散系数比较n股票 A:n去年的均价 = $50n标准差 = $5n股票 B:n去年的均价 = $100n标准差 = $5n离散系数:n股票 A:n股票 B:$5100%100%10%$50SCVX$5100%100%5%$100SCVX分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 消防安全制度
- 洗煤厂消防安全制度
- 档案馆内部审计制度
- 校园巡逻值守制度
- 有效工时制度
- 日立电梯公司休年假制度
- 企业网络设备管理与维护指南
- 能源管理优化与节能减排实施指南
- 2025四川宜宾高县国盛劳务派遣有限责任公司招聘劳务派遣人员3人笔试历年常考点试题专练附带答案详解2套试卷
- 2025四川威斯卡特工业有限公司绵阳分公司模具工程师岗位测试笔试历年常考点试题专练附带答案详解
- 方案酒店装饰装修工程施工组织设计方案
- 注册监理工程师(市政公用)继续教育试题答案
- 2024年6月GESP编程能力认证Scratch图形化等级考试四级真题(含答案)
- 2025年水空调市场分析报告
- T/GFPU 1007-2022中小学幼儿园供餐潮汕牛肉丸
- 货运险培训课件
- 新收入准则税会差异课件
- 车辆资产闲置管理办法
- PICC管感染病例分析与管理要点
- 超声波成像技术突破-全面剖析
- 水电与新能源典型事故案例
评论
0/150
提交评论