




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章:统计描述 第1章:统计描述 1.1 变量的测量尺度 1.2 分类变量的统计描述 1.3 连续变量的统计描述 1.4 统计描述的SPSS实现 1.5 统计描述的实例分析 2 1.1 变量的测量尺度 标度测量(Scale Measurement) 温度 体重 有序测量(Ordinal Measurement) 默认字母顺序表示大小顺序,等价于有序分类 名义测量(Nominal Measurement) 等价于无序多分类 问题:二分类算什么测量类型? 3 第1章:统计描述 1.1 变量的测量尺度 1.2 分类变量的统计描述 1.3 连续变量的统计描述 1.4 统计描述的SPSS实现 1.5 统计描述的实例分析 4 分类变量的常用描述指标 基本的描述方式 原始数据: 频数列表 百分比 累计频数 累计百分比 集中趋势:众数 相对数指标 比:两个有关指标之比A/B 构成比:部分占总体的比例 率:某事件的发生率=观察期内某事件的发生率/该时期开始时的 观察对象数,实际上有速度的概念在里面,可以和物理中速率的 定义相对照 5 分类变量的联合描述 列联表 常见的是二维,但三维及更 高维列联表的使用原理是完 全相同的 频数 行、列、总百分比 行、列、总合计 6 第1章:统计描述 1.1 变量的测量尺度 1.2 分类变量的统计描述 1.3 连续变量的统计描述 1.4 统计描述的SPSS实现 1.5 统计描述的实例分析 7 频数表 Frequency 是一种非常直观的方法,但比较粗糙,如 果希望进行深入的分析,则必须要使用一 些严谨的统计指标对各方面特征加以描述 操作步骤:确定组数;确定组距;确定各 组段的上下限 各步骤的操作都存在着一些主观性, 但因为只是进行初步的观察,这并无 大碍 观察到的信息 集中趋势 离散趋势 分布形状(是否对称,分布曲线的形 状) 分布特征(单、双峰,有无极端值等 ) 8 集中趋势 Central tendency 均数mean 描述一组数据在数量上的平均水平,总体均数和样本均数用不同 符号表示 适用范围:对称分布,特别是正态分布资料 中位数median 适用范围:万金油 和均数相比较为迟钝,只有样本量较为充足时结果才稳定下来 9 离散趋势Dispersion tendency 全距Range 适用范围最广,但是也最不稳定 方差Variance 信息利用充分 受极端值影响 适用于正态分布的数据 标准差 std.deviation 解决了阅读时量纲的问题 变异系数(coefficient of variation) 解决了不同资料间变异程度对比的问题 测量尺度相差太大:比较蚂蚁和大象的体重变异 量纲不同:比较身高和体重的变异程度 10 百分位数 教科书上传统将其列为集中趋势的描述指标,但实际上不仅限于此 ,单独列为一类可能更为妥当 适用于各种分布 P2.5 P5 P10 P25 P50 P75 P90 P95 P97.5 使用条件:只有样本量较大时结果才比较稳定,对位于两端的百分 位数而言更是如此 100例时,P95右侧只有5例! 四分位数 实际上是P25、P50和P75分位数的总称,他们正好能够将全部总 体单位按标志值的大小等分为四部分的三个数值 上(P75)、下(P25)四分位数的差值被称为四分位间距 11 其他描述指标 分布形状描述指标Distribution 针对某种分布进行进一步的特征描述,主要是用于正态分布 偏度系数Skewness 正态峰 正偏态 负偏态 峰度系数Kurtosis 正态峰 平阔峰 尖峭峰 离群值与极端值列表 12 第1章:统计描述 1.1 变量的测量尺度 1.2 分类变量的统计描述 1.3 连续变量的统计描述 1.4 统计描述的SPSS实现 1.5 统计描述的实例分析 13 统计描述的SPSS实现 SPSS中所有专业的制表过程都能够完成统计描述的任务 Reports菜单项:主要输出文本化报表 Tables菜单项:输出标准的SPSS结果表格 Multiple Response菜单:专门用于多选题数据描述 但Descriptive菜单项中 提供的是最基本的统计 描述过程 14 Frequencies过程 计算各种常用的描述指标 特色是产生频数表 对分类资料和定量资料都适用 实例(CCSS_SAMPLE) 对CCSS数据中学历S4、性别、职业、婚姻状况等变量的分布状况 进行分析 对CCSS数据中的消费者信心总指数index、现状指数indexa、预 期指数index1b进行统计描述。 15 Descriptive 过程 一般性的统计描述 适用于服从正态分布的定量资料 可直接计算标准化Z值 实例:利用描述过程进行总指数index、现状指数index1a、预期指 数index1b统计描述分析 16 Explore 过程 可对变量进行更为深入详尽的描述性分析 主要用于对资料的性质、分布特点等完全不清楚时 常用描述性统计指标/图形更加详细、全面 可分组进行描述 实例:分月份对总指数进行统计描述,以详细了解其分布情况 17 Crosstabs过程 完成分类资料和等级资料的统计描述 完成分类资料各种各样“常规”的统计检验 实例:分析性别、学历的交叉分布情况 18 第1章:统计描述 1.1 变量的测量尺度 1.2 分类变量的统计描述 1.3 连续变量的统计描述 1.4 统计描述的SPSS实现 1.5 统计描述的实例分析 19 探索消费者信心指数随 背景资料的变化规律 什么是消费者信心指数 消费者信心 (Consumer Confidence or Consumer Sentiment) 是 指消费者根据国家或地区的经济发展形势,对就业、收入、物价、 利率等问题的综合判断后得出的一种看法和预期 消费者信心指数(Consumer Sentiment Index, CSI) 的概念和方法 是由美国密歇根大学调查研究中心的乔治 卡通纳(George Katona) 在上世纪40年代后期提出的。 消费者的看法、态度和预期这些心理的直接感受决定了他们的消费 支出计划。对消费者心理及其变动的测度就是对消费总量变动测度 的一个补充。根据消费者调查结果可以计算消费者情绪指数 (Consumer Sentiment Index),又称“消费者信心”。 21 消费者信心指数背后的经济学原理 居民在决策家庭的开销,特别是购买诸如住宅、汽车等耐用商品时 ,是经过深思熟虑才决定的。不仅是以目前的经济条件为基础,同 时结合了对未来收入、就业、物价、利率变动等因素的判断和预期 六十多年的时间已经充分验证了上述理论在解释宏观经济现状时的 有效性与合理性 22 密歇根大学消费者信心指数的价值已得到实际证明 是预测宏观经济走向的精确指标 消费者总体信心可预测GDP增长趋势 (平均领先3个季度,相关系数0.9) 消费者就业信心可预测实际失业率 (平均领先3个季度,相关系数0.8) 消费者的物价预期可预测实际通胀率 (平均领先1个季度,相关系数0.9) 消费者购车信心可预测实际汽车销量 (平均领先2个季度,相关系数0.73) 密歇根大学消费者信心指数对美、欧股市以及美国政府的经济政策有直接影响 l 已列入美国商务部发布的主要综合指标,并被各大媒体广泛引用 l 前美国联邦储备委员会主席格林斯潘就曾表示,他非常重视消费者信心指数 l 在美国及全球各大消费品生产商中广泛使用,用于预测销量及利润 全球各国的消费者信心指数研究方式大致相同,其理论基础均源于密歇根大学的研究方法 ,指数有效性在各国已得到广泛验证 中国消费者信心调研 遵循了美国密歇根大学消费者信心调研的方法学,并根据中国国情进行了修正 和深化,是密歇根大学消费者信心调研的中国版 23 中国消费者信心调研(China Consumer Sentiment Survey, CCSS) 每月进行的、反映中国消费市场状况及消费者对家庭经济及宏观经济信心的独立第三方调研 目前属于德国证券交易所集团旗下产品 中国消费者信心调研的研究方法是在美国密歇根大学社会研究院消费者信心调查课题组负责人 Richard Curtin博士的协助与指导下完成的 月度总信心指数 现状指数 预期指数 当前家庭经济状况 耐用品消费 未来1年家庭经济预期 未来1年宏观经济预期 未来5年宏观经济预期 行业分类指数 耐用品购买 房地产 证券投资 汽车消费 消费者物价感受及预期 消费者利率预期 中国消费者信心调研(CCSS)包括以下方面: 24 中国消费者信心调研的研究方法 发布频率每月一次 数据采集方式CATI (电脑辅助电话访问),随机抽样,第一手调研 样本选择18-64岁中国城市居民,家庭开支或投资决策者 抽取中国经济最发达的30个城市 代表中国1/7的人口与1/3的GDP 访谈时间长度1015 分钟 问卷问题数量不少于30题 样本量每月不少于1,000样本 25 中国消费者信心指数研究问卷 S0 受访者所在城市: 100 北京 200 上海 300 广州 S1 请问您贵姓是?_ S2 记录被访者性别: 1 男性 2 女性 S3 请问您的十足年龄是?_ S4 请问您的学历是? 1 初中/技校或以下 2 高中/中专 3 大专 4 本科 5 硕士或以上 S5 请问您的职业是: 1. 企/事业管理人员 2.工人/体力工作者(蓝领)3.公司普通职员(白领) 4. 国家公务员 5.个体经营者/私营业主 6.教师 7. 学生 8.专业人士(医生、律师等) 9.无/待/失业、家庭主妇 10. 退休 11.其他职业 S7 请问您的婚姻状况是: 1. 已婚 2. 未婚 3. 离异/分居/丧偶 S9 请问您的月收入(包括工资、奖金和各种外快收入)大约在什么范围 1. 999或以下 2. 10001499元 3. 15001999元 4. 20002999元 5. 30003999元 6. 40004999元 7. 50005999元 8. 60009999元 9. 80009999元 10.1000014999元 98. 无收入 99.拒答 26 C0 请问您的家庭目前有下列还贷支出吗? C0_1 房贷 1 有 2 无 99 拒答 C0_2 车贷 1 有 2 无 99 拒答 C0_3 其他一般消费还贷 1 有 2 无 99 拒答 O1 请问家里有家用轿车吗? 1. 有 2.没有 A3 首先,请问与一年前相比,您的家庭现在的经济状况怎么样呢?是变好、基本不变还是变差? 1 明显好转 2 略有好转 3 基本不变 4 略有变差 5 明显变差 9 说不清/拒答 A3a 为什么您这样说呢?(最多限选两项)_ 0 中性原因 90 不知道/拒答 10 改善:收入相关 110 恶化:收入相关 20 改善:就业状况相关 120 恶化:就业状况相关 30 改善:投资相关 130 恶化:投资相关 40 改善:家庭开支相关 140 恶化:家庭开支相关 50 改善:政策/宏观经济 150 恶化:政策/宏观经济相关 A4 那么与现在相比,您觉得一年以后您的家庭经济状况将会发生什么变化? 1.明显好转 2.略有好转 3.基本不变 4. 略有变差 5. 明显变差 9. 说不清/拒答 A8 那么与现在相比,您觉得一年以后本地区的经济发展状况将会如何? 1.非常好 2.比较好 3.保持现状 4.比较差 5.非常差 9.说不清/拒答 A9 您认为一年以后本地区的就业状况将会如何变化? 1.明显改善 2.略有改善 3.保持现状 4.略有变差 5.明显变差 9.说不清/拒答 A10 那么与现在相比,您觉得5年以后,本地区的经济发展状况将会出现怎样的变化? 1.明显繁荣 2.略有改善 3.保持现状 4.略有衰退 5.明显衰退 9.说不清/拒答 A16. 对于大宗耐用消费品的购买,如家用电器、家用计算机以及高档家具之类的,您认为当前是 购买的好时机吗? 1.很好的时机 2.较好时机 3.很难说,看具体情况 4.较差时机 5.很差的时机 9.说不清/拒答 27 题目得分(信心值/感受值)计算 所有用于指数计算的题目均为五级得分,类似于非常好(VF), 比较好(F), 一般, 比较差(U), 非常差(VU),以及不知道/拒答。首先针对每一道题目 ,计算每个选项被选中的百分比(包括“不知道/拒答”),随后使用以下 公式计算其相对得分: 题目得分 =100% + 1.0*VF% + 0.5*F% - 0.5*U% -1.0*VU%. 因此,这一数值反映的是答案偏向乐观的人群和偏向悲观人群的比例之 差,当人群中这两者的比例基本平衡时,得分接近于100(100%);如果 乐观人群比例偏高,则得分大于100;反之,则小于100。 中国消费者信心指数计算方法说明 28 信心指数计算 总信心指数的计算基于下面五道问题的回答进行: A3首先,请问与一年前相比,您的家庭现在的经济状况怎么样呢? A4那么与现在相比,一年以后您的家庭经济状况将会如何变化? A8那么与现在相比,您认为一年以后本地区的经济发展状况将会如何? A10那么与现在相比,您认为五年之后,本地区的经济将会出现怎样的变化? A16对于大宗耐用消费品的购买,如家用电器,家用电脑,以及高档家具之类的,您 认为当前是购买的好时机吗? 将上述5题的题目得分直接相加,然后除以“基线”调查时的这一数值,即为当期的信心指数 值。因此,所计算出的指数代表的是当期数值相对于“基线”调查数值的变动比例。如果乐 观人群的比例高于“基线”,则指数大于100,反之,则小于100。目前作为基线水平的是 2007年4月的数值。 实际上,上述指数算法和美国密歇根大学消费者信心指数的计算方法完全相同。 中国消费者信心指数计算方法说明 29 分析思路 在数据分析中,任何已经获得的数据信息都应该被加以有效利用。 图形和统计表都可以用于数据描述。图形可以提供直观的信息,但 操作较为复杂;统计表读起来枯燥,但操作比较容易,二者应当搭 配使用。 虽然数据描述往往以单一影响因素为主,但也需要考虑不同影响因 素的作用可能是重叠的。 30 对月份的影响进行分析 使用均值过程对各指数在月份和城市间的变化进行简单比较描述。 选择“分析”-“比较均值”-”均值” 菜单项 在打开的对话框中将“总指数”、“现状指数”、“预期指数”选入“ 因变量”列表框中。 讲“月份”选入“自变量”列表框中 单击“选项”按钮,只保留“均值”选项。 单击“确定” 用探索过程加以深入刻画 选择“分析”-“描述统计”-“探索”菜单项 在打开的对话框中将“总指数”、“现状指数”、“预期指数”选入“ 因变量”列表框中。 讲“月份”选入“自变量”列表框中 但就“确定” 总指数、现状指数和预期指数在2007年4月2008年12月之间均呈现下降趋 势,然后在2009年12月出现反弹。 仔细观察可以发现,现状指数下跌要明显早于预期指数。 31 对性别和教育的影响进行分析 使用均值过程对各指数在性别间的变化进行简单比较描述 用多重线图加以深入刻画 选择“图形”-“图表构建程序”菜单项,打开“图表构建程序” 对话框。 选择“线”组图,将多重线图拖入画布中。 同时选中“总指数”、“现状指数”、“预期指数”,将其拖入纵轴 中。 将”学历”拖入横轴中。 选择”组/点ID”选项卡,选中列嵌板变量。 将“性别”拖入画布中新增的“列嵌板变量”框中。 男性受访者,其信心指数在专科学历时最高,学历更高或者更低时信心均 下降; 女性受访者,其总信心指数大致呈随着学历上升而上升的趋势, 如果考察分指数,就会发现大专-本科是一个明显的分水岭,本科及以 上学历的受访者其现状、预期信心均明显高于大专及以下受访者。 32 对婚姻状况的影响进行分析 利用指标进行分析 选择“分析”-“表”-“定制表”菜单项 在打开的对话框中同时选择“总指数”、“现状指数”、“预期 指数”,将其选入“行变量”列表框中。 保持对行变量的选中状态,进入“摘要统计量”子对话框,在显 示列表中增加计数,单击“应用选择”按钮。 将“性别”选入“列变量”列表框中,然后将婚姻状况嵌套在性 别下方。 单击“确定”。 无论男女,已婚人群的总信心、现状信心和预期信心值都低于未婚 人群,但总体而言男性受访者在已婚、未婚人群上的信心值差异要 更大一些。 这种差异究竟反映的是婚姻状况的影响,还是反映的年龄甚或学历 等因素的影响目前还难以下结论。 33 对年龄的影响进行分析 利用散点图考察年龄与信心指数间的关系 选择“图形”-“图表构建程序”,打开“图表构建程序对 话框”。 选择“散点”图组,将右侧出现的简单散点图拖入画布中。 将“年龄”拖入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 城乡投合同管理制度
- 学生操行分管理制度
- 排污池安全管理制度
- 售楼处客服管理制度
- 学校暑假工管理制度
- 天猫店委托管理制度
- 搜车棚充电管理制度
- 注塑厂品质管理制度
- 空乘教学课件
- 面试时自我介绍范文15篇
- DB31/T 1249-2020医疗废物卫生管理规范
- 四川省宜宾市翠屏区2025届数学七下期末综合测试试题含解析
- 乡镇合法性审查工作报告
- 2025届四川成都锦江区数学七下期末质量检测试题含解析
- 2025年发展对象考试题题库及答案
- 2025上半年山东文旅集团有限公司直属企业招聘88人笔试参考题库附带答案详解
- 《临床精准用血培训》课件
- 《外国文学》课件-说不尽的莎士比亚教学课件:《麦克白》
- 2025中国新型储能行业发展白皮书
- 油气管道输送试题及答案
- 2025年挖掘铲运和桩工机械司机(技师)职业技能鉴定理论考试题库(含答案)
评论
0/150
提交评论