




已阅读5页,还剩56页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会调查人员系列培训,调查统计/数据分析讲座,课程要点,一、数据的收集二、数据的整理三、数据的统计特性分析,一、数据的收集,两种数据来源:原始数据次级数据两种数据形式横截面数据(点)时间数列数据(面),数据的来源与分类,数据收集(调查)策划,调查目的,调查对象-调查内容-调查方法,调查结果满足调查目的,调查对象,一、全面调查不重复、不遗漏二、非全面调查代表性、选择偏性例1936年罗斯福与兰登的总统竞选:文学摘要:罗斯福(43%)兰登(57%)1千万盖洛普:罗斯福(56%)5万人实际结果:罗斯福(62%)兰登(38%),调查方法,调查内容,(一)问卷结构:说明词、填写要求、问卷正文及结尾说明词:主办单位及调查员身份、调查的目的和意义、承诺及感谢问卷正文:需要调查的问题及答案、被调查者的背景资料结尾:说明,问卷设计,清楚定义内容:5w“您使用什么品牌的化妆品”用词通俗、词义明确“您经常收看电视节目吗?”“1、从来不看;2、偶尔看;3、有时看;4、经常看;5、天天看”避免隐含的选择(乘车、牛仔裤)避免否定形式的提问避免诱导性或倾向性的词汇、避免重叠、答案详尽,(二)问卷的措辞,(三)问题的顺序,1、先易后难2、封闭型问题置前,敏感性、开放性问题置后3、注意对后继问题的影响:1)您在选择购物时,哪些因素是重要的?2)您在选择购物时,售后服务这个因素的重要性如何?4、逻辑思路保持一致,二、数据的整理,审核,分组(品质数据、数量数据),计算频数与频率,观察数据的表现,审核数据资料的可用性,方法错误如:时间,空间,口径等逻辑错误如:产值与销售值,年龄与工作年限主观错误敏感性、政治性等如:失业率与平均每周申请失业保险人数,数据的分组与频率的计算,(一)品质数据的分组与计算频数:每组数据值出现的次数例:下表为购买50台计算机的样本数据,下表为购买计算机数据的频数分布表,数量数据频数分布的分组需要3个步骤:1.确定组数;2.确定组距;3.确定组限。,(二)数量数据的整理,案例:下表为年终审计耗用的时间(单位:天),=,1.确定分组数目:,本例组数=5.3确定分5个组。,2.确定组距:,本例组距=取整数5天,3.计算频数与频率,5.计算审计时间数据的相对频数和百分比频数分布:,6.计算审计时间数据的累积频数分布,在数量数据整理中要注意的问题,1、在一些应用中,我们需要知道各分组的中点,也就是组中值。2、开口组(即只有上限或只有下限的组),其组中值用邻组的组距计算。3、在数据较少的情况下,可用品质数据整理的方式,采取单变量值分组。4、连续变量与离散变量的组限问题上组限不在内5、等距与不等距分组,观察数据的表现,观察数据的表现(特征)一般通过图表来分析:统计图统计表统计指标,(一)统计图,1、直方图:是用图形说明数量数据的一种常用方法。下图为审计时间数据直方图,2、条形图:是用图的方式描述已概括成频数、相对频数或百分比频数分布的数据的特征,3、饼图:是用圆的各部分面积来呈现品质数据的常用方法。本例中所有各组计算机购买的百分比频数总和为100,一个圆有360,则饼图中苹果机的部分为26%X360=93.6其他组的部分以此类推算出:,4.统计折线图与曲线图,洛伦茨曲线生命曲线投机需求曲线质量曲线5、象形图,洛伦茨曲线,累计收入的%,累计家庭的%,1975,1985,1995,100,101,(二)统计表,三、数据的统计特性分析,绝对数与相对数集中趋势:众数、中位数、平均数离散趋势:全距方差、标准差方差系数、标准差系数,一.绝对数与相对数,(一)绝对数反映社会现象整体规模和水平时期数时点数(二)相对数结构、比较、计划等,(三)绝对数与相对数的应用,1、指标内涵和可比性:GNP、工业增加值2、指标的结合运用举例:在美国,1985年有19893人遭谋杀,与1970年16848人遭到谋杀相比,增加了20%。这些数字揭示了在1970-1985年期间美国变成一个更多暴力的社会中国的国民生产总值增长了8%,美国的为1%,二.数据集中趋势的分析,(一)众数Mode众数是总体数据中出现次数最多的变量值。例一:有10名大学生的年龄:18,18,19,19,19,19,19,20,20,21,在这里19岁的人数最多,所以19岁是众数。例二:有10名职工的年龄:20,21,22,23,24,25,26,27,28,29,由于各年龄的人数相同,没有明显集中趋势点的数值,所以这里没有众数。,注意:,1、是位置平均数,不受极端值的影响2、假定各单位在组内是均匀分布的3、信息量小,缺乏敏感性,不适合代数运算4、用于非对称的次数数列、特别是品质标志数列5、用于数列中有较多的数值向某一数值集中6、有时会存在多个众数,(二)中位数Medium,中位数就是把计算对象的数据按大小顺序排列后,处于中间位置上的变量值。,1、是位置平均数,不受极端值的影响2、假定各单位在组内是均匀分布的3、信息量小,缺乏敏感性,不适合代数运算4、用于非对称的次数数列如:个人收入、年龄,注意:,(三)均值Mean,1.定义:均值就是分布中全部数据的算术平均值。,2.确定1、对未经整理的原始数据,表示均值,2、对分组数据(加权)的均值,某公司推销员工作量如下:,举例,对平均数的理解:,(1)某房间有10人平均身高1.6米,第11人走进,其身高1.9米,求11人的平均身高;若房间里20个人身高平均1.6米则第21人走进,21人的身高又会如何(2)一教师出3个问题,每题1分班级中30%得3分,50%得2分,10%得1分,10%得0分;全班有10个人;全班有20人?(3)经济衰退时,工人的平均工资高,平均失业期短;经济繁荣时,平均工资低,平均失业期长;这会是真实吗?,注意:,1.平均数的大小受变量值和权重两个因素的影响2.平均数收极端值的影响3.权重的选择要注意其经济意义4.正确理解各平均数指标,众数、中位数和均值的特点和应用场合,三.数据分布离散程度的分析,离散程度是评价数据一般水平代表性大小的依据,并可以反映数据分布的均衡程度。(一)全距(Range)与四分位距:全距也称极差,是用分布数据中的最大值减去最小值的差,表示为四分位距:将所有数据分为4份,每部分之间的分界点为四分位数据,1、简单标准差:,(二)标准差与方差,举例:某百货公司有6家分店,经理要求掌握这6家分店的年净收入差异水平,其标准差计算如下:平均年净收入,(三)对标准差的理解:,1、相同的数列,用原始数据计算和用分组数据计算,标准差有何不同?2、10个数的数列,若只包括1、9且标准差最大,这10个数是什么?,1、是非变量的标准差在统计研究中,经常遇到这样一种情况,即统计对象总体只有两种表现的可能,这类总体的现象表现就是是非变量。一般我们将其中一种表现的变量值表示为1,另一种表现的变量值表示为零,如果我们用P表示变量值1在总体中出现的频率,用Q表示变量值零在总体中出现的频率,则有:,,(四)其他形式的标准差,是非变量的均值:,是非变量的方差:,2.总体方差与组方差,举例:某厂某班组12名工人日产量件数如下:9,11,14,15,16,19,20,21,21,22,23,28,对上述12名工人求日产量的均值及总方差得:,如果对上述12名工人按工人的技术等级分为两组:第一组工人的日产量分别为9,11,14,15,16这5个变量值,则其组内均值:,组方差:,第一组的方差:,第二组的方差:,同理,第二组2人日产量分组有19,20,21,21,22,23,28七个变量值,则其组内均值和组内方差为:,组间方差计算列表,组内方差的均值与组间方差之和等于总方差,在本例中各组内方差的均值为:,则各类方差之间的关系为:,26.92=7.17+19.75,主要是标准差系数或,(五)离散系数,举例:有两个不同的生产小组,甲组是生产配件,乙组是整机装配,现在要比较这两个生产小组在一周内平均日产量的均衡程度。,计算:,(六)标准值,设标准化分位值为Z,则有:,或,举
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CAB 1035-2016聚氯乙烯丝圈汽车脚垫
- 血肿腔引流管的护理常规
- 2025年社交电商裂变营销实战技巧分享助力企业实现用户快速增长报告
- 2025年铀矿资源勘探开发投资前景与核能产业增长潜力报告
- 言语康复进修
- SZDB/Z 236-2017河湖污泥处理厂产出物处置技术规范
- 糖尿病酮症情志护理
- DB36/T 980-2017电子政务云平台资源服务规范
- 音乐治疗的原理
- 学校景观设计概念
- 高血压指南课件
- 2024-2029年中国机器人润滑油行业市场现状分析及竞争格局与投资发展研究报告
- 电工电子技术卷
- 公路养护手册流程
- 卵巢过度刺激综合征OHSS护理查房
- 隧道勘察重点难点分析报告
- 食品供应链安全培训
- 《新课程标准解读》课件
- 《铁及其化合物》说课课件(省级课比赛)
- 高考复习-烃的衍生物课件
- BODAS编程培训课件
评论
0/150
提交评论