版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本科课程陈宜治系列课件统计学课件制作:陈宜治 按其反映时间状况的不同,分为时期指标和时点指标。 时期指标是反映某种社会经济现象在一段时期发展变化结果的总量指标,表示累计的结果.如产品的产值、商品销售额、工资总额等。 时点指标是反映社会经济现象在某一时点(瞬间)状况上的总量指标,仅仅在某个 时点上有意义.如年末人口数(或人口普查中,11月1日零时人口数)、月末商品库存额、季末银行存款余额、年末固定资产净值等。时期指标与时点指标的差别:时期指标时点指标 可加性 具有 不具有 与时间长度 的关系 有直接关系没有直接关系 获得数值的方式连续登记取得间断计数取得相对指标 计划完成相对指标=(实际完成数/
2、计划任务数)*100% 结构相对指标=(总体某一部分数值/总体全部数值)*100% 比例相对指标=(总体某一部分数值/总体中另一部分数值)*100% 比较相对指标=(某一指标在某一空间条件下的数值/该指标在另一空间条件下的数值)*100% 强度相对指标=(某一总量指标数值/另一有联系但性质不同的总量指标数值)*100% 动态相对指标=(报告期发展水平/基期发展水平)*100% 相对指标一般用无名数表示!平均指标主要用来表明同质总体中某一标志值,在一定时间、地点条件下所达到的一般水平。其数值表现平均数。一是从总体各单位变量值中抽象出具有一般水平的量,这个量是根据各个单位的具体标志值计算出来的,这
3、种平均数称为计算平均指标。计算平均指标有算术平均指标、调和平均指标、几何平均指标等形式二是先将总体各单位的变量值按一定顺序排列,然后取某一位置的变量值来反映总体各单位的一般水平,把这个特殊位置上的数值看作是平均指标,称作位置平均指标。位置平均数有众数、中位数、四分位数等形式。统计指标描述指标按功能分类按反映现象的时间分类静态指标(一般总量指标、静态相对指标、一般平均指标)动态指标(增长量指标动态相对数指标序时平均数指标) 评价指标预警指标 浙江工商大学是浙江省规模最大的财经类院校.目前,研究生、全日制普通本科在校生17000人,学生规模居在杭高校第3位。2006年共招新生4855人,为2005
4、年的108%.全校教职工1622人,专任教师998人,占教职工人数的61.53%,师生比达到6:100, 正高职称127人,副高职称368人,比率为35:100。 图书馆藏书170多万册,国内外报刊、杂志5130余种。经济类藏书种类列浙江省高校前茅, 学生的平均藏书为100册/人。1、确定指标的名称和涵义2、确定指标的计算范围和计算方法3、确定指标的资料搜集方法和统计量化尺度4、确定合适的计量单位4.统计指标的设计1.统计指标体系的含义 反映同一总体或样本多个方面数量特征的一系列相互联系的统计指标所形成的体系,成为统计指标体系。 2.统计指标体系的表现形式 数学等式关系 相互补充关系 相关关系
5、 原因、条件和结果关系(二)统计指标体系存在确定的数量关系:产量 价格产值 存在某种共同性: 产销比率、盈利水平、劳动效率、偿债能力 存在某种因果、条件关系: 工业企业总产值、工人劳动生产率、资金装备率3.统计指标体系的设计目的性原则科学性原则可行性原则灵活性原则层次性原则联系性原则协调性原则财政部制订的企业经济效益评价指标体系:销售利润率总资产报酬率资本收益率资本保值增值率资产负债率流动比率应收账款周转率存货周转率社会贡献率社会积累率国家统计局制订的工业企业综合经济效益评价指标体系: 总资产贡献率资本保值增值率资产负债率全员劳动生产率成本费用利润率流动资产周转率产品销售率第2章统计数据的收集
6、、整理与显示 2.1统计数据的收集2.2统计数据的整理2.3统计数据的显示理解统计数据收集的含义与要求,掌握统计数据收集方案设计;熟悉统计数据收集的各种方式、方法并能加以应用;基本掌握调查问卷设计技能;理解统计数据整理的含义、要求与步骤;理解统计分组的意义,正确掌握统计分组方法;掌握分布数列、尤其是变量数列的编制方法;了解统计表的结构、种类和编制方法;了解统计图的意义,掌握常用统计图的绘制方法;掌握Excel在统计数据整理与显示中的应用 学习要求2.1统计数据的收集2.1.1统计数据收集的含义和要求统计调查 所谓统计数据收集,就是按照统计研究的目的和任务,运用各种科学有效的方式和方法,有针对地
7、收集反映客观现实的统计数据的活动过程。又称统计调查。准确性及时性完整性 蒐集收集搜集统计调查任务下达从上到下,数据汇总从下到上2.1.2统计数据收集方案设计确定数据收集目的统计数据收集过程设计数据收集方案开展数据收集活动评估数据收集质量 至关重要数据收集方案(一)数据收集目的 (WHY)(二)数据及其类型(WHAT TYPE)(三)数据收集对象和观测单位(WHOM)(四)观测标志和调查表(WHAT)(五)数据收集方式与方法(HOW)(六)数据所属时间和数据收集期限(WHEN)(七)数据收集地点(WHERE)(八)数据收集的组织(WHO)8w原则调查对象(搜集数据的对象)是根据调查目的所确定的研
8、究事物的全体。统计总体这一概念在统计调查阶段称调查对象。 调查单位(观测对象)也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。 报告单位报告单位也称填报单位,也是调查对象的组成要素。它是提交调查资料的单位,一般是基层企事业组织。例:要了解全国商业企业的情况,则: 调查对象-全国所有商业企业 调查单位-每一个商业企业 报告单位-每一个商业企业例:要了解全国工业企业设备情况,则: 调查对象-工业企业的所有设备 调查单位-每一台设备 报告单位-每一个企业注意:调查单位与报告单位 的区别:调查单位与报告单位有时一致,有时不一致:当调查单位自己负责向上报告时,它同时也是报告单位;当调
9、查单位的资料由它的上级组织收集整理并向上报告时,调查单位与报告单位则不一致。观测标志即依附于调查单位(总体单位)的统计标志,其标志表现就是统计调查所得的资料。调查表是用来表现调查项目的表格,其目的是保证统计资料的规范化和标准化。观测标志调查表调查时间1、调查时间:是指调查资料所属的时间。时期现象就是调查资料的起止日期;若是时点现象,则是规定统一的标准时间2、调查期限:是指完成整个调查工作所需要的时间譬如第五次人口普查是调查时间是2000年11月1日0时0分0秒,而调查期限花了近三年。调查地点调查地点是指登记调查资料的地点。调查地点和调查单位的所在地有时是一致的,有是则不一致。譬如:人口普查中登
10、记“常住人口”应在每个人的常住地点进行登记,如果出差到外地,并不是在他现在的所在地登记,还是在常住的地点进行登记。 例:第六次全国人口普查的标准时间是2010年11月1日零时,普查现场登记工作从11月1日开始到11月10日前结束。调查员到过的几家遇到情况并作出处理:(1)11月2日到1号家庭,这家11月1日中午生了一个小孩,调查员把关于新生小孩的材料填入调查表;(2)11月3日到2号家庭,这家11月2日一成员死亡,调查员把关于死亡者的材料填入调查表;(3)11月4日到3号家庭,11月2日新婚夫妇到户籍登记处登记结婚,统计员登记调查表中的”婚姻状况”为“已婚”;(4)11月5日到5号家庭,遇到户
11、主儿子从外地回家探亲,户主对调查员说,他儿子10月25日回家,已在派出所办理了一个月的临时居住证,其儿子户籍仍应由原居住地地区登记为常住户口; 以上处理方法哪些正确?2010年全国第六次人口普查的标准时间为11月1日零时,请指出下列人口数是否应该予以统计? (1)11月8日登记时,得知某户家庭新出生一对双胞胎,其中一个于10月31日23时55分出生,另一个于11月1日零时8分出生。(2)11月8日登记时,得知某人于10月31日晚23时59分去世。(3)11月12日登记时,得知某地区迁来新住户,该家庭共4口人,户口关系未迁入,这个家庭的人口数是否应该登记在该地区?(4)一对夫妇加入美国籍,已于1
12、0月31日办好在美国定居的手续。(5)一名新加坡老华侨回国定居,国籍未变动。(6)一名司机在11月1日凌晨2点左右发生车祸死亡 2.1.3统计数据收集方式统计数据收集方式统计调查观察实验抽样调查普 查随机区组试验重点调查统计推算正交试验完全随机试验拉丁方试验原则:规定统一的标准时点。规定统一的普查期限。规定调查的项目和指标。 一种专门组织的一次性全面调查。 主要用来搜集某些不能够或不适宜用定期全面统计报表搜集的统计资料,尤其是有关一个国家人力、物力、财力的数量和利用情况的详细资料。 如:人口数量及构成变化;耕地面积和农作物品种及其分布;工业设备等等,以了解重要的国情、国力。1.普查特点 一次性
13、。普查一般用来调查属于一定时点上的社会经济现象的总量。 全面性。普查大多是在全国或很大的范围内进行,调查的项目多,能取得详细的资料。组织方式自上而下建立专门的普查机构,配备一定数量的普查人员,对调查单位进行直接登记。如人口普查。 颁发一定的调查表格,由调查单位根据原始记录进行填报,所建立的普查机构对整个普查工作进行组织领导和协调。如我国历次的物资库存普查。注意事项()规定标准时点,以免产生重复或遗漏。()各调查单位尽可能同时或尽可能短期内进行调查与完成调查任务。()普查项目一经确定,不能随意更改,且要注意普查资料的可比性,以提高资料的利用价值。(4)普查前要试点、总结经验,交流推广,普查后要对
14、资料进行修正。经济普查后对经济总量的修正,由世界第六上升为第四。适用情况要耗费大量的人力、物力、财力和时间,一般在需要掌握基本的国情国力,作重大决策时采用。案例:我国历次人口普查次别第一次第二次第三次第四次第五次主要目的配合各级人民代表大会的选举,为第一个五年计划提供依据为制定第三个五年计划和长远规划提供依据结束动乱,为给国家制定政策和计划提供人口数据为检验“七五”计划执行情况,制定“八五”计划提供数据为了制定国民经济和社会发展战略规划,实现人口与资源、环境的协调发展 普查对象常住人口常住人口常住人口常住人口常住人口标准时间1953.7.1零时1964.7.1零时1982.7.1零时1990.
15、7.1零时2000.11.1零时调查项目6项:本户地址、姓名、性别、年龄、民族、与户主关系。9项:新增本人成分、文化程度、职业。19项:新增本户人数、本户出生人数、本户死亡人数等。21项:新增五年前常住地状况、迁来本地原因。短表:9项。长表:26项。(增加生育、婚姻、学业、职业等项目)第六次全国人口普查主要数据:人口普查登记的全国总人口为1339724852人。比2000年第五次人口普查相比,10年增加7390万人,增长5.84%,年平均增长0.57%,比1990年到2000年年均1.07%的长率下降了0.5个百分点。第六次人口普查的标准时间是2010年11月1日零时。2.抽样调查从总体中抽取
16、部分个体构成样本,以样本指标(统计量)为依据推断总体参数或检验总体的某种假设,抽样误差可以事先计算并加以控制。一个著名案例:1936年,美国总统选举前,一份颇有名气的杂志文学摘要的工作人员做了一次民意测验,调查共和党的兰登(当时任堪萨斯州州长)和民主党的罗斯福(当时的总统)谁将当选下一届总统。为了了解公众意向,调查者从电话号码簿和俱乐部会员名单上选取了1000万人调查,收回240万份调查问卷。通过分析收回的调查表,显示兰登非常受欢迎(两者之比57%43%),于是该杂志预测兰登将在选举中胜出,并大力进行宣传。最后结果却是罗斯福以62%38%的巨大优势获胜连任总统,预测失败使杂志社威信扫地,不久只
17、得关门停刊,被称作抽样中的泰坦尼克事件。请分析失败的原因。 解 预测失败主要有两方面原因,原因之一是抽取的样本不具代表性。在1936年,美国家庭电话尚未普及,大约仅有100万部左右,有条件参加社会俱乐部的人,多数为经济上富有、政治上保守的选民,当时经济萧条期刚过,贫困与失业人数较多。“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民从中得到了好处。该杂志抽取的样本没有很好地反映出各阶层的利益需要,有失公平性。原因之二是问卷回收率较小,一半以上的问卷意见没有得到真实反映。因此,预测失败也就不足为奇了。 评析 以上事例说明,在抽样调查中,样本的选择至关重要,样本能否代表
18、总体,直接影响着统计结果的可靠性。再如,一些心理学实验是由志愿人员完成的,可能缺乏代表性。一些医疗广告中的数据可能只来自某个医院,并非随机抽样,也有可能产生误导。有一位精神病学者在报告中指出,事实上每个人都有精神病!你觉得的“随机”和“随意”有区别吗?非概率抽样概率抽样总体中的个体是否有一个事先已知的概率被抽中?random , as one pleases 一是在样本的抽取上遵循随机原则。 二是在调查的功能上能以部分推断总体。 三是在推断的手段上运用概率估计的方法。 四是在推断的理论上,以大数定律和中心极限定理为依据 。五是在推断的效果上,抽样误差可以计算并加以控制。 概率抽样的特点:重复抽
19、样又被称作重置抽样、有放回抽样抽出个体登记特征放回总体继续抽取特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行可以分为重复抽样和不重复抽样的两种概率抽样的方法: 从总体N个单位中,用重复抽样的方法,随机抽取n个单位构成一个样本,则共可抽取 个样本。 例:从1、2、3中重复抽取2个数字组成新的数,可以组成多少个数。 11,12,13; 21,22,23; 31,32,33。 共329个不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点 总体中每个单位都不会重复出现在一套样本中,在连续抽取时,每次抽取都不是独立进行 从总体N个单位中,用不重复抽样的方法,抽取n个单位样本
20、,全部可能抽取的样本数目为 重复抽样的样本个数总是大于不重复抽样的样本个数。 例:从1、2、3中不重复抽取2个数字组成新的数,可以组成多少个数。 12,13; 21,23; 31,32, 一共6个引例:有100个苹果分给10个人,你有多少种分法能够体现合理公平呢?概率抽样的组织方式:1)简单随机抽样(纯随机抽样)方法:将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位。适用:总体规模不大;总体内部差异小2)类型抽样(分层抽样)方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。总体N样本n等额等比例最优 分的目的是为了更好的组(组内差异性小),而组是为了更好
21、的分(区分,组间差异性较大) 分层随机抽样简称分层抽样,又称为类型抽样,从统计分组的思想出发,根据调查者对被调查对象的理解和了解,按照调查目的的标志进行分组。3)等距抽样(机械抽样)方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。排序依据的标志:(1)无关标志;(2)有关标志(总体单位按某一标志排序)4)整群抽样方法: 将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查。例:例:从某省100多万农户中抽取1000户,调查农户的生产性投资情况。5)多阶段抽样第一阶段:从省内所有县中抽取5个县;第二阶段:从抽中的5个县中各抽4个乡镇 第三阶
22、段:从抽中的20个乡镇中各抽5个村 第四阶段:从抽中的100个村中各抽10户样本容量n=10010=1000(户)非概率抽样的特点及类型非概率抽样是凭人们的主观判断或根据便利性原则来抽取样本。这时,总体中每个个体被抽取的可能性是难以用概率来表示和计算的。 包括:任意抽样典型抽样定额抽样流动总体抽样等 特点有意识选取调查单位。(主观性较强)掌握现象总体发展变化的规律和总结经验。 典型调查虽选取单位不能排除主观性,推断总体只能是近似值,但选取单位数量少,取得资料快,调查效率高,特别适用于了解新情况、解决新问题的调查。 适用情况方法:“解剖麻雀”;“ 划类选典”。 抽样调查作用一是用于认识那些不能或
23、难以进行全面调查的总体的数量特征以及具有破坏性的产品质量检测等二是用于认识那些发展变化比较稳定和有规律性而不必进行全面调查的现象总体的数量特征等三是用于收集灵敏度高、时效性强或时间要求紧迫的统计数据四是用于与其他数据收集方式相结合,相互补充和核对五是用于对总体特征的某种假设进行检验,判断这种假设的真伪,决定方案的取舍,为行动决策提供依据。 在调查对象中, 只选择其中的一部分重点单位进行的调查, 用以掌握所研究现象总体的基本情况。 在总体中,这些单位虽数目不多, 但就调查的标志值来说, 它们的总量在总体中却占有绝对的比重, 能够反映出总体的基本情况。 方式:一次性调查:专门设计和备配人员现场调查
24、。 经常性调查:同报表制度结合,用统计报表调查。 3.重点调查例如:要了解全国煤碳的生产变化情况, 只要对全国几个大型煤矿集团进行调查, 就可以及时地了解全国煤碳生产的基本情况。 对为数不多的大型钢铁企业进行调查, 就可以对全国钢铁产品的产量、品种、质量等变化情况作出基本分析。对我国32个大中城市的零售商品价格的变化进行调查, 可以及时了解全国城市零售商品价格变化的趋势。特点(1)重点单位的选择不带有主观因素,但有量的限制。(2)目的在于反映现象总体的基本情况,搜集重点单位详细的调查资料。 因此能以较少的投入,较快的速度了解取得某些标志的主要情况或基本趋势。适用情况 当调查目的只要求了解总体基
25、本情况、发展趋势,不要求全面数据,而总体中又确实存在着重点单位时,就可以采用这种调查方法。 重点调查可以用于不定期的一次性调查,也可以用于经常的连续性调查。概念:统计推算是以已掌握的统计信息为基础,根据事物之间的内在联系或发展规律,对被研究现象的有关数量特征或数量关系作出估算或测算的间接统计调查方法。 特点:假定性 、以实际统计资料为依据 、抗干扰性 、存在推算误差 方法:前提推算法 、预计推算法 、比例推算法 、因素推算法 、平衡推算法 、插值推算法 、回归推算法 4.统计推算二次大战期间,莫斯科遭到德军的空袭,大家都钻防空洞。哎,就有这么一个前苏联的著名的统计学教授,他就不肯下防空洞,他对
26、朋友说,我算过的,莫斯科有700万居民,我自己被炸弹击中的概率非常小,不用管我。但几天后,忽然朋友在防空洞里看到了这位教授,很惊讶,就问他,教授您为什么改变了原来的看法呢?这位教授脸色铁青,回答到,“唉,虽然莫斯科有700万人,只有1头大象,但昨天那头大象被炸死了。” 实验方式 所谓实验方式,就是运用自然科学的试验法,通过观测人为安排条件下试验产生的各种结果并加以记录的方式来获取数据; 或通过人为安排条件下的试验来探求某个或某些因素对所研究事物的数量影响程度和作用方式,凭借实验结果来揭示所考察因素与所研究事物之间的数量因果关系。 1.实验的原则均衡分散性原则整齐可比性原则 均衡分散性原则是指所
27、进行的试验应能把所观测的因素及其状态均衡地分散在因素与状态的所有各种可能的配合之中,以保证试验结果具有较强的代表性。 整齐可比性原则是指试验考察某个因素的各个状态对所研究事物影响的效应时,其他因素应保持不变的状态,以便保证在该因素各个状态的效应之中能最大限度地排除其他因素的干扰,从而能对所考察因素不同状态的效应进行比较。 2.常用的实验设计(1)完全随机试验:采用纯随机抽样的方式,将各试验观测个体随机地安排到所要试验的因素状态组合中。(2)随机区组试验:先将试验观测个体进行分类,然后将区组中的各试验个体随机地分配到所要试验的因素状态组合中。(3)拉丁方试验:将一组元素编排成行与列相等且每个元素
28、在各行各列出现一次且只出现一次的正方形方格。 (4)正交试验:利用正交表安排的试验。正交表由1、23等数字构成,任意两列的同行元素对都形成出现次数相同的完全对的矩阵表。 数据收集误差包括观测性误差和代表性误差 观测性误差也叫登记性误差或调查性误差。它是在调查观测的各个环节因工作粗心或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差,包括计量错误、记录错误、计算错误、抄写错误、汇总错误、计算机输入误差等工作误差。 代表性误差是指在抽样调查中,因样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。又分为系统性误差和偶然性误差两种。系统性误差,是由于抽样框不完善、抽样时违反随
29、机原则、被调查者无回答等因素引起的误差。偶然性误差,是由于抽样的随机性引起的样本结构与总体结构不完全相符而产生的估计结果与总体真值不一致的误差,这种误差在随机抽样中不可避免,但可以计算和控制。直接观察法是由调查人员到现场对被调查对象进行计量、点数和登记,或对实验结果进行观察和记录,直接取得第一手数据的方法。 2.1.4统计数据收集方法在观察过程中,调查人员所处的地位是被动的,也就是说调查人员对所观察的事件或行为不加以控制或干涉。 直接观察法又可以分为公开观察法和隐蔽观察法两种方法。 通讯法是调查组织者(例如政府统计部门)把调查表(例如统计报表或调查问卷)邮寄或电子传送给被调查者,被调查者按要求
30、填写后返回给调查组织者的一种数据收集方法。 2.1.4统计数据收集方法 采访法是由调查人员对被调查者进行采访,根据被调查者的答复来收集数据的方法。 2.1.4统计数据收集方法央视记者走基层,国庆期间忙着问:“您幸福吗?” 登记法是指当事人根据有关法制法规规定,在开展某些活动或发生某事件时,主动到有关机构进行登记,填写有关表格,提供有关统计信息。 2.1.4统计数据收集方法学籍登记、户口登记、工商登记等2.1.4统计数据收集方法网络、电话调查法是指通过互联网、电话对单位和个人进行有关问题的调查,以取得相关资料的方法。2.1.5问卷设计问卷的概念和结构 .问卷的概念与种类 问卷是依据统计研究目的和
31、要求,按照一定的理论假设设计出来的、由一系列问题、项目、备选答案及说明所组成的、向被调查者搜集资料的一种工具。自填式问卷 代填式问卷.问卷的结构问卷的附件 问卷的主要部分也可以放到后面问题种类事实性问题按表现形式分类按回答方式分类开放式问题封闭式问题意见性问题解释性问题问题的设计问题设计的原则:1、所列问题必须符合客观实际情况2、问题不能太多3、问题必须是被调查者有能力回答的4、不要直接提社会上禁忌的和敏感性的问题5、问题不能带有诱导性6、问题的内容要具体、单一7、问题的语言要简单易懂、标准规范8、问题的排列要讲究逻辑性问题设计案例:一、 您家有等离子电视机吗?、有、没有二、请问您在购买小轿车
32、时,主要考虑哪些因素?(选出您认为合适的答案) 、价格、款式、品牌、耗油量、售后服务、维修费用、乘坐舒适、行驶平稳三、您在购买这种牌子的电视机时,主要是考虑哪些因素? (按主要程度进行排序) 、产品的品牌、价格合理、售后服务、外形美观、维修方便四、您对这款轿车是否感到满意? 1、非常满意 2、比较满意 3、一般 4、不太满意 5、不满意 问题答案的设计 .问题答案的设计形式是非式 (对选式) 要求被调查者在两个可能答案中选择一个,例如“是”与“否”,容易发问也容易回答。但只限于搜集简单的事实或态度,对于既不肯定也不否定的答案就无法表示。多项式 列举几个可能的答案,由被调查者选出最符合自己情况和
33、意见的答案。优点是答案有一定的范围,便于被调查者取舍。但是,备选答案不可能穷尽所有可能的情况,因而也容易使被调查者做出随意应付的选择。顺位式 列出对某一问题不同层次的答案,由被调查排出次序,表示自己的态度和倾向。程度评价式 这是直接测定被调查者主观感觉和意见强弱程度的问句。 如:由被调查者根据自己的感觉和意见在上面圈注 0 1 2 3 4 5 6 7 8 9 10 很赞同 比较赞同 赞同 无意见反对 相当反对 很反对 比较式 把若干可比较的事物整理成两两对比的形式,由被调查者进行比较2.问题答案的设计原则 1)所列答案应包括所有可能的答案(穷尽) 不能遗漏 “其他”来弥补 2)不同答案之间不能
34、互相包容(互斥) 不能交叉 3)答案的表达必须简单易懂、标准规范(简洁) 4)每一项答案都应有明确的填答标记,答案与答案之间要留下足够的空格(方便)示例旅游及生活方式调查问卷简单的引言(略)旅游1、您是否喜欢旅游? 是 否 如果是,在3年内计划去哪? 中国 亚洲 欧洲 美国 澳洲 其他 如:2、当您旅游度假时选择哪种住宿? 别墅 公寓 酒店客房 其他 如:3、您通常与谁一同旅游度假? 夫妻小孩 亲友 朋友 其他 如:4、他们有护照吗? 有 没有5、您是否希望我们帮助您办护照呢? 是 否6、您旅游度假时通常使用:信用卡 支票 现金生活方式1、您是否已成为以下俱乐部的会员? 高尔夫俱乐部 健身俱乐
35、部 网球俱乐部 美容院 其他 (注明)2、您现在的住房是: 自购别墅 自购公寓 公司房 租住别墅 租房 与家人亲戚同住3、您的交通工具是: 私家车 公司车 打的 摩托车 其他 如:4、婚姻状况:已婚 单身 同居5、您的职业:_ 您的职务:老板 总裁 经理 职员 其他如: 您的年龄:低于26岁 2639岁 4059岁 60岁以上 6、您配偶的职业:_ 您配偶的职务:老板 总裁 经理 职员 其他如: 您配偶的年龄:低于26岁 2639岁 4059岁 60岁以上 7、你们夫妻双方的月收入合计(人民币/月) 1000元4000元 4000元8000元 8000元15000元 15000元以上 您的姓名
36、:_ 您的地址:_您的得奖联系电话为:家庭_手机_幸运号码:0012083-感谢您的宝贵时间 :0012083 为了感谢您的帮助,主办人将把所有填写完整的调查问卷存入电脑抽奖系统,该系统将赠一批高质量礼品给幸运中奖者,请保存您的回执单。祝您好运!公司地址: 联系电话: (一)判断题1、全面调查只适用于有限总体的调查。( )2、人口普查可以经常进行,所以它属于经常性调查。( )3、在任何条件下,典型调查的资料都可以推算总体指标。( )4、在统计调查中,调查单位和报告单位之间一般是有区别的,但有时也一致。( )2、统计调查对象指的是()需要调查的那些具体单位需要调查的那些社会现象的总体需要调查的各
37、项指标及数据负责向上级报告调查内容的单位3、调查工业企业设备情况时,每个工业企业是( )调查对象 调查单位报告单位 调查单位和报告单位4、调查工业企业经济效益时,每个工业企业是()调查对象 调查单位报告单位 调查单位和报告单位(二)选择题1、制定统计调查方案的首要问题是( )。选择统计调查的方式明确调查的任务和目的制定统计调查的组织实施计划明确统计调查的对象和单位2.2统计数据的整理2.2.1 统计数据整理的含义与要求2.2.2统计数据整理的步骤2.2.3统计分组2.2.4分布数列某班统计学的成绩表序号成绩序号成绩序号成绩序号成绩序号成绩1731081198828803775277117920
38、90298538873781275218230743972461137122953174407457314892376328541966921584248933744277778166925953482439188117862686358244829791876275936824551从以上成绩表中,你能看出什么信息?以下是反映月收入增长的两个图,请问谁的收入增长快?对统计学的成绩进行统计整理(统计分组)后的表和图序号组限人数160分以下226070分237080分1848090分17590分以上6最高分96分最低分51分平均分76.4分图1和图2的数据来源相同2.2.1统计整理的概念 统计整
39、理通常是指对调查所得到的原始资料进行分类、汇总,使之系统化、条理化的工作过程。 但广义的统计整理也包括对原来已经加工的综合资料的再整理。如历史资料的整理、统计年鉴的编辑、次级资料(如各出版物公布的)的加工整理等。 承上启下的作用统计整理是统计工作的第二阶段。这个阶段是统计调查的继续,统计分析的前提。统计调查统计整理统计分析统计工作统计整理的意义原始资料分散,不系统,难以从总体上分析和认识社会经济现象的数量表现。资料在分组方法、总体范围或指标涵义、口径、计算方法等方面不同,而不能满足统计分析的要求。通过统计整理:1.原始资料或次级资料变为综合资料,能够反映总体特征;2.发现和弥补调查工作的遗漏与
40、不足,提高资料的准确性。资料的审核资料的分类(分组)资料的汇总结果显示(图或表)2.2.2统计资料整理的基本步骤设计整理方案设计整理方案。与资料收集方案衔接、指标一致审核统计资料。包括:完整性、准确性、及时性进行统计分组。这是统计整理的关键问题。进行资料的汇总。这是统计整理的中心内容。编制统计表或统计图。呈现统计整理的结果。说明:1.统计整理前必须对资料进行审核; 2.选择最基本、最重要的指标对资料进行加工整理。 2.2.3统计分组 统计分组的含义 统计分组的种类统计分组的概念和原则概念 根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究对象的总体划分为若干个不同性质的组
41、。原则穷尽原则、互斥原则例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业 文盲或识字不多小学毕业中学毕业(含中专)大专毕业大学及大学以上 ()253342( )例2:某商场把服装分为男装、女装、童装。 成年装(男女装) 儿童装(男女装)统计分组的种类()按分组标志的多少不同简单分组复合分组按分组标志的性质不同品质标志分组数量标志分组( ) 对总体只按一个标志进行分组,称为简单分组。如:以产值作为划分企业规模的标志;按文化程度对人口总体进行分组。统计对总体往往要从多方面进行研究,仅仅依赖一个分组标志进行分组是难以满足需要的,必须运用多个分组标志进行多种分组,形成一个分组体系,
42、才能满足需要。 1.简单分组对同一总体选择两个或两个以上的标志层叠进行分组,就形成复合分组。例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、学制、性别等三个标志进行复合分组,得到如下分组体系。2.复合分组 文科理科本科专科男生女生男生女生本科专科男生女生男生女生按品质标志分组,就是选择反映事物属性差异的品质标志作为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。 例如:人口总体按性别,分为男、女两组; 再如:企业总体按所有制,分为全民、集体、合营、个体等组。 3.按品质标志分组按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,
43、并在数量标志的变异范围内划定各组界限,将总体划分为性质不同的若干组成部分。 例如,居民家庭按子女数分组,可分为0人(无子女)、1人、2人、3人;等等。 4.按数量标志分组例 1 为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:按存款性质分组 企业存款 储蓄存款 财政性存款按存款期限分组 活期存款 定期存款简单分组复合分组存款同时按其性质及期限分组 企业存款 活期 定期 储蓄存款 活期 定期 财政性存款 活期 定期例2 企业职工按工龄分组: 5年以下 510年 1015年 1520年 20年以上品质标志分组数量标志分组统计分组的作用 1、提示类型:统计分组的根本作用是将
44、复杂的社会经济现象按照统计认识的要求区分为各个性质不同的组成部分。 说明总体现象的内部结构。现象的内部结构是表明现象本质特点的一个重要方面,将同一总体不同时期的结构联系起来,还可以看到现象的发展趋势和规律。3、反映变化。将总体的分组资料按时间的移动联系起来进行分析,可以反映总体及各组在数量上的变动情况和变动规律。4、分析总体现象之间的依存关系。通过分组将有相互影响的现象联系起来进行研究,反映它们在数量上的变动规律。例如:商品销售额与流通费用率的关系;居民收入与储蓄额的关系。 2.2.4分布数列 在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,就叫做分布数
45、列(frequency distribution)。分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。分布数列的概念 各组名称(常用x 表示)两个构成要素 各组次数(有两种表现形式: 绝对数也称频数,用 f 表示 相对数称为频率,用表示。)按成绩分组X人数f60分以下360-70分870-80分1280-90分1090分以上7合 计40各组名称X各组次数f例:分布数列的种类由于分组是分布数列的基础,因此有怎样的分组就形成怎样的次数分布。综合上述各种的分组,分布数列的类型,可归纳为:分布数列品质数列变量数列单项数列组距数列等距数列异距数列不连续组距数列连续组距数列例:
46、1、某地人口的性别分布按性别分组次数人数(人)比重(%)男女154349271461329751.3748.63合计30048224100.002、学生的成绩分布学生按成绩分组x次数学生数(人)f比重(%)f/f60以下60-7070-8080-9090以上2820155416403010合计50100变量数列品质数列变量数列的编制1.单项数列的编制 1)确定变量数列的形式根据变量的性质及特点选择不同的变量数列。 2) 确定组距和组数 注意几个概念:上限、下限、组距、组数。 组数过多,组距太小,要避免将相同性质的单位分到不同组中去;反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一组
47、中去。 3) 确定组限(1)客观数量界限。(2)第一组的下限和最后一组的上限。有极端值时,第一组和最后一组可采用开口组。(3)尽可能采用或的倍数。 “上限不在内原则” 4) 确定分配次数 可利用EXCEL表进行汇总。2.组距数列的编制根据总体各单位的变量值进行同类合并,并列出相应的单位数或比重。单项数列不存在组距的问题,如下表所示。此时,组数等于数量标志所包含的变量值的数目。 1)确定组距和组数然而当所包括的变量值较多时,单项数列显得十分繁琐,如下表,难以反映总体内不同性质组成部分的分布特征。这就有必要编制组距数列。编制组距数列时,不仅要考虑各组的划分是否能区分总体内各组成部分的性质差别,还需
48、要确定适当的组距和组数,才能准确而清晰地反映总体的分布特征。在实际进行分组时,采用等距数列或异距数列,应决定于现象的性质和研究的目的。标志值分布比较均匀时,一般用等距数据;标志值分布很不均匀时,应采用异距数列 。 当偏度系数不大时,用斯特吉斯(美国H.A.Sturges)经验公式确定组数:n为组数,N为总体单位数,d为组距,R为全距,即最大值(xmax)与最小值(xmin)的差。根据这个公式,可得出如下的组数参考标准:N15242544458990179180359n56789 当偏度系数大时,分布明显偏态时,以平均数为中心,以K倍标准差为组距。1)确定组距和组数有时异距数列能比较准确地反映总
49、体内部各组成部分的性质差异。在异距数列中,各组频数或频率不能直接比较。为消除各组组距不同所造成的影响,需要计算频数密度或频率密度。频数密度是频数与组距之比,频率密度是频率与组距之比。各组的频数密度或频率密度可以进行比较。在社会经济统计总体中,有一部分现象性质差异的变动并不均衡,很难用等组距的办法近似地区分性质不同的组。譬如,为研究人口总体在人生各发展阶段上的分布,就需要按照人在一生中自然的和社会的发展规律采用异距分组。例如,整理我国1982年第三次人口普查资料时采用了如下的异距分组。1)确定组距和组数 统计年鉴中按年龄分组为:0-14少年15-64 中青年65岁以上老年1)确定组距和组数 当组
50、距、组数确定后,只需划定各组数量界限便可编制组距数列。一般讲来,按数量分组标志分组的组限应是决定事物性质的数量界限。然而在具体划分时,尚需在遵循这一原则的前提下,从次数分布特征的角度考虑编成的组距数列是否真实地反映了总体内各个单位的实际分布特征。 例如:某小组10名工人的基本工资变量资料如下(单位:元): 45 49 54 56 58 60 62 64 69 702)组限的确定设已确定分为低、中、高三个工资组,各组组距为10元(已确定组数和组距)。 于是可以有如下两种划分组限的方法,形成两个分布特征不同的组距数列(表4-15、表4-16)。表4-15的分布持征反映着高工资的工人占全小组工人数的
51、一半,中等工资的工人数居中,低工资的工人数最少。表4-16的分布特征反映着中等工资的工人占全小组工人数的一半,低工资的工人数持中,高工资的工人数最少。 究竟哪一种分布特征准确?需要依据该小组工人工资变量的实际分布来检验。2)组限的确定工资(元)工人数(人)40-50250-60360-705合计10表工人按基本工资分组工资(元)工人数(人)45-55355-65565-752合计10表工人按基本工资分组可以看出,这一数轴可以分为三个区段:其中以5565元一段变量值分布最为密集;数轴的首段,则是另外一种形态,变量值分布较为稀疏;而在数轴末段,直至70元附近才有两个变量值出现。因而可以判断,表4-
52、15的组距数列正是由于组限划分不当将最密集的55-65段变量值拆散在两个组内,造成了高工资组分布最多的假象。2)组限的确定 组距数列掩盖了分布在组内各单位的实际变量值。为了反映各组中个体单位变量值的一般水平,统计工作中往往用组中值来代表它。组中值是组内变量范围的中间数值,通常可根据备组的上限、下限进行简单平均,即:组中值(上限+下限)/2例如:3)组中值的计算 3)组中值的计算在编制组距数列时,为了避免出现空白组,同时又能使个别变量离差较大的单位不致于无组可归,往往在首末两组使用“以下”及“以上”的不确定组限的形式。这种形式叫做“开口组”。 为进行统计分析,有时也要假定开口组的组限,并计算其组
53、中值。一般可按相邻组的组距来计算“开口组”的假定的组限然后再计算组中值。计算式为, 首组假定下限首组上限邻组组距(4) 组中值上限邻组组距/2 末组假定上限末组下限邻组组距(5) 组中值下限邻组组距/23)组中值的计算次数是分布在各组中的个体单位数。如用相对数形式表示便是比率。比率是一种结构相对数,各组比率之和应等于1或100。各组次数或比率的大小意味着相应的变量值在决定总体数量表现中所起的作用不同。次数或比率大的组,其变量值在决定总体数量表现中的作用就大,反之就小。 4)分布数列的次数由于社会经济现象性质的不同,各种统计总体都有不同的次数分布,形成各种不同类型的分布特征。1.频率分布的性质
54、按顺序列出各组的组别及相应的频率,就构成频率分布。频率分布可以比频数分布更好地体现出总体分布特征。频率分布有两个基本性质:一是各组频率都是一个介于0与1之间的分数,即大于0而小于1;二是各组频率之和等于1。2.累计频率分布 在频数分布的基础上,将各组频数依次累计,就形成累计频数分布。各组累计频数与总频数之比,就形成累计频率分布。 频率分布 累计分布有向上累计分布与向下累计分布两种。 向上累计分布是将各组的频数或频率由变量值小的组向变量值大的组累计,累计结果分别说明各组上限以下的累计频数或累计频率的分布状况。当累计到最后一组时,其累计频数或累计频率等于总频数或100%。 向下累计分布是将各组的频
55、数或频率由变量值大的组向变量值小的组累计,累计结果分别说明各组下限以上的累计频数或累计频率的分布状况。当累计到最后一组时,其累计频数或累计频率等于总频数或100%。 频率分布表2-4 某年年底某高校在职教师年龄累计分布数列教师按年龄分组人数(人)比重(%)向上累计向下累计频数(人)频率(%)频数(人)频率(%)30岁以下3040岁4050岁5060岁60岁以上201317366151 1519.14 30.19 34.86 14.38 1.43 201 518 8841035105019.1449.3384.1998.57100.001050849 532 166 15100.00 80.86
56、50.67 15.81 1.43合计1050100.00 2.3数据的显示 2.3.1 统计表2.3.2 统计图统计表 将统计数据按一定的顺序排列在表格上,就形成了统计表。从广义讲,统计表包括统计工作各阶段所使用的一切表格,有调查表、汇总表和分析表。本章将侧重就表现统计整理结果所用的统计表进行讨论。 1从统计表的形式上看,可由总标题、横行标题、纵栏标题和指标数值四部分组成。 此外有些统计表在表下还增列补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。统计表的构成统计表的构成横行标题 指标数值表2-5 2005年我国三次产业增加值及增长情况表 总标题产业增加值
57、(亿元)占GDP的比重(%)比2004年增长(%)第一产业第二产业第三产业227188620873395 12.40% 47.30% 40.30% 5.20%11.40% 9.60%合计182321100.00% 9.90%资料来源:国统计局,中华人民共和国2005年国民经济和社会发展统计公报,。 主词 宾词纵栏标题总标题是表的名称,用以概括统计表中全部统计资料的内容。一般写在表的上端中部。横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。指标数值列在各横行标题与各
58、纵栏标题的交叉处。统计表中任何一个数字的内容由横行标题和纵栏标题所限定。统计表的构成统计表的内容可以分为两个组成部分:一部分是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部,这一部分习惯上称为主词。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词。统计表的内容统计表的种类 统计表根据主词是否分组以及分组程度不同,可分为: 1、简单表,是指对总体未作任何分组而形成的统计表,可以有两种形式:一是按总体单位名称排列的统计表;二是按时间顺序排列的统计表。 2 、简单分组表,是指总体仅按一个标志分组而形成的统计表。 3、复合分组表,是指
59、总体按两个或两个以上标志进行复合分组而形成的统计表。统计表年份国内生产总值(亿元)1996199719981999200067884.6 74462.6 78345.2 82067.5 89403.6 1、我国近年来国内生产总值资料:2、1999年日均创国内生产总值:按产业和行业分组国内生产总值(亿元)第一产业第二产业 工业 建筑业第三产业 交运仓储邮电通信业 批发零售贸易餐饮业 其他39.6110.795.814.974.112.218.743.2合计224.4简单表复合表按产业分组国内生产总值(亿元)第一产业第二产业第三产业 39.6110.774.1合计224.4简单分组表 简单设计:说
60、明主词的各项指标在表中并列平行排列。 复合设计:说明主词的各项指标在表中层叠排列。统计表的宾词设计统计表3、1999年日均创国内生产总值:按产业和行业分组国内生产总值(亿元)比重(%)第一产业第二产业 工业 建筑业第三产业 交运仓储邮电通信业 批发零售贸易餐饮业 其他39.6110.795.814.974.112.218.743.217.749.386.513.533.016.525.258.3合计224.41004、某市近年从业人员分布表:年份三 次 产 业第一产业第二产业第三产业小计男女小计男女小计男女1997199819992000总计宾词简单设计宾词复合设计统计表的编制规则开口式上下端
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年广安市金证民商事调解中心委托公开招聘1名劳务派遣电话调解员岗位的备考题库含答案详解
- 2026年国家电投集团氢能科技发展有限公司招聘备考题库含答案详解
- 2025年湖州市吴兴区国有企业工作人员公开选聘备考题库及一套答案详解
- 2026年中新嘉善现代产业园开发有限公司招聘备考题库及完整答案详解一套
- 2026年北部湾职业技术学校关于招聘历史、地理、物理和化学类教师5人的备考题库及参考答案详解1套
- 2026年厦门大学药学院陈海峰教授课题组科研助理招聘备考题库附答案详解
- 2026年天津中远海运泰港化工物流有限公司招聘备考题库及参考答案详解一套
- 2026年呼伦贝尔市大学生乡村医生专项计划公开招聘备考题库带答案详解
- 2026年内蒙古恒科新材料科技有限公司招聘备考题库及一套答案详解
- 2026年北京市海淀区中关村第一小学教育集团招聘备考题库及1套参考答案详解
- 2026 年高职应用化工技术(化工设计)试题及答案
- 2026年山西供销物流产业集团面向社会招聘备考题库及一套完整答案详解
- 2024-2025学年重庆市大足区六年级(上)期末数学试卷
- 2025年高级经济师金融试题及答案
- 苏少版七年级上册2025秋美术期末测试卷(三套含答案)
- GB/T 7714-2025信息与文献参考文献著录规则
- 2025年苏州工业园区领军创业投资有限公司招聘备考题库及一套参考答案详解
- 涉融资性贸易案件审判白皮书(2020-2024)-上海二中院
- DB65∕T 8031-2024 高海拔地区民用建筑设计标准
- 2024年暨南大学马克思主义基本原理概论期末考试题带答案
- 2025内蒙古能源集团智慧运维公司社会招聘(105人)笔试参考题库附带答案详解(3卷)
评论
0/150
提交评论