


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据、模型与决策第一章1社会科学研究中,积极借助定量分析可达到的目的:1、通过引进数量研究方法,可以在一定程度上改变社会科学的研究面貌。2、通过增加数量研究的成分,可以改变社会科学工作者的身份。3、数量分析法可以为经济政策和管理措施的制定提供实验室的论证与检验。4、数量分析法可以提高研究结论的精确化水平。2模型的概念:对客观事物的一种描述、模仿或抽象。3数据、模型与决策的关系:1、数据、模型共同服务于决策分析。2、从应用的角度讲,统计方法比较强调实证性做法。统计的语言是数据,没有大量的、客观准确的数据资料,统计决策分析只能停留在纯理论的阶段,无法形成具体的分析结论。3、数据资料本身存在不系统、不充分、不完备的问题。因此,背景数据必须经过科学的编辑处理汇总提炼才能用于决策。对此,模型起着重要的转化作用。4原则上,运用定量方法开展决策分析需要考虑以下要求:1、以定性分析为先导。2、以管理决策为根本目标。3、以科学方法论为指导。4、以数学模型为主要工具。5、以软件应用为辅助性手段。5运用数量分析管理手段进行管理决策需要经过的步骤:1、明确对象。2、建立决策分析模型。3、搜集数据资料。4、模型求解和检验。5、结果解读和敏感性分析。6、形成决策分析报告。第二章1搜集数据资料之前,提纲的内容:1、研究目标。2、研究对象。3、研究变量。4、数据资料搜集的渠道。5、资料的最终用途。2统计数据资料的来源:1、直接来源:把搜集第一手统计资料所采用的方法称为直接来源。2、间接来源:把搜集第二手资料的渠道称为间接来源。3普查的概念、作用和特点:普查是专门组织的、一次性的全面调查,主要用来搜集某一时点或一定时期内现象总量的资料。通过普查所得到的资料,在了解国情国力、制订社会发展规划、确定重大决策方面,发挥重要作用。特征:1、定期举行。2、依法进行。3、应用广泛。4、质量控制。5、项目增多。6、计算机介入。4随机抽样调查的概念、优点:抽样调查既具备一般非全面调查的优点,又可以通过科学推算达到对研究对象的认识,因而是一种最常用、最重要的获取统计资料的手段。抽样调查是指按照随机性原则,从调查对象中抽取一部分单位组成样本,然后根据样本调查的结果,对总体情况进行推断。优点:组织实施灵活方便,具有普查等全面调查不可比拟的优势,是现代统计活动中搜集资料广泛使用的手段之一。5抽样调查的种类:1、简单随机抽样的做法:从总体N个单位中抽取n个单位组成样本时,保证每一个单位被抽出来的概率相等。2、分层抽样的环节:将总体分成互不交叉重叠的若干层。再从各层中抽取一定数量的个体单位。3、整群抽样的做法:先将总体划分为若干互不交叉的群组,然后以这些群为抽样单位进行抽样,并对被抽中的群实行全面调查。4、系统抽样的做法:先将总体单位按某种标识排列,在规定的范围内随机抽取第一个样本单位,此后按一套规则确定其他样本单位。5、多阶段抽样不是一次性直接从总体中抽出,而是分两个后两个以上的阶段完成。6、双向抽样的做法:先从总体中随机抽取一个较大的样本,获得第一重抽样,然后从第一重样本中随机抽取一个较小的样本即第二重样本,利用第二重样本,对研究目标进行统计推断。6非随机抽样的种类包括:1、判断抽样:指通过对调查对象深入细致的了解和分析,并结合统计研究任务的需要,有意识地选取一部分单位进行调查。2、任意抽样的确定取决于现场情况、调查者的现场判断和被调查人是否愿意配合。调查对象的各个组成成分比较均质,任意抽样调查的结果具有较好的体现性。3、配额抽样:在进行样本调查之前,先对总体进行分解处理,把总体划分为不同的组别,并且规定每一组别的抽样数目,至于各个组别中最终抽出哪些单位,由调查人员自行决定。7内容分析法和参与观察法的特征和做法:1、内容分析法就是解决上述问题所使用的统计采集分析资料的工具,它把非定量的文献史料、语言习惯等带有特征的因素设法转换成可以量化处理的数据,然后对这些数据进行定量分析并作出相应的判断。2、参与观察法与卧底、暗访有类似之处,研究人员亲身参与到被研究人员的日常生活中,利用长时间的相处,消除被研究人员的戒心,以搞清所发生的事情及其真正的原因。8间接来源的渠道:公司内部的历史记录、政府部门、国家统计局、专门从事数据资料采集的组织、产业协会和特殊利益组织、因特网。9利用间接资料的注意事项:1、结合研究和分析目的,有针对性地获取所需要的统计研究数据。2、评估间接资料的可用价值。3、注意指标的含义、口径、统计方法的可比性。4、注意弥补缺失资料。10 定类资料:对事物进行分类或分组得到的结果。定序资料:语义上表现出明显的等级顺序关系的定类资料。定距资料:具有定序资料的所有特征,并且任意两个数之间可以比较差距大小的统计资料。定比资料:具有定距资料所有的性质特征,并且有一个绝对零点的资料。11截面资料:在同一时点搜集起来的有关研究总体各个单位的资料。通过截面资料,可以分析总体内部的构成情况,了解社会现象在空间范围发展的差异。12时间序列资料:将若干时间点搜集来的资料按时间的先后顺序排列在一起。通过这些资料可以考察同一现象在不同时间上发展变化的过程,掌握社会经济动态变化的趋势。13面板资料:截面资料和时间序列资料交织在一起。既具有截面资料的特征,又具有时间序列资料的特征。14数据质量的解释:获得的观察值与客观现象实际数量水平之间的离差。15数据质量的相对性及影响因素:1、做任何一项工作难免有误差。2、统计数据质量误差普遍存在的原因是调查准备工作不充分、数据搜集阶段产生误差、资料整理阶段产生误差。3、数据搜集阶段产生误差。4、数据处理阶段产生误差。16数据质量检验的后验技术的概念和特征:1、概念:是在调查工作已经完成,进入数据编辑和整理阶段所用的评估数据质量的方法。2、特征:不再亲临现场,而是通过逻辑关系分析、计算以及将调查数据与独立来源的资料进行对比的方式确定调查数据的质量。17数据质量检验后验技术的方法:1、逻辑关系分析法:把调查数据与人们普遍接受的对现象的某些特征或关系的看法进行比较,以判断有无矛盾的地方。2、计算比较法:如果掌握了大量资料,可通过计算或利用平衡公式来检查数据的质量。3、设置疑问框法:现象之间客观上存在一定的量值范围和比例关系,根据这种量值范围和比例关系,可以判断参照标准,从而据之判断数据的误差大小。4、与独立来源数据对比法:把调查数据与和该调查不同的调查数据进行比较,通过两者的差别验证调查数据的误差。18运用后验技术检查数据质量应注意的问题:1、后验技术的使用范围比较有限,因为这种方法常常要求所研究现象的变化具有某种规律性,对那些调查特征变化无常的活动,后验技术因找不到合理的假设而不能使用。2、所有的后验技术都仅适用于对最后调查结果的检查,不能用于单项数据误差的评估。3、有同一研究主题的大量统计资料。4、作为对比、推算基础的资料必须准确,否则无法知道调查数据的误差。5、后验技术检查的结果只反映数据的质量,不能提供新的统计数据。19抽样方法的概念:在一次调查之后,紧接着再从这些被调查单位中抽取一定数量的单位组成样本,重新调查登记,最后将两者的结果进行对比,以检查先前调查数据的质量,并进行适当的调整。20抽样方法的优点:1、数据质量检验的结论完全根据样本资料得出,因此不管有没有相关的统计资料可依,无论是过去是否做过类似的调查,都不会影响现在数据质量评估。2、运用灵活,适用于各种场合的调查数据检查,不仅可以帮助了解数据的质量水平,还可以帮助寻找产生误差的原因。3、有助于提高数据的质量。4、抽样方法不受对调查项目之间关系假设的限制,如果对它们的情况了解不多,那么抽样法就成了唯一的检查手段。5、运用调查方法,可以获得一些额外的资料。6、后验技术只能说明数据有无质量问题,抽样方法不仅能做到这一点,还可以估算数据误差的大小,对原调查资料进行修正和调整。21抽样方法应注意的问题:1、必须在一次调查之后不久进行,防止时过境迁。2、样本数据是检查的依据,样本数据的搜集和核查需要由专业人员完成。3、样本单位的确定要考虑到随机性要求,数量不应太少。22实施数据变换的理由:1、能够运用简单的方法开展分析。2、 有助于从原始资料中迅速获得更加清晰的信息。3、能够保证数据分析所需要的假定条件得到满足。4、有助于弱化乃至消除数据资料不准确对计量分析结论的影响,有助于减少模型受到的干扰,有利于减少预测和估计的误差。5、有利于选择和建立合适的分析模型。23数据资料的变换方法:1、线性和线性化变换:线性变换是针对既定的线性关系所做的变换处理,一般只涉及原点的改变和形状的压缩和放大,不会从根本上改变变换后数据与变换前数据之间的线性关系。线性变换是通过变换将一个非线性的函数关系转化成标准的线性函数关系。2、差分变换。3、方差稳定性变换:目的是使变换后得到的新样本观察值的方差趋近于某个恒量。方法:算术平方根变换,即对观察值取算术平方根。对数变换:即对观察值取自然对数。第三章1统计表的种类:1、根据变量的数目,分为单变量统计表(反映某个变量数值的变化情况)、两变量统计表(反映两个变量数值变化和相互之间的关系)、多变量统计表(并列编排和交叉编排)。2、根据指标反映的内容,分为计数分布表和计量计值表。3、根据表中的时空特性,分为空间截面统计表(同一时间维度下进行观察或调查得到的统计资料)、时间序列表(将某一现象随着时间变化产生的结果按时间顺序编制在一起)、混合截面表(把几个不同时间维度下的空间截面资料编织在一张表中)、面板数据表(由一系列样本的时间序列资料编制而成,与混合截面数据表主要区别是,对每个样本单位都进行了动态跟踪观察,混合截面数据表虽然也有时间因素,但不同时间下的样本观察单位可能完全不同)。2频数分布是在统计分组的基础上形成的样本单位在各个组间的分配。频数分布有两大要素组成,一个是各个组的名称,另一个是各组变量的出现得到次数。把每个组观察值出现的次数称为频数,用以反映各组观察值发生的频繁程度。3频率的性质:1、Pj为正数。2、所有组频率之和等于1。频率分布的累积量包括累积频数和累积频率。1、累积频数:几个相关组发生频数的合计,能够反映组合并后的观察值总共出现的次数。2、累积频率:几个相关组发生频率的累加和,能够用于描述和解释组合并后观察值出现的相对频繁程度。4频数分布编制的意义:搜集来的原始数据往往杂乱无章,加上人的直觉认识能力有限,不对其进行必要的加工整理,很难据以形成有价值的认识。频数分布是统计资料整理和描述分析过程中经常使用的方法,能对观察资料实施大幅度的压缩和提炼,使资料以更加清晰、简洁的形式展现出来,从而便于人们直观地了解现象的内部结构。5全样本频率:把交叉出现的频数与全部样本相除得到。行样本频率:将每一行的频数分别除以该行的样本数。列样本频率:每一列中的频数分别除以该列样本数之和的结果。6全样本频率、行样本频率、列样本频率的功能:各自都有自身的优点和不足,具体运用时,需要遵守经验法则:用行变量解释列变量的,最后采用行样本频率,用列变量解释行变量的,最后采用列样本频率。7茎叶图的概念:把每个观察数据划分成两个部分:主部和余部,分别用植物的茎和叶形象地称呼,然后把数据的主部按从小到大的顺序纵向排列,再在每个数据的主部后面列出余部,由此得到的统计图称为茎叶图。8茎叶图的好处:1、整理资料时,不需要做什么准备工作,省时方便。2、同时具有频数分布和直方图的功能。3、由于保持了原始资料的信息,还原能力强。9算术平均数的概念和特征:概念:将样本观察值累加起来除以观察数目。特征:1、同时受两个因素的影响,一个是各组观察值的大小,一组是各组分布频数的多少。2、易受极端值的干扰。10中位数、四位数的概念和特征:概念:把观察值从小到大排列,位置居中的数叫中位数。特征:1、不受极端值的影响。2、由组距频数分布资料计算中位数时,要求是等距分组,且要求观察值在中位数所在的组中近似服从对称分布,否则计算结果可能存在误差。3、对于观察值大量重复的现象,中位数未必准确。将一组观察资料按升序排列,然后分成四段,位于第一个分界点处的值叫下四分位数,位于第三个分界点叫上四分位数。11众数、截尾均值的概念和特征:概念:众数根据观察值出现频率的大小来确定,观察值中出现次数最多的数值。特征:可以作为频数分布集中趋势的代表性指标。众数存在的基本条件是,观察值必须出现某种程度的堆集,均匀分布或各个组观察值出现的频数差别不大,就不会有众数。与中位数一样,众数不受极端值的影响,具有较好的统计稳健性。去掉最大和最小值后保留下来的平均值称截尾均值。12集中趋势特征数据字的综合利用:1、算术平均数、中位数、众数的综合应用: 1衡量社会收入分配水平和财富占有状况时,算术平均数远不如中位数或众数能使人感觉真实。评估风险型产品如股票的价格波动时,人们更喜欢采用中位数而不是算术平均数。农副产品价格采集,衣着类产品的加工尺寸,实际中采用更多的是众数。2从利用样本资料的信息的角度来看,算术平均数对资料信息的利用最充分,但其抗干扰性差。中位数、众数具有极强的干扰性,然而对资料信息利用的充分性较差。正因如此,才提出了截尾均值。3将算术平均数、中位数和众数结合起来,可以大致判断现象存在状态的对称性。2、中位数与四分位数结合起来能发挥更大作用。在风险性问题的分析中,人们经常用到箱线图。箱线图由最大值、最小值、中位数、上四分位数、下四分位数这五个特征数字绘制的图形。(P54-55)13测定观察资料离散趋势的作用:1、反映算术平均数的代表性程度。2、可用于频数分布间的比较。3、有助于对数据分散程度的考察。14极差的概念和性质:概念:是观察资料中最大值与最小值之间的离差。性质:1、极差很好理解也容易计算,通过直接观察就能得出结论。因为具有这些特点,所以在质量控制的现场统计中,往往用极差反映质量的波动情况。2、然而,作为反映观察值离散性的统计量,极差的作用很有限。极差只考虑最大的观察值和最小的观察值,不顾及数据中其他数值之间的差异,显然它所能反映的离散信息不充分。3、如果样本资料中间的观察值差别不大,只是最大值与最小值相差悬殊,那么单纯依赖极差度量,可能会夸大样本间的离散程度。15四分位数差的概念和性质:概念:用一组数据的上四分位数减去下四分位数,就得到四分位数差,以IQR表示四分位数差,则有IQR=Q0-Q1,四分位数差大,表明数据的离散程度大,反之则意味着离散程度小。性质:具有较强的干扰性,比极差小得多,所以它常常被用来诊断数据中是否存在极端异常值。16方差与标准差的概念和作用:概念:观察值与它们的算术平均数离差平方和的算术平均数称为方差。对方差开平方得到标准差。作用:方差与标准差的数值大,说明离散程度大,反之说明离散程度小。17变异系数的概念和作用:概念:把算术平均数与标准差联系起来的一个测度。作用:在观察值基数水平和研究对象性质不同的几组资料间进行离散差异比较,就需要使用变异系数。18切比雪夫经验准则:任何一个数据集中,至少有11/z2个数据位于均值附近z个标准差的范围内,其中z为任意一个大于1的数。19相关系数的概念、公式和应用:相关系数是反映变量间线性相关关系的重要指标。根据总体资料计算的相关系数称为总体相关系数,用P表示,由样本资料计算的相关系数称为样本相关系数,用r表示。公式、应用:(P60-62)20属
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 布病防培训课件
- 2025年特种作业类特种设备作业-溶解乙炔气瓶充装P3参考题库含答案解析
- 2025年特种作业类危险化学品安全作业胺基化工艺作业-氯碱电解工艺作业参考题库含答案解析
- 2024-2025学年高一下学期化学期中模拟卷一含答案解析
- 2025年特种作业类危险化学品安全作业氟化工艺作业-裂解(裂化)工艺作业参考题库含答案解析
- 布施健康知识培训内容课件
- 南和五年级期末数学试卷
- 乐清乐成一中数学试卷
- 南宁重点小升初数学试卷
- 2025年学历类自考公共课计算机应用基础-英语(二)参考题库含答案解析
- 注重整体强化联系提高质量(西南师大李忠如)
- NB-T 33025-2020 电动汽车快速更换电池箱通.用要求
- JT-T-864-2013吸油拖栏行业标准
- 广东省深圳市2022-2023学年八年级下学期英语期末试卷(含答案)
- DB32-T 1510-2015升降作业平台检验规则
- 知识题库-人社劳动知识竞赛测试题及答案(十三)
- 读书分享交流《爱心与教育》课件
- 新手直播方案
- 消毒隔离技术
- 符合RBT214-2017防雷装置检测机构质量手册+检测作业指导书2021首版
- 6S证据资源金字塔模型
评论
0/150
提交评论