调查资料的数据统计分析_第1页
调查资料的数据统计分析_第2页
调查资料的数据统计分析_第3页
调查资料的数据统计分析_第4页
调查资料的数据统计分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场调查与预测,第7章调查资料的数据统计分析,第7章调查资料的数据统计分析,第1节数据统计分析的概要第2节单变量数据统计分析第3节双变量统计分析第4节多变量统计分析,第1节数据统计分析的概要,数据统计分析,根据数学科学用各种方法分析事物数量的特征,进而阐明事物的特征及其规律性一、数据统计分析的特点(一)量化(二)客观性(三)系统分析(四)方法和工具(五)科学性,二)数据统计分析的类型和程序,(一)数据统计分析的类型1 .统计学的主要功能,数据统计分为统计分析和估计统计分析。 (1)记述统计分析的(2)推测统计分析,表7-1的数据的4种计量尺度及其适用统计方法的比较,2 )根据相关变量多少分为单变量、双变量和多变量统计分析,(1)单变量统计分析通过计算分析某个变量数据,总结其数量水平和其他特征,或者推测整体(2)二变量统计分析二变量分析目标是确定两个变量之间的相关性,测量它们之间的预测和解释的能力。 根据测定的程度不同,所使用的分析方法也不同。 (3)多元统计分析多元统计分析是一种统计方法,包括很多方法,最基本的是单元变量,进一步扩展的多元分析。 统计资料中同时存在多个变量(或要素、指标)时所采用的统计分析是统计学的重要分支,是单变量统计的发展。 (2)数据统计分析的顺序,1 )明确数据统计分析的目的。 2 .统计资料的整理工作。 3 .确定变量类型并选择统计方法。 4 .计算统计值。 5 .统计推理。 三、数据统计分析的作用和要求,一.数据统计分析的作用(一)提供简洁、清晰、明确的语言,有助于调查研究人员进行科学的定量分析。 任何东西总有质和量两个特性。 (2)帮助我们管理大量调查资料,方便数据资料的显示、保存和比较。 (3)有助于我们认识复杂的社会现象,找出其中的内在联系和规律。 (4)有助于更准确地预测社会现象的发展变化趋势。 不仅可以预测某个社会现象会发生怎样的变化,还可以预测其预测本身有多大的可靠性。 (5)运用统计分析,对调查研究人员自身的思维方式和调查研究态度也有很大影响,有助于调查人员避免“成见”的片面性,培养思维和行为的严谨性和准确性。 第一,数据统计分析应结合前面的几个环节。 第二,数据统计分析必须与定性分析相结合。 第三,数据统计分析要与认真工作态度相结合。 第四,数据统计分析必须与调查目的相结合。 2 .数据统计分析的要求,第二节单变量数据统计分析,第一、描述性统计分析描述性统计分析是市场调查资料分析中最常见的定量统计分析方法,主要描述和评价调查对象的数量特征和规律。 (1)数据中心趋势分析1 .数据中心趋势分析的定义数据中心趋势分析是准确描述整个调查特征的重要前提。 中心倾向是数据分布集中在一个分布中心的倾向。 第一,阐述一定条件下社会现象数量的一般水平。 第二,估计或预测整个调查中各具体单位的数值。 第三,比较两组数据,确定一组数据与另一组数据之间的数字差异。 第四,可以分析社会现象之间的依赖关系。 2 .中心趋势值的意义3 .反映数据中心趋势的常用指标,(1)平均值:总体单位的数值总和除以指标值项数。如果等差或等比例数据以组、组或层的形式出现,则可以使用以下公式计算平均值: 其中,对于特定特性样本的平均值,n是样本单元数目、第I组、组或层的样本单元数目、第I组、组或层的平均值,或k是组、组或层的数目。 (2)众数:众数是整体中各单位出现在某个标记的次数最多的变量值,也是测量数据集中倾向的一种方法。 克服了平均指标受数据中极值影响的缺点。 (3)中央值:中央值是当整体的各单位按某标记上的数值大小顺序排列时,位于中间位置的变量值。 在一些情况下,反映现象的中值的一般水平比算术平均值具有代表性,尤其是两极分化更为严重。 调和平均也称为倒数平均,是指各变量值的倒数的算术平均的倒数。 一般来说,符号表示式中的每一单位的数值,且n表示样本的数目。 调和平均是集中倾向的测度值之一,以平均的另一种表现形式,适用于比例数据的分析,同样容易受极端值的影响。 (4)调和平均值,返回,(5)几何平均是n个变量值的乘积的n次方,通常以符号表示,并应用于对比度数据的平均值,主要用于计算平均增长率和平均发展速度。 计算式中,1 .全距离全距离(也称为极差)是数据中的两个极值之差。 一般来说,总距离越大,值的代表越小。 2 .极差也被称为总距离,其指变量序列中的最大变量值和最小变量值之间的差,并且一般由符号r来表示。 其计算式是:极差=最大标志值-最小标志值根据组间距数列求出极差的计算式,极差=最高组上限-最低组下限可以根据极差的大小说明标志值的变动范围的大小。 (2)数据的离散度分析,3 .平均差平均差是整体的各单位指标值及其算术平均的离散绝对值的算术平均。 平均差异和平均的代表关系,与极差基本一致。4 .方差和标准偏差这两个指标是测量数据方差程度的最重要的指标,反映了整个单位指标值与平均值的方差关系,数值的大小和平均值的代表性大小正在逆向变化。 标准偏差的计算式中,5 .离散系数上述各指标的变异度指标是整体的各单位指标值的变异测定的绝对量指标。 一般的离散系数主要是标准偏差离散系数。 其式:6 .频度数学上的频度是指在相同的条件下进行n次实验,在该n次实验中,将事件a发生的次数n(A )称为事件a发生的频度。 比较n(A)/n称为事件a发生的频率,记为fn(A )。 1 .结构相对指标,2 .相对指标的比较相对指标可以反映同一时间、不同空间内类似现象的差异程度,通常表示为倍数或百分比。 3、比例相对指标需要比较不同的部分,以掌握整个社会经济现象各组成部分之间数量的相关性。 4、强度相对指标与强度相对指标有密切关系的两个不同性质的总量值之比,反映了现象的强度、密度和普通度。 强度相对指标是特殊的相对数,一般以复名数为单位来表示。 二、推定性分析、推定性统计分析分为两类: (1)参数推定。 参数的估计是指根据一个随机样本的统计值来估计整体的参数值为多少。 包括点估计和区间估计(2)的假设验证。 这首先假定总体情况,然后使用随机样本的统计值来验证该假设是否正确。 也就是说,在构想整体情况后,对样品资料进行抽样分析。第三节双变量统计分析,一、相关分析相关关系是指在一个变量与另一个变量之间存在非严格且不确定的依赖关系。 其计算公式为二、方差分析用于两个和两个以上样本均值差异的显着性检验。 其目的是通过数据分析找出影响此事物的因素、各因素之间的相互作用、影响因素的最佳水平等。 三、交集分析交集是一种以表格形式同时描述两个以上变量和结果的统计方法,反映了变量的协同分布。 交叉分析的变量必须是离散变量。 在进行市场研究的过程中,我们可以通过简单的描述性分析来解决很多数据分析问题。 第四节多变量统计分析、第一、多变量相关分析多变量相关分析主要用于描述两个以上变量之间的相关程度。 偏振相关系数是在控制其他变量的条件下获得的两个变量之间的相关性指标。 二、多元判别分析判别分析是判别样本所属类型的多元统计方法,由fisher (r.a.fisher )于1936年提出。 常用于生产、科研和日常生活。 例如,市场调查研究中,市场调查员可以根据调查数据,判断产品是畅销,一般还是滞销。 判别分析的原理,判别分析是对事物进行分类的方法。 在将已知研究对象划分为若干类型(或组)并获取各种类型的样本观测数据之后,鉴别分析器基于某一准则产生尽可能区分属于不同类型的数据的鉴别函数,以便确定未知类型的样本应属于哪种类型判别分析过程包括五个基本步骤:第一步,明确研究目标,确定判别变量和参数,定义问题。 在步骤2中,估计判别函数的系数。 在步骤3,确定函数的有效性检验。 在步骤4,描述判别系数。 步骤5,验证结果。 三、聚类分析聚类分析是一种建立分类的多变量统计分析方法,又称群分析、聚类分析或分类分析,是一种基于某些标准或许多特征,根据性质亲疏度在缺乏先验知识的情况下自动对个体(样本或变量)进行分类的多变量统计分析方法。 四、因子分析因子分析是将多个变量转换成少数综合变量的多元分析方法。 所描述的变量是可观测的显着变量,综

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论