




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 市场调查资料的整理与分析,陈方英,第一节 市场调查资料的整理,第二节 市场调查资料的分析,小结,第一节 市场调查资料的整理,一、资料整理的步骤和内容 1、步骤 2、审查内容 1)资料的真实性 2)资料的准确性 3)资料的完整性,二、资料整理的方法,1、行列选择与数据输入 2、汇编、制表和绘图,第二节 市场调查资料的分析,定性分析与定量分析 动态分析与静态分析,一、定性分析,是与定量分析相对而言的,它是对不能量化的现象进行系统化理性认识的分析,其方法依据是科学的哲学观点、逻辑判断及推理,其结论是对事物的本质、趋势及规律的性质方面的认识。,二、定量分析与预测,定量分析是指从事物的数量特征方面入手,运用一定的数据处理技术进行数量分析,从而挖掘出数量中所包含的事物本身的特性及规律性,从而挖掘出数量中所包含的事物本身的特性的分析方法。 分类:静态分析和动态分析,(一)数据的静态分析:,含义:分析现象当前的情况或者是本次调查的情况。 主要方法有: 1、数据的统计描述: (1)数据的相对程度分析:频数(百分数),倍数, (2)数据的集中趋势:均值和均标准误差,中位数,众数, (3)数据的离散程度:方差与标准差, 2、均值比较和T检验 3、方差分析、相关分析、回归分析、因子分析、聚类分析等,相对程度分析,它通过对比的方法反映现象之间的联系程度,表明现象的发展过程。 几分之几: 一比几: 倍数: 百分数:又叫频数(Frequency),是一个变量在各个变量值上取值的个案数。,案例:对50名顾客有关“饮料品牌”选择的调查,1999年全国国际旅游外汇收入构成,资料来源:中国旅游年鉴2000,频数,数据的集中趋势分析,均值(平均值,平均数Mean)表示某变量所有取值的集中趋势或平均水平。包括简单算术平均和加权算术平均。,算术平均值,加权平均值,案例:,调查泰山游客的满意度,从六个方面入手(吃、住、行、游、购、娱),用5点量表来测量,其中,1非常不满意,5非常满意。某游客在吃、住、行、游、购、娱六方面打分分别为:5,4,4,4,2,1,计算该游客的满意度的算术平均值和加权平均值 1. 算术平均值:x=(544421)6=3.67 2.加权平均值 (1)确立各个指标的权数:假设:吃0.15、住0.15、行0.1、游0.3、购0.1、娱0.1 (2)加权平均值: x=(50.1540.1540.140.320.110.1)=3.25,众数(Mode),众数(Mode)是总体中出现次数最多单位的标志值 无众数 原始数据: 10 5 9 12 6 8 一个众数 原始数据: 6 5 9 8 5 5 多于一个众数 原始数据: 25 28 28 36 42 42,中位数(Median),中位数(Median)是把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。 【例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排序: 750 780 850 960 1080 1250 1500 1630 2000 位置: 1 2 3 4 5 6 7 8 9,中位数1080,数据的离散程度分析,方差(Variance):是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。 标准差(Standard Deviation):是方差的平方根,它表示了一组数据关于平均数的平均离散程度。 均值标准差(Standard Error of Mean ,S.E. mean):描述样本均值与总体均值之间平均差异的程度。 方差与标准差越大,表示变量之间的差异越大,距离平均数这个“中心”的离散趋势越大。,均值比较和T检验,均值比较(Compare Means):比较不同样本之间平均值是否存在显著性差异。 T检验(T-Test): A单一样本的T检验(one-sample T test):研究研究某一样本均值与指定值之间是否存在显著性差异。 B两独立样本T检验(Independent-samples T test):独立样本是指两个样本之间彼此独立没有任何关联,两独立样本各自接受相同的测量。两独立样本T检验的主要目的就是了解这两个样本之间是否存在显著性差异。 C两配对样本T检验(Pared-Samples T test):是根据样本数据对样本来自的两配对总体的均值是否存在显著性差异进行推断。,显著性差异的含义,显著性差异(Significant Difference,sig.):就是先给定一个显著性水平数值,0.05(95%),或0.01(99%),或0.001(99.9%), 进行均值比较时,零假设为:假设两者之间不存在显著差异。 SPSS统计检验结果进行均值比较时会给出比较结果的相伴概率, 如果相伴概率大于0.5,表示大于95%的概率表明两者之间确实不存在明显差异,则零假设成立;如果相伴概率小于0.5,表示小于95%的概率表明两者之间确实存在明显差异,零假设不成立,则表明两者之间确实存在明显差异。 显著性差异一般用*表示。*表示significance level0.05(2-tailed或1tailed),* 表示significance level0.01,* 表示significance level0.001。,方差分析 Analysis of Variance (ANOVA ),ANOVA 由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称 F 检验 (F test)。用于推断两个或多个总体均数有无差异。 方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同.)。 (1)各处理组样本来自随机,独立的正态总体(D法,W法,卡方检验); (2)各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果 的判断)。,方差分析分类: Analysis of Variance (ANOVA ),(1)单因素方差分析:即不同水平下各个总体的均值是否有显著的差异。 SPSS实现过程:Compare Means-One- Way ANOVA,(2)多因素方差分析:当需要比较多个控制变量值之间有无明显差异时采用。 SPSS实现过程: Analyze-General Linear Model-Univariate,相关分析(Correlation analyze): 运用相关系数(r, Correlation coefficient)来表示两个变量间相互的线性关系的统计方法。,如果变量Y与X间是函数关系,则r=1或r=-1; 如果变量Y与X间是统计关系,则-10, 如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r0 而r=0表示无线性相关,,一般地, |r|0.95 存在显著性相关; |r| 0.8 高度相关; 0.5 |r|0.8 中度相关; 0.3 |r|0.5 低度相关; |r|0.3 关系极弱,认为不相关,因子分析(Factor Analyze),用较少的综合指标分别综合归纳存在于各变量中的各类信息。 统计要求: (1)一般要求变量之间的相关系数大于0.3 (2)巴特利特球形检验(Bartlett Test of Sphericity),要求通过统计检验。相伴概率要小于0.05,0.01,0.001 (3)KMO(Kaiser-Meyer-Olkin)检验。Kaiser给出了KMO的标准,一般 KMO0.9:非常适合 0.8KMO0.9:适合 0.7KMO0.8:一般 0.6KMO0.7:不太适合 KMO0.5:不适合,因子分析(Factor Analyze),在SPSS主菜单中按“AnalyzeData ReductionFactor“顺序逐一单击鼠标键,打开因子分析主对话框,聚类分析(Cluster Analyze),聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。 在SPSS主菜单中按“AnalyzeData ReductionFactor“顺序逐一单击鼠标键,打开因子分析主对话框,物以类聚、人以群分,回归分析(regression analysis),是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛。 按照涉及的自变量的多少 ,可分为一元回归分析和多元回归分析 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析,一元回归分析,设预测目标因变量为Y,影响它变化的一个自变量为X,因变量随自变量的增(减)方向的变化。一元线性回归分析就是要依据一定数量的观察样本(Xi, Yi),i=1,2,n,找出回归直线方程 Y=a+bX (1),(三)回归方程需要通过的显著性检验 对于任何给定的一组因变量、自变量观察样本资料,用最小二乘法都可以计算出回量归方程参数,建立回归方程式。但是,这样建立的回归方程并非一定有实用意义。 1相关分析(对于一元线性回归方程来说,也就是回归系数的t检验),就是借用统计方法用计算自变量、因变量观察样本资料的相关系数,说明变量之间的线性相关密切程度,并通过r显著性检验指出这种线性相关密切程度的显著性水平。 2方差分析(ANOVAF,回归方程的F显著性检验)是分析自变量与因变量线性相关关系对因变量的变异的影响程度,并通过F显著性检验指出反映自变量与因变量线性相关关系的回归方程式的显著性水平。只有通过r显著性检验和F显著性检验,才能说明建立的回归线性方程有实际意义。,3回归系数的显著性检验(t检验):对于一元线性回归方程来说,回归系数的t检验就是相关系数的显著性检验。 4模型的拟合优度R2(Goodness of fit)分析:模型的拟合优度表示所建立的回归方程预测值与实际观察到的值之间差异的大小,一般用判定系数R2实现, R2越接近1,表明方程的拟合度越好,所建立的方程与实际方程越接近。,5回归方程的残差检验。 对于上述回归模型中的随机误差要求满足如下的假设条件: 残差序列要求正态分布的随机性变量,且残差项之间互相独立: (1)应当是服从正态分布的随机变量,即满足“正态性“的假设. (2)残差的均值为零,即E()=0,我们称满足“无偏性“的假设. (3) 残差序列满足随机性:的方差等于=,这就是说,所有的分布的方差都相同,即满足“共方差性“的假设. (4) 残差序列互相独立:各个残差间相互独立,即对于任何两个随机误差和其协方差等于零,即,Cov(,)=0, )这称之为满足“独立性“的假设. 因此应该进行残差检验,判断回归模型的残差是否满足上述假设,A残差序列的正态性分布:通过残差序列的带正态曲线的直方图或累计概率图来分析。直观观察图形来判断是否为正态分布。 B残差序列的随机性:通过绘制残差序列和对应的预测值序列的散点图判断,如果残差序列是随机的,那么残差序列应与预测值序列无关,残差序列点将随机地分布在经过零的一条直线上。,C残差序列的独立性分析:回归模型中假设Cov(,)=0,即随机项是独立的。这一假设是否成立,可以通过回归模型的误差序列是否相互独立来进行检验。若误差序列各项间相互独立,则序列各项之间没有相关关系。若序列各项之间有相关关系,误差序列不满足线性回归模型的基本假设,回归模型就不能表达变量Y与X之间的真实变动关系。DW(Durbin-Watson)检验可以检验残差序列的相关性。其检验办法如下: 如果D-W0,表示残差序列存在完全自相关;如果D-W4,表示残差序列存在完全负相关;如果0D-W2表示残差序列存
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-河北-河北医技工二级(技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-江苏-江苏家禽饲养员四级(中级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏仓库管理员一级(高级技师)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广西-广西计算机操作员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东防疫员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东汽车驾驶与维修员五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-广东-广东有线广播电视机务员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东地图绘制员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-安徽-安徽中式烹调师二级(技师)历年参考题库典型考点含答案解析
- 2025年银行金融类-金融考试-银行业专业人员中级(法规+银行管理)历年参考题库含答案解析
- 先天性甲状腺功能减退症诊治指南解读课件
- 2025至2030中国裸眼3D行业产业运行态势及投资规划深度研究报告
- 检修安全监护管理制度
- 产科工作管理制度
- 初中历史教师业务考试试题及答案
- 导尿管相关尿路感染预防与控制试题(附答案)
- 中医烧伤课件
- 2025-2030中国水下混凝土行业市场发展趋势与前景展望战略研究报告
- GB/T 30134-2025冷库管理规范
- 2025年心理咨询师基础理论知识测试卷:心理咨询心理学理论体系试题
- 急诊患者安全管理
评论
0/150
提交评论