




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
企业电子商务解决方案E CommerceSolution 市场研究的数据分析方法 第一节线性回归分析 一 线性回归方程的基本模型线性回归方程从样本资料出发 一般利用最小二乘法 根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则 进行回归方程的参数的求解 线性回归分析是考察变量之间的数量关系变化规律 它通过一定的数学表达式 回归方程 来描述这种关系 以确定一个或几个变量的变化对另一个变量的影响程度 为预测提供数学依据 1 一元线性回归模型 模型是 式中 为被解释变量 因变量 为解释变量 自变量 是随机误差项 i为观测值下标 n为样本容量 与是待估参数 称为回归常数 为回归系数 2 多元回归模型多元线性回归模型中自变量的个数在2个以上 模型的一般形式为 i 1 2 n其中 为被解释变量 因变量 为解释变量 自变量 是随机误差项 i为观测值下标 n为样本容量 为k 1个待估参数 为回归常数 称为回归系数 在应用线性回归模型时 必须满足以下假设 1 解释变量是确定性变量 而且解释变量之间不相关 2 随机误差项具有0均值和同方差 3 随机误差项在不同样本点之间是独立的 不存在序列相关 4 随机误差限于解释变量之间不相关 5 随机误差项服从0均值和同方差的正态分布 二 线性回归方程的统计检验1 回归方程拟合优度检验2 回归方程的显著性检验3 回归系数显着性检验三 回归分析假设条件的检验1 残差分析2 多重共线性3 误差项的序列相关 四 线性回归分析的基本步骤1 确定回归中的自变量和因变量 2 从收集到样本资料出发确定自变量和因变量之间的数学关系 即建立回归方程 3 对回归方程进行各种统计检验 4 利用回归方程进行预测 例 CheckersPizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一 其直接竞争对手是欧文公司 提供相同的产品与服务 另外麦当劳也是它的一个重要竞争者 在过去的24个月中 该公司的销售量 Q 价格 P 小镇上居民的人均收入 M 欧文公司产品的价格 P欧文 以及麦当劳产品的价格 P麦当劳 假定下个月公司产品价格为9 05 人均收入为26614元 欧文公司产品的价格10 2元 麦当劳产品的价格为1 15元 请预测该公司下个月的销售量 五 实例分析 首先CheckersPizza公司根据资料估计下面的线性需求方程的参数 Q a bP cM dP欧文 eP麦当劳式中 Q 比萨饼的销量 P 比萨饼的价格M 小镇居民的人均收入P欧文 欧文公司产品的价格P麦当劳 麦当劳产品的价格 下面是SPSS11 0的输出结果 从上面的输出结果可以看出 模型可以解释97 的比萨饼销售量的变化 模型整体非常显著 F统计的相伴概率值P 0 000 四个参数b c d e非常显著 T统计的相伴概率值P都远小于0 01 所以 回归方程为 Q 343 748 195 895P 0 0742M 174 403P欧文 81 057P麦当劳该公司下一个月比萨饼的销量为 Q 343 748 195 895 9 05 0 0742 26614 174 403 10 2 81 057 1 15 1730 2872 第二节判别分析 一 判别分析法的基本思想判别分析包括以下两步 1 分析和解释各类指标之间存在的差异 并建立判别函数 2 以第一步的分析结果为依据 将对那些未知分类属性的案例进行判别分类 二 判别分析基本模型与统计术语 一 假设条件1 每一个类别都取自一个多元正态总体的样本2 所有正态总体的协方差矩阵或相关矩阵都相等 二 基本模型 1 先验概率2 后验概率3 判别系数4 结构系数5 分组的矩心6 判别力指数7 残余判别力 三 统计术语 三 分析的基本步骤判别分析一般都是通过现成的统计软件进行分析 一般而言 利用统计软件的判别分析具体包括以下步骤 确定研究的问题 某公司生产一新产品 该公司在新产品末大量上市以前 进行了一次市场调查 公司将新产品寄给十五个代理商 并附意见调查表 要求对该产品给予评估并说明是否愿意购买 评估的因素有 式样 包装及耐久性 评分用10分制 高分表示特性良好 低分则较差 其中有三位代理商没有表明自己的购买意愿 那么这些代理商是属于 非购买组 还是 购买组 四 实例分析 以下是SPSS11 0的部分输出结果 表中 式样 包装和耐用性的标准化系数分别为0 91 0 083 0 254 因而 式样是最重要的判别变量 其次是 耐用性 最后是包装 表中最大概率组一栏是判别分析得出的组别 13 15号代理商属于 非购买组 14号代理商属于 购买组 第三节聚类分析 一 聚类分析的基本思想聚类分析 又称数字分类学 是新近发展起来的一种研究分类问题的多元统计分析方法 样品聚类是对事件进行聚类 或是说对观测量进行聚类 是对反映被观测对象的特征的变量值进行分类 变量聚类则是当反映事物特点的变量很多时 根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法 二 距离与相似系数 一 常用的距离指标有1 欧式距离2 欧式距离的平方3 曼哈顿距离4 切比雪夫距离 二 常用的相似系数指标主要有1 余弦系数2 皮尔逊相关系数 三 定类数据的距离1 卡方距离2 法方距离 三 聚类方法1 层次聚类法2 迭代聚类法四 聚类分析的主要步骤 确定研究的问题 某家具公司为了对市场进行的细分 对购买家具的顾客进行了一次市场调查 这次调查的指标有 喜爱的款式 老式为1 新式为2 图案 素式为1 格字为2 花纹为3 颜色 蓝色为1 黄色为2 红色为3 绿色为4 调查样本为30人 五 实例分析 根据聚类结果 这30名顾客分为3类 可以较好的反映这些顾客对家具的偏好类型 第一类 1 9 13 17 24第二类 2 3 4 5 6 7 8 11 12 15 16 18 20 21 22 23 26 28 29 30第三类 10 14 19 25 27 第四节因子分析 一 因子分析的基本思想因子分析是一项多元统计分析技术 其主要目的就是简化数据 它通过研究众多变量之间的内部依赖关系 探求观测数据中的基本结构 并用少数几个假想变量来表示基本的数据结果 这些假设变量是不可观测的 通常称为因子 它们反映了原来众多的观测变量所代表的主要信息 并能解释这些观测变量之间的相互依存关系 二 因子分析的数学模型和相关统计量 一 数学模型 二 相关统计量1 因子载荷2 共同度3 因子的贡献4 巴特利特球体检验5 KMO指数 三 因子分析的基本步骤1 确定研究变量 2 计算所有变量的相关矩阵 3 构造因子变量 4 因子旋转 5 计算因子得分 四 实例分析某公司为了了解消费者对牛肉 色 羊肉 猪肉及鸡等五种肉类食物的偏好倾向 进行了一次市场调查 请10位消费者对这五种肉类进行评分 评分采用十分制 分数越高表示越喜欢 调查结果列于下表 试用因子分析方法研究影响消费者选择食物的因素 上表是SPSS11 0输出的旋转后的因子载荷矩阵 我们可以依此推断两个公共因子的含义 从表中的数据来看 鸡 鱼 牛肉在第一公共因子的因子载荷值较高 而在第二公共因子的因子载荷值较低 故第一公共因子反映鸡 鱼 牛肉的公共特性 第一公共因子可能代表脂肪少 而羊肉 猪肉在第二公共因子的因子载荷值较高 在第一公共因子的因子载荷值较低 这说明第二公共因子反映羊肉 猪肉的公共特性 第二公共因子可能代表价格 因而我们可以认为脂肪和价格是决定消费者肉类消费的主要因素 第五节对应分析 一 对应分析的基本思想对应分析 又称为相应分析 是在R型和Q型因子分析基础上 发展起来的一种多元相依的变量统计分析技术 它通过分析由定性变量构成的交互汇总表来揭示变量间的关系 当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时 使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系 二 有关统计术语与资料格式 一 统计术语1 列联表2 主成分3 惯量和特征值4 卡方 似然比卡方 曼图 汉斯泽鲁卡方 法系数 列联系数 二 数据格式 三 分析的步骤1 确定研究的内容2 获取分析资料3 对列联表作对应分析4 解释结果意义5 评价分析结果 四 实例分析某公司进行一次市场调查 得到轿车特征于一些用户特征的数据 如有 轿车大小 大 中 小 轿车类型 家用型 跑车 商用车 收入 一份收入 双份收入 状态 已婚 已婚有孩子 未婚 未婚有孩子 房子 租房 买房 等数据 现请分析它们之间的联系 1 已婚有孩子 家用车和中型车相关性较大 2 已婚和双份收入有联系 已婚 已婚有孩子和买房也有一定的联系 3 未婚 一份收入和租房之间关系紧密 4 跑车与小型车之间也有关系 从对应图可以推断出下面一些结论 根据上面的结论 我们在进行市场细分 制定营销战略方面可以充分利用这些信息 例如 面向已婚家庭应重点推销中型家用车 而那些未婚 一份收入 租房的消费者 因其经济条件方面的原因 他们难以成为轿车消费的目标顾客群 另外现没有适合双份收入 已婚的消费者的车型 应考虑开发新车型满足他们的需求 第六节多维偏好分析 一 主成分分析法简介 一 主成分分析的基本思想主成分分析法就是将原来众多具有一定相关性的指标 如p个指标 重新组合成一组新的相互无关的综合指标来代替原来的指标 二 主成分分析的数学模型 三 主要统计术语1 偏好评分2 特征值或惯量二 分析的基本步骤1 确定研究的问题2 资料的收集3 主成分分析4 偏好图并解释结果意义 三 实例分析某心理学期刊作了一项市场调查 以了解自己刊物与现有的其它心理学刊物的相对定位 他们挑选10种心理学刊物 请39个专业心理学家根据他们对这些刊物的偏好按1 10的量表评分 其中 1 代表低评价 10 代表高评价 利用SPSSCategoriesPRINCALS过程的 非线性 主成分分析方法对上表的资料进行分析 部分结果如下 这些刊物表现为以下分组 1 一个 硬 组 包括JEXP PMET MVBR JAPP 或许BULL2 一个 发展 组 包括JEDP HUDE 2 成份加载图表 箭头指向相同的心理学家的偏好相似 如 图形左上方的 D 组的发展和教育心理学家偏好教育心理学杂志和人类发展两种期刊 其它组心理学家的偏好也很明显 都集中指向其研究方向的期刊 3 双图 4 模型总结 最后结果说明 总的拟合情况好 二维顺序方案占总方差的大约82 第七节多维尺度法 一 多维尺度法的基本介绍具体主要包括两步 1 初步图形结构的构造 2 初步图形结构的修改 二 统计术语与数据格式 一 统计术语1 接近程度2 空间图3 克鲁斯卡系数4 残差 二 数据格式多维尺度法输入的数据是表示待比较事物之间相似程度的矩阵 三 分析的基本步骤1 确定研究的问题 2 获取资料 3 作多维尺度分析 4 作空间图并解释结果意义 5 评价分析结果 四 实例分析 在某次市场研究中 研究者调查了10位消费者 要求他们对A B C D E等五种品牌的相似性进行评分 消费者利用李克量表分别对AB AC AD AE BC BDBE CD CE DE中的每一对评分 其中一位消费者的评分结果为 AB 2 AC 1 AD 4 AE 5BC 6 BD 8 BE 6CD 3 CE 7 DE 5 从而可以得到一个相似性比较矩阵 请就此进行多维尺度分析 将表的相似矩阵输入 利用SPSS11 0进行计算 可得到如下的概念空间图 从该空间图可以看出 D和E相对接近 在第一维度方向 A B C D E几个品牌的差异较为明显 第八节联合分析 一 联合分析的基本概念与功能联合分析方法的基本思想是 通过提供给消费者以不同的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年昆明市事业单位招聘考试教师招聘政治学科专业知识试卷(政治)
- 我爱家乡的水蜜桃800字(9篇)
- 心爱之物的描写写物作文11篇范文
- 细节的美丽节日作文12篇
- 小学三年级数学五千以内加减混合两步运算综合测试训练题带答案
- 两位数加减一位数同步考核习题大全附答案
- 2025年医保知识考试题库及答案:医保患者权益保障法律法规与实务操作试题卷
- 国庆的一件事小学作文12篇
- 小班安全课件制作
- 为梦想同行观后感1200字(14篇)
- 2025长城汽车人才测评答案
- 幼小衔接写字教学安排
- 2025四川省安全员B证考试题库
- 消防工程专项竣工验收监理质量评估报告
- 驾驶员安全月试题及答案
- 科技创新与中国特色社会主义理论的结合心得体会
- 反假币上岗资格证书培训考试题库
- 2024年中考模拟试卷道法(北京卷)
- 2025年上半年某县消防大队工作总结(二篇)
- 2025届高考英语复习读后续写练习:纸报停刊后少年开启邻里简报之路+课件
- 2025年考研政治全套复习题库及答案(全册完整版)
评论
0/150
提交评论