统计学之因子分析_第1页
统计学之因子分析_第2页
统计学之因子分析_第3页
统计学之因子分析_第4页
统计学之因子分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学之因子分析&多元分析:就是通过多个变量对数据进行分析的方法的统称。第5季度多元分析消费者理想点MDS -Ideal Value密名精:酬雌习i;会司朝:sun.;心垂I?:氐匿形g|色 Welcome 王充、Today is Friday, January si, 2005.打印本页牺公市场袋济性能脚技迫求型7.82.76.7时词管理型6.125-6序象迫求型1131-59-9个人交往型0.4-2r4-io.g多元分析包括:因子分析重回归分析LOGISTIC 分析主成分分析聚类分析结构方程模型等等所谓因子分析就是将数据背后的潜在的共性因子挖掘出来的一种分析方法。简单来说,就是通过问卷调查

2、的结果,将受访者的真实想法归纳出来的一种分 析方法。#问卷调查的基础知识因子分析大多是先通过问卷调查来收集数据,然后再进行分析,所以我们必须 先掌握问卷调查的相关知识。%抽样方法总体:由全部调查对象所组成的集合称为“总体”。抽样:从总体中抽出的若干个个体所组成的集合称为“样本”。By the way,以总体的为对象的调查称为“普查”;以样本为对象的调查称为“抽样调查”。-但是,样本如果不能成为“总体的精确缩影”的话,那么做样本分析就失去意 义了。(书18页图)抽样方法,就是将样本从总体中抽出的方法的统称。作为代表性的方法,我们 主要介绍四种:“简单随机抽样法”“分层抽样法”“二阶抽样法”“分层

3、二阶抽样法”*“简单随机抽样法”就是从总体中随机抽取个体的抽样方法。这种方法常常用来进行像“某大型企业的员工意识调查”,因为虽然可以拿到全体成员的名册, 但是人数过多,不适合进行普查,这是就可以用简单随机抽样法。“分层抽样法”它是先将总体按照“出生地”、“出生年代”、“职业”或“最 高学历”等属性划分出不同的层,然后再针对每层做简单随机抽样的一种方法。 从不同的层得到的调查结果会有比较大的差别,当这些状况能够事前预测到时, 适合使用这种方法。例如:“喜欢哪类食品”这类问题可能会因“地域”的不同 而有所不同;“喜欢哪位明星”这类问题可能会因“出生年代”不同而有所不同。“二阶抽样法”就是分2个阶段

4、抽取数据的方法。作为第一阶段,按照“出生 地”或其他属性进行抽样;第二阶段,对已抽出的每一个区域进行简单随机抽 样。需要注意的是:我们必须知道第一阶段中各区域的准确人数,否则无法进行调 查;此外,在第一阶段中没有被抽到区域的人们,他们的意见将被我们忽视。“分层二阶抽样法”就是分层抽样法和二阶抽样法相结合的抽样方法。以上均是随机抽样。定向抽样是一种随机抽样以外的抽样方法,也就是将构 成样本的个体从总体中非等概率地抽取出来的方法。下面介绍几种定向抽样法。介绍法:以熟人或朋友为调查对象,获取样本的方法。征召法:以读者意见反馈卡等方式招募调查对象,获得样本的方法。%调查方法拦截法:在商业街或街角等处寻

5、找调查对象,获得样本的方法。邮寄调查 网络调查现场调查留置调查 电话调查RDD(Rondom Digit Dialing)调查%样本容量的标准样本中的个体数目称为样本容量。样本容量越大,就越接近总体的数量,但不 会超过总体的数目。“样本容量的统计学最低标准”是不存在的。但是,在问卷调查领域中,通常会有一个“约400”的最低标准,不过这个标准也不能说是合理的。“约400”只是出于某种考虑而设定的值,并不能无条件的令人信服。(第35页)%数据分析的搭配方法数据分析的搭配方法有两种类型。探索型验证性“探索型”的数据分析流程收集手头资料。试着运用各种分析方法,进行全面分析。如“事后诸葛”般恍然大悟“原

6、来世上还有这样的事”。向周围的人公布自己的分析结果。“验证型”的数据分析流程建立假设为了确认假设是否成立,收集资料,并进行分析。得出结论,即假设成立与否。向周围的人公布自己的分析结果。“探索型”的数据分析,只需要手头的数据即可,其优点在于能够简单、快速 的完成分析。另一方面,它也存在弊端,如数据被随意加工、变量间被强加上 想当然的因果关系,从而可以让“事后诸葛”们乱说一通。更有甚者,便会“为 所欲为”了。“验证型”的数据分析,一定要在调查的最初阶段建立假设,所以着手分析时 会比较困难,这也正是他的缺点。但是另一方面,假设一旦建立,接下来便是 收集数据和分析数据。经过一番分析,如果假设成立,就可

7、以得到一个非常有 说服力的结果,获得周围的认同。即便假设不成立,我们同样可以得到一个事 实“至少这个假设不成立”,这对指导今后的研究很有帮助,所以绝不能说一个没有意义的数据分析。#调查问卷和问题无论是调查问卷的构成还是询问的问题都没有一个所谓的“最佳法则”,但是还 是有一些规则能使调查问卷和问题的设计更科学合理一些。在调查问卷中,首先要询问受访者的行为或经验这些“现状”层面的东西,接 下来再询问感觉啦、想法啦这些“意识”层面的东西,最后询问“属性”层面 的东西。这样的结构才是最佳结构。询问“现状”是否接触过、是否拥有、什么时候买的、在哪里买的,等等询问“意识”满意或不满意之处、满意或不满意的理

8、 由、价值观,等等询问“属性”性别、年龄、婚姻状况、收入、最高学历、 家庭结构,等等%问题的分类调查问卷中的问题大致可分为“单项选择题”、“多项选择题”、“数量题”、“文 字题”等。“单项选择题”也就是只允许选择一个选项的问题。当几个问题的选项相同时, 为了节约纸面空间,建议采取下面的方式很好好尚可不好很差w我们的服务10S641、业务能提供迅速的报价;且价格合理?口口口力 钢丝产品质量能符合您的要求?13,产品交付时能确实符合约定的承诺4.产品的包装质量;5,现场服务人员态度|良好&产品交付后的跟踪服务能有效解决问题?nIJ口口7、产品能否港时交付於如产品数量是否充足?:n9,质量检验报告交

9、付是否及时?-10.出厂材质书明组表是否随产品交付R口多项选择题,也就是同一道题可以选择多个选项的问题。另外,还有类似下面的这 种询问方式19,兼E过程中,你最大的收状是什么?最咨可选两项)I A抑费水”提高B生.洁更加充压 C更J、lll:地顼他人交流D对制会的.解刎探.许凯为今AW口作奠走阳NliE没仙过兼耿但是并不推荐大家使用,因为与“可选多项”相比,这种设计要求受访者必须先将 全部选项浏览一遍之后才能作答,这样无形中会增加受访者的负担。数量题,也就是需要回答具体数值的问题。这时要用线将每一位数字隔开,以免书 写时出现错误。文字题,也就是不需要选择选项,而是需要自由作答的问题。% 应当避

10、免的问题不能对于过于隐私的问题问得太具体。如果一定要询问具体值的话,就要另想办法。例如下面的方式会让受访者感到更为 亲切。5.企业年产值以人民币计,靖在适台您的口内划山逸一)fli 低丁;500 打入史:(2) - 500-1000: _lI1W方削00万人恍:不能存在表达不明确的问题。 口5000万-1亿人民币 (5) 口1亿人民币J I.同一问题不能包含两层以上的意思。比如:Q你觉得服务员的制服和服务态度如何?倘若受访者认为“服务态度好,而制服不好”那他该如何作答呢?所以问题要一个 一个的明确的提出来。最好不要设置排序问题。例如“觉得两者都不错的”或者“没有尝试过某一种”的人将不好作答。问

11、题的提出关键在于从“受访者角度”出发。如果你是受访者的话,做这份调查问 卷会有什么感受。如果你身边的人是受访者的话,他们会协助你完成调查吗。如果 你已经考虑到这些的话,就没有问题了。诱导回答的问题。例如:Q.由于日本的资源紧缺,所以在21世纪,关于科学科技的教育越发显得重要。因此,您对今后的初中理科教育有何看法?1、应当更丰富一点2、保持现状就好注:面对这种提问,很多人都是出于不得已会选“ 1”。程度等级太多的问题。评分的问题。征集自由答案的问题。当拿到千奇百怪的答案时,你就会意识到您所肩负的工作是多么沉重。% “中值”的存在性 在进行程度等级的评价时,无论采用哪种方式,都会有包括“中值”和不

12、包括“中 值”的两种情况。*包括中值问卷调查表.序号4调查内容“奸差,领导班予在g站、勤政、廉政方面-卫生政策的宣传落实方面依法行医、履行职责方爵医生在拒媲红包,回扣方面中工作人员的服务态度方面,医院药品等收费价格的公开方面,队医院在治哩或收费方面口口药费的一日谓羊制落夹方面%在追理重复检查方面99IS匮院在医务人员鸠管厘方面a9在与患者的淘通方面/2砂】2.在港理大处方岑过度医抨方面/单位在环境建设方面P14.在魔务信息公开方面/砂15/在办理投诉及来信来访方卧-1办事效率方面卜*不包含“中值”二、对教抑行为的评价很满意满意基本满意不满意1.教师对学习方法的指导65-6 分;4-5 分:2-

13、4 分:0-2 分:2.教师上课与学生交流65-6 分* 54-5 分*2-4 分:02 分:3 .联系实际举例情况66分;4-5 分;2-4 分:0-2 分*4.介纽新知识情况43F 分:32-3 分:1-2 分:0-1 分;$.布置作业及批改质材65-6 分:45分:牛2-4 分:0-2 分:28 分总体来说,包括不包括“中值”都可以,但是不包含中值会出现这样的问题: 必须明确的回答“是”或者“否”,这会增加受访者的回答难度。与含有“中值”的情况相比,其直方图与正态分布的相似度也比较低。#基础数学知识为了理解因子分析我们有必要先来学习一下数字的基础知识。这部分主要讲讲 一些事实性的问题。权

14、且当作“就是这么回事,来理解就好。%相关矩阵相关矩阵,也就是由单相关系数所构成的矩阵。褰1相关蛆阵X,X.%X*XL1.000踱3130.0010. 013一上 147-0. 073X,0. 3131.0000. 352一。一 0490. 1290. 0030.001f, 352L0000. 3265110, 118%0. 013-0. 0490. 321, 0000. 3700* 376用-0. 147一 0. 1290-5110, J70L00O0. 628X,-0,073一。.0030, 1180. 3760. 8281.000%单位矩阵单位矩阵,就是主对角线(左上至右下)上的值全为1,

15、其余的值全为0。而且同单位矩阵相乘并不会对原来的矩阵产生影响。也就是说这个矩阵就像数 字里的1 一样。%坐标的“旋转”围绕原点的旋转:如下图,在2维坐标上,有一点p(x, y),直线op 长度为r,直线op和x轴的正向的夹角为a。直线op围绕原点做逆时针方向b度的旋转,到达p(s,t)s = r cos(a + b) = r cos(a)cos(b) - r sin(a)sin(b) (1.1)t = r sin(a + b) = r sin(a)cos(b) + r cos(a) sin(b) (1.2)其中 x = r cos(a) , y = r sin(a)代入(1.1), (1.2)

16、,s = x cos(b) - y sin(b) (1.3) t = x sin(b) * y cos(b) (1.4)用行列式表示如下,司 f cos - sm fUJ侦抵月cos/?%特征值和特征向量每个矩阵都会有与之相对应的“特征值”和“特征向量”。例如:2vn=3v e,这说明=3是工的特征值,v是对应于又=3%对称矩阵的特征向量。P行P列的矩阵的特征值和特征方程,原则上讲,存在P组。所谓对称矩阵就是各元素关于对角线对称的矩阵。如此说来,相关矩阵,单位 矩阵都是对称的矩阵。%矩阵的补充矩阵的书写规则矩阵的加法矩阵的乘法逆矩阵:逆矩阵就是与原矩阵相乘之后得到同型的单位矩阵的那个矩阵。转置矩阵:转置矩阵就是将行和列互换后得到的矩阵。离差平方和、方差、标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论