数据分析与语言视频课件_第1页
数据分析与语言视频课件_第2页
数据分析与语言视频课件_第3页
数据分析与语言视频课件_第4页
数据分析与语言视频课件_第5页
已阅读5页,还剩16页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析与R语言第12周2012.7.22DATAGURU专业数据分析因子分析n 降维的法,是主成分分析的推广和发展n 是用于分析隐藏在表面现象背后的因子作用的统计模型。试图用最少个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量n 例子:各科学习成绩(数学能力,语言能力,运动能力等)n 例子:生活满意度(工作满意度,家庭满意度)n 例子:P5222012.7.222DATAGURU专业数据分析因子分析的主要用途n 减少分析变量个数n 通过对变量间相关关系的探测,将原始变量分组,即将相关性高的变量分为一组,用 共性因子来代替该变量n 使问题背后的业务因素的意义更加清晰呈现2

2、012.7.223DATAGURU专业数据分析与主成分分析的区别n 主成分分析侧重“变异量”,通过转换原始变量为新的组合变量使到数据的“变异量”最大,从而能把样本角度难以解释之间的差异最大化,但得出来的主成分往往从业务场景的n 因子分析更重视相关变量的“共变异量”,组合的是相关性较强的原始变量,目的是找到在背后起作用的少量关键因子,因子分析的结果往往更容易用业务知识去加以解释2012.7.224DATAGURU专业数据分析因子分析使用了复杂的数学n 比主成分分析更加复杂的数学模型n 求解模型的方法:主成分法,主因子法,极大似然法n 结果还可以通过因子旋转,使到业务意义更加明显2012.7.22

3、5DATAGURU专业数据分析数学模型2012.7.226DATAGURU专业数据分析数学模型2012.7.227DATAGURU专业数据分析因子模型性质2012.7.228DATAGURU专业数据分析统计意义n 因子载荷的意义n 共同度n 特殊方差n 总方差贡献2012.7.229DATAGURU专业数据分析因子载荷矩阵和特殊方差矩阵的估计n 主成分法n 主因子法n 极大似然法2012.7.2210DATAGURU专业数据分析主成分法n 通过样本估算期望和协方差阵n 求协方差阵的特征值和特征向量n 省去特征值较小的部分,求出A、Dn 程序n 例子2012.7.2211DATAGURU专业数据

4、分析主因子法n 首先对变量标准化n 给出m和特殊方差的估计(初始)值n 求出简约相关阵R*(p阶方阵)n 计算R*的特征值和特征向量,取其前m个,略去其它部分n 求出A*和D*,再迭代计算2012.7.2212DATAGURU专业数据分析极大似然法n 似然函数n 极大似然函数n 算法描述(p533)2012.7.2213DATAGURU专业数据分析方差最大的正交旋转n 由于因子载荷矩阵不是唯一,有时因子的实际意义会变得难以解释。n 因子载荷矩阵的正交旋转n 因子载荷方差n 载荷值趋于1或趋于0,公共因子具有简单化的结构n varimax( ) 函数2012.7.2214DATAGURU专业数据

5、分析因子分析函数factanal( )2012.7.2215DATAGURU专业数据分析因子得分p543n2012.7.2216DATAGURU专业数据分析知识点1 数据分析体系的多层模型。数据挖掘与统计分析有什么区别?2 ETL是什么?ETL层负责哪些功能?3 OLAP是什么?DW=ETL+OLAP4 什么是BI?BI系统主要由哪些部分5 R语言的历史和特点?6 R中与向量和矩阵运算有关的函数和运算符7 R中用于求基本统计量的函数8 R中数据框的操作,及怎样从外部数据文件读入数据9 R中产生各种分布随机数的函数10 R中涉及下标操作及、筛选有关的函数和写法2012.7.2217DATAGUR

6、U专业数据分析知识点11 直方图、散点图(多种)、箱型图、柱状图、饼图、图、脸谱图、茎叶图、向日葵散点图、热力图、密度图、12 熟悉R常用的内置数据集13 R的条件判别语句与循环语句14 R的判别函数15 R的集合运算函数16 协方差与相关系数的意义与计算等常见统计图的画法和意义17 怎样使用R进行线性回归分析,及有关建模和计算函数18 线性回归模型结果的解释,及各项指标的意义19 多元线性回归应该怎样选择合适的变量?20 logistic回归模型2012.7.2218DATAGURU专业数据分析知识点21 怎样用apriori算法做购物篮分析?22 线性分类法的原理及线性判别函数23 距离判别法的原理。有哪些距离(点与点之间,点集与点集之间)?24分类器的原理25 怎样利用决策树算法进行分类?26 knn分类算法的细节27 层次聚类法的原理与有关实现函数28 k-means聚类法的原理与实现函数29 k中心聚类法的原理30 dbscan聚类法的原理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论