




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章人力资源数据——分析与挖掘学习目标:1.掌握建立数据分析思维的方法2.掌握数据类型与常用的数据分析方法3.了解常用的数据挖掘方法DataAnalysisandMining引例如何提高人力资源大数据分析与挖掘的能力?本章提纲建立数据分析思维数据分析010203数据挖掘建立数据分析思维第一节数据分析思维要点数据分析思维是做好数据分析与挖掘的前提。数据分析思维决定了你如何确定问题,如何思考问题,如何科学使用数据分析与挖掘方法,如何得出专业的结论。那么究竟什么是大数据分析思维呢?可以从以下五个方面去学习。先谈事实,再谈观点用客观事实代替主观判断不预设立场演绎而不是归纳找出背后的逻辑数据分析思维建立方法:穆勒五法穆勒五法是英国哲学家穆勒关于确定现象因果关系的五种归纳方法,他们对于利用数据进行问题分析、找到可能原因可以起到非常好的作用。求同法求异法共用法共变法剩余法求同法:比相同如果各个不同场合除了一个条件相同外,其他条件都不同,那么这个相同条件就是被研究现象的原因。可以用下列公式表示:场合1,相关条件A、B、C,出现现象a;场合2,相关条件A、D、E,出现现象a;场合3,相关条件A、F、G,出现现象a。以上三种场合中,都出现了现象a。不同场合下都有条件A,所以可以认为条件A是现象a的原因。求异法:比不同比较某现象出现和不出现的场合,如果两种场合除了一点不同外,其他条件都相同,那么这个不同点就是这个现象的原因。可以用下列公式表示:场合1,相关条件A、B、C,出现现象a;场合2,相关条件B、C,不出现现象a。所以条件A与现象a之间具有因果关系。上述两种场合中,场合1出现了现象a,场合2没有出现。观察他们各自的条件发现,场合1有A、B、C三个条件,场合2只有B、C两个条件,所以可以认为是条件A导致了现象a。共用法:先比相同,再比不同共用法也称求同存异法,运用共用法包括三个步骤:第一步,把研究现象a出现的正面场合加以比较,发现只有一个共同条件A,由此根据共同法确定条件A与现象a的因果关系;第二步,把研究现象a不出现的反面场合加以比较,发现条件A不出现是唯一的共同点,由此又根据共同法确定条件A的不存在与现象a的不存在有因果关系;第三步,比较正反两组场合,发现有条件A就有现象a,无条件A就无现象a,由此根据就异法得出结论:条件A与现象a有因果关系。共用法的目的是找出因果关系,当现实环境下找到因果关系比较困难,所以分析到深层结论时一般都用相关关系替代因果关系,即不追求“有条件A就有现象a,无条件A就无现象a”,只追求“有条件A则现象a更明显,无条件A现象a不明显”。共变法:比变化在其他条件不变的情况下,如果某一条件发生变化现象也随之发生变化,那么这一条件就是现象的原因。可以用下列公式表示:场合1,相关条件A1、B、C,出现现象a1;场合2,相关条件A2、B、C,出现现象a2;场合3,相关条件A3、B、C,出现现象a3。所以条件A是现象a的原因。不过现实情况下,很难做到只有一个因素引发不同程度的变化,因此想要增加结论的可靠性,要么增加样本量,要么做A/B测试。剩余法:比剩余已知一个复合的研究对象是由一个复合原因引起的,如果这个现象的一部分是复合原因中的一部分的结果,那么这个复合现象的剩余部分就是复合原因中剩余部分的结果。可以用下列公式表示:已知:由a、b、c、d构成的复合现象是复合原因A、B、C、D作用的结果。现象a是原因A作用的结果;现象b是原因B作用的结果;现象c是原因C作用的结果。所以,现象d是原因B作用的结果。剩余法的要求非常苛刻,现象和原因必须明确。这一点在极度复杂的现实业务场景下很能实现,因此剩余法的应用范围有限。数据分析第二节数据分析类型数据分析的四种类型:描述性分析:是什么,发生了什么描述性分析旨在通过一些核心指标数据的前后对比,告诉业务方业务现状是怎么样的,其主要关注三个方面:关注哪些业务。思考和确定要展现哪些业务。用哪些指标,如何衡量变好和变坏。通过衡量业务的定量指标体系,展现指标数据并直观反映出目前状态的好与坏。沉淀分析框架。沉淀诊断性分析的框架对指标的框架性拆解分析,并从指标的跌涨中定位问题环节,再进一步分析深层次的原因。诊断性分析:为什么会发生,发生背后的原因诊断性分析中需要分析业务结果和诸多因素的相关性,包括定性分析和定量分析。定性分析若分析的仅是一个特征与一个结果的相关性,则可以通过画二者的二维散点图进行分析,通过图形可以初步且直观判断二者存在何种相关关系。定量分析结构分析法:通过对指标体系中各分项目在总体项目中的比重或组成,分析考量各分项目在总体项目中的定位,从而分析出影响因素或原因。相互对比法:通过指标的相互比较来揭示指标之间的数量差异,进而分析形成差距的原因。预测性分析:后续可能发生什么预测性分析就是提前评估后续可能发生什么,在工作场景中,经常利用现有数据进行测算,评估业务接下来的发展。大数据预测的优势体现在把一个非常困难的预测问题,转化为一个相对简单的描述性问题,并且通过大数据预测,不仅得到指导现实业务客观结论,还能帮助企业决策、规划、开发。大数据研究不同于传统的逻辑推理研究,需要对巨大数据做统计归纳,一般采用预测分析,通过数学建模、训练集和测试集的不断优化,提供准确的预测结果。大数据除了关注相关性,更关注因果关系。相关性的目的是找出数据集里隐藏的相关性,并不能分析现象出现的原因,“知其然,还知其所以然”就是相关性预测和因果预测的分界线。指导性分析:采取什么措施通常情况下,指导性分析是在前面所有方法都完成之后,再使用的方法。我们在数据上找到了影响结果的因素,就需要去业务层面去寻找原因。然而现实的分析中业务原因的定位往往是缺失的,分析人员往往在发现数据原因后就开始思考运营策略,指向性非常强,举措粗糙,举措一但停止业务还会恢复原态。核心还是找到业务改变的关键以及运营的业务场景,不能盲目的行动。数据分析方法常用的数据分析方法:(1)对比分析法;(2)趋势分析法;(3)相关分析法;(4)交叉分析法。对比分析法概念:指将两个或者两个以上相互联系的指标数据进行比较,从数量上展示说明研究对象的规模大小、高低水平、速度快慢等相对数值,通过相同维度的指标对比,可以发现、分析其中差异,找出业务在不同阶段的问题,从而揭示指标代表的发展变化及变化规律。特点:简单,直观、量化。原则:坚持可比性原则,主要表现在对比对象相似,对比指标同质两个方面。常用对比标准:运用对比分析法时,最主要的是找到合适的对比标准,目前常用的对比标准是时间标准、空间标准、特定标准。趋势分析法概念:指将两个或者两个以上的指标或比率进行对比,以便计算出他们增减变动的方向、数额以及变动幅度的一种分析方法。特点:一般用于长期跟踪,并制作简单的数据趋势图用于确定数据变化,分析背后原因。产出:趋势分析最好的产出是比率,包括环比、同比、定基比。环比:当前时间范围内数据与上一时间范围内数据对比.同比:当前时间范围内数据与上一周期相同时间范围内数据进行对比,包括周同比、月同比、年同比。定基比:以某一时期即基数的数值为固定基数,然后将各时期的数值与之相比。计算公式为:定基比=各期数值/基期数值×100。相关分析法概念:研究两个或两个以上处于同等地位的随机变量间的相关关系的分析方法。特点:探讨数据之间是否具有统计学上的关联性;重在研究相关关系,但相关关系不包括因果关系。相关分析法重点关注内容:相关程度:完全相关、不相关和完全不相关;相关方向:正相关、负相关;相关形式:线性相关、非线性相关;影响因素的多少:单相关、复相关。相关分析法相关分析常用分析方法:图标分析法:通过绘制图表的形式将数据可视化处理,图表包括散点图、折线图。协方差:用来衡量两个变量的总体误差,两个变量的变化趋势一致,协方差就是正值,说明两个变量正相关;变化趋势相反,协方差则为负值,两个变量负相关;变量相互独立,协方差为0,说明两个变量不相关。相关系数:反映变量之间关系密切程度的指标,相关系数取值在-1到1之间。1代表两个变量完全正相关,-1代表两个变量完全负相关,0表示不相关,且越趋近于0相关性越弱,越趋近于1相关性越高。回归分析:确定两组或两组以上变量间关系的统计方法。按照变量数量分为一元回归和多元回归,且在回归分析前需确定变量的数量和自变量、因变量。交叉分析法概念:又称立体分析法,是在纵向分析法和横向分析法的基础上,从交叉、立体的角度出发、由浅入深、由低级到高级的一种分析方法。特点:既有横向对比也有纵向对比;是对数据从多个维度进行交叉展现;是一个由粗到细的分析过程。应用:通常运用于分析两个变量之间的关系,但实际应用中通常把这个概念推广到行变量和列变量之间的关系,这样行变量和列变量都可能由多个变量构成。交叉分析主要作用是多维度细分数据,细分主要步骤是按照分析维度和目标,由浅入深拆分指标,从中发现最为相关的维度来探索数据变化的原因。常见的人力资源维度:分时、分部门、分员工、分地区交叉分析法交叉分析操作:钻取:在维的不同层次间的变化,从上一层降到下一层,或者将汇总数据拆分成更细节的数据。上卷:钻取的逆操作,即从细粒度数据向高层的集合。切片:选择维中特定的值进行分析。切块:选择维中特定区间的数据或者某特定值进行分析。旋转:维的位置互换,就像二维表行列的互换。数据挖掘第三节数据挖掘概念及方法概念:数据分析是指在大量数据中,提取隐含在其中的、人们事先不知道的但潜在有用的信息和知识的过程。常用方法:回归、分类、聚类、关联规则、文本分析等。常用流程:如下图机器学习概念及分类概念:研究使机器获得新知识和技能,并识别现有知识的学问。学习形式:监督学习、非监督学习。常用流程机器学习于传统统计学对比:项目机器学习传统统计学目的旨在使最准确的预测成为可能推断变量之间的关系评估程序集训集、测试集度量最终假设尝试不同模型并收敛到最终假设提供最优解,没有测试任何其他假设数据挖掘方法常用数据挖掘方法:(1)回归(2)分类(3)聚类(4)关联规则(5)文本分析回归:线性回归概念:利用线性回归方程的最小平方函数对一个或者多个变量和自变量之间关系进行建模的一种回归分析建立回归模型前准备工作:(1)判断是否有缺失值(2)判断变量是否相关:皮尔逊检验(3)数据标准化:变量转化为统一单位(4)类别变量处理:线性回归要求输入变量全部为数值类型回归:线性回归最小二乘法:为得到最佳拟合线,最小二乘法是最常用的方法,它通过最小化每个数据点到线的垂直偏平方和来计算最佳拟合线。回归:逻辑回归概念:用来计算“事件=成功”和“事件=失败”的概率。当因变量属于二元变量时,我们就应该使用逻辑回归。特点:(1)广泛应用于分类问题,不要求自变量和因变量时线性关系。(2)为了避免过拟合和欠拟合,需要输入所有重要的变量。(3)需要极大的样本量,因为在样本数量较少的情况下,极大似然的效果比普通最小二乘法的效果差。(4)自变量不能相互关联,即不具有多重共线性。回归:多项式回归概念:将自变量x
与因变量y
之间的关系建模为高次多项式的一种回归形式。特点:(1)与线性回归类似,只是使用曲线而非直线;(2)虽然通过高次多项式拟合较少出错,但这可能会导致过拟合,需要多次画出关系图来查看拟合情况,保证拟合合理性。回归:逐步回归概念:处理多个自变量时,可以使用逐步回归。在这种技术中,自变量的选择是在一个自动的过程中完成的。常用方法:(1)标准逐步回归做两件事,即增加和删除每个步骤所需要的变量;(2)向前选择法从模型中最显著的预测开始,然后为每一步添加变量;(3)向后剔除法中模型的所有预测同时开始,然后在每一步消除最小显著变量;这种建模技术的目的是使用最少的预测变量数来最大化预测能力。数据挖掘方法:回归岭回归概念:用于存在多重共线性(自变量高度相关)数据的技术。在多重共线性情况下,尽管最小二乘法对每个变量都很公平,当它们的差异很大,使得观测值偏离并远离真实值,岭回归通过回归估计增加一个偏差度来降低标准误差。套索回归概念:类似于岭回归,通过减少变化程度来提高线性回归模型的精度。套索回归和岭回归的不同点在于,它使用的惩罚函数(求解有约束的最优化问题的一种算法)是绝对值而不是平方。数据挖掘方法:分类分类方法:1.朴素贝叶斯(1)定义:基于贝叶斯定理与特征条件独立假设的分类方法,使用概率统计的知识对样本数据集进行分类。(2)特点:结合了先验概率和后验概率,即避免了只使用先验概率的主观偏见,又避免了单独使用样本信息的过拟合现象。先概率检验:根据以往检验和分析得到的概率,无需样本数据,不受任何条件影响后概率检验:类似于条件概率数据挖掘方法:分类(3)应用介绍——单个特征判断例:哈密瓜的状态分为瓜熟和瓜生两种,概率分别为0.6与0.4,在瓜熟的情况下,瓜蒂脱落的概率为0.8,瓜生的情况下瓜蒂脱落的概率是0.4。那么现在挑到一个瓜蒂脱落的瓜,则瓜熟的概率是多少。我们根据联合概率和全概率公式,可以得出瓜蒂脱落的瓜成熟的概率为0.75。数据挖掘方法:分类(3)应用介绍——多个特征判断例:判断一个哈密瓜是否成熟,不仅需要看瓜蒂是否脱落,还需要观察瓜的颜色、形状。颜色有深绿、浅绿、青色之分,形状有圆形、尖形之分。特征由原来的1个变为3个,我们用X
表示特征,Y
表示瓜的类型(生/熟)根据贝叶斯定理,后验概率表达式为:其中ck
表示类别,k
表示类别个数。本例中,k=1,2;c1表示瓜熟,c2
表示瓜生。若P(Y=c1|X=x)>P(Y=c2|X=x),则判断瓜熟;若P(Y=c1|X=x)<P(Y=c2|X=x),则判断瓜生。数据挖掘方法:分类(4)朴素贝叶斯分类:例题:已知我们可以通过哈密瓜的瓜蒂、形状、颜色判断哈密瓜是否成熟。收集样本数据,获得一组包含10个样本的数据,这组数据是不同的瓜蒂、形状、颜色对应哈密瓜的类别(生/熟)。把这组数据当作历史数据,以它为标准:样本序号12345678910瓜蒂脱落未脱未脱脱落脱落未脱脱落未脱脱落未脱形状圆形尖形圆形尖形圆形尖形尖形圆形尖形圆形颜色深绿浅绿浅绿青色浅绿青色深绿青色浅绿深绿类别瓜熟瓜生瓜生瓜熟瓜熟瓜生瓜熟瓜熟瓜生瓜熟数据挖掘方法:分类对于瓜熟的情况:瓜熟的先检验概率P(瓜熟)=6/10=3/5瓜熟的条件概率P(脱落|瓜熟)=4/6=2/3瓜熟的条件概率P(圆形|瓜熟)=4/6=2/3瓜熟的条件概率P(青色|瓜熟)=2/6=1/3计算瓜熟的后验概率分子部分:P(瓜熟)×P(脱落|瓜熟)×P(圆形|瓜熟)×P(青色|瓜熟)=(3/5)×(2/3)×(2/3)×(1/3)=4/45。数据挖掘方法:分类对于瓜生的情况:瓜熟的先检验概率P(瓜生)=4/10=2/5瓜熟的条件概率P(脱落|瓜生)=1/4瓜熟的条件概率P(圆形|瓜生)=1/4瓜熟的条件概率P(青色|瓜生)=1/4计算瓜生的后验概率分子部分:P(瓜生)×P(脱落|瓜生)×P(圆形|瓜生)×P(青色|瓜生)=(2/5)×(1/4)×(1/4)×(1/4)=1/160。数据挖掘方法:分类对于瓜生的情况:瓜熟的先检验概率P(瓜生)=4/10=2/5瓜熟的条件概率P(脱落|瓜生)=1/4瓜熟的条件概率P(圆形|瓜生)=1/4瓜熟的条件概率P(青色|瓜生)=1/4计算瓜生的后验概率分子部分:P(瓜生)×P(脱落|瓜生)×P(圆形|瓜生)×P(青色|瓜生)=(2/5)×(1/4)×(1/4)×(1/4)=1/160因为4/45>1/160,所以预测为瓜熟。瓜熟的概率是(4/45)/(4/45+1/160)=0.9343。数据挖掘方法:分类(4)朴素贝叶斯评估要素误差率与精准度。误差率与精准度既适用于二分类任务,也适用于多分类项目。错误率是分类样本数占总样本数的比例,精准度是分类正确的样本数占总样本数的比例准确率、召回率。二分类问题中将样本根据其真实类别与分类器的组合划分为真正例(TP)、假正例(FP)、真反例(TN)、假反例(FN)四种情形。
TP+FP+TN+FN=样本总数。分类结果的混淆矩阵如图:准确率P
和召回率R
的计算公式分别为:P=TP/(TP+FP)R=TP/(TP+FN)数据挖掘方法:分类ROC与AUC利用ROC
曲线判断分类器性能:曲线无交点:当一个分类器的曲线被另一个分类器的曲线全包时,则认为后者性能大于前者。曲线有交点:ROC
曲线下的面积,即AUC。AUC可通过对ROC
曲线下的各部分面积求和得到。ROC曲线:纵轴:真正例率TPR=TP/(TP+FN)横轴:假正例率FPR=FP/(TN+FP)数据挖掘方法:分类F1利用P-R
曲线判断分类器性能:曲线无交点:当一个分类器的
P-R
曲线被另一个分类器的P-R
曲线全包时,则认为后者性能大于前者。曲线有交点:(1)平衡点BEP,“准确率=召回率”的取值。平衡点大,分类器越优;(2)F1度量F1=2×P×R/(P+R)=2TP(样本总数+TP-TN)数据挖掘方法:分类2.决策树:一种机器学习的方法,是用于实例进行分类的树形结构,是依托于决策抉择而建立的树。组成部分:节点、向边;节点类型:根节点、父节点、子节点、叶节点。子节点由父节点分裂形成,子节点作为新的父节点继续分裂;根节点是没有父节点的节点;叶节点是没有子节点的节点。数据挖掘方法:分类决策树主要算法:ID3、C4.5、CART,前两者选用信息熵增益作为选择特征的标准,后者使用基尼系数作为选择特征标准。信息熵——表述信源的不确定度,从而对信息进行量化度量。信息熵介于0-1之间,0为理想状态;划分数据集的原则是将无序变为有序,划分数据集前后信息变化称为信息熵增益,获得信息熵增益最好的特征就是最好选择。数据挖掘方法:分类例:给出一组学生样本数据,一共10个样本,每个样本有分数、出勤率、回答问题次数、作业提交率4个属性、需要判断这些学生是否优秀。最后一列出人工分类结果。决策树算法应用:数据挖掘方法:分类为简化过程,我们假设决策树为二叉树。通过数据,可以设置各个属性的阈值,当决策树一共节点所代表的数据无法判断时,则选择这一节点分裂为2个节点,同时选择适当的阈值使得分类错误最小。如有4个属性,单一通过以下语句分类:分数小于70为不优秀:分错1个,序号5;出勤率大于70%为优秀:分错3个,序号3、6、7;问题回答次数大于9为优秀:分错2个,序号1、2;作业提交率大于80%为优秀:分错2个,序号3、6。ID3分类法:数据挖掘方法:分类由此可知分数小于70为不优秀这条分错最少,也就是信息熵最小,所以应选择这条为父节点进行树的生成。存在很多类似于上述的条件,例如分数可以选择大于71、大于72等,最后选择分类错误最小的那个条件。分类有许多选择,针对每一个选择于分裂前的分类错误率进行对比,留下效果最好的选择,即熵的最大选择。ID3分类法:ID3分类法缺点:因为分类越细分类错误率越小,ID3会越分越细,导致新的数据分类错误率上升。数据挖掘方法:分类为避免分类太细,C4.5对ID3进行改进,C4.5要除以分裂太细的代价,这个比值叫信息增益率,显然分类太细,分母增加,信息增益率降低。除此之外,其他原理与ID3相同。C4.5分类法:数据挖掘方法:分类CART分类法:CART只能将一个父节点,分为2个父节点。如针对前述给出两个分类条件:(1)出勤率大于70%将数据集分组。在大于和小于或等于70%中分别有优秀和不优秀两类;(2)分数小于70将数据集分组。小于70只有不优秀一类,大于或等于70有优秀和不优秀两类。比较条件(1)、(2),发现(2)的凌乱程度小于(1),即条件(2)的基尼系数比(1)小,所以选择条件(2)。数据挖掘方法:分类CART分类法:CART还是一个回归树,回归分析用来决定分布是否终止。理想情况下,节点里都只有一个类别时停止分裂,但很多数据并不容易完全划分,或者完全划分需要多次分裂,造成很长的运行时间。CART对每个节点的数据分析其方差,当方差小于一定值时就可以停止分裂,以换取计算成本的降低。数据挖掘方法:聚类概念:聚类分析是指将数据对象的集合划分为由类似的对象组成的多个类别的分析过程。簇:聚类试图将数据集中的样本划分为若干个通常不相交的子集,每个子集称为一个簇。聚类算法类型:原型聚类密度聚类层次聚类等聚类分析数据挖掘方法:聚类1.性能度量与距离计算(1)性能度量概念:聚类性能度量亦称为有效性指标。对聚类结果,我们通常需要通过某种性能指标来评估其好坏。类别:外部指标:将聚类结果与某个参考模型进行比较内部指标:直接参考聚类结果而不利用任何参考模型常用聚类性能度量外部指标:Jaccard系数、FM指数、Rand指数。(结果均在0-1之间按,值越大越好)常用聚类性能度量内部指标:DB指数、DI指数。(DB的值越小越好,DI则相反)数据挖掘方法:聚类(2)距离计算闵可夫斯基距离(简称闵式距离):设n维空间中有两点坐标x
和y,p
为常数,闵式距离计算公式为:p=2时,闵式数据即为欧几里得距离(简称欧式距离),即两点之间的直线距离;p=1时,闵式距离即为曼哈顿距离,即绝对值距离,如二维空间中两点之间直角边距离;p
趋于无穷大时,闵式距离即为切比雪夫距离。闵式距离可用于有序属性计算,无序属性可采用VDM距离计算,将两种距离结合即可处理混合属性。数据挖掘方法:聚类(2)距离计算轮廓系数:评价聚类效果好坏的一种内部指标。它可用来在相同原始数据的基础上评价不同算法或者算法的不同运行方式对聚类效果所产生的影响。每个样本有对应的轮廓系数,轮廓系数由两个得分组成:a:样本与同一簇类中的其他样本点的平均距离b:样本与距离最近的簇类中所有样本点的平均距离每个样本的轮廓系数s定义为:s=(b-a)/max(a,b)一组数据集的轮廓系数等于该数据集中每一个样本轮廓系数的平均值。轮廓系数处于[-1,1]的范围内,-1表示错误的聚类,1表示高密度的聚类,0接近重叠的聚类;当簇密度较高且分析较大时,聚类的轮廓系数亦越大,聚类效果越好。数据挖掘方法:聚类2.K均值聚类概念:在原型聚类中,包括K均值聚类、学习向量化聚类、高斯混合聚类等。其中K均值聚类因简单高效、时间复杂度和空间复杂度低等特点而得到广泛应用。数据挖掘方法:聚类2.K均值聚类聚类过程:选择质心—计算距离—分簇—再次选择质心。K的含义:K类均值不能决定究竟要分几簇,K即为分类数。畸变程度:每个簇的质心与簇内样本的误差平方和。畸变程度越低,簇内成员越密集,反之,则越松散。畸变程度会随着类别的增加而降低,但对于有一定区分度的数据,在达到某个临界点时畸变程度会得到极大的改善,之后缓慢下降。数据挖掘方法:关联规则概念:反映一个事物与其他事物之间的相互依存性和关联性,常用于推荐系统——通过对用户的选择记录数据库进行关联性挖掘,最终发现用户群体使用习惯的内在共性的概率。Apriori算法:项目:可以是一种商品、一个网页链接或一个险种;项集:若干个项目的集合。若项集包含K个项目,则称K项集;事务:由序号和项集组成;序号:确定一个事务的唯一标志;频繁项集:指经常同时出现的一些项目的集合,又称频集;关联规则:指项集A与项集B的相互依存性和关联性。如果存在A⇒B的蕴含式,则说明两种项目之间存在很强的某种联系。数据挖掘方法:关联规则评价指标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电子商务专员招聘题目及答案
- 2024-2025学年贵州省铜仁市高二(下)质检数学试卷(7月份)(含答案)
- 2025年道行测试题及答案
- 2025年微创舒适拔牙试题及答案
- 2025年胸外考试题及答案
- 2025年五粮液笔试考试题及答案
- 2025年应激试题及答案
- 2025年面点试题及答案
- 2025年性病试题及答案
- 2025年保定二模文综试题及答案
- 2024年湖北襄樊公开招聘社区工作者考试试题答案解析
- DB61-T 1248-2019 压裂返排液 回配压裂液用水水质要求
- 井下矿山顶板安全知识培训
- 病历质量管理持续改进
- 护理实习生安全教育
- 自动化生产线设计与运营技术手册
- T-CRACM 0005-2024 非医疗生殖健康保健机构服务管理规范
- TCNFIA 212-2024 食品接触材料及制品用油墨 符合性声明要求
- 采购安装壁挂、柜式空调项目投标方案(技术标 )
- 2025年1月浙江省高考英语试卷真题(含答案)
- 2025年全国(卫生应急处理事件)技能资格知识考试题库与答案
评论
0/150
提交评论