回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf

上传人：飞*** IP属地：河北上传时间：2020-03-03 格式：PDF 页数：107 大小：2.72MB 积分：0 举报 版权申诉

回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf_第2页

回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf_第3页

回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf_第4页

回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf_第5页

已阅读5页，还剩102页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

School of Information and Mathematics 回归学习回归学习 2 of 36 内容概要 1 线性回归 2 多元线性回归 3 代价函数 4 逻辑回归 3 of 36 回归学习回归属于有监督学习中的一种方法该方法的核心思想是从连续型统计数据中得到数学模型然后将该数学模型用于预测或者分类该方法处理的数据可以是多维的回归是由达尔文的表兄弟Francis Galton发明的 Galton于1877年完成了第一次回归预测目的是根据上一代豌豆的种子双亲的尺寸来预测下一代豌豆种子孩子的尺寸身高 Galton在大量对象上应用了回归分析甚至包括人的身高他得到的结论是如果双亲的高度比平均高度高他们的子女也倾向于平均身高但尚不及双亲这里就可以表述为孩子的身高向着平均身高回归 Galton在多项研究上都注意到了这一点并将此研究方法称为回归 4 of 36 线性回归介绍例子假如你刚刚搬到学校需要知道在你学校周围的房价设计一个数据回归程序距离学校的距距离学校的距离离卧室数目卧室数目房租房租 2 30km 1 1600 5 06km 2 2000 4 33km 2 2100 1 09km 1 1500 1 50km 1 2 70km 1 5 5 of 36 例子假如你刚刚搬到学校需要知道在你学校周围的房价设计一个数据回归程序距离距离房房租租 1 0 距离距离房间房间房房租租线性回归介绍 6 of 36 回归学习问题引入问题引入面积 m 2 销售价钱万元 123 250 150 320 87 160 102 220 假设有一个房屋销售的数据如下如果来了一个新的面积假设在销售价钱的记录中没有的怎么处理解决方法用一条曲线去尽量准的拟合这些数据然后如果有新的输入过来我们可以在将曲线上这个点对应的值返回如果用一条直线去拟合可能是下面的样子 7 of 36 回归学习常用概念和符号房屋销售记录表房屋销售记录表训练集 training set 或者训练数据 training data 是我们流程中的输入数据一般称为x 房屋销售价钱房屋销售价钱输出数据一般称为y 拟合的函数或者称为假设或者模型拟合的函数或者称为假设或者模型一般写做 y h x 训练数据的条目数训练数据的条目数 training set training set 一条训练数据是由一对输入数据和输出数据组成的输入数据的维度n 特征的个数 features 这个例子的特征是两维的结果是一维的然而回归方法能够解决特征多维结果是一维多离散值或一维连续值的问题 8 of 36 回归学习学习过程学习过程首先给出一个输入数据算法通过一系列的过程得到一个估计的函数函数这个函数有能力对没有见过的新数据给出一个新的估计也被称为构建一个模型就如同上面的线性回归函数一个典型的机器学习的过程 9 of 36 回归学习线性回归 Linear regression 是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析线性回归属于监督学习监督学习因此方法和监督学习应该是一样的先给定一个训练集根据这个训练集学习出一个线性函数线性函数然后测试这个函数训练的好不好即此函数是否足够拟合训练集数据挑选出最好的函数 cost function最小即可 10 of 36 线性回归注意 1 因为是线性回归所以学习到的函数为线性函数即直线函数 2 因为是单变量因此只有一个x 单变量线性回归模型 X feature h x hypothesis 问题线性函数拟合的好不好 11 of 36 简单线性回归 Simple Linear Regression 1 很多做决定的过程通常是根据两个或者多个变量之间的关系 2 回归分析 regression analysis 用来建立方程模拟两个或者多个变量之间如何关联 3 被预测的变量叫做因变量 dependent variable y 输出 output 4 被用来进行预测的变量叫做自变量 independent variable x 输入 input 12 of 36 正向线性关系 13 of 36 负向线性关系 14 of 36 无关系 15 of 36 估估计计的的简单线简单线性回性回归归方程方程 y b0 b1x 这个方程叫做估计线性方程 estimated regression line 其中 b0是估计线性方程的纵截距 b1是估计线性方程的斜率 y 是在自变量x等于一个给定值的时候 y的估计值使用场景一般来说只要觉得数据有线性关系首先选择 LinearRegression类如果发现拟合或者预测的不好再考虑用其他的线性回归库如果是学习线性回归推荐先从这个类开始第一步的研究 16 of 36 线线性回性回归归分析流程分析流程 17 of 36 关于偏差的假定 1 是一个随机的变量均值为0 2 的方差 variance 对于所有的自变量x是一样的 3 的值是独立的 4 满足正态分布 18 of 36 简单线性回归模型举例汽车卖家做电视广告数量与卖出的汽车数量 19 of 36 如何画出适合简单线性回归模型的最佳回归线 20 of 36 使sum of squares最小计算过程 21 of 36 预测预测假设有一周广告数量为6 预测的汽车销售量是多少 x given 6 Y hat 5 6 10 40 22 of 36 多元线性回归 1 与简单线性回归区别 simple linear regression 多个自变量 x 2 多元回归模型 y 0 x1 2x2 pxp 其中 0 2 p是参数值是误差值 3 多元回归方程 E y 0 x1 2x2 pxp 4 估计多元回归方程 y hat b0 b x1 b2x2 bpxp 一个样本用来计算 0 2 p的点估计b0 b1 b2 bp 23 of 36 5 估计流程与简单线性回归类似 24 of 36 6 估计方法使sum of squares最小运算与简单线性回归类似涉及到线性代数和矩阵代数的运算 25 of 36 7 例子一家快递公司送货 X1 运输里程 X2 运输次数 Y 总运输时间 Time b0 b1 Miles b2 Deliveries Time 0 869 0 0611 Miles 0 923 Deliveries 26 of 36 线性回归代价函数代价函数有的地方也叫损失函数 Loss Function 在机器学习中的每一种算法中都很重要因为训练模型的过程就是优化代价函数的过程代价函数对每个参数的偏导数就是梯度下降中提到的梯度防止过拟合时添加的正则化项也是加在代价函数后面的一个好的代价函数需要满足两个最基本的要求能够评价模型的准确性对参数可微 27 of 36 假设有训练样本 x y 模型为h 参数为 h Tx T表示的转置 1 概况来讲任何能够衡量模型预测出来的值h 与真实值y 之间的差异的函数都可以叫做代价函数C 如果有多个样本则可以将所有代价函数的取值求均值记做J 2 首先确定模型h 然后训练模型的参数训练参数的过程就是不断改变从而得到更小的J 的过程理想情况下当我们取到代价函数J的最小值时就得到了最优的参数记为当J 0 表示模型完美的拟合了观察的数据没有任何误差 28 of 36 3 在优化参数的过程中最常用的方法是梯度下降这里的梯度就是代价函数J 对 1 2 n的偏导数通过以上内容可以总结得出以下关于代价函数的性质对于每种算法来说代价函数不是唯一的代价函数是参数的函数总的代价函数J 可以用来评价模型的好坏代价函数越小说明模型和参数越符合训练样本 x y J 是一个标量选择代价函数时最好挑选对参数可微的函数全微分存在偏导数一定存在 29 of 36 线性回归代价函数 Cost Function 对假设的函数进行评价 cost function越小的函数说明拟合训练数据拟合的越好 30 of 36 线性回归在线性回归中最常用的代价函数 Cost Function 是均方误差 Mean squared error 具体形式为其中表示向量x中的第i个元素表示向量y中的第i个元素用参数和x预测出来的y值 m为训练集的数量例给定数据集 1 1 2 2 3 3 则x 1 2 3 y 1 2 3 此处的语法为Octave语言的语法表示3 1的矩阵如果我们预测theta0 0 theta1 1 则h x x 则cost function J 0 1 1 2 3 h 1 1 2 h 2 2 2 h 3 3 2 0 如果我们预测theta0 0 theta1 0 5 则h x 0 5x 则cost function J 0 0 5 1 2 3 h 1 1 2 h 2 2 2 h 3 3 2 0 58 31 of 36 代价函数与参数代价函数与参数总的代价函数J是h 和y的函数即J f h y 又因为y都是训练样本中给定的 h 由决定所以最终还是模型参数的改变导致了J的改变对于不同的对应不同的预测值h 也就对应着不同的代价函数J的取值变化过程为引起了h 的改变进而改变了J 的取值 32 of 36 为了更直观的看到参数对代价函数的影响举个简单的例子有训练样本 0 0 1 1 2 2 4 4 即4对训练样本每个样本对中第1个数表示x的值第2个数表示y的值这几个点很明显都是y x这条直线上的点如下图图不同参数可以拟合出不同的直线代价函数与参数 33 of 36 常数项为0 所以可以取 0 0 然后取不同的 1 可以得到不同的拟合直线当 1 0时拟合的直线是y 0 即蓝色线段此时距离样本点最远代价函数的值误差也最大当 1 1时拟合的直线是y x 即绿色线段此时拟合的直线经过每一个样本点代价函数的值为0 代价函数与参数 34 of 36 通过下图可以查看随着 1的变化 J 的变化情况当 1 1时代价函数J 取到最小值因为线性回归模型的代价函数均方误差的性质非常好因此也可以直接使用代数的方法求J 的一阶导数为0的点就可以直接求出最优的值正规方程法图代价函数J 随参数的变化而变化代价函数与参数 35 of 36 代价函数与参数下图可以看做是代价函数J 与参数做出的图曲面上的一个点 0 1 J 有无数条切线在这些切线中与x y平面底面相当于 0 1 夹角最大的那条切线就是该点梯度的方向沿该方向移动会产生最大的高度变化相对于z轴这里的z轴相当于代价函数J 36 of 36 线性回归一般情况 in xR 001n n h xxxX 求解最小二乘法是一个直接的数学求解公式不过它要求X是列满秩的梯度下降法最小二乘损失函数最小二乘损失函数 37 of 36 线性回归 Gradient DescentGradient Descent 梯度下降梯度下降找出cost function函数的最小值梯度下降原理将函数比作一座山我们站在某个山坡上往四周看从哪个方向向下走一小步能够下降的最快方法方法 1 先确定向下一步的步伐大小我们称为Learning rate 2 任意给定一个初始值 3 确定一个向下的方向并向下走预先规定的步伐并更新 4 当下降的高度小于某个定义的值则停止下降 38 of 36 线性回归梯度下降算法梯度下降算法特点特点 1 初始点不同获得的最小值也不同因此梯度下降求得的只是局部最小值 2 越接近最小值时下降速度越慢 39 of 36 线性回归梯度下降算法梯度下降算法问题问题如果如果初始值就在初始值就在local minimumlocal minimum的位置则的位置则会如何变化会如何变化答因为已经在local minimum位置所以derivative 肯定是0 因此不会变化如果取到一个正确的如果取到一个正确的值则值则cost functioncost function应该越来越小应该越来越小问题怎么取值答随时观察值如果cost function变小了则ok 反之则再取一个更小的值从上面的图可以看出初始点不同获得的最小值也不同初始点不同获得的最小值也不同因此梯度下降求得的只是局部最小值 40 of 36 线性回归注意下降的步伐大小非常重要因为如果太小则找到函数最小值的速度就很慢如果太大则可能会出现overshoot the minimum的现象 overshoot minimum现象如果Learning rate取值后发现J function 增长了则需要减小Learning rate的值 41 of 36 线性回归 Gradient Descent for Linear RegressionGradient Descent for Linear Regression 梯度下降能够求出一个函数的最小值线性回归需要求出使得cost function的最小因此我们能够对cost function运用梯度下降即将梯度下降和线性回归进行整合如下图所示 42 of 36 def gradientDescent x y theta alpha m numIterations xTrans x transpose for i in range 0 numIterations hypothesis np dot x theta loss hypothesis y cost np sum loss 2 2 m print Iteration d Cost f i cost gradient np dot xTrans loss m theta theta alpha gradient return theta 43 of 36 多项式回归原理前面提到根据样本的趋势来决定假设函数当趋势较为复杂时线性模型就不适用了下图是房子的价格与尺寸的关系图从图中可以看出符合样本趋势的数学模型应该是非线性的在这里采用的是二次曲线怎么去求该数学模型的代价函数极小值呢可以简化求解的复杂度只需要把符合趋势的假设函数转换为等价的线性模型即可 44 of 36 多项式回归假设函数转换函数通过以下转换得到 45 of 36 多项式回归 from sklearn preprocessing import PolynomialFeatures 将曲线的多项式的次数的初始值设置为3 polynomial PolynomialFeatures degree 3 下面用数据点来计算多项式的参数 X train transformed polynomial fit transform X train 其中 X train transformed表示多项式形式的输入与线性回归模型是一样大的 46 of 36 逻辑回归 Logistic Regression 例子 47 of 36 逻辑回归逻辑回归 Logistic Regression 逻辑回归的模型是一个非线性模型 sigmoid函数又称逻辑回归函数逻辑回归函数但是它本质上又是一个线性回归模型因为除去sigmoid映射函数关系其他的步骤算法都是线性回归的可以说逻辑回归都是以线性回归为理论支持的只不过线性模型无法做到sigmoid的非线性形式 sigmoid可以轻松处理0 1分类问题 48 of 36 逻辑回归逻辑回归 Logistic Regression 1 找一个合适的预测函数一般表示为h函数该函数就是需要找的分类函数它用来预测输入数据的判断结果 2 构造一个Cost函数损失函数该函数表示预测的输出 h 与训练数据类别 y 之间的偏差可以是二者之间的差 h y 或者是其他的形式综合考虑所有训练数据的损失将Cost求和或者求平均记为 J 函数表示所有训练数据预测值与实际类别的偏差 3 显然 J 函数的值越小表示预测函数越准确即h函数越准确所以这一步需要做的是找到J 函数的最小值找函数的最小值有不同的方法 Logistic Regression实现时有的是梯度下降法 Gradient Descent 49 of 36 逻辑回归二分类问题二分类问题是指预测的y值只有两个取值 0或1 二分类问题可以扩展到多分类问题例如我们要做一个垃圾邮件过滤系统是邮件的特征预测的y值就是邮件的类别是垃圾邮件还是正常邮件对于类别我们通常称为正类 positive class 和负类 negative class 垃圾邮件的例子中正类就是正常邮件负类就是垃圾邮件应用举例是否垃圾邮件分类是否肿瘤癌症诊断是否金融欺诈 50 of 36 逻辑回归 Logistic函数如果忽略二分类问题中y的取值是一个离散的取值 0或1 我们继续使用线性回归来预测y的取值这样做会导致y的取值并不为0或1 逻辑回归使用一个函数来归一化y值使y的取值在区间 0 1 内这个函数称为Logistic函数 logistic function 也称为Sigmoid函数 sigmoid function 函数公式如下 Logistic函数当z趋近于无穷大时 g z 趋近于1 当z趋近于无穷小时 g z 趋近于0 Logistic函数的图形如下 51 of 36 逻辑回归 Sigmoid函数 sigmoid function 的性质 52 of 36 分类问题线性决策边界 53 of 36 对于线性边界的情况边界形式如下构造预测函数为 54 of 36 分类问题非线性决策边界非线性边界的边界形式可表示为 55 of 36 逻辑回归对于线性边界的情况边界形式如下构造预测函数为函数的值有特殊的含义它表示结果取1的概率因此对于输入x分类结果为类别1 和类别0的概率分别为正例 y 1 负例 y 0 56 of 36 逻辑回归构造损失函数构造损失函数J J Cost函数和J函数如下它们是基于最大似然估计推导得到的求J 的最小值可以使用梯度下降法根据梯度下降法可得的更新过程 57 of 36 58 of 36 逻辑回归梯度下降算法梯度下降算法更新过程梯度下降法求J 的最小值 59 of 36 梯度上升法对于输出值为y 0 1 的两类分类问题做出一个假设根据这个函数可以得到对于一个样本的概率分布为综合起来就是可以将问题转化为求Logistic回归的最佳系数因为logistic回归可以被看做一种概率模型且y发生的概率与回归参数有关因此可以对进行最大似然估计使得y发生的概率最大此时的便是最优回归系数 60 of 36 梯度上升法对数据集求似然函数并取对数计算要使得最大化则运用梯度上升法求出最高点 61 of 36 梯度上升法计算结果为此公式便是梯度上升算法的更新规则是学习率决定了梯度上升的快慢可以看到与线性回归类似只是增加了特征到结果的映射函数 62 of 36 梯度上升法梯度上升主要是采用了最大似然的推导 def gradAscent dataMatIn classLabels dataMatrix mat dataMatIn labelMat mat classLabels transpose m n shape dataMatrix n 3 alpha 0 001 学习率 maxCycles 500 循环轮数 theta ones n 1 for k in range maxCycles h sigmoid dataMatrix theta error labelMat h theta theta alpha dataMatrix transpose error return theta 63 of 36 梯度下降法向量化Vectorization Vectorization是使用矩阵计算来代替for循环以简化计算过程提高效率如上式是一个求和的过程显然需要一个for语句循环m次所以根本没有完全的实现vectorization 下面介绍向量化的过程约定训练数据的矩阵形式如下 x的每一行为一条训练样本而每一列为不同的特称取值 64 of 36 65 of 36 向量化Vectorization g A 的参数A为一列向量所以实现g函数时要支持列向量作为参数并返回列向量由上式可知可由一次计算求得更新过程可以改为综上所述 Vectorization后更新的步骤如下 1 求 2 求 3 求 66 of 36 m n X shape 矩阵大小 alpha 0 0065 设定学习速率 theta g np zeros n 1 初始化参数 maxCycles 3000 迭代次数 J pd Series np arange maxCycles dtype float 损失函数 for i in range maxCycles h logit dot X theta g 估计值 J i 1 100 np sum Y np log h 1 Y np log 1 h 计算损失函数值 error h Y 误差 grad dot X T error 梯度 theta g alpha grad print theta g 67 of 36 正则化Regularization 过拟合问题过拟合问题对于线性回归或逻辑回归的损失函数构成的模型可能会有些权重很大有些权重很小导致过拟合就是过分拟合了训练数据使得模型的复杂度提高泛化能力较差对未知数据的预测能力欠拟合合适拟合过拟合 68 of 36 正则化Regularization 问题的主因过拟合问题往往源自过多的特征解决方法 1 减少特征数量减少特征会失去一些信息即使特征选的很好可用人工选择要保留的特征模型选择算法 2 正则化特征较多时比较有效保留所有特征但减少的大小 69 of 36 正则化Regularization 正则化方法正则化是结构风险最小化策略的实现是在经验风险上加一个正则化项或惩罚项正则化项一般是模型复杂度的单调递增函数模型越复杂正则化项就越大房价预测问题多项式回归 70 of 36 正则化Regularization 正则化方法正则化是结构风险最小化策略的实现是在经验风险上加一个正则化项或惩罚项正则化项一般是模型复杂度的单调递增函数模型越复杂正则化项就越大房价预测问题多项式回归 71 of 36 正则化Regularization 72 of 36 正则化Regularization 正则项可以取不同的形式在回归问题中取平方损失就是参数的L2范数也可以取L1范数取平方损失时模型的损失函数变为 lambda是正则项系数如果它的值很大说明对模型的复杂度惩罚大对拟合数据的损失惩罚小这样它就不会过分拟合数据在训练数据上的偏差较大在未知数据上的方差较小但是可能出现欠拟合的现象如果它的值很小说明比较注重对训练数据的拟合在训练数据上的偏差会小但是可能会导致过拟合 73 of 36 正则化后的梯度下降算法的更新变为正则化后的线性回归的Normal Equation的公式为正则化Regularization 74 of 36 范数 L0范数是指向量中非0的元素的个数 L1范数 W 1是指向量中各个元素绝对值之和也叫稀疏规则算子 Lasso regularization L1范数和L0范数可以实现稀疏 L1因具有比L0更好的优化求解特性而被广泛应用 L2范数 W 2范数是指向量各元素的平方和然后求平方根它也不逊于L1范数在回归里面叫岭回归 Ridge Regression 也叫权值衰减weight decay 强大功效是改善机器学习里面一个非常重要的问题过拟合 75 of 36 岭回归 Ridge Regression 使用最小二乘法拟合的普通线性回归是数据建模的基本方法其建模要点在于误差项一般要求独立同分布常假定为正态零均值 t检验用来检验拟合的模型系数的显著性 F检验用来检验模型的显著性方差分析如果正态性不成立 t检验和F检验就没有意义对较复杂的数据建模比如文本分类图像去噪或者基因组研究的时候普通线性回归会有一些问题 76 of 36 岭回归 Ridge Regression 1 预测精度的问题如果响应变量和预测变量之间有比较明显的线性关系最小二乘回归会有很小的偏倚特别是如果观测数量n远大于预测变量p时最小二乘回归也会有较小的方差但是如果n和p比较接近则容易产生过拟合如果n p 最小二乘回归得不到有意义的结果 2 模型解释能力的问题包括在一个多元线性回归模型里的很多变量可能是和响应变量无关的也有可能产生多重共线性的现象即多个预测变量之间明显相关这些情况都会增加模型的复杂程度削弱模型的解释能力这时候需要进行变量选择特征选择 77 of 36 岭回归 Ridge Regression 以上的这些问题主要就是表现在模型的方差和偏差问题上方差指的是模型之间的差异而偏差指的是模型预测值和数据之间的差异我们需要找到方差和偏差的折中这样的关系可以通过下图说明低方差高偏差高方差低偏差测试误差曲线训练误差曲线 78 of 36 岭回归 Ridge Regression 针对OLS的问题在变量选择方面有三种扩展的方法 1 子集选择这是传统的方法包括逐步回归和最优子集法等对可能的部分子集拟合线性模型利用判别准则如AIC BIC Cp 调整R2 等决定最优的模型 2 收缩方法 shrinkage method 收缩方法又称为正则化 regularization 主要是岭回归 ridge regression 和lasso回归通过对最小二乘估计加入罚约束使某些系数的估计为0 3 维数缩减主成分回归 PCR 和偏最小二乘回归 PLS 的方法把p个预测变量投影到m维空间 m from sklearn import linear model clf linear model Lasso alpha 0 1 导入模型传入参数alpha 0 1 clf fit 0 0 1 1 0 1 训练数据 Lasso alpha 0 1 copy X True fit intercept True max iter 1000 normalize False positive False precompute False random state None selection cyclic tol 0 0001 warm start False max iter 迭代次数 tol 收敛精度 clf predict 1 1 模型预测 array 0 8 98 of 36 最小角回归法 LARS算法是一个适用于高维数据的回归算法其主要的优点如下对于特征维度n 远高于样本点数m 的情况 n m 该算法有极高的数值计算效率该算法的最坏计算复杂度和最小二乘法 OLS 类似但是其计算速度几乎和前向选择算法一样它可以产生分段线性结果的完整路径这在模型的交叉验证中极为有用其主要的缺点为由于LARS的迭代方向是根据目标的残差yres定的所以该算法对样本的噪声是极为敏感的 99 of 36 import numpy as np import matplotlib pyplot as plt from sklearn import linear model from sklearn import datasets 导入数据集这个数据集总的样本个数为442个特征维度为10 diabetes datasets load diabetes X diabetes data y diabetes target print X shape 100 of 36 所谓参数正则化路径其实就是LARS算法每次迭代的时候每个参数的数值所组成的曲线其横轴对应着迭代的程度纵轴是每个特征参数对应的数值这里一共有10个特征所以有10条特征正则化曲线 print 基于LARS算法计算正则化路径 alphas coefs linear model lars path X y method lasso verbose True 这里讲迭代程度归一化到 0 1 直间 xx np sum np abs coefs T axis 1 xx xx 1 101 of 36 plt plot xx coefs T ymin ymax plt ylim plt vlines xx ymin ymax linestyle dashed plt xlabel coef max coef plt ylabel Coefficients plt title LASSO Path plt axis tight plt show 102 of 36 使用场景一般来说对于高维的特征数据尤其线性关系是稀疏的会采用Lasso回归或者是要在一堆特征里面找出主要的特征那么Lasso回归更是首选了但是Lasso类需要自己对调优所以不是Lasso回归的首选一般用到的是下一节要讲的LassoCV类 LassoCV类的损失函数和损失函数的优化方法完全与Lasso类相同区别在于验证方法验证方法 LassoCV类对超参数使用了交叉验证来帮忙选择一个合适的在初始化 Lasso

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf

文档简介

温馨提示

最新文档

评论

回归分析(线性回归、逻辑回归、多项式回归、岭回归、Lasso回归).pdf

文档简介

温馨提示

最新文档

评论

相关文档