


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学习理论 统计学习理论是一种机器学习的方法,也就是为机器学习服务的,首先我们有个一学习机器LM。 学习机器学习的对象是什么,我们称这个对象叫做训练器S,学习机器又是如何学习的,是通过观测训练集,产生器G根据分布函数F(x)随机独立产生输入数据x,通过训练器S中算子训练之后,产生样本z1x1,y1、z2x2,y2.我们称依据联合分布函数F(x,y)=F(x)F(y|x)随机产出的数据集Z叫做训练集,而学习机器则是学习训练器S的这个训练过程或是学习出这个目标算子。 学习机器有两个追求的目标:1.模仿训练器的算子:对训练器输出提供最佳的预测结果;2.辨识训练器的算子:试图构造一个非常接近于训练算子的算子。模仿更加简单易于解决,而我们的目标是构造一个算子,从形式上看,他的意义是学习机器可以通过构造一个机器来实现某一固定函数集,在学习过程中,它从函数集中选取一个适当的函数。 那么如何选取到适合的函数,我们必须找到一个规则目标,也就是一个品质标准,我们用它来评价学习的优劣。问题便转到了在函数集中找到一个以最佳可能方式满足给定的品质准则的函数。我们定义一个损失函数:Lz,gz,=Qz,来度量学习机器的输出与训练器的输出之间的偏差,我们希望对于所有的产生器产生的样本,学习机器的响应和训练器的响应都是一致的,为此我们定义一个泛函:R=Qz,dFz , a并将泛函定义为数学期望,这一泛函称为风险泛函或风险,其最小值对应于最好的品质标准。所以问题转到如何最小化泛函R()的问题,由于分布F(z)未知,我们无法直接进行最小化,在模式识别问题上,我们知道损失函数是0,1函数,即是两点分部,损失等于概率p,由此我们想到大数定理,在样本数大的情况下,频率是逼近于概率的,依此我们想到用经验数据的损失均值来代替泛函的期望,我们定义经验风险:Remp=1lllQzi, , 假设风险泛函的最小值在Q(z,0)上取得,经验风险泛函的最小值在Q(z,l)上取得,我们将Q(z,l)作为Q(z,0)的一个近似。解风险最小化问题的这一原则称为经验风险最小化(归纳)原则。为此我们需要研究经验风险最小化原则的一致性条件,我们给出一个经典定义,对于函数集Qz, , 和概率分布函数F(x),如果下面两个序列依概率收敛于同一极限:RlPinfRRemplPinfR则我们称经验风险最小化原则是一致的。然而经典定义中会出现一致性的平凡情况,也就是这个一致性特性是由函数集中个别元素的性质所得到的,我们为了建立经验风险最小化方法的、不依赖函数集元素的性质而仅仅依赖函数集的一般性质的一致性理论,我们调整之后定义了严格一致性定义。如果任何非空子集c,c(-,+)c=:Qz,dFzc使得收敛性inf(c)RempPinf(c)R则,称经验风险最小化方法是严格(非平凡)一致的。对于经验风险最小化方法的严格一致性,它的充分必要条件是在给定的函数集上单边一致收敛性成立:limlPsupQz,dFx-1li=1lQzi,=0推广到双边一致收敛:limlPsupQz,dFx-1li=1lQzi,=0双边一致收敛单边一致必然收敛,即双边一致收敛更为严格。为了估计经验风险最小化原则的推广能力,我们必须知道函数Q(z,l)提供多大的风险值,对于一个给定的函数集,这一风险值接近最小可能风险值的程度如何。即研究这样两个界:RlRempl+l=Rl-R0=0从关于学习机器推广能力的界:RlRempl+(l,h,)我们可以知道当l/h较大时,较小,于是实际风险就接近经验风险的取值。然而当l/h较小,那么一个小的Rempl并不能保证小的实际风险值。在这种情况下,要最小化实际风险R(),我们必须对右边的两项同时最小化。针对此我们给出了一个一般的原则,称作结构风险最小化(SRM)归纳原则,给出了一个嵌套集的概念,设函数Qz,的集合S是由一系列嵌套的函数子集Sk=Qz,ak组成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育行业发展趋势报告:2025年教育行业未来发展方向与挑战
- 金融科技赋能2025年普惠金融普惠性评估模型创新与实践研究报告
- 玉露香梨采摘协议协议书
- 父母房产分给子女协议书
- 股东欠债股份转让协议书
- 股份财产分配协议书范本
- 物管装修垃圾清运协议书
- 网约车区域代理协议合同
- 银行共同合作协议书范本
- 物流信息部签约合同范本
- 建设项目使用林地可行性报告
- 新安全生产法2025全文
- 感恩地球活动方案
- 2025年中国共产党支部工作条例(试行)暨党支部建设标准化工作知识竞赛考试试题(综合题库)(含答案)
- 2025年江苏省扬州树人学校七年级英语第二学期期末综合测试试题含答案
- 中试基地相关管理制度
- 2025年云南省中考数学试卷真题及解析答案
- 2025至2030中国安全劳保用品行业发展分析及产业运行态势及投资规划深度研究报告
- 2025年广东省广州市华兴教育港澳台联考学校高考英语三模试卷
- 2025事业单位工勤技能考试考试题库及答案
- 拐杖的使用试题及答案
评论
0/150
提交评论