已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
INTRODUCTIONTOMachineLearning2ndEdition,ETHEMALPAYDINTheMITPress,2010.tr.tr/ethem/i2ml2e,LectureSlidesfor,CHAPTER8:NonParametricMethods,之前的方法均假定数据取自一个(或几个)已知的概率分布或混合分布非参数的方法:让数据自己说话,不对输入密度作任何假设,8.1Introduction,Parametric:singleglobalmodelsemiparametric:smallnumberoflocalmodels优点:将概率密度、判别式和回归函数均归约为估计一些参数缺点:假设并非总是成立,不成立时可能导致很大的误差特点:获得模型之后,训练数据不再被需要,LectureNotesforEAlpaydn2010IntroductiontoMachineLearning2eTheMITPress(V1.0),4,Nonparametric:SimilarinputshavesimilaroutputsFunctions(pdf,discriminant,regression)changesmoothlyKeepthetrainingdata;“letthedataspeakforitself”Givenx,findasmallnumberofclosesttraininginstancesandinterpolatefromtheseAkalazy/memory-based/case-based/instance-basedlearning,非参数方法:不存在全局模型,局部模型只受近邻实例的影响算法:使用合适的相似性度量找出相似的实例通过插值得到正确的输出不同的算法在第1和3项有所不同特点:一直存储着训练训练数,标识每一个新实例均需要训练数据缺点:耗存储空间,耗计算时间(因为每新实例均需要重复一次算法),回顾求导,F(x)dF(x)/dx(F(x+h)-F(x)/h现在F(x)是一个CDF那么,对应的密度函数怎么求?若假定已经有IID样本注意只考虑x其CDF的估计如上。此时,对应的密度函数又如何估计?,8.2非参数密度估计,由8.2衍生出来的估计密度的方法有HistogramEstimatorNaiveestimatorKernelEstimatorK-NearestNeighborEstimator,8.2.1直方图估计子,DividedataintobinsofsizehGivenanoriginxoandabinwidthh任意区间xo+mh,xo+(m+1)h)内优点:一旦bin确定下来,bin内的样本计数完成,就不再需要存储样本集了。新样本的密度估计取决于其所处的bin缺点:需要选取xoandh,且两者对估计的结果影响大,10,LectureNotesforEAlpaydn2010IntroductiontoMachineLearning2eTheMITPress(V1.0),Naiveestimator,避免选取起点,但要保留所有样本缺点:每个样本对每个区域的影响(权函数)是“hard”(0or1),因而所得估计不连续,且在xth/2处有跳跃.,12,LectureNotesforEAlpaydn2010IntroductiontoMachineLearning2eTheMITPress(V1.0),8.2.2KernelEstimator,平滑的权函数,得到平滑的估计原权函数:核函数(以高斯核为例):,14,LectureNotesforEAlpaydn2010IntroductiontoMachineLearning2eTheMITPress(V1.0),每个样本对所有点的密度估计有影响核函数的性质h的选择h也可以适应性地变化,8.2.3k-NearestNeighborEstimator,通过调整近邻系数k控制光滑度,以适应数据的局部密度。估计时不考虑N个样本,仅考虑其中的k个也可以核化,17,LectureNotesforEAlpaydn2010IntroductiontoMachineLearning2eTheMITPress(V1.0),KerneldensityestimatorMultivariateGaussiankernelsphericellipsoid,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 13084:2025 EN Surface chemical analysis - Mass spectrometries - Calibration of the mass scale for a time-of-flight secondary ion mass spectrometer
- 司机与汽车安全协议书
- 司机临时劳务合同范本
- 农村街房出售合同范本
- 南京墓地买卖合同范本
- 公司车辆质押合同范本
- 合伙人买车合同协议书
- 家庭护理行业市场分析
- 家居家装行业家居家装计划
- 厂房水泵销售合同范本
- 北京市海淀区2023-2024学年七年级上学期数学期中考试试卷(含答案)
- 医院感染管理科十五五发展规划
- 学堂在线 实验室安全教育 章节测试答案
- 《教育强国建设规划纲要(2024-2035年)》及三年行动计划全面解读
- 医院特殊群体服务优先制度方案
- 2025年知识产权普法知识竞赛题库附答案
- 垫付农产品采购资金服务合同模板
- 纳税申报实务说课课件
- 敦煌地貌课件
- 2025-2026学年七年级英语上学期第一次月考 (福建专用) 2025-2026学年七年级英语上学期第一次月考 (福建专用)原卷
- 9.25电动剪刀式升降车安全培训
评论
0/150
提交评论