版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
INTRODUCTIONTO
MachineLearning
2ndEditionETHEMALPAYDIN©TheMITPress,2010alpaydin@.tr.tr/~ethem/i2ml2eLectureSlidesforCHAPTER8:
NonParametricMethods之前的方法均假定数据取自一个(或几个)已知的概率分布或混合分布非参数的方法:让数据自己说话,不对输入密度作任何假设8.1IntroductionParametric: singleglobalmodelsemiparametric:smallnumberoflocalmodels优点:将概率密度、判别式和回归函数均归约为估计一些参数缺点:假设并非总是成立,不成立时可能导致很大的误差特点:获得模型之后,训练数据不再被需要LectureNotesforEAlpaydın2010IntroductiontoMachineLearning2e©TheMITPress(V1.0)4Nonparametric:SimilarinputshavesimilaroutputsFunctions(pdf,discriminant,regression)changesmoothlyKeepthetrainingdata;“letthedataspeakforitself”Givenx,findasmallnumberofclosesttraininginstancesandinterpolatefromtheseAkalazy/memory-based/case-based/instance-basedlearning非参数方法:不存在全局模型,局部模型只受近邻实例的影响算法:使用合适的相似性度量找出相似的实例通过插值得到正确的输出不同的算法在第1和3项有所不同特点:一直存储着训练训练数,标识每一个新实例均需要训练数据缺点:耗存储空间,耗计算时间(因为每新实例均需要重复一次算法)回顾求导F(x)dF(x)/dx≈(F(x+h)-F(x))/h现在F(x)是一个CDF那么,对应的密度函数怎么求?若假定已经有IID样本注意只考虑x其CDF的估计如上。此时,对应的密度函数又如何估计?8.2非参数密度估计由8.2衍生出来的估计密度的方法有HistogramEstimatorNaiveestimatorKernelEstimatorK-NearestNeighborEstimator……8.2.1直方图估计子DividedataintobinsofsizehGivenanoriginxoandabinwidthh任意区间[xo+mh,xo+(m+1)h)内优点:一旦bin确定下来,bin内的样本计数完成,就不再需要存储样本集了。新样本的密度估计取决于其所处的bin缺点:需要选取xoandh,且两者对估计的结果影响大10LectureNotesforEAlpaydın2010IntroductiontoMachineLearning2e©TheMITPress(V1.0)Naiveestimator避免选取起点,但要保留所有样本缺点:每个样本对每个区域的影响(权函数)是“hard”(0or1),因而所得估计不连续,且在xt±h/2处有跳跃.12LectureNotesforEAlpaydın2010IntroductiontoMachineLearning2e©TheMITPress(V1.0)8.2.2KernelEstimator平滑的权函数,得到平滑的估计原权函数:核函数(以高斯核为例):14LectureNotesforEAlpaydın2010IntroductiontoMachineLearning2e©TheMITPress(V1.0)每个样本对所有点的密度估计有影响核函数的性质h的选择h也可以适应性地变化8.2.3k-NearestNeighborEstimator通过调整近邻系数k控制光滑度,以适应数据的局部密度。估计时不考虑N个样本,仅考虑其中的k个也可以核化17LectureNotesforEAlpaydın2010IntroductiontoMachineLearning2e©TheMITPress(V1.0)Kerneldensityestimator MultivariateGaussiankernel spheric ellipsoid8.3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 技术创新绩效考核评价体系
- 2026北京航空航天大学宇航学院聘用编科研财务助理F岗招聘1人备考题库含答案详解
- 2026第十四届贵州人才博览会贵州医科大学附属口腔医院引进高层次人才5人备考题库含答案详解(培优)
- 2026上海市公共卫生临床中心招聘备考题库及答案详解(夺冠系列)
- 2026湖南岳阳市屈原管理区科技和工业信息化局编外人员招聘备考题库含答案详解(夺分金卷)
- 2026江苏南通通州湾三余人民医院招聘医疗辅助人员1人备考题库及答案详解1套
- 2026云南玉溪市江川区妇幼保健院就业见习岗位招募8人备考题库及答案详解(基础+提升)
- 2026年河南省焦作市事业单位联考招聘628名备考题库及答案详解(易错题)
- 2026浙江嘉兴经济技术开发区招聘教师20人备考题库含答案详解(达标题)
- 2026中国共产党曲靖市委员会统一战线工作部招聘公益性岗位3人备考题库(云南)及1套完整答案详解
- 患者十大安全目标(2025) 2
- 2025年独山子石化分公司招聘笔试参考题库含答案解析
- 2023年泸县选调机关事业单位工作人员考试真题
- 新建雄安新区至忻州环境影响报告书
- 河南省南阳市邓州市2023-2024学年六年级下学期6月期末英语试题
- 悬挑式卸料平台验收表
- GB/T 754-2024发电用汽轮机参数系列
- 河道整治方案的PPT
- 2022年上海电机学院辅导员招聘考试真题
- 最全医疗机构基本标准(试行)2023年
- GB/T 14916-2022识别卡物理特性
评论
0/150
提交评论