专业前沿讲座心得体会.docx_第1页
专业前沿讲座心得体会.docx_第2页
专业前沿讲座心得体会.docx_第3页
专业前沿讲座心得体会.docx_第4页
专业前沿讲座心得体会.docx_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专业前沿讲座心得体会 近年来,数据挖掘引起了信息产业界的极大关注,其 主要原因是存在大量数据,可以广泛使用,并且迫切需要 将这些数据转换成有用的信息和知识。获取的信息和知识 可以广泛用于各种应用,包括商务管理,生产控制,市场 分析,工程设计和科学探索等。 机器学习和数据挖掘这些年一直是计算机应用方面研 究的重点和热点,首先要了解什么是数据挖掘,简单地说, 数据挖掘是从大量数据中提取或“挖掘“知识。我一直对这 方面的知识颇感兴趣,这学期学院开设的学术前沿讲座的 课程,很有幸听到了文益民教授对于自己在机器学习和数 据挖掘方面研究的讲座,让我对这些知识有了深入浅出的 理解,受益匪浅。 12 月 5 号,文益民教授做了题为“大规模数据的分类” 的讲座,在讲座的最开始,文教授提到了戈登德莱顿 学习的革命一书,皆在指导我们如何积累知识如何思 考如何学习如何去做研究,具有抛砖引玉的指导意义。在 这之后,又对了解机器学习和数据挖掘首先要了解的知识 做了简要的说明,比如对于问题的分类是分为线性问题和 非线性问题;比如聚类的含义是将物理或抽象对象的集合分 成由类似的对象组成的多个类的过程;比如对于这个世界上 计算机的分类可以只分成工人(maker)和思考者(thinker) 两类。至此正式进入问题的讨论。 对于这次讲座,文教授从四个方面进行了讲授。第一, 实际应用中的大规模数据分类问题。第二,大规模数据给 机器学习带来的挑战。第三,大规模数据分类算法的研究。 第四,展望发展前景。文教授主要是在第三点中做了很多 工作也取得了可喜的成绩。 在机器学习的实际应用中,大规模数据分类问题一般 会应用在以下几个方面,在高速高精度的工业图像检测方 面,在专利分类方面,在生物信息数据快速增长方面,在 支持向量机参数选择方面。 大规模数据给机器学习带来的问题有:1、算法一般不 是收敛太慢就是难以收敛,训练时间过长。2、海量数据无 法一次装入内存。3、算法可靠性得不到保证。4、已经训 练好的学习器遇到心得训练样本时需要重新训练。 在最重要的部分,文教授提到了几个重要的研究方法, 包括算法,这里面包含有:1、基于并行计算的算法,2、 以并行计算方法求解工作集方法中每个迭代步中二次规划 的子问题,3、Meta-learning,最小最大模块化支持向量 机以及快速模块化支持向量机,4、Cluster- SVM,Cluster-based-SVM,Cascade-SVM。文教授在第三和 第四点中都有自己的工作和贡献,在第三点中,他提出了 分类面拼接算法,在第四点中,提出了分层并行支持向量 机训练算法。对于分类面拼接算法我进行了比较仔细的了 解,并下载阅读了文教授于 XX 年 3 月份在湖南大学学报上 发表的论文“基于分类面的快速模块化支持向量机研究” , 对于分类面拼接算法有了初步的研究,下面说说我对这个 算法的理解。 信息采集和信息处理技术的快速发展导致了诸如公共 健康数据、信用交易数据、国家经济普查数据、网络文本 数据和地理信息数据等大规模数据集的产生。由于训练时 间很长和空间需求很大,现有的大多数机器学习算法很难 被直接用于大规模数据的机器学习。 这个算法是针对大多数现有的机器学习算法处理大规 模问题时需要的训练时间很长和存储空间很大的难点而提 出的,英文名是 psfnrSVMs, 在训练阶段,psfm2SVMs 采用一簇平行超平面对大规模 问题实施软划分,然后针对每个子问题并行训练支持向量 机。在测试阶段,测试样本坐落于哪个子问题所在空间中, 就由该子问题训练的支持向量机给出判别结果。在 4 个大 规模问题上的实验表明:与采取硬划分的快速模块化支持向 量机(fm2SVMs)相比,软划分能够使 psfm2SVMs 得到更加光 滑的分类面,因而 ps2fm2SVMs 的泛化能力较高。在不增加 训练时间的条件下,psfm2SVMs 减少了由于训练集分割导致 的分类器泛化能力下降。 支持向量机方法的本质是在训练集的一个高维像空间 中寻找最大间隔分类超平面,这个分类超平面对应于训练 集所在空间的一个光滑曲面。如果采用训练集分割的方法, 将这个光滑曲面分段求出,然后进行连接,就可以得到这 个光滑曲面的近似曲面。 该算法使用平行超平面簇对训练集实施软划分,使得 拼接后的分类面相比 fm2SVMs 得到的分类面更光滑,更接 近最优分类曲面。因而,psfm2SVMs 的泛化能力比 fm2SVMs 的泛化能力要高。在并行条件下,两者的训练时间和测试 时间相同。在多核计算技术快速发展的今天,本文提出的 算法,提供了一种可行的并行机器学习框架,对于研制高 速高精度的机器学习算法具有一定的借鉴意义。未来计划 研究随机向量 w 的方向对 psfm2SVMs 泛化能力的影响,并 将该算法用于高速高精度工业图像检测。 这就是我的心得体会,在讲座的最后,文教授还对机 器学习和数据挖掘的未来进行了展望,诸如现在流行的云 计算,还有动态数据流学习,例外的发现,学习更复杂的 函数,粒计算等等,都是今后发展的的热点。听完这个讲 座,我感到责任重大,即使是一个点,也还有很多方面值 得拓展和探索,作为研究生,研究是我们主要的工作,想 要取得满意的结果和优异的成绩,我们所要做的就是倍加 努力,汲取现有的知识,在新的领域开拓新的研究道路, 积极探索,永不止步。 在科学技术和信息技术的带动下,经济全球化的进程 逐步加快,企业面临的竞争已演变为价值链与价值链之间 的竞争,为了提高供应链管理对我绩效,要做到拥有高效 运行机制的同时建立一个科学合理的供应链及其管理系统。 因此,供应链优化势在必行。 今天企业面临的最大挑战之一,就是要对从未有过的 需求变数做出快速的反应。很多原因导致了产品和技术的 生命周期缩短,企业间的竞争压力也导致产品的频繁变化。 为了应对这个挑战,企业需要集中力量做到比以前更敏捷, 以便在更短的时间内对产量和种类的变化做出反应。一条 快速的供应链能够是企业更加快速的发展。 供应链的定义是:供应链是围绕核心企业,将供应商、 制造商、分销商、零售商,直至最终客户连成一个整体的 功能网链结构,通过对信息流、物流,资金流的控制,从 采购原材料开始,制成中间产品以及最终产品,最后由销 售网络把产品送到消费者手中。供应链管理的基本概念使 供应商、制造商、分销商、零售商和最终 用户形成整体的 功能网链;包括所有加盟企业(节点企业);从原材料供应开 始,直至最终产品;通过供应商到用户的物料链、信息链和 资金链,实现增值链,即使相关企业都有收益(多赢)。 首先,供应链管理把产品在满足客户需求的过程中对 成本有影响的各个成员单位都考虑在内了,包括从原材料 供应商、制造商到仓库再经过配送中心到渠道商。不过, 实际上在供应链分析中,有必要考虑供应商的供应商以及 顾客的顾客,因为它们对供应链的业绩也是有影响的。 其次,供应链管理的目的在于追求整个供应链的整体 效率和整个系统费用的有效性,总是力图使系统总成本降 至最低。因此,供应链管理的重点不在于简单地使某个供 应链成员的运输成本达到最小或减少库存,而在于通过采 用系统方法来协调供应链成员以使整个供应链总成本最低, 使整个供应链系统处于最流畅的运作中。 第三,供应链管理是围绕把供应商、制造商、仓库、 配送中心和渠道商有机结合成一体这个问题来展开的,因 此它包括企业许多层次上的活动,包括战略层 次、战术层次和作业层次等。 尽管在实际的物流管理中,只有通过供应链的有机整 合,企业才能显著地降低成本和提高服务水平,但是在实 践中供应链的整合是非常困难的,这是因为:首先,供应 链中的不同成员存在着不同的、相互冲突的目标。比如, 供应商一般希望制造商进行稳定数量的大量采购,而交货 期可以灵活变动;与供应商愿望相反,尽管大多数制造商愿 意实施长期生产运转,但它们必须顾及顾客的需求及其变 化并作出积极响应,这就要求制造商灵活地选择采购策略。 因此,供应商的目标与制造商追求灵活性的目标之间就不 可避免地存在矛盾。 供应链是一个动态的系统,随时间而不断地变化。事 实上,不仅顾客需求和供应商能力随时间而变化,而且供 应链成员之间的关系也会随时间而变化。比如,随着顾客 购买力的提高,供应商和制造商均面临着更大的压力来生 产更多品种更具个性化的高质量产品,进而最终生产定制 化的产品。 在听讲座的时候老师讲得很认真,我也带着解决以下 五个问题尝试着学习。包括物流管理与供应链管理的关系 处理,物流企业和生产制造企业物流的视觉差异、物流管 理战略和战术问题的区分与协调、反映物流领域的最新研 究与实践成果及理论性与实用性相合共五个问题。 学习的过程可以分为两个阶段,一从被动地听老师授 课,起初就觉得讲座理论性太强,而可感性又不高,难以 更好的理解书中的理论,没法更好地学习知识点,二对课 本上所提到的案例加上老师的讲解后,案例具体的指出存 在的相关问题,并提出的对应的解决措施,我对课程理论 的学习进入了半知半解的状态,有了一定的认识、了解、 感悟,通过听讲座我对书本的理论又有了进一步的认识, 可感悟有了进一步的提升。对比自己本学期所学到的知识 及能力,感觉自己再具体提出相关解决措施的时候,没办 法更好的调研、分析,得出解决的方案,理论与实际的两 者结合不够,没办法列出更为具体且行的方式以解决问题, 提出方案的可操作性都有待提升。 自己学习方面的转变由只是老师讲解,转变到了自己 主动去了解、学习。通过自己上网下载相关案例,学习更 多的东西。这就是我这学期有学习进步的地方。 不足之处:由于是第一次听这一类的讲座,自己没办 法去了解到哪些途径与方法能够更好的解决我们的问题。 通过本学期的学习,我明显的感觉到了,在看待问题, 分析、解决具体问题方面的能力,明显不足,心态上有些 急切,很想学习相关方面的具体解决问题的知识,进一步 提升自己。 在进一步学习的方面,我希望老师能再强化学生在这 方面的意识,旨在合适的时候指出学生的不足和问题,让 学生更好的意识到问题,有何途径去更好的解决问题,灌 输树立学生们树立这方面的意识或习惯。 学生和老师的沟通不足,导致学生上课没办法更好的 与老师所讲解的内容,能有知识。思想或思维上的碰撞, 擦出思维碰撞的火花。在讲座之前,老师能先提前跟下节 课有关的案例,课后让学生更好的在课前提出相关的问题, 讲座上引导学生更好的在课前思考提出相关的问题,讲座 上引导学生广泛地参与到思考与讨论中出现了什么问题, 为什么会出现问题,怎么去解决问题,为什么要这么去解 决问题,如何具体的提出相关可行具体的方案去落实。这 样子就能更好地让学生对理论与运用有更深地认识了。 通过这次讲座我不仅学习到了专业知识,也使得我的 视野更开阔了,学习能力也提高了。我觉得这是我踏上社 会之前收获的一笔财富。 听了几位老师所讲的学科先沿讲座,我的感想颇多。 尤其是对林林老师的智慧时代中的挑战与机遇颇有感 触。下面我谈谈自己通过听讲,查资料,经过思考后对这 一问题的理解。 当今的信息新技术主要包括这么几类,即 新息安全新技术:主要包括密码技术、入侵检测系统、信 息隐藏技术、身份认证技术、数据库安全技术、 网络容灾 和灾难恢复、网络安全设计等。信息化新技术:信息化新 技术主要涉及电子政务、电子商务、城市信息化、企业信 息化、农业信息化、服务业信息化等。软件新技术:软件 新技术主要关注嵌入式计算与嵌入式软件、基于构件的软 件开发方法、中间件技术、数据中心的建设、可信网络计 算平台、软件架构设计、SOA 与 RIA 技术、软件产品线技术 等。网络新技术:网络新技术包括宽带无线与移动通信、 光通信与智能光网络、家庭网络与智能终端、宽带多媒体 网络、IPv6 与下一代网络、分布式系统等。计算机新技术: 计算机新技术主要关注网格计算、人机接口、高性能计算 和高性能服务器、智能计算、磁存储技术、光存储技术、 中文信息处理与智能人机交互、数字媒体与内容管理、音 视频编/解码技术等。 大胆的预测一下计算机技术往下怎么发展,因为形势 明白了,历史规律搞清楚了,需求也明白了,该怎么做呢? 我大胆做这么一个发言,中国计算机界必须把握机遇迎接 挑战。看一下处理器方面该怎么做,上个世纪我们关心的 是每秒种可以完成多少指令,处理的速度。后来发现不对, 应该做高性能的处理器,每花掉一块钱可以处理多少能力, 重要的是功耗要低,然后是无线,是互联,我们更关心消 耗每瓦功率处理能力是多少,大家关心的点开始转移,从 每秒处理能力,关心到每块买到多少处理能力,到最后消 耗每瓦功耗有多少能力。在处理结构上面有什么变化,从 上世纪 70 年代左右,人围着计算机转,每个单位只要很好 就有一个漂亮的机房,大家围着机房转,算题是通过一个 小窗口把题递进去,过一段时间里面算好,把题递出来。 那时候一切围绕 CPU 转,所以那时候 CPU 当之无愧,我的 处理器是中心所以叫 CPU。再往下可以看到计算机围着人转, 我们口袋里的手表等一切一切,人走到哪里,计算装备围 着我来转,在机器内部不是围着 CPU 转,而是围着存储期, I/O,通道转,因此不能光搞 CPU,比如出现 PIM 等新的名 称,所以我们应该与时俱进。从 CPU,C 要改成无处不在的 处理单元。 网络将怎么发展,我们在上个世纪 70 年代所关心的就 是互联互通互操作,在这儿不是讲互联互通互操作不重要, 它是一个基础绝对重要,关心这个是数据和控制信号的传 递,数据和控制信号可以传过去。做了一些日子以后发现, 需求不仅仅是这个,我们要提高网络的带宽,我们关心是 信息沟通和处理能力的增强,光把信号传过去是不是可以 处理好呢?再往下又是怎样的?我们应该关心网上有这些信 息,有这么多人用,是动态的变化,所以我们要关心信息 融合、信息确认等。要把消息传给该给的人,该给的时间, 该给的地方,该给的人,传正确的东西,这个变化不承认 不行的,以往包括我个人在内,我和我同事们宣扬,看我 家里环境,办公室环境,我计算机有多少能力联网,这已 经过去了。下面关心的是这个网络具有多少计算个算计的 能力,算计要做推理更难,再往下要面对什么问题?我的网 络环境怎么样有非常强的资源按需聚合,人机协同工作的 协调能力,体系结构将怎么发展,70 年代的时候,大家做 体系结构设计,费劲脑筋是在计算机内挖掘可能的潜力, 处理可能的矛盾,搞体系结构的人,什么是好的所长,厂 长,它的学问是处理轻重缓急,这件事应该放得下,哪件 事应该要处理,所以好的应该处理删、增、减、抑、扬, 在这种情况下发现,我们设计在机群中挖掘和平衡,我们 要在网络环境下怎么做挖掘和平衡,因为系统给人用的, 机器的环境,是给销售人员,管理者用的,所以把协同工 作做好,就要验证,所以从 HPCS 变成 HPCE,我们需要的不 是高性能,需要的是生产力可用性,中国科学家预感比较 早,因此 1997 年再一次会上,就决定当前做 ClieitServer,之后做 Cluster,之后做 Networking,之 后是 VSE,基于网络的虚拟服务含量是未来体系结构的发展 方向。这是 1997 年 8 月 25 号,到 1998 年的时候,世界有 名的计算机科学家 Isea 发表了 GRID 专著,我们要把 GRID 定位了,而是要考虑你究竟想干什么?我们做一个好的系统, 必须要看到定位准确,你在这个坐标上关于服务,你是要 做计算服务,还是数据服务,还是应用服务,还是信息服 务,还是知识服务,还是实用的服务。如果明确了你的目 标,你的技术就明确,你的评价指标就明确了。如果要做 信息服务,你就要了解你处的信息是多大一块,这件事很 重要,不能杀鸡用牛刀,也不能杀牛用鸡刀,如果系统力 度大小这么大,最后生产的问题,究竟打算怎么交帐,是 向投钱的单位交一个概念的设计,不是不可以的,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论