



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学之美读后感 确切的来说数学之美并不是一本书它是谷歌黑板报中的一系列文章介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用每一篇文章都不长但小中见大从看似高深的高科技中用通俗易懂的案例展示了数学之美深深的吸引了我 这一系列文章的作者是google公司的科学家吴军他毕业于清华大学计算机系(本科)和电子工程系(硕士)并于19931996年在清华任讲师他于1996年起在美国约翰霍普金斯大学攻读博士并于XX年获得计算机科学博士学位在清华和约翰霍普金斯大学期间吴军博士致力于语音识别、自然语言处理特别是统计语言模型的研究他曾获得1995年的全国人机语音智能接口会议的最佳论文奖和XX年eurospeech的最佳论文奖 吴军博士于XX年加入google公司现任google研究院资深研究员到google不久他和三个同事们开创了网络搜索反作弊的研究领域并因此获得工程奖XX年他和两个同事共同成立了中日韩文搜索部门吴军博士是当前google中日韩文搜索算法的主要设计者在google其间他领导了许多研发项目包括许多与中文相关的产品和自然语言处理的项目并得到了公司首席执行官埃里克.施密特的高度评价吴军博士在国内外发表过数十篇论文并获得和申请了近十项美国和国际专利他于XX年起当选为约翰霍普金斯大学计算机系董事会董事 正是他在信息检索与自然语言处理领域中的一系列工作使他讲述了我所看到的内容数学之美 看了数学之美立即联想到了金庸小说中的武林高人总是把一套大多数人都会的入门功夫使得威力无比击溃众多敌者东西放在那它的威力如何并键在于使用者武术如此数学同样如此 于我而言语音视别是一类高科技作为非专业人土深觉高奥但看完数学之美之后顿感惊诧原来如此深奥东西的解决方法自己也学过并且理工科读过大学的人都学过那就是统计学中的条件概率p(a/b)即b事件发生条件下a事件发生的概率 如果s表示一连串特定顺序排列的词w1w2wn换句话说s可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子现在机器对语言的识别从某种角度来说就是想知道s在文本中出现的可能性也就是数学上所说的s的概率用p(s)来表示利用条件概率的公式s这个序列出现的概率等于每一个词出现的概率相乘于是p(s)可展开为: p(s)=p(w1)p(w2|w1)p(w3|w1w2)p(wn|w1w2wn1) 其中p(w1)表示第一个词w1出现的概率;p(w2|w1)是在已知第一个词的前提下第二个词出现的概率;以次类推不难看出到了词wn它的出现概率取决于它前面所有词从计算上来看各种可能性太多无法实现因此我们假定任意一个词wi的出现概率只同它前面的词wi1有关(即马尔可夫假设)于是问题就变得很简单了现在s出现的概率就变为: p(s)=p(w1)p(w2|w1)p(w3|w2)p(wi|wi1) (当然也可以假设一个词又前面n1个词决定模型稍微复杂些) 接下来的问题就是如何估计p(wi|wi1)现在有了大量机读文本后这个问题变得很简单只要数一数这对词(wi1,wi)在统计的文本中出现了多少次以及wi1本身在同样的文本中前后相邻出现了多少次然后用两个数一除就可以了,p(wi|wi1)=p(wi1,wi)/p(wi1) 也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题其实不光是常人就连很多语言学家都曾质疑过这种方法的有效性但事实证明统计语言模型比任何已知的借助某种规则的解决方法都有效比如在google的中英文自动翻译中用的最重要的就是这个统计语言模型去年美国标准局(nist)对所有的机器翻译系统进行了评测google的系统是不仅是全世界最好的而且高出所有基于规则的系统很多 这就是数学的美妙之处了它把一些复杂的问题变得如此的简单 看到数学之美在感叹数学的美妙与神奇之处时自然而然联系到自己专业(地质工程而或岩土工程)中的数学应用 现在找文献搜索期刊一大堆基于数学的专业文献灰色数学的、模糊数学的、非线性的、系统的等等这么多的数学的使用促进了一大批的文章但这些数学方法的应用究竟是发现了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届山东省临朐市中考英语最后冲刺模拟试卷含答案
- 2025年行政执法资格证考试题库及答案
- 2025年行政执法人员行政执法资格证考试必考题库及答案解析
- T-GDPHA 002-2025 医用电子直线加速器不良事件报告规范
- (2025)网格员招聘笔试题库及答案
- 2025年网格员知识题库附含参考答案
- 浙江省宁波市宁海县2026届初中英语毕业考试模拟冲刺卷含答案
- 文化传承与社区特色塑造融合方案
- 新媒体对高校专业课教育的思潮影响应对路径
- 2026届山西省怀仁市重点达标名校中考语文仿真试卷含解析
- 《建筑施工技术》课件-砌筑工程施工
- 2024至2030年中国医药销售外包(CSO)行业市场运行及投资策略咨询报告
- 高中英语外研版 单词表 必修3
- 高中文言文试题练习题(有答案)百度文库
- DB43-T 2142-2021学校食堂建设与食品安全管理规范
- 电厂锅炉大修施工方案
- 第八届全国职工职业技能大赛(焊工)辽宁选拔赛试题库-下(判断题)
- DL∕T 2447-2021 水电站防水淹厂房安全检查技术规程
- 2023年新疆克州高校毕业生“三支一扶”计划招募考试真题
- 大气热力环流 教学设计 湘教版(2019)高中地理必修一
- HG∕T 2049-2018 搪玻璃设备 高颈法兰
评论
0/150
提交评论