搜狗2023校招笔试题_第1页
搜狗2023校招笔试题_第2页
搜狗2023校招笔试题_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Word第第页搜狗2023校招笔试题以下哪个不属于CRF模型对于HMM和MEMM模型的优势()

A:特征敏捷

B:速度快

C:可容纳较多上下文信息

D:全局最优

答案:B

解析:HMM模型是对转移概率和表现概率直接建模,统计共现概率。而MEMM模型是对转移概率和表现概率建立联合概率,统计时统计的是条件概率。CRF是在给定需要标记的观看序列的条件下,计算整个标记序列的联合概率分布,而不是在给定当前状态条件下,定义下一个状态的状态分布。MEMM简单陷入局部最优,是由于MEMM只在局部做归一化。CRF模型中,统计了全局概率,在做归一化时,考虑了数据在全局的分布,而不是仅仅在局部归一化,这样就解决了MEMM中的标记偏置的问题。

CRF没有HMM那样严格的性假设条件,因此可以容纳任意的上下文信息,特征设计敏捷。CRF需要训练的参数更多,与MEMM和HMM相比,它存在训练代价大、冗杂度高的缺点。

②、概率

假设一个完好的扑克牌有52张牌,2黑色(黑葵和梅花)和2红色(方块和红心)。假如给你一副完好的牌,和半副牌(1红色和1黑色),则两种状况下抽两张牌都是红色的概率是多少()

A:1/2,1/2

B:25/102,12/50

C:50/51,24/25

D:25/51,12/25

答案:B

解析:一副牌,第一张为红色的概率为26/52,其次张为红色的概率为25/51,两张都为红色的概率为:26/52*25/51=25/102

半副牌,第一张为红色的概率为13/26,其次张为红色的概率为12/25,两张都为红色的`概率为:13/26*12/25=12/50

③、机器学习

下面关于ID3算法中说法错误的选项是()

A:ID3算法要求特征必需离散化

B:信息增益可以用熵,而不是GINI系数来计算

C:选取信息增益最大的特征,作为树的根节点

D:ID3算法是一个二叉树模型

答案:D

解析:ID3算法的核心思想是以信息增益度量属性选择,选择分裂后信息增益最大的属性进行分裂。ID3算法的局限是它的属性只能取离散值,为了使决策树能应用于连续属性值状况,可以使用ID3的一个扩展算法C4.5算法。BC选项都是ID3算法的特点。I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论