百度11月4日网上笔试题及答案(仅供参考).doc_第1页
百度11月4日网上笔试题及答案(仅供参考).doc_第2页
百度11月4日网上笔试题及答案(仅供参考).doc_第3页
百度11月4日网上笔试题及答案(仅供参考).doc_第4页
百度11月4日网上笔试题及答案(仅供参考).doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

百度11月4日网上笔试题及答案(仅供参考).txt人永远不知道谁哪次不经意的跟你说了再见之后就真的再也不见了。一分钟有多长?这要看你是蹲在厕所里面,还是等在厕所外面 百度11月4日网上笔试题及答案(仅供参考) 编程: 1用C语言实现一个revert函数,它的功能是将输入的字符串在原串上倒序后返回。 2 编程: 用C语言实现函数void * memmove(void *dest,const void *src,size_t n)。memmove 函数的功能是拷贝src所指的内存内容前n个字节 到dest所指的地址上。 3 英文拼写纠错: 在用户输入英文单词时,经常发生错误,我们需要对其进行纠错。假设已经有一个包 含了正确英文单词的词典,请你设计一个拼写纠错 的程序。 (1)请描述你解决这个问题的思路; (2)请给出主要的处理流程,算法,以及算法的复杂度; (3)请描述可能的改进(改进的方向如效果,性能等等,这是一个开放问题)。 4 寻找热门查询: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串 的长度为1-255字节。假设目前有一千万个记录, 这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个 。一个查询串的重复度越高,说明查询它的用户越多, 也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。 (1)请描述你解决这个问题的思路; (2)请给出主要的处理流程,算法,以及算法的复杂度。 5 集合合并: 给定一个字符串的集合,格式如: aaa bbb ccc, bbb ddd,eee fff,ggg,ddd hhh 要求将其中交集不为空的集合合并,要求合并完成后的集合之间无交集,例如上例应 输出 aaa bbb ccc ddd hhh,eee fff, ggg (1)请描述你解决这个问题的思路; (2)请给出主要的处理流程,算法,以及算法的复杂度 (3)请描述可能的改进(改进的方向如效果,性能等等,这是一个开放问题)。 /1 1 题 char *revert(char * str) int n=strlen(str); int i=0; char c; for(i=0;i c=str; str=strn-i; strn-i=c; return str; / 2 题 void * memmove(void *dest,const void *src,size_t n) assert(dest!=0)&(src!=0); char * temp=(char * )dest; char * ss=(char * )src; int i=0; for(;i *temp+=*ss+; return temp; / 3 题 (1)思路 : 字典以字母键树组织,在用户输入同时匹配 (2) 流程: 每输入一个字母: 沿字典树向下一层, a)若可以顺利下行,则继续至结束,给出结果; b)若该处不能匹配,纠错处理,给出拼写建议,继续至a); 算法: 1.在字典中查找单词 字典采用27叉树组织,每个节点对应一个字母,查找就是一个字母 一个字母匹配.算法时间就是单词的长度k. 2.纠错算法 情况:当输入的最后一个字母不能匹配时就提示出错,简化出错处理,动态提示 可能 处理方法: (a)当前字母前缺少了一个字母:搜索树上两层到当前的匹配作为建议; (b)当前字母拼写错误:当前字母的键盘相邻作为提示;(只是简单的描述,可 以有更多的) 根据分析字典特征和用户单词已输入部分选择(a),(b)处理 复杂性分析:影响算法的效率主要是字典的实现与纠错处理 (a)字典的实现已有成熟的算法,改进不大,也不会成为瓶颈; (b)纠错策略要简单有效 ,如前述情况,是线性复杂度; (3)改进 策略选择最是重要,可以采用统计学习的方法改进。 / 4 题 (1)思路: 用哈希做 (2) 首先逐次读入查询串,算哈希值,保存在内存数组中,同时统计频度 (注意值与日志项对应关系) 选出前十的频度,取出对应的日志串,简单不过了。 哈希的设计是关键。 / 5 题 (1)思路:先将集合按照大小排列后,优先考虑小的集合是否与大的集合有交集。有 就合并,如果小集合与所有其他集合都没有交集,则独立。独立的集合在下一轮的比 较中不用考虑。这样就可以尽量减少字符串的比较次数。当所有集合都独立的时候, 就终止。 (2)处理流程: 1.将集合按照大小排序,组成集合合并待处理列表 2.选择最小的集合,找出与之有交集的集合, 如果有,合并之; 如果无,则与其它集合是独立集合,从待处理列表 中删除。 3.重复直到待处理列表为空 算法: 1。将集合按照大小从小到大排序,组成待处理的集合列表。 2。取出待处理集合列表中最小的集合,对于集合的每个元素,依次在其他集合中搜索 是否有此元素存在: 1若存在,则将此小集合与大集合合并,并根据大小插入对应的位置 。转3 。 2若不存在,则在该集合中取下一个元素。如果无下一个元素,即所有元素 都不存在于其他集合。则表明此集合独立,从待处理集合列表中删除。并加入结果集 合列表。转3。 3。如果待处理集合列表不为空,转2。 如果待处理集合列表为空,成功退出,则结果集合列表就是最终的输出。 算法复杂度分析: 假设集合的个数为n,最大的集合元素为m 排序的时间复杂度可以达到n*log(n) 然后对于元素在其他集合中查找,最坏情况下为(n-1)*m 查找一个集合是否与其他集合有交集的最坏情况是m*m*(n-1) 合并的时间复杂度不会超过查找集合有交集的最坏情况。 所以最终最坏时间复杂度为O(m*m*n*n) 需要说明的是:此算法的平均时间复杂度会很低,因为无论是查找还是合并,都是处 于最坏情况的概率很小,而且排序后优先用最小集合作为判断是否

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论