【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc_第1页
【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc_第2页
【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc_第3页
【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc_第4页
【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

冷热冲击试验箱 s11被遗忘的互联网搜索引擎之父 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森弗莱彻(JonathonFletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。BBC日前对他进行了专门报道,以下为文章主要内容:首次触网在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。弗莱彻给自己的发明取名“JumpStation”。 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森弗莱彻(JonathonFletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。BBC日前对他进行了专门报道,以下为文章主要内容:首次触网在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。弗莱彻给自己的发明取名“JumpStation”。 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森弗莱彻(JonathonFletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。BBC日前对他进行了专门报道,以下为文章主要内容:首次触网在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。弗莱彻给自己的发明取名“JumpStation”。 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森弗莱彻(JonathonFletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。BBC日前对他进行了专门报道,以下为文章主要内容:首次触网在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。弗莱彻给自己的发明取名“JumpStation”。 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森弗莱彻(JonathonFletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。BBC日前对他进行了专门报道,以下为文章主要内容:首次触网在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。弗莱彻给自己的发明取名“JumpStation”。 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森弗莱彻(JonathonFletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。BBC日前对他进行了专门报道,以下为文章主要内容:首次触网在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。弗莱彻给自己的发明取名“JumpStation”。 今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创早在20年前,英国年轻人乔纳森 弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。 弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容: 首次触网 在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。 Mosaic有个“Whats New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。 那时候,乔纳森 弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。 但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作正是这份工作,让他首次接触万维网和Mosaic的“Whats New”页面。 改进索引 在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“Whats New”页面存在重大缺陷网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。 弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西这个东西,其实就是世界上第一个Web爬虫软件。 弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引整个流程自动进行,直到爬虫没有东西可访问为止。 10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。 而今天,谷歌已经对超过1万亿个页面建立了索引。 引擎问世 弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“Whats New”页面上世界上第一个现代化的搜索引擎就这样运行起来了。 澳大利亚皇家墨尔本理工大学(RMIT)的马克 桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。 但是,谷歌创始人谢尔盖 布林(Sergey Brin)和拉里 佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。 JumpStation越做越大,需要的投资也越来越多后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。 无奈放弃 到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。 不堪重负的还有弗莱彻毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。 后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利 史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。 展望未来 弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。 桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。 几周前,弗莱彻在都柏林的一次会议上引起了关注作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。 “我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。 他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪这对我来说相当珍贵,所以我很幸福。”(悠拉) 搜狐IT /tech/ true 中关村在线 report 4157 今年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论