展望2020年的计算科学技术.doc_第1页
展望2020年的计算科学技术.doc_第2页
展望2020年的计算科学技术.doc_第3页
展望2020年的计算科学技术.doc_第4页
展望2020年的计算科学技术.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

展望2020年的计算科学技术之一:征战比特尽管很艰难,但玄妙的量子计算机正在令人吃惊的变成现实。“这些不同寻常的机器将会持续发展。”五年前,询问任何一个研究量子计算机的人何时能研制出一台实用的量子计算机,他们可能会说无法预测,因为太遥不可及。但现在已经为期不远了。英国牛津大学量子计算机团队的人乐观地认为,到2020年将出现实用的量子计算机。然而,建构量子计算机仍然是极为艰难的,原因之一是量子系统的研制是一件非比寻常的工作。这方面工作有进步但相当缓慢。即使我们今天有一台量子计算机,但几乎没有任何程序驱动它。事实可能是,有朝一日量子计算机被研制出来,却只能用于较小的范围,即:可以出色地担当某些任务,但不像常规个人电脑那样通用。麻省理工学院的量子物理学家艾萨克庄(Isaac Chuang)认为“量子计算机几乎肯定不能成为多用途桌面机器” 。无论如何,作为科学研究工具的量子计算机是革命性的,因为它有能力模拟不同的量子系统。在传统的计算机中,信息被贮存为一系列的比特(注:比特,英文bit,计算机术语,由英文二进制binary和数字digit缩合而成,意为“位”。在传统计算机中,信息被编码成一串代表数字“1”和“0”的二进制电子脉冲,其中每个数字被称为一个比特。)。量子计算机中的信息贮存方式也是如此。所不同的是,量子比特是存储在微系统的量子态中,比如原子或离子的电子态,因此,量子计算机比传统计算机更适合模拟量子系统。通过精确捕捉分子的基本量子形态,量子模拟器能描绘并预测分子和材料的结构与反应。早期这类机器的使用情况显示,化学家、材料学家和分子生物学者似乎对计算很感兴趣。“只需数十个比特就可以为那些常规计算机难以解决的物理学问题带来希望。”“量子模拟器可以具备高温超导特性和凝聚态系统。”事实上,量子模拟已经能够通过利用原子和分子的原子核自旋储存量子比特来实现,并能用核磁共振技术进行探测和操纵。“这些量子计算机可以围绕任何传统的超级计算机运转。”量子模拟器的容量超出了最强大的传统计算机的范围。麻省学院的理论物理学家Seth Lloyd预见,2020年将出现机能完备的量子模拟器,当然在模拟不同的系统方面还有一定的限制。数据在量子态中的储存与操纵是量子计算机的关键。由于量子的“超态”(superposition)和“纠缠”特性,量子计算机拥有非常巨大的信息存储能力和超强的并行计算能力。但由于量子的这些特性比较脆弱,易受环境影响,所以量子计算机的运算出错率(乐观地数值约1/107)远高于传统计算机(现代晶体管的出错率低于1/1014)。有些科学家们曾一度以为量子计算机出错率太高而无法应用。1990年代量子纠错码出现后,如今纠错率已提高到十万分之一。理论学家们自2002年以来在量子计算机之后又提出了一些关键的构建原理,但要将这些原理变为现实的装置依然还有着广未解决的问题。最近的进步令人鼓舞。“比起从前的各种方法,离子阱芯片能更好地创造可应用的计算机。”很多研发团队正在争相创建复杂的离子阱芯片。而有些研究者则选用中子来编码量子比特,因为原子受环境的影响比离子更小,但是原子之间仍有一些微弱的影响。此外,还有其他建构量子计算机的观点,有些研究者试图以超导装置为基础,认为超导自身就是量子环境;还有人希望创建一个光学量子计算机,将量子比特编码进光子的量子态中。之二:无所不在,无处不在微型计算机用于持续监控生态系统、建筑物乃至人体,将会推进科学前沿。未来,计算机将从目前支持办公的数字运算工具进入到操纵天地,它们可以夜以继日地检测生态系统或人体的任何变化,无论尺度大小,小至纳米材料,大至地球陆地。新的计算机将会形成网络,网络内到处充满了内置有数字处理和传播装备的传感器。那些被称为“尘”、“节点”、“群”的成千上万只微型计算机将会被植入真实世界的各种物件中,它们将协作行动、共享数据,更有效地处理数据,从而使所表达的数字更有意义。研究者可以进入这些“传感器网络”,向之提出新问题或对假设进行检验。即使科学家忙于处理自己的事务,智能网络也能继续自动分析、修正自己的行为去适应世界的变化。如果觉得这些设想听起来似乎遥不可及,那么就如同1970年代电脑主机的拥有者问“为什么它没有进入千家万户风行世界?”一样,这其实是个荒谬的问题,因为答案很简单:“这只是个时间问题”。1970年之后,全球的计算力量和计算设备分布量呈指数式增长,网络技术能力也一样。这种趋势并没有放缓迹象,传感网络的普及是必然的。完全可以预见到,现有的桌面微型设备不久将会更便宜而遍布各地。计算机科学家认为,这种计算能力的广泛分布将引发一种范式的巨大变革,“人类将在第一时间大规模地从现实世界获取实时数据。”研究者将随时可以轻而易举地采掘到各个方面的环境数据,例如,通过持续监控大量的临床病人以理解疾病和疗效,通过无线传感网提供前所未有的任何时空尺度的探测可以变革土壤生态学。“这是一种完全不同的思维方法,通过筛选数据发现方案,将会大大缩短假设产生和检验的周期。”计算科学的前景将是联结整个物质世界,这是下一个前沿。但是目前传感器网对于科学研究的作用还非常有限,它还处于前期阶段,如:微尘技术专家可以做出令人叹为观止的原型,却还难以付诸应用;微尘网的创建还需要开发更多用户系统;迫于传感器昂贵的价格,传感网的密度无法满足每个分领域实验的需求。不过,无论怎样困难,传感器网的应用会持续发展,它的普及是毫无疑问的。数据网络的目标是发展成为科学知识库。未来的研究者在回望今日世界的科学家受迫于人工进行数据筛选和实验分析的情景时会感觉很不可思议,在他们的眼里,今天的科学显然还没有做好捕捉真实世界本质的准备。之三:超越人类极限科学家正求助于自动化程序和技术来应对越来越多的数据。“自动化对科学未来的影响远不止只是自动处理数据。”所有科学研究的数据收集和数据鉴别正日趋自动化。例如:单个生物学实验每天就能轻易地产生超过1兆的数据;在天文学中,自动数据收集每晚都能产生超过1千兆的数据。在整个科学研究中,数据的存档量正呈指数式增长,这里不仅有低成本数字存储的贡献,还有效率日益提高的自动化设施的支持。显然,未来科学的各个方面都将受到自动化拓展的影响:数据采集、信息存储、假设形成和验证。未来的发展将有能力推动更为有力的新的科学形式,它使理论和实践更为交融。但是,若要最大限度地从自动化中获取利益,开发有助于人类加深理解和拓展见识的高效自动化设备是根本。在21世纪,计算机在支持测试、计算公式、提出假说等方面将继续扮演日益重要的中心角色。科学的计算机化具有很高的潜在利益从广泛的科学数据中产生知识,为各类技术创新铺平道路,这些技术创新从个性化机器到处理和避免气候变化影响,包罗万象。20世纪90年代,国际人类基因组计划确定单个人类基因组的序列需要花费十年时间。如今,基因测序速度的加快预示着2050年之前可以完成对地球上每一个人的基因测序。鉴于数据产生的规模和速度,需要开发科学数据计算模型自动建构和修正技术。我们注意到,来自数学、统计学和计算机科学的一系列技术被用于创建科学模型,这种科学模型获取经验数据的自动化程度越来越高。例如,在气候学和流行病学中,每天大量的经验数据被用于检验那些关于气候变量和疾病传播的微分方程模型预报。没有计算机的帮助,科学的很多方面已经无法成立。而且,来自计算机科学(包括神经系统网络和遗传运算法则)的机器学习技术已被用于从数据中自动产生科学假设。某些机器学习的更高级形式,能够从预设的知识背景(由科学家提供公式并不断修正)中,根据逻辑规则和原理产生新的科学假设。之四:创造性机器利用网络作为研究工具将会发生什么?受想象力的局限,我们无法很好地回答这个问题。我们人类已经建立了一部具有创造力的机器,它由三个方面组成:数亿台计算机,联接这些计算机的通讯系统,和使用这些计算机与通讯的数百万人。这部创造性的机器就是互联网。它改变了我们科学研究的方式,最重要的是,增强了科学研究者之间的合作。当今的互联网为计算机化的实验室和模拟与研究数据库之间提供了便捷的联系,同时也表征了数亿消费者需求驱动下的庞大的财政投资。用于互联网软件和基础设施的总投资使其他科学研究项目预算及许多政府国防项目预算的投资额相形见绌。比以往所有大工程项目更为重要的是,互联网的实质是提供信息的协同处理,研究者可利用它搜寻有价值的资源。互联网本身已成为一些学科的研究工具:利用网格计算已经开发出数百万台联网机器的能力。基于SETI(注:Search For Extraterres Trial Intelligence,意为“搜索地外文明”,该行动始于1960年)网格和素数搜索的普及,如今,物理学家、医学和生物信息学工程受到全世界人们(和他们的计算机)的热情支持;语言学家和社会学家可以简单地通过观察发生在互联网上的事件来调查研究新问题,甚至于实证社会学也可以通过互联网进行研究。互联网的潜力不止于此,甚至在线游戏也在吸引着学术界,一些游戏拥有数百万的玩家。MMORPGs(注:Massively Multiplayer Online Role-Playing Games,意为“大规模多人参与的在线角色扮演游戏”)如:“魔兽争霸”和“无尽的任务”,其合作和争斗的三维动作极其生动。另一类MMORPGs没有重大的争斗或任务,常被称为“虚拟世界”,例如,Second Life(第二人生)具有栩栩如生的现实主义特征,这种游戏提供了包括程序设计语言等软件工具,授予了游戏参与者根据自我设计创造产品的能力,游戏的成功依赖于参与者的技术和创造性。这种虚拟世界已被用于教育项目,值得心理学和社会学研究。招募使用者创造内容的想法在当今的互联网中日渐盛行。如Google公司向用户提供工具将搜索和地图服务整合到各自的网站上。这一切表明了近期科学开发互联网可能的路线。此外,硬件将被持续改进。15年后,计算机的处理能力可能是今天的1000倍,联网设备(微传感器、受动器等)的数量将大大增加。另外,这些改进将为我们带来一个网络阶层,创造一个充满亿万个微型设备的世界,知道他们是什么,他们在哪里,如何与其他人联系,一切的一切。我们该为这样的未来做怎样的准备?最重要的工作可能就是研究具有创造力的机器。我们需要不断发展传感/受动相关层面的技术与设施,将世界打造成一个实时的数据库。在人类社会中,我们需要设计和试验大型合作体系,需要语言学家和人工智能研究者拓展搜索引擎和社会网络的服务能力,这将使人们跨越技术壁垒共同解决问题。计算机+网络+人,其结果将超越人类的创造力。未来将会怎样,我们无法想象。之五:指数世界的科学科学数据的总量每年成倍增长。科学的研究方法已经从书面笔记本进化到巨型在线数据库。科学家很早就被训练在实验室笔记本上详细记载实验过程和实验观察,以便能分析实验结果,并方便其他人能够重复他们的实验。伽利略是这样做的,门德尔是这样做的,达尔文是这样做的,我们也得这样做。当记录的数据很少时,计算分析工作就很容易完成。但现代科学大部分领域的数据量每年在成倍增长,分析变得越来越复杂,超出了书面记录的能力。当数据关系变得复杂并需要数百万个数据时,做实验、记录结果、分析并公布结果这些传统的研究步骤便显得很繁琐。现在的科学研究方法已发生了戏剧性的变化,而如今尚存的一些传统研究步骤到2020年时将不复存在。今天,科学家们主要使用桌面电脑替代手抄本记录他们的实验结果,将电脑与科学文献库相连,通过电子邮件与合作者联系。这些电脑可以进行数据分析,Matlab(注:一种数学计算程序,特别是线性代数的计算)、Mathematica(注:一种数学分析软件,以符号计算见长,具有高精度的数值计算功能和强大的图形功能)和Excel(注:电子表格)等软件是流行的分析工具。但是,这些分析工具仍然无法处理数百万的数据,从大部分标准看,它们还很原始。随着数据量的增加,获取知识的道路日益艰难。科学家们必需努力去组织、分类并简化数据,尽可能从更少的数据集中获取重大结论。分析数百万兆(terabytes)的数据是一个挑战,但是数十亿兆(petabyte)的数据集已经出现。十亿兆相当于十亿本教科书的数据量。很多科学工具,包括大型气象观察望远镜在内,每年都将产生数十亿兆数据。为应对数据的泛滥,数据库的系统使用已成为科学研究过程的一个主要部分。数据库提供了组织大型数据集、发现符合标准的目标、计算数据统计表、分析并得到图案的工具。如今,很多实验都将试验数据导入数据库进行分析。但能结合多尺度和数据集将数据完全可视化的工具很少。如果我们不能检测到所有与论证有关的数据,那么我们如何能“看到”一个新的方案或发现一个不符合假设的数据?幸运的是我们有数据库工具能履行这个角色,如多维数据集(datacubes)。自动化系统将使得从天文学到土壤取样等各类数据的收集形式发生变化。科学实验正在日益电子化,计算机被用来获取、处理和分析巨量数据集。有人争辩说,要重复做复杂的生物学实验总是很困难,因为有太多的变量。我们相信,实验的难以重复确实是当前的趋势,这个问题无法解决。但重要的是要认识到这个问题,以尽可能地捕捉操作过程,为编档工具、程序和检测开发协议草案,这些都将是未来的有效方法。已有几百位科学家通过网络协作提出了共享数据的标准化问题,这个问题已经越来越关键了。之六:计算机能有助于解释生物学吗用计算机模型解释生物功能的道路将非常艰难。罗杰-布伦特(Roger Brent)和乔许-布鲁克(Jehoshua Bruck)提出了三个有希望的路径能使我们更接近这个目标。不难想象,计算机和信息技术的发展将极大地影响生物学实践。我们期望,到2020年时,生物学家将利用计算机、众多类型的“组学”(omic)数据和大规模的生物学文献来设计实验,生产和分析新数据,并思考他们所做的工作。希望在发展计算机的同时能重视发展计算机科学应用开发模型,对生物学相关模型的探索将极大地影响对生物功能的认知(如生物系统行为的定量预测)。在2006年已经知道,生命系统在整个发展时间和空间中的轨迹,极大程度上由基因组编码功能分子的行动和相互作用来决定。这些编码分子又进一步受到外部世界的影响。由于生物系统的动力行为主要由生物的中央贮存程序来决定,因此生物系统与其他所有自然发生的、涉及时间的系统完全不同。例如气象就没有基因组。生物系统的某些方面,如编码蛋白质的序列(这决定蛋白质结构)直接来源于基因组。但是生物系统的其他方面,包括绝大部分生物功能,则是由基因组通过更复杂的途径产生。如果生物学和信息科学能继续持续发展,到2020年时,现有的关于生物学功能的自然语言的故事,绝大部分将通过更好的计算机组织与路径而叙述得更为精湛,但是这些故事的框架可能基本保持不变。而且能够设想,计算机科学模型可以帮助我们更深入地理解生物功能。当然,成果的获得也离不开深思熟虑和艰苦工作。计算机科学既需要发展用于捕获自然语义的新模型,又需要发展物理仪器作为实现这些模型的工具。生物学需要发展更新的关于生物分子及其活动方式的自然语言的描述方法。计算科学与技术提供给我们的生物结构新形式对我们的启发,要比传统的挂图方式展示生物形式所提供的启发大得多。在生物学系统里,基因组中的DNA如同执行代码,这些代码由一系列程序命令来定义。同样,可以把任何信号转换路径看作是一系列蛋白机器的集成,这些蛋白机器从细胞内部和外部提取信号,完成对它们的处理并形成一系列决定,然后将这些决定传达给负责执行的机器。然而,将生物系统与计算机进行对比,结果发现它们之间有着重大区别。在细胞和有机体层面,生物系统在许多方面不同于计算机,如:代码没有模块和边界;代码没有固定的执行程序;编码成分的自组装;没有清晰的感应方案;在贮存、处理、输入和输出组件中缺乏明晰的边界;等等。在生物系统中,处理和输出、表型和选择动作之间是没有什么差别的。最重要的是,生物系统在处理和输出之间常常没有清晰的边界。这种特性的出现缘于生物选择的结果。由于生物选择常常是在各个不同层面进行,因而,最简单的人类问题“系统是如何被选择的?”通常会同时存在若干个正确答案。在这里介绍三个值得探讨的途径:第一种富有成效的路径是通过明确分子之间所经历的化学反应来为已知的蛋白质和调节器之间的因果关系建立模型。这对于理解神经讯号至关重要,并有助于识别反应类型以发现导向分子。第二种路径是模拟近似数字和随机方法。这种模拟已经形成了理论,从狭义上看,他们能产生可以直接由实验来检验的假设。同样重要的是,他们启发了数学家和计算机科学家运用现有手段来降低复杂性并寻求新方法。例如,生物反应网络无规则可循,而应用概率方法则可能探寻到由特定网络执行的大概的反应链。第三条途径是深入分析现有的描述生物功能的自然语言,以获得更好的理解。目前用于叙述蛋白质和调节器之间功能因果关系的词汇还相当贫乏。正如词汇量同样有限的地球信息系统中的信息一样,生物学的因果叙述已被计算机系统化了,目前至少有四家商业公司正致力于这类系统化且已经取得一些成效。对于生物功能而言,还需要面临一个众所周知的难题“目的论”(注:这是一种哲学论点,认为世界上任何事物都由某种目的所安排和决定。),这是无法回避的。20世纪信息理论的建构者刻意地限制信息概念,这是因为他们定义和测定信息的能力还很有限。与此相似,生物学家喜欢用术语描述内涵和目的,但却受到测定能力的限制。正如我们所说,就生物选择而言,生物学要提供一个清晰的内涵定义,但是选择行为发生的多元性意味着总是难以确定内涵。所幸的是,科学家们对于把生物语义学的基本要素融入信息技术理论有着极大的兴趣。在与生物学相关的语义学概念方面实现信息处理模型化,可以帮助生物学家透过生物系统的定量反应速率和分子种类去理解它们的动力行为,还有助于生物学家提出新的实验,如拥有清晰可辨的处理和输出功能的人造生物系统工程,它能有助于人工选择的发展。到2020年,计算方面的伟大发展如果还不足以很大程度上影响信息的生产与处理和信息的可视(直观)化与综合,那么它将无法为生物功能的研判作出贡献。如果可以更多地了解生物系统是如何工作的,我们就可能更好地干预现实事物(如人类医学),就可能设计和构造更好地事物,而这类工作的成功和失败无疑将是未来真正的关注点。之七:计算与科学的互动在今天看来,把计算和科学的关系看作单向关系这一观点几乎是错的,而到2020年时这种看法则肯定是错的。如果不是使用了计算机,从大气模拟到基因组学等日益增多的新兴科学将不会发展到现在的水平。关于计算和科学之间的关系,有一种过于简单的分析认为是硬件关系,即把科学看作是计算机产业不懈创新的巨大受益者。计算机创新成果的获得和应用使运算速度、磁盘容量和程序器功能等记录不断被刷新,从这方面看,科学和计算机技术之间的关系的确无话可说:计算机产业的发展促进了科学的进步。一种更为动人的说法是,科学正日益信息化:包括科学研究中的资料收集、组织和转化。如果我们把计算机科学看作是对信息描述和变换算法程序的系统研究,那么计算技术是从根本上支撑了科学。有人认为,“应用计算机科学”正扮演着数学在17世纪至20世纪期间曾经的角色,即为其它科学提供有序的表形构架和探索工具。为什么会发生这种转变?答案是信息越来越多,而目前的技术手段可以使我们收集、存储和分享更多的数据。同样重要的是,科学正日趋统一,例如研究者正试图研究更大系统下的集体行为,引用理查德道金斯(注:英国皇家科学院院士,牛津大学教授,著名的动物学家)的话:“假若你想理解生命,就不要去考虑那些活的、博动的血液和分泌物,而应该考虑信息技术。”像这种系统层面的研究方法正在多个领域出现,如:生物学、气候学、地震学。这种研究的目标通常是开发高保真计算机仿真系统,以作为研究系统行为的工具。就“复杂性科学”而言,计算机科学的重要意义在于如何建构仿真系统、如何分析其输出值并与实验结果作比较。相应的,信息理论可为生物系统如何编码、转换和传导信号提供令人振撼的深刻见解。海量数据和系统科学两者均需要各个方面的计算机技术,包括硬件、软件、运算法则和理论等。这种日趋增长的重要性对2020年的科学有如下三个方面的影响:首先,2020年的科学家将善于使用计算机技术:他们不仅要知道如何编程,而且要在一些方面具有坚实的基础,如:信息管理的原理和技巧;数字模拟的可能性和有限性;用于大型软件系统构造、测试、改进的概念和工具。这些知识被很多先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论