计算社会科学美等美国科学中文_第1页
计算社会科学美等美国科学中文_第2页
计算社会科学美等美国科学中文_第3页
免费预览已结束,剩余1页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、译文第 7 卷 第 6 期 2011 年 6 月科学*计算作者等译者:孟雷 秦 兵:计算科学我们生活在网络之中。我们定期查收电子邮不可重复的自述性数据。新的科学技术,比如surveillance)1、电子邮件和“智能”件,在各处拨打移动,刷卡乘坐公交车,并且使(用像机购物。我们在公众场所的活动可能被摄名徽(“smart” name badges),可以提供一段时长中的每时每刻的交互图景,这幅图景提供了人们,医疗信息可能会成电子文件。我们可以发布博客任人浏览,还可以通过社交网络来维持友谊。上述种种活动都留下了数字踪迹。通过这些数字踪迹可以描绘出个人和群体行为的综合图景,这关系间的结构等信息。比如

2、,通过电子邮件的数据来研究群体交互,这样可以解决如下人类通 信的时空动态特性问题:这些工作组是达到了一个 几乎没有改变的平衡状态,还是在随着时间大幅度变化2?什么样的交互模式代表着具有高成效的群有可能会改变我们对于生活、组织、的理解。收集和处理海量数据的能力已改变了诸如生物 学和物理学这样的领域。但是数据驱动的“计算科学”(Computational Social Science)的出现却太过组和个人?从我们收到消息的多样性是否能预示我们的能力和表现3?面对面的群组互动可以缓慢了。在乎没有这一领域的会学和政治学的顶级上几通过“计量器”(sociometers)来进行评估。这。但是计算科学正在样

3、的电子设备可以佩戴在身上,用来捕获物理上的接近、位置、移动和其他方面的行为和群体互显露端倪它出现在谷歌和雅虎这样的互联网公司中,也出现在美国安全局这种机构中。计算机构的专属领动。这些设备回的数据可能会一些有趣的科学可能会变成私人公司和问题,比如,一个组织内(成员间)互相接近的模式和通信模式,以及与具有高效表现的个人和群体域。或许会有另外一种情况,出现占有私有数据的特模式4。权学术研究群体,他们使用私有数据的是无相的法被批驳和复现的。上述两种情形对于积累、验证和我们也能了解到一个社区的“宏观”网络看起来是什么样的5,并且是如何随着时间演化知识这些长远的公众利益有任何益处。基于一个开放的学术环境,

4、计算科学通过的。公司拥有用户多年的通话模式,像谷加强对和群体的认知会给带来哪些益处?歌和雅虎这样的电子商务门户收集全球的即时是什么阻碍了计算科学的出现?通讯数据。这些信息是否可以描绘出一幅级通信模式的综合图景?这些交互通过怎样的迄今为止,对人类相互影响的研究主要靠那些*2009年2月,以哈佛大学为首的15位美国知名大学教授联名在美国科学(Science)杂志上了题为“计算科学”的具有里程碑意义的,宣告:随着人们能够收集和分析大规模的人类行为数据并从中发现个人和群体行为的模式,一个新的研究领域“计算志2009年2月第6期文章Computational social science。科学”诞生了。

5、本文译自美国科学杂70第 7 卷 第 6 期 2011 年 6 月响着生产力和公众健康?跟踪人们的行动也变得越来越简单6。移动使我们有可能在大范围内跟踪人在一段时间内的移动和物理邻近7。这样的数据可以揭示流行病的内在机理:一些病原体,比如流感,是如何由物理接近推动而在人群中的?互联网提供了一个完全不同的来了解人们在说什么和如何进行8。比如,在刚刚过去的政治大选,跟踪政治辩论、政治立场和其他9,以及话题在博客中的在互联网上“冲浪”的行为10,从而可以从他们所进行的搜索中了解选民的关切。虚拟世界在本质上使我们可以捕获图1 来自博客(blogosphere)空间的数据:上图是一结构(从2004年开始

6、),红色节个政治博客群的点代表保守派,节点代表自由派。橙色从自行为完整,可以为研究提供丰富的机会,由派博客指向保守派,紫色反之。每个博客节点实现以其他方法无法实现或不被人们接受的实验11。相似地,社交网络提供了独一无二的机会去了解一 个人在网络中的地位对其方方面面的影响,从他们 的品味到他们的情绪再到他们的健康12,在此自然 语言处理则提供了更强的能力来组织和分析来自互联网和其他 的海量文本13。的大小反映了指向该博客的其他博客的数量。文献8。自发出。在基础设施上,从学到计算科学的变化幅度要超过从生物学到计算生物学,这在很大程度上是由于需要解决分布式、权获简而言之,一个计算科学正在出现,它取和

7、加密等问题。在科学领域里可用的还充分发挥了(互联网)在前所未有的广度、深度和 范围上收集和分析数据的能力。但是,固有的会限制该学科的发展。目前网络环境可以提供万亿字节级别的,能描述每一分钟的交互情况和整个人比较少,即使科学部门到计算机科学或工程部门之间物理上的(还有就是行政上的)距离也比其他科学要大。或许最棘手的些科学所感在于数据的和隐私。这群的位置的数据,但现有的描述人类行为的方的大部分数据是私有的(比如信息)。在美国(AOL)公法并非在此基础上发展起来的。现有的网络理移动和金融论,大部分都是基于的“快照式”的数据,司泄露其许多用户“”搜索之后,随之而一般都只包含几十个人,这样的理论对于包含

8、了地来的凸显了在通过私有公司共享个人数据过程中对个人和公司可能带来的潜在风险14。为了推动点、财务和通信信息的百万规模纵向数据集又能够告诉我们什么呢?这些海量的,正在出现 的关于人们如何进行交互的数据集当然为群体人类 行为的研究提供了有价值的新视角,但是我们现有的研究方法可能不适用。研究同时又保护消费者的隐私,为公司提供赖性的保障,需要建立工业界与学术界合作和数据共享的经得起考验的模式。更一般地讲,妥善地处理。最近美国研究理事会(U.S.隐私问题National Research Council)关于地理信息系统数据在计算科学的发展中还有很大的体制性障碍。从研究方法层面分析,在物理学和生物学里

9、的的报告强调指出,即使对于采取谨慎处理后的数据依然可以从中抽取出个人资料15。去年,美国目标在观察和干预过程中带来的不同于社(U.S. National Institutes of Health)(Wellcome Trust)突然将一部分会科学。夸克和细胞既介意我们发现它们的秘卫生和英国惠康密,也对于我们在研究过程中改变它们的环境71译文第 7 卷 第 6 期 2011 年 6 月列表中删除16。这些数据看数据库从委员看来有必要对创建一个安全的、集中式的 数据基础设施进行监管。目前,已有的数据集分散 于许多群体,这些群体对于数据安全和各种不同的 协议的处理能力和理解力参差不齐。研究者本身必

10、须开发出能够保护隐私同时又能保留对研究来说不 可或缺的数据的技术。这样的系统,反过来,可能会对管理用户隐私和数据安全的产业有用18。起来是的,只是简单地报告了特定遗传标记的总出现率。但是,研究发现基于从数据库中收集的每个得到的完整数据的统计,仍有潜在的可能性进行去化(deanonymization)17。一个小小的戏剧性的破坏隐私就可能会产生能够将计算科学这一新兴研究领域扼杀的规则和,因此需要程序、技术和规则组成的一最后,计算科学的出现与其他刚刚出现的种自律机制来实现既降低风险又保留进行研究的可交叉学科(比如可持续性科学)都需要发展一套培养新学者的机制。终身教职委员会和编辑委员会需能性。作为这

11、种自律机制的基石,美国委员会委员(U.S. Institutional Review Boards)必须增要了解和为开端,计算那些跨学科文章所做的努力。作强他们的技术知识来了解产生和个人的可科学需要的是和计算机科学能性,因为新的危害的产生条件会不同于现存的模家团队的工作。长远地看,需要考虑学术界是要培式。许多委员会成员可能没有能力去评估养计算科学家,还是要培养懂计算机的科复杂数据有可能被去化的可能性。再者,学家和懂学的计算机科学家组成的团队。认知科72CCFU-52:陕西师范大学2011年5月13日,“CCF走进高校” 活动在陕西师范大学举行。“”、“教育部 感知与智能重点实验室”、信息科学技

12、术学院博士生导师研究员作了“谈可视化与可视分析研究进展 ”的 报告。报告会由计算机科学学院副院长副教授主持,院长教授出席报告会,学院相关教师及聆听了本次报告会。研究员在报告中介绍可视化的由来及主要应用领域, 从如何通过引入信息可视化和人机交互的新 分析处理复杂科学数据,构建人与数据 的桥梁;介绍了复杂高维时空数据可视分析技术,介绍了可视化分析在大气模拟数据、 目录数据、交通轨迹数据等领域的应用。还介绍了在可视化方面的研究成果及国际研究进展情况,可 视化领域的主要研究方向,指出了可视化领域的一些科学问题。 研究员与计算机科学学院师生进行了亲切的和交流,生动、细致地解答了同学们的提问。报告会上,师

13、生提问踊跃, 气氛热烈,研究员的 回答博得了全场的阵阵掌声。本次“CCF走进高校”活动提高了对可视化研究领域的认识,对同学们的职业 发展有很大的启发,为学习与就业起到了帮助作用。(余)第 7 卷 第 6 期 2011 年 6 月学的出现为计算科学的发展提供了一个的模(Myron Gutmann)密歇根大学(University of Michigan, Ann Arbor, MI, USA.)式。认知科学所涉及的领域从神经生物学到哲学再到计算机科学,已经吸引了数目可观的来投资创(Tony Jebara)哥伦比亚大学(Columbia University, New York, NY, USA)

14、立一个共同的领域,并且为过去一代公共物品(publicgood)1做出了很大的贡献。我们认为计算科学也具备同样的潜力,并且值得获得类似的投资。(Gary King哈佛大学(Harvard University, Cambridge, MA, USA.)作者:(Michael Macy)康奈尔大学(Cornell University, Ithaca, NY, USA.)(David Lazer)哈佛大学(Harvard University, Cambridge, MA, USA.)(Alex Pentland)麻省理工学院(Massachusetts Institute of Technol

15、ogy, Cambridge, MA, USA.)戴博·(Deb Roy)麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.)(Lada Adamic)密歇根大学(University of Michigan, Ann Arbor, MI, USA.)冯·(Marshall Van Alstyne)麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.),波士顿大学(Boston Univer- sity, Boston

16、, MA, USA.)思南·(Sinan Aral)麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.),纽约州立大学(New York University, New York, NY, USA.)译者 孟 雷哈尔滨工业大学计算与信息检索研究中心博士生。lmeng计算拉巴斯(Albert-László Barabási)跨学科科学研究中心(Interdisciplinary Scientific Research, Seattle, WA,USA.)译者 秦 兵CCF高级会

17、员。哈尔滨工业大学计算计算与信息检索研究中心教授。主要研究方向为 计算、文本挖掘。 qinb(Devon Brewer)跨学科科学研究中心(Interdisciplinary Scientific Research, Seattle, WA,USA.)(Nicholas Charistakis)哈佛大学(Harvard University, Cambridge, MA, USA.)参考文献·(Noshir Contractor)1D. Roy., “The Human Speech Project,” Proceedings美国西北大学(Northwestern Universit

18、y, Evanston, IL, USA.)of the 28th Annual Conference of Cognitive Science Society, Vancouver, BC, Canada, 26 to 29 July 2009福勒(James Fowler)亚哥分校(University of California¨CSan2J. P. Eckmann 14333 (2004)参考文献:. Proc. Natl. Acad. Sci. U.S.A. 101,加州大学Diego, La Jolla, CA, USA)1公共他性。的一个术语,亦可译成“公共品”。指公共

19、使用或消费的物品和服务,其特征是非竞争性和非排73译文第 7 卷 第 6 期 2011 年 6 月743 S. Aral, M. Van Alstyne, “Network Structure & Information Advantage,” Proceedings of the Academy of Management Conference, Philadelphia, PA, 3 to 8 August 20074 A. Pentland, Honest Signals: How They Shape Our World (MIT Press, Cambridge, MA, 2

20、008)5 J.-P. Onnela ., Proc. Natl. Acad. Sci. U.S.A. 104,7332 (2007)6 T. Jebara, Y. Song, K. Thadani, “Spectral Clusteringand Embedding with Hidden Markov M s,” Proceedings of the European Conference on Machine Learning, Philadelphia, PA, 3 to 6 December 20077 M. C. González ., Nature 453, 779 (

21、2008) 8 D. Watts, Nature 445, 489 (2007)9 L. Adamic, N. Glance, in Proceedings of the 3rd Inter- national Workshop on Link Discovery ( L I N K D D 2005 ) , p p. 36 43 ; h t t p:/ d o i . a c m. org/10.1145/1134271.113427710 J. Teevan, ACM Trans. Inform. Syst. 26, 1 (2008)11 W. S. Bainbridge, Science 317, 472 (2007)12 K. Lewis., Social Networks 30, 330 (2008)13 C. Cardie, J. Wilkerson,J. Inf. Technol. Polit. 5, 1 (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论