版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《2025年开放数据现状:十年发展与挑战》《2025年开放数据报告》2026年1月调查结果:纵向
6开放科学意识和实践的变化熟悉FAIR原则:7两个群体的故事对开放数据的热情全球减少10项指令强烈支持开放12项实践持续存在信用差距:认可14对现实采纳AI工具15跨学科总结17个基于调查数据的主题和影响报告可在以下链接获取:https://10.6084/m9.figshare.30823079数
据可在以下链接获取:https://10.6084/m9.figshare.30763190内容开场白
3位专家对开放数据的观点
18数字科学斯普林格自然3指令和政策可以有所帮助19推动变革但量身定制4
支援需要建议27结论28致谢29附录1:关于
30个开放数据现状及2025调查附录2:关于
32家开放数据平台,包括Springer
Nature、Figshare和DigitalScience开放式数据具有长期20个难以被机构衡量的影响这个信贷差距再次出现:缺乏22项研究成果认可互操作性与人造智能24集成将是下一步步骤什么是接下来的10年?
25等待开放数据?《2025年开放数据报告》引言52.£1!11数码":'=
科学丹尼尔·胡克博士首席执行官,数字科学随着社区期望受到新资助者规定、FAIR原则以及全球对透明度日益增强的动力的塑造,他们的声音描绘了
一种稳定的文化转变。研究人员描述了人们对开放数据价值的认识不断加深,例如其在提高研究影响力和覆盖面
、确保研究可重复性和可再利用性以及加强研究诚信方面的作用。今天,《开放数据报告》已成为全球研究者情绪在十年快速变革中演变的一个独特纵向记录。在数字科学公司
,我们自豪地与施普林格自然出版集团和Figshare合作
,共同维护这份记录,并倡导研究者的声音。通过倾听社区的声音——并在过去10年的《开放数据
状况报告》中传播其观点——我们帮助突出了持续存
在的挑战,提出了有意义的变革建议,并展示了开放
性如何从一种愿望转变为现代研究的核心实践。今天,《开放数据报告》已成为全球研究者情绪在十年快速变革中演变的一个独特纵向记录。。我们希望我们的工作与开放研究运动的原理保持一致,因此我们在Figshare上公开了调查数据。我们也希望,如果这份报告能够取得成功,它可以被重复进行,从而我们可以建立一个可能对社区有价值的长横数据源,帮助从文化和社交两个视角跟踪这个研究生态系统中的成长时期。因此,我们特意选择了一套我们认为能够经得起考验的问题,并可以在每年重复这些问题。十多年前,我们意识到开放数据运动有可能成为自1680年代后期研究杂志问世以来,对研究开展和共享方式最具深远影响的变化。然而,直到2016年才发生了“开放数据状态”。为了我们确立报告,核心目的是倾听研究社区的声音,并在
开放研究背景的上升中理解它与数据共享的演变关系在这段旅程的开始,我们知道,有意义的进步不仅取决于新政策和基础设施,还取决于理解被要求分享数据的科研人员的生活经历、动机和顾虑。我们相信,调查数据和相应的报告为这些声音提供了一个平台——逐年捕捉研究人员对数据共享的看法,他们面临的障碍以及他们所需的支持。《2025年开放数据报告》3大自然泉HARSHJEGADEESAN首席出版官,斯普林格·自然展望未来,开放数据最大的变化将来自人机协作、为自动化和互操作性结构化的内容,以及基于信任和诚信的工作流程。这些发展将重塑数据集的创建、共享和验证方式,将开放性提升到新的水平,使其变得无缝、自动化且可信赖。同样重要的是确保开放数据被视为可信的研究成果,
一个可以链接、引用和可见的成果,因此被视为职业
发展和资金决策的一部分并获得认可和重视。展望未来,开放数据最大的变化将来自人机协作、为自动化和互操作性结构化的内容,以及基于信任和诚信的工作流程。这些发展将重塑数据集的创建、共享和验证方式,将开放性提升到新的水平,使其变得无缝、自动化且可信赖。在施普林格·自然,我们相信,开放数据对于加速发现和负责任地推动研究向前发展至关重要。过去十年间,开放数据已变得更加普及,但进展仍然不均衡——部分原因是因为研究往往碎片化,数据在一处
,方法在另一处,代码在别处。从与合作伙伴Figshare和Digital
Science共同开发的《开放数据状态调查报告
》中,我们了解到,尽管对共享的态度正在改善,但认可和实际支持仍然滞后。这些研究人员的见解有助于形成社区对数据共享挑战和机遇的理解。基于这些经验,我们倾听研究者的意见,与合作伙伴合作,更好地了解需求并开发满足他们需求的解决方案。我们最新的报告突出了地区和学科之间的差异,并显示对数据共享的认可仍然不足。将政策转化为实践需要集体努力。研究人员、出版商和机构需要共同努力,通过在存储库、标准、许可和文档方面的明确指导,使数据共享变得更加简单和一致。《2025年开放数据报告》4介绍加速发现,促进合作,增强信任和透明度,以产生更
大影响。尽管广泛认可共享开放数据的好处,但仍然存在重大挑战。正如内格尔·沙德博特爵士在他撰写的客座文章《开放数据的现状》中所写:前言,首届,“如果我们真的要改变习俗,2016年报告:研究领域的实践与文化建设,我们必须认识到,我们需要激励措施,也需要强
制要求。
十年后,他的评论依然如故,它界定了本周年报告探
讨的问题:我们在文化和实践上走了多远?差距在哪
里持续存在?以及哪些策略可以推动未来几年的实质性进步?随着我们纪念开放数据报告十年的里程碑,这一时刻呼吁我们反思开放数据运动走了多远,以及为什么它比以往任何时候都更加重要。起初,这一趋势起源于通过倡导和开放获取宣言来推动开放。现在它已经发展成为全球范围内的广泛应用,甚至在一些国家形成正式要求,推动全球向开放转型。今天,FAIR原则(使数据可寻、可及、可互操作和可重复使用)构成了这些政策与实践的全球基石。将研究数据与研究人员直接网络之外分享,长期以来被视为具有益处。关于第10届周年报告《开放数据现状》是数字科学、施普林格·自然和Figshare每年一次的合作项目,旨在追踪这一转变。通过调查研究人员对开放数据的看法和经验——包括分享数据的动机、使数据可访问时遇到的障碍以及公开共享数据的可靠性感知——这份年度报告旨在为变化提供持续的基准。了解更多关于这些报告的影响以及附录1的内容。2025调查方法与人口统计,见调查洞察专家声音建议第一部分基于2025年的调查结果,审视了当前开放数据的现状,并对比了关键主题的纵向研究。第二部分汇集了与研究人员、图书管理员和数据专家访谈的见解,提供了关于开放数据共享的区域视角。受访者的名单可在致谢部分找到。o=-在此基础上,《开放数据状况》特别十周年报告旨在分享对开放共享研究数据中障碍和潜在解决方案的更深入和更全面的理解,回顾过去十年并展望未来。:~~;:~!Higs
hare-i~a数字•:'=
科学斯普林格自然《2025年开放数据报告》5调查结果:开放科学意识和实践的长时变化本节基于2025年调查发现和长期趋势,探讨了开放数据的现状,突出了主要的转变和持续性的挑战。数据显示了开放科学原则在不断增强的意识和参与度,同时也体现了实现过程中持续存在的障碍。《2025年开放数据报告》640.6%
“熟悉数据原理”的人群比例从15.2%上升到40.6%,在2024年超过了“听说过数据原理但不太熟悉”的人群(比例达到38.9%)。20.4%
自2018年引入FAIR意识问题以来,到2025年,从未听说过FAIR数据原则的受访者的比例已从
59.6%下降到20.4%。79.5%今天,近80%的人至少对此有一些认识(比2018年的40%有所上升),标志着对这些原则参与
度的一个重大转变。熟悉FAIR原则:两个队列的故事自2018年首次提出这个问题以来,对FAIR原则的了解已经大幅提升:《2025年开放数据报告》7也许最重要的变化是,现在熟悉FAIR原则(而不仅仅是听说过它们)的研究者比例大大增加。工程研究人员对FAIR原则的熟悉度从13.6%上升至45.6%,而生物研究人员则从14.9%增至41.8%,这标志着从被动认了解到主动参与的转变。研究人员被问及:“你对FAIR数据原则(即:可发现性、可访问性、互操作性及可重用性)有多熟悉?”选项包括:“之前从未听说过FAIR”,“之前听说过FAIR但不了解其原则”和“熟悉FAIR”。每年样本量:2018年(n
=
1,239),2025年(n
=
3,932)。关于对FAIR数据原则熟悉程度的问题在2018年的调查中被提出。因此,此图从2018年开始显示了趋势数据。我图1您对FAIR数据原则(即可查找性、可访问性、互操作性和可重用性)有多熟悉?在各学科领域,对FAIR原则的认识也急剧增长(见图2)。2018年,陌生自2018年以来(广泛存在:大多数研究人员从未听说过FAIR,尤其是在商业/投资(80.0%)、化学(64.6%)和材料科学(65.9%)领域。到2025年,这幅图已经发生了显著变化:
陌生感在大多数领域下降了40-60个百分点。商业/投资领域的改善最为显著,从80.0%降至20.0%,而艺术与人文领域则几乎减半,从40.9%降至22.38.9听说过“公平竞技”(FAIR),但不熟悉。20.4从未听说过FAIR。0%2018201920202021202220232024202559.650%40%65.9%材料科学20.0%商业/投资80.0%商业/投资22.2%艺术与人文64.6%化学30%20%10%《2025年开放数据报告》熟悉公平数据原则熟悉FAIR40.625.215.22%。8熟悉2018年FAIR数据原则•
•从未
说过
之前听说
熟悉80%60%40%20%熟悉FAIR数据原则,2025•
•从未听说过
之前听说80%60%40%20%
r--
t---对图2FAIR数据原则按学科领域熟悉的程度对FAIR原则的认知和熟悉度在各个学科中急剧上升,标志着向积极参与开放科学的转变,并为研究人员如何看
待和采纳更广泛的开放实践奠定了基础。-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……研究者被问及“您对FAIR数据原则(即可查找、可获取、可互操作和可重用)的熟悉程度如何?”选项包括:’之前从未听说过这
一数据原则’、’之前听
说过但不太熟悉’、’熟悉这些数据原则’。年样本量:2018年(n=1,239),2025年(n=3,932)。9《2025年开放数据报告》
熟悉r--对2016-2025年在10个国家实施要求公开研究数据的国家级令的研究者支持65%60%55%50%45%40%35%30%25%20%15%10%5%0%印度54.7意大利47.3西班牙44.7德国40.4加拿大39.1联合王国39.1巴西39美国29.7澳大利亚27.4中国25.82016201920222025全球对开放数据命令的热情正在
下降。支持国家法规——要求研究人员分享其数据——图3)。全球范围内,支持
在过去的10年里全球和地区范围内都发生了变化(相对稳定,但这掩盖了显著的地区差异)。-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……来自澳大利亚、巴西、加拿大、中国、德国、印度、意大利、西班牙、英国和美国的研究对象被问及:“您对
一
项全国性要求公开研究数据的命令会有多大的支持?”以下为“强烈支持”的受访者每年有效回复的百分比。样本量:2016年(n=945),2017年(n=1,348),2018年(n=692),2019年(n=2,907),2020年(n=2,430),2021年(n=2,303),2022年(n=2,783),2023年(n=3,139),2024年(n=2,598),2025年(n=2,410)。纵向总样本量N=2
1,555。我图3研开究放人1个支国持家一的项研国究家数强据制,要21
-2025...52.9....38839278990134555666651.946.7《2025年开放数据报告》1040.4%
39.1%
39.1%
39.0%德国加拿大英国巴西
25.8%中国(25.8%)在2025年的“强烈支持”类别中处于最低端。总体而言,这种模式表明,对命令的早期高自信支持可能正在让位于更合格的观点,因为实施和遵守的现实
变得更加清晰。这加强了将政策与实际基础设施和支持相结合的需要,以便共享变得可行并真正可重复使用。11尽管轨迹因国家而异,自2016年以来,所有十个国家对“强烈支持”的强劲支持已有所减弱。到2025年,只有印度在“强烈支持”这一项上仍超过50%。
54.7%印度在2025年仍位居第
一,占比为54.7%,较2016年的59.8%有所下降。2025年,中等规模集群已汇聚至约40%。
27.4%
29.7%澳大利亚强烈支持国家开放数据要求的受访者比例出现最大降幅,从2016年的63.2%下降到202
5年的27.4%,降幅为35.8个百分点。美国也遵循了相似的轨迹,净支持率从52.
9%下降到29.7%,下降了23.2个百分点。《2025年开放数据报告》强有力的支持开放实践的态度持续存在。尽管对强制规定的支持度下降,但对开放实践的热情依然强烈。这表明研究人员在原则上继续重视开放性,但对开放性
的实施方式越来越持批评态度。88.1%
80.9%75.7%59.3%支持开放获取支持开放数据对开放同行评审的热支持预印刷情对开放获取(88.1%)和开放数据(80.9%)的支持稳固,这与对开放同行评审(75.7%)的略微较低的积极性以及
围绕预印本的明显犹豫(59.3%)形成对比,这很可能是受到学科规范和最近对大规模人工智能生成内容的担忧所
影响。这些模式突显出,实际和文化因素,而非仅仅依靠指令,推动着特定开放实践的采用。12《2025年开放数据报告》预印刷应为常见的学术规范做法•
•
•强烈同意
有点同意
中立/没有意见稍有不同意见强烈反对100%90%80%70%60%50%40%30%20%10%0%2022202320242025开放同行评审应该是常见的学术实践。•
•
•强烈同意
有点同意
中立/没有意见稍有不同意见强烈反对100%90%80%70%60%50%40%30%20%10%0%2022202320242025开放研究数据应该是常见的学术实践。•
•
•强烈同意
有点同意
中立/没有意见稍有不同意见强烈反对100%90%80%70%60%50%40%30%20%10%0%2021
2022
20232024
2025使研究文章开放获取应该成为常见的学术惯例•
•
•强烈同意
有点同意
中立/没有意见稍有不同意见强烈反对100%90%80%70%60%50%40%30%20%10%0%2021
2022
20232024
2025受访者对每项实践在学术交流中应普遍存在的同意/不同意比例。受访者被问及“在多大程度上你同意/不同意以下陈述?”在5点李克特量表(“强烈同意”,“稍
微同意”,“中立/无意见”,“稍微不同意”,“强烈不同意”)上。关于开放同行评审和预印本的问题于2022年引入。年度样本量:2021年(n=4,491),2022
年(n=6,104),2023年(n=6,091),2024年(n=4,454),2025年(n=3,959)。这些问题在不同的调查年份被引入。展示了每个问题首次被包含在调查中的趋势数据。13我对开放科学实践的科研人员态度研究-i~a数字
斯普林格自然•:'=
科学:~~;:~!Higs
hare
图4《2025年开放数据报告》您认为研究人员目前为分享数据得到的认可是否足够?是的或过度赞誉(%)
太少的信用(%)202022.1
77.92021
22.877.32022
23.276.72023
23.6
76.32024
27.3
72.62025
30.7
69.2他们收到太少了赞誉这个。信用差距
代表了对开放科学实践广泛采用的最重大障碍之一。五年内微小的改进表明,尽管对这一问题的认识有所增加,但学术界奖励结构的系统性改革进展缓慢。-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……对开放实践的强烈支持并不能消除障碍,尤其是在数据共享的认可仍然有限的情况下。图5突出了对数据共享信用归属的持续担忧。当我们在2020年提出这个问题时,77.9%的受访者认为研究人员在共享数据方面获得的信用过
少,而仅有22.1%的人认为信用是充足的。尽管到2025年这一差距已缩小(69.2%对30.7%),但绝大多数研究人员仍认为,数据共享所要求的努力与获得的职业认可之间存在基本不匹配。
我图5对数据共享的信用认知,2020-2025研究人员被问及“您认为目前研究人员因共享数据而获得足够的认可吗?”条形图显示了每年对于“是的,他们获得了足够的认可”以及“他们获得的认可过多”与“不,他们获得的认可过少”的百分比回应。来自六年年度“开放数据状态调查”的纵向数据(N=28,584)。年度样本量:2020年(n=4,945)、2021年(n=4,491)、2022年(n=6,104)、2023年(n=6,091)、2024年(n=3,721)、
2025年(n=3,232)。信用差距:认识与现实的差异69.2%《2025年开放数据报告》14最显著的变化体现在数据处理领域。“积极使用”(已经开始使用或定期使用AI的人)的比例从22.1%上升到31.9%——一年内增长了近10个百分点——这主要
得益于“开始使用”回答的激增(从14.4%上升到21.7%)。与此同时,“不知情”或“知情但不考虑”的群体规模明显收缩(合计减少9个百分点),表明犹豫不决正在迅速减少。人工智能在元数据创建中的应用表现出类似的轨迹。“活跃使用”从16.1%增加到25.1
%(增加9个百分点),同时不熟悉程度明显减少,从15.1%减少到9.7%。这表明研究人员正在从被动认识转向与人工智能在实际描述和文档任务中的应用中进行实际互动。那时看起来试探性的东西在2025年显得截然不同:诸如低意识度和缺乏考虑之类的障碍已经被积极的实验和常规使用所取代。鉴于这个问题相对较新,2025年的结果应被视为从2024年的基线开始的动态变化,而不是长期趋势。人工智能工具的采用随着开放数据实践的演变,我们的调查问题也随之更新。针对对人工智能不断增长的兴趣,我们在2024年增加了一个关于人工智能工具应用的问题。2024202522.1%-
31.9%2024
202516.1%-
25.1%2024
202515.1%-
9.7%
人工智能在元数据创建中的使用增加开始使用或定期使用人工智能减少陌生感《2025年开放数据报告》1516我使用AI工具进行数据收集,2024-20即便是在数据收集中采用人工智能,这种变化通常较为缓慢,也展现出明显的势头。积极使用率从17.2%增加到23.5%
,而“不了解/不知道”的回答比例则降至个位数(从12.0%降至8.2%)。在2024年至2025年之间,人工智能工具从边缘的好奇心转变为研究工作流程的组成部分,数据处理的进步最为显著
,元数据方面取得了显著进展,收集方面也持续取得进展。随着采纳率的增长,确保透明度、可重复性和负责任的
使用至关重要——这些趋势也可能支持与FAIR原则更为一致的实践,特别是在元数据标准化和仓储集成方面。
图6
是的,定期使用它是的,我已经开始使用了不,但我考虑过。
我了解到这些工具,但尚未考虑它
不清楚/不知道元数据创建100%80%60%40%20%20242025数据收集100%80%60%40%20%20242025数据处理100%80%60%40%20%20242025研究人员被问及:“您是否使用Chat
GP
T或类似的人工智能工具进行数据收集、处理或元数据创建?”来自两年度《开放数据状态调查》的纵向数据(N=8386
)。年度样本量:2024年(n=4454),2025年(n=3932)。《2025年开放数据报告》总结基于调查数据的跨主题和影响数据指令的支持差异很大,表明一刀切策略无效;考虑当地研究文化和基础设施的区域方法可能更
有效。STEM领域在FAIR采用方面领先,而人文社会科学领域落后,凸显了学科特定支持和培训的
必要性。对开放科学原则的认识已经增长,但缺乏认可和资源仍然阻碍了实施。仅靠强制命令是不够的——实际
支持是必不可少的。-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……总体而言,进步明显,但结构性障碍和文化壁垒依然存在。下一个十年必须关注激励措施、认可和资源,将意识转化为行动——这些主题将在下一节由我们专家进行探讨。1
知识无支持32数据揭示了关于当前开放科学的三个关键洞察:探索交互式调查仪表板:《2025年开放数据报告》区域差异17专家对开放数据
的看法虽然第一部分探讨了全球趋势和纵向数据,接下来则汇集了研究者和数据专家的观点,展示了政策是如何转化为实践的。他们的见解揭示了数字背后的文化、基础设施和学科细微差别,以及下个十年开放数据可能需要的内容。专家名单及致谢。
可以在以下地方找到《2025年开放数据报告》18指令和政策可以推动变革,但需
要量身定制的支持。根据一些地区对国家指令支持度下降的调查结果(图3),我们的专家一致认为,由于存在实施挑战,指令不能成为鼓励公开数据共享的唯一解决方案。施的兴起至关重要。让我们不要重新发明轮子。非洲PID联盟使用经过验证和测试的现有开放基础设施
——
我们不断
对其进行创新,使其适
应我们的社区。”虽然许多地区在将政策转化为可重复使用的数据集方面面临挑战,但全球南方正在采取积极主动的做法,通过制定适应土著知识和实践的政策。开放科学被视为保护这些传统的机会。张道伟
国家材料腐蚀与防护数据中心副主任,北京科技大学先进材料创新学院教授,中国基础设施与政策同步发展。在中国,张大为指出数据共享平台和标准取得了快速发展:建立了20个国家级科学数据中心(包括他在腐蚀材料领域工作的一个),后来又成立了国家级材料大数据中心,以支持多个行业,为数据标准、AI准备的数据和更智能的研发奠定了基础。这种标准的扩散有助于解释为什么跨学科对FAIR原则的熟悉度有所提高(图2)。OwangoJoy
创立TCC非洲通信培训中心(TCC
Africa)的主任,肯尼亚在过去十年中,我们的专家注意到,资助方的要求和基层倡导共同推动了开放数据的采用,使其成为许多研究人员和机构的常规做法。资助方的要求和期望对于那些非早期采用者的研究人员和机构创造这种增长至关重要。JoyOwango:
“数据管理和研究基础设施一直都很昂贵[...]因此,开放基础设在非洲,当地倡议正在推动可持续数据管理的实际解决方案。《2025年开放数据报告》19开放数据具有长期影响,难以被机构衡量。机构需要展示开放数据的影响和投资回报率,以证明基础设施成本合理,满足资助者的期望,并与绩效
指标如排名和可见度相一致。价值的证据也可以推动文化变革,帮助将开放科学融入研究评估和奖励体
系,同时突出不采取行动的成本,如重复研究和错失机会。20梅丽莎·海德尔
博士,FACMI,莎拉·格雷厄姆·肯安杰出教授——北卡罗来纳大学教堂山分校将政策转化为真正可重复使用的数据集仍然具有挑战性,这涉及到质量、文档等方面(图4)。区域在授权支持方面的差异(图3)表明:基础设施的有效性至关重要
(本地治理的基础设施——而非一刀切解决方案——是必不可少的。尽管开放数据现在已成为学术工作流程的一部分,但这些挑战如果不加以解决,仍将存在。然而,在需要新基础设施的同时,
一个新的挑战也随之而来。尽管得到了支持(见图4),
一些平台仍然托管着结构不佳的数据集,其中标准
对于开放科学实践(定义不统
一)。布赖恩·诺塞克:
真正需要的支持是:研究人员如何让另
一个人像自己一样容易地了解他们的数据?[...]
例如,在学术图书馆员群体中,有巨大的能力来很好地完成这些事情。“梅丽莎·亨德尔:
当美国国家卫生研究院的数据共享政策实施后,我们开始看到的是数据垃圾场。人们正在共享他们的数据
,但并不一定使其可重复使用。
布莱恩·诺塞克联合创始人兼执行主任,开源中心科学,美国弗吉尼亚大学心理学教授:::::)(figshare)-i~IDIGITAL斯普林格自然《2025年开放数据报告》苏妮·吴强调了认识到不同类型影响的重要性,以PATHOS项目为例,该项目衡量学术、社会和经济影响,而非仅仅依靠
…
…
仅仅基于引用指标。衡量这些更广泛的成果是展示开放数据价值以及传达其长期潜力的关键。框架和自我评估工具可以在帮助机构加强其开放科学政策、构建支持性生态系统、评估其进展并与世界最佳实践保持一致方面发挥关键作用。r布莱恩·诺塞克:
基础研究具有非常长的周期。我们是如何到达今天的全球定位系统的呢?在60年前,我
们无法预测到这一点。[...
]我把开放科学放在同样的框架下。这些数据是共享的。某个人明天可能会重新分
析它,我们可能在一周、
一个月、
一
年之内,不管多久,都能从中获得重新分析的价值。但是,其中
一些
可能需要十年才会再次被研究。-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……对开放数据广泛和长期影响的理解对机构、资助者和社会有益,但研究人员也需要在研究评估中体现他们的时间
和努力。21苏·妮·郭
“我强烈建议资助机构和机构仔细研究RISE”
框架和工具。例如,数字典藏中心的框架;研究基础设施自我评估。还有由Open
AIRE开放科学政策创
建的机构研究数据管理框架。
澳大利亚研究数据共享,研究绩效组织清单,他们的研究资金组
织工具,以及联合国教科文组织关于大学实施联合国教科
文组织开放科学建议的清
单和资助者的指南。”
开放数据在数十年内带来益处,使其影响在短期内难以捕捉,尤其是对于专注于即时指标的机构而言。我们的专家强调,其真正价值随着时间的推移而显现,这对当前的评估方法提出了挑战。Hilary
Hanahoe
一
所希望推广开放科学或开放数据的机构,预期会自己进行数据管理、整理和清洗。研究者的生产力会显著降低。无疑,这会带来投资回报,但证明这
一
点很难,而且人们喜欢将其与美元或欧元联系起来。
苏妮·郭
副总监兼开放科学和研究服务负责人新加坡南洋理工大学图书馆团队
希拉里·汉纳霍伊
秘书长,研究数据联盟(RDA)《2025年开放数据报告》那信用差距再次显现:对研究者的认可不足在过去五年中,调查的反馈明确:绝大多数研究人员仍然认为,共享数据的努力与专业认可之间存在根本性的脱节(图5)。关于这一点,我们的专家贡献者
他们与调查受访者意见一致。Joy
Owango:
乔伊斯·奥万戈
研究人员因在顶级期刊发表文章而获得巨大认可和财务激励。大学领导层也需
要为开放科学做同样的事情,因为这同样会帮助早期职业研究人员。这必须从政府开始,因为我可以向你保证,一个机构很难开始给予认可。小或纳米级别的归属概念在罕见病医学研究中尤其有趣,因为这些疾病的实例在地理上分布广泛,数据本体是
从广泛的实践者和与患者合作的研究人员中构建的。22-i~a数字
斯普林格自然
•:'=
科学 露西·卢·王 自然语言处理与健康信息学研究员美国华盛顿大学信息学院助理教授作者身份、引用和影响因子仍然是识别某个研究领域贡献的主要方式,往往忽视了数据集的贡献。认可此类贡献有助于在研究群体中建立社区和信任。研究人员需要将他们创建的FAIR开放数据整合到研究评估系统中以获得认可。实现这一点需要高级领导人理解,尽管开放数据共享需要资源,但它会带来显著的长远利益。露西·路易斯·王
许多数据集工作被视为不如其他研究方面严格,也不如它们贡献大,比如开发新的方法论或新的发现。《2025年开放数据报告》23苏恩·伊戈霍
W
innersget
to
present
their
open
science
practices
at
the
Singapore
Open
Research
Confe
rence.
We
had
a
digital
humanities
award
recipient
who
was
able
to
document
how
he
collected
his
data.
At
every
point
where
the
data
can
be
found,
he
showed
how
to
reuse
that
data,
what
the
steps
he
took
we
re,
what
software
he
used
to
arrive
at
the
derivative
of
that
original
data.我们鼓励我们的研究人员分享他们在开放科学中取得的成果。其中
一
些人展示他们的Git
Hub或数据仓库数量
,
一
些人包括影响叙事。他们可以使用两者的组合来阐述他们对学科带来的增值。梅丽莎·亨德尔:
TheMondoDiseaseOntology
integrates
a
lot
of
different
resources,
especially
for
genetic
and
rare
diseases.
There
are
hundreds
of
people
who
have
contributed,
and
we
track
every
single
contribu
tion
on
our
GitHub
repository.
By
giving
people
the
opportunity
to
be
authors
on
a
paper,
we
can
really
cha
nge
their
incentive
structure.缩小这一信用差距是实现促进更加紧密生态系统研究文化的第一步,在这个生态系统中,由智能工具支持的可查找
、可访问、互操作和可重用数据可以放大每位研究者的工作影响。机构可以通过认可研究人员的努力和分享最佳实践来帮助规范和庆祝开放数据。像新加坡开放研究奖这样的举措展示了正式认可如何推动文化变革。《2025年开放数据报告》利用人工智能和互操作性可以使数据更加可用和高效,但要持续进步,则需要解决更深层次的结构性和文化挑战。24互操作性及人工智能集成将是下一步步骤。另一个挑战在于不仅使开放数据可用,还要实现互操作
性,以便数据集能够无缝协作。如图6所示,
AI工具的
积极使用增加了与2024年相比,显著增加。AI可以促
进数据集的重新格式化,但这取决于明确的、实用的标
准,这些标准能够促进最佳实践而不阻碍数据共享。速
度也是一个考虑因素——研究人员希望在阅读论文时立
即获得数据,而不仅仅是几个月后。r露西·路易斯·王
在许多机器学习会议上,发布代码和数据集之前进行审查的规范相当严格,同时读者可以访问论文。这确实是
一
个很好的转变,因为它触及了仅仅发布数据和真正使其可用的区别。-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……Zhang
Dawei
未来可能会出现能够自动识别数据差异、纠正并改进它们的工具或模型,且人类干预最少
。我认为这将大大有助于互操作性。人工智能也可以在找到并修复防止互操作性尽可能顺利运作的错误中发挥作用。《2025年开放数据报告》rJoyO
汪汪:
我们有
一
些非洲国家实行了数据保护策略。我们需要审视机构内部的数据以及共享和管理
可用工具政策的现状,这样如果进行科研合作,就能非常明确数据将保留在这里。看看Tim的例子,在Mali。当时人们必须为了保护这些文本而战斗,因为它们可以追溯到
一千年以前。我们需要保护我们的本土知识。我们该如何做呢?将其数字化。然后你分配可解的标识符,还要看看各种使
信息公平化的方法。”未来十年,开放数据将如何发展?我们的调查捕捉了过去和当前开放数据共享的状态,但什么是可以推动未来十年有意义进步的策略呢?我们的专家谈到了数据保护、研究安全以及培训的重要性。一个重点领域将是通过数据保护策略来缓解开放性带来的紧张关
系,特别是在与其他地区合作时。梅丽莎·亨德尔:
我们甚至没有回答关于罕见病患者最基本的问题。他们完全在我们的临床护理信息雷达之外
。我们如何将基础研究数据、生活经验和在临床环境中永远不会看到的个性化数据联系起来?研究安全是机构面临的一个越来越重要的问题,需要与开放性谨慎平衡。在已有数据管理计划并考虑伦理和安全问
题的情况下,数据可以更及时地提供。25数据隐私和保护在与个人最敏感数据——他们的健康状况打交道时同样至关重要。《2025年开放数据报告》苏·妮·郭
现在不仅仅是关于公平,大学还在考虑如何使其更加公平,其中E代表道德,
R代表责任。我们正在考虑保护研究,因为国家和大学级别的网络安全要求更加严格。[
...]
保障安全和开放研究的最佳实践。[...]
20
24年,G7制定并支持了
一
组关于研究安全的措施。研究安全是
一
个不断发展的领域,开放科学实践需要以适当方式适应新的研究安全风险。”公平更公平的Hilary
Hanahoe
我代表
一
群相信找到这些解决方案将真正改善世界的人们,因此他们可以回馈
一些东西。公
共利益和社会福祉的目标是如此有益。我建议人们投资于了解局势并确定与他人同步、合作和协作的方式。
.”Hilary
Hanahoe
我认为在未来10年里,我们需要在技能上投资。我们有
一
个真正展示开放数据与人工智能真
实价值的机会。高质量、管理良好的数据对于准确、可重复和稳健的人工智能驱动的洞察至关重要。布莱恩·诺塞克:
开放数据和人工智能可以并肩发展。在广泛多样的数据上对人工智能进行训练,以及
使用人工智能工具的研究者,都能从中获得相互的利益。专家们传递的信息明确:推进开放数据是一项共同责任,需要各方、各地区、各学科和各机构之间的合作。26专业知识可以通过现有培训和资源得到发展,以指导苏妮提到的学术透明度和开放性推广指南。社区,例如Goh。下一步是确保它们得到广泛采用。尽管在管理开放数据方面取得进展令人鼓舞,但最终目标依然明确:研究应推动知识进步并带来社会效益。在借鉴早期观察的基础上,为研究人员和图书馆员提升AI技能也是一个应考虑的机会。《2025年开放数据报告》
改革研究评估,以确保数据共享得到应有的认可
2投资于使共享更加便捷、快速且互操作的人工智能解决方案。从政策导向转向具体解决方案:加强期刊存储库整合,采用通用的元数据和标识符标准,并利用负责任的人工智能支持元数据创建、质量检查和格式标准化。可互操作、适合人类和机器处理的存储库,结合对人工智能使用的明确边界,将提高数据质量,减轻研究人员的负担,并加快跨学科的再利用。建议基于调查洞察和专家访谈,以下列举了三个关键行动,以加速开放数据的进展。为了实现这一目标,数据集需要具有可引用性、被引用性、机器可读性、可发现性和可衡量性。资助机构和学术机构需要调整政策,以奖励研究人员并通过激励数据共享的卓越性——无论是质量还是数量——来推动文化变革。发展符合当地环境、学科规范和数据主权需求的共享基础设施、标准和培训。区域网络和特定领域的治理模式有助于小型机构在同等条件下参与,加强社区治理,并确保开放数据实践具有包容性、可持续性,并与文化、道德和监管期望相一致。3区域性和学科范围内协调,建设符合需求的存储库和支持系统《2025年开放数据报告》27结论十年的国家开放数据调查揭示了一条清晰的轨迹:开放数据已经从愿望变为期待,然而从政策到实践的转变
仍然不完整。对公平性(FAIR)原则的认识和对开放的enthusiasm都有显著增长,但结构性障碍,尤其是
关于认可、资源和专业技术支持方面的障碍,仍在阻碍进展。这些发现强调了成功取决于使开放实践并具有回报性。集成的工作流程、机器可处理的链接和结构化的数据
声明被证实的助力,而区域网络和当地管理的基础设施显示了如何将全球原则转化为现实世界的影響。人工智能等新兴技术如果负责任和透明地部署,将提供改善质量和互操作性的强大机遇。展望未来,挑战不在于说服研究人员开放数据的价值——而在于确保共享和再利用得到支持、激励并融入
日常研究文化中。下个十年必须专注于将这些原则付诸实践,确保开放性不是额外的负担,而是研究和社会的默认、高效且最
有益的道路。28《2025年开放数据报告》致谢感谢过去10年里参与这份调查的所有研究人员以及《数据开放现状报告》的所有贡献者。编辑■Melissa
Lapine产品市场营销经理数字科学审稿人 格雷厄姆·史密斯施普林格·自然 爱德华·杰斯特纳施普林格·自然
HannahTippett
Simpson施普林格·自然
大卫·埃利斯数字科学作者
马克·哈尼尔副总裁,开放研究数字科学
■MeganToogood资深高级顾问马维尔克出版咨询■保尔·贾维斯高级研究分析师施普林格·自然■克里斯蒂娜·埃默里SpringerNature思想领导力项目主管布莱恩·诺塞克
联合创始人兼开放科学中心执行董事,美国弗吉尼亚大学心理学教授张道伟
国家材料腐蚀与防护数据中心副主任,北京科技大学先进材料创新学院教授,中国
希拉里·汉纳霍伊
秘书长的研究数据联盟(RDA)创立TCC非洲通信培训中心(TCC
Africa)的主任,肯尼亚露西·卢·王
自然语言处理与健康信息学研究人员,美国华盛顿大学信息学院助理教授
梅丽莎·海德尔
博士,
FACMI,莎拉·格雷厄姆·肯南尊敬的教授-北卡罗来纳大学教堂山分校苏妮·哥*-i~IDIGITAL
斯普林格自然:
{::}f1gshare
……受访者我们想感谢以下专家慷慨分享他们宝贵的时间和见解,为这份报告做出贡献。新加坡南洋理工大学图书馆开放科学和研究中心副总监兼负责人苏慧敏的观点是个人观点,不代表南洋理工大学图书馆的立场。《2025年开放数据报告》Owango
Joy29附录
一关于开放数据的现状与2025
调查自10年前启动以来,开放数据调查已经从212个国家和地区的43,000多名研究人员那里收集了见解,使其成为该领域持续时间最长的纵向研究。随着开放数据从理论转向实践,我们在收集、分析和呈现研究结果的方法也随之发展。2023年,我们推出了一份补充报告《从理论到实践》,通过一系列来自不同研究团队成员的实际情况和观点,扩展了我们多年调查的定量结果。202
4年,我们开发了一种新的数据分析类型,以帮助我们更好地理解数据共享中政策与实践之间的差距。我们的关注点既
到
了扩展又变得更加敏锐:在绘制全球模式的同时,融入区域专家的评论,以更好地理解不同情境下的差异和细微差。别得调查报告已被合计观看354,000次,来自170多个国家的下载量达44,000次,并在100多部学术作品中被引用。这些报告被世界卫生组织、欧盟、经济合作与发展组织、澳大利亚科学院等机构的影响力政策文件所引用。该系列还获得了诸如媒体机构的重要报道。科学,Tim
es高等教育
并且InsideHigherEd
除了读者和引用之外,《开放数据报告》还促进了与研究数据社区的直接互动——通过主题演讲、专题讨论会和论坛。这些活动突显了报告作为可信资源和全球开放数据对话催化剂的双重作用。《2025年开放数据报告》30并且之前的报告。在过去十年中,该调查一直保持一致的核心问题集以支持纵向分析,同时不断演变,包括如人工
智能等主题性补充。2025年受访人群细分招聘渠道包括电子邮件、社交媒体和网站拦截,并采取了欺诈预防措施。受访者来自不同地区(亚洲49.7%,北美17.5
%,欧洲15.8%,非洲9.7%,南美洲4.7%,大洋洲及太平洋2.5%)和所属机构(62.0%大学,10.9%研究机构,6.5%医学院,6.1%医院,5.9%私营公司),政府/地方政府3.4%,其他5.1%。早期职业生涯的研究者占44.0%,这一比例近年访问调查数据和仪表盘
调查问题和2025年的数据可在Figshare上获取:https:///10.6084/m9.figshare.307631902025年的调查从2025年4月28日开始,至2025年7月15日结束,共收到来自151个国家的4,774名合格受访者
。调查提供五种语言(英语、简体中文、日语、法语和德语),并包括定量和定性问题,探讨在本报告中讨论的关键主题。亚洲北美欧洲非洲南美洲澳大拉西亚和太平洋1515国家
语言2025调查方法与人口统计学
通过交互式仪表板探索趋势:
https://大学研究机构医学院校医院私人公司文A4,774合格的受访者来一直在上升。《2025年开放数据报告》31附录2关于数字科学、施普林格自然
和Figshare的开放数据合作伙伴Digital
Science、Springer
Nature和Figshare已经合作了一段时间,共同探讨、解决并实施对开放研究实践采纳和意识产生直接影响的变化。在这大部分领域,长期以来的《开放数据报告》发挥了开创性和领导性的作用,为每个合作伙伴以及更广泛的社区提供了共同的理解,使他们能更好地在鼓励、促进和支持开放数据共享方面取得实质性的改进。这些努力正帮助研究人员遵守数据共享规定,并促进一个更加开放和可重复的研究生态系统的形成。32《2025年开放数据报告》它还引入了四项数字科学开放原则,以指导如何倡导并鼓励在整个研究生态系统中进行数据 共享:
1.社区所有权2.参与开放基础设施3.利益相关者优先4.
建立信任为了实现大规模采用,数字科学公司与威康基金会、凯勒奥斯汀基金会等合作,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建医科大学孟超肝胆医院(福建医科大学吴孟超纪念医院)自主招聘26人考试备考试题及答案解析
- 2025年县乡教师选调考试《教育学》综合提升试卷含答案详解(预热题)
- 2026年县乡教师选调考试《教育学》真题附答案详解
- 2026年县乡教师选调考试《教育学》通关试题库及答案详解(基础+提升)
- 2026威高集团有限公司博士后科研工作站招聘考试参考试题及答案解析
- 2026浙江省自然资源厅部分所属事业单位招聘高层次人才(博士)5人笔试备考题库及答案解析
- 2025年注册岩土工程师之《岩土基础知识》通关提分题库附答案详解(精练)
- 电气制图与CAD 教案 模块五 装配图的识读
- 2026年县乡教师选调考试《教育学》练习题库含答案详解(考试直接用)
- 2026中国国际海运集装箱(集团)股份有限公司校园招聘(福建漳州有岗)考试备考题库及答案解析
- 热处理电阻炉设计
- 毕业设计(论文)-龙门式建筑3D打印装置设计
- 青岛版(六三制)小学科学四年级下册20课《导体和绝缘体》课件
- 3.2 小数点搬家 课件 北师大版数学四年级下册
- 股骨干骨折护理个案
- 无创辅助呼吸护理要点
- GB/T 6433-2025饲料中粗脂肪的测定
- 施工现场环境保护责任清单
- DL∕T 5342-2018 110kV~750kV架空输电线路铁塔组立施工工艺导则
- DZ∕T 0291-2015 饰面石材矿产地质勘查规范
- 《乙烯基聚乙二醇醚(VPEG)、乙烯氧基丁基聚乙二醇醚(VBPEG)》
评论
0/150
提交评论