- A+
王翠萍 王佳佳 (东北师范大学计算机科学与信息技术学院 )
摘要:文章主要利用网络调查法和对比分析法,从资源收录量、检索功能、服务模式、软件应用情况等方面对re3data.org、OAD、OpenAIRE、OpenDOAR 和ROAR 5 个科研数据知识库注册目录系统进行调研,分析了科研数据知识库目录系统的发展现状。研究发现,科研数据知识库呈现快速上升的趋势;re3data.org、OAD、OpenAIRE、OpenDOAR 和ROAR 这5 个系统各有特色;美国、德国、英国、欧盟等国家在建设科研数据知识库注册目录系统方面进展较快,已形成一定的规模。
关键词: 科研数据 数据知识库 目录注册系统
1、引言
随着e-science、信息开放存取运动的迅速发展,数据已成为信息化时代的重要战略资源。微软研究院出版的《第四范式:数据密集型科学的发现》中提出科学研究结构的“第四范式”,即以大数据为基础的数据密集型科学研究[1]。越来越多的科研人员关注科研数据的共享和再利用。早在2003 年《柏林宣言》已经将科研数据归为学术知识中重要组成部分[2]。2007 年,经济合作与发展组织在《公共资金科研数据获取的原则与指南》中提出“指南的目的是促进研究人员之间的数据访问和共享”[3]。2012 年英国皇家学会在《科学是开放事业》报告中提出科学家应该将数据存储在知识库中以便使用和验证数据[4]。欧盟委员会在2013 年发布的《关于获取和保存科学信息的建议》中提出公共资金资助的科研项目数据要实现公共获取和利用[5]。同年,欧盟第8 次地平线2020 框架[6]、美国科技政策办公室[7]也提出类似的文件。同时,越来越多的大学、科研院所以及出版机构开始建立科研数据知识库(Research Data Repositories,RDR),促进数据的长期保存和再利用。数据管理成为科研中的重要组成部分,科研数据知识库已经成为科学数据管理的有效途径之一。随着各类科研数据知识库的增长,发现、检索和使用知识库的难度也随之增大。为了更加有效的查找和利用知识库,科研数据知识库的注册目录系统应运而生。笔者选取了全球范围内应用最广泛、较知名的5 个注册目录系统re3data.org[8]、OAD[9]、OpenAIRE[10]、OpenDOAR[11] 和ROAR[12]进行了调研和分析,以期为科研人员提供科研 数据知识库的检索途径,同时为我国建设科研数据知识库注册目录系统提供经验和参考。
2、科研数据知识库注册目录系统发展概况
需要指出的是,科研数据(Research Data)指科研过程中的一部分或者科研结果的数字数据。此过程覆盖从科研数据生成到科研结果产出的所有阶段,包括科学、社会科学实证研究或文化现象观察等[13]。目前,各 学科已经出现了大量的科研数据知识库,其中包括生物、医学以及农学等学科。国际范围内应用较广泛的知识库如 figshare[14]、Dyrad[15]、Zenodo[16] 等均收录在re3data.org、ROAR、OpenDOAR 等系统中。
2.1 re3data.org
由于学科领域要求及各数据知识库结构的不同, 研究人员、资助机构、出版商及学术机构选择适当知识库的难度增大。为了解决此问题,柏林洪堡大学图书馆与信息科学学院(School of Library and Information Science at Humboldt University Berlin)、德国 GFZ 地球科学研究中心-图书馆和信息服务中心(GFZ German Research Centre for Geosciences -Library and Informa⁃ tion Services),以及卡尔斯鲁厄理工学院的图书馆(Li⁃ brary of the Karlsruhe Institute of Technology,KIT)合作组成 re3data.org(Registry of Research Data Repositories),并于2013 年5 月正式启动[17]。截至2017 年3 月,re3data.org 收录的研究数据知识库达到1823 个,已成为最全面的在线研究数据知识库注册目录系统之一。re3data.org 平均每周增加10 个新的存储库,每月有超过5000 个独立访问者浏览re3data.org[18]。
2.2 Open Access Directory
Open Access Directory 是2008 年4 月30 日由美国西蒙斯学院图书馆和信息科学学院(SLIS)主办的开放存取目录(Open Access Directory,OAD),是目前最为活跃的数据知识库注册目录系统之一。OAD 是一个通过Wiki 形式提供开放数据知识库列表的系统,用户可以创建和浏览数据知识库的简单事实列表。OAD 的目标是在编辑委员会的适当干预下,使OAD 的开放存取列表进一步扩大。由于有维基百科等详细叙述的Wiki 和开放存取期刊目录(DOAJ)等大型数据库的存在,OAD列表去掉了数据库功能,只进行简短事实的陈述。OAD 提供了OA 期刊、OA 课程、OA 科研数据知识库等在内的56 个开放存取相关列表。
2.3 OpenAIRE
欧洲开放存取基础设施研究项目(Open Access In⁃ frastructure Research for Europe,OpenAIRE)是 2009 年12 月立项的为期三年期的项目,是由欧盟第7 框架计划(Seventh Framework Programme,简称 FP7) [19] 和欧洲研究委员会资助的研究数据基础架构。目前,OpenAIRE 得到欧盟范围内59 个合作方的积极响应和参与。OpenAIRE 有欧洲委员会、美国国家科学基金会和英国维康信托基金会在内的6 个资助机构,开放存取期刊目录、欧洲医学中心和于韦斯屈莱大学在内的100 个数据提供者的近36 万个研究项目[20]。
2.4 The Directory of Open Access Repositories
开放存取知识库名录(The Directory of Open Ac⁃ cess Repositories,OpenDOAR)是 2005 年 2 月创建的。由英国诺丁汉大学(University of Nottingham)和瑞典隆德大学(University of Lund)在开放社会研究所(Open Society Institute,OSI)、英国联合信息系统委员会(Joint Information Systems Committee,JISC)、英国研究图书馆 (Research Libraries UK,RLUK)、欧洲学术出版与学术资源联盟(Scholarly Publishing and Academic Resources Coalition Europe,SPARCEurope)等机构的资助下创建的学术开放存取仓储检索系统[21]。OpenDOAR 是目前提供开放存取信息知识库列表最全面最权威的系统之一。由图1 可知,从2005 年~2016 年OpenDOAR 数据库注册数量呈上升趋势,截至2017 年3 月OpenDOAR 收录的数据库已经达到3334 个。
2.5 Registry of Open Access Repositories
开放存取注册表(Registry of Open Access Repositories,ROAR)是由南安普敦大学(University of Southampton)的EPrints 在2003 年创建的[22]。截至2017 年3月,ROAR 的注册数据知识库已经达到4367 个,根据ROAR 网站所提供的数据可绘制其增长态势图(下页图2)。此外,ROAR 的子系统ROARMAP( Registry of Open Access Repositories Mandatory Archiving Policies, 即开放存取知识库强制归档政策)是由南安普敦大学电子与计算机科学学院开发的信息可视化软件,是用来存储大学、研究机构和科研资助者在开放存取方面的相关政策。
图1 OpenDOAR 增长态势
图2 ROAR 增长趋势图
3、科研数据知识库注册目录系统调查分析
由于数据知识库注册目录系统的侧重点不同,为深入了解科研数据知识库注册目录系统,笔者从其收录范围、数据检索、服务模式等方面进行了调研。
3.1 资源的收录量与开放存取情况
资源收录量是科研数据知识库注册目录系统容量的重要反映,收录量的大小也在一定程度上体现了系统的建设质量。re3data.org 系统注册的知识库均属于科研数据知识库,re3data.org 将研究数据知识库的内容分为15 类,其中科学和统计数据格式的数据知识库为1110 个、标准办公文件1037 个,纯文本882 个,具体如表1 所示。
表1 re3data.org 对数据知识库的分类及注册数目
文本类型 | 数目 | 文本类型 | 数目 |
科学和统计数据格式 | 1143 | 视听数据 | 338 |
标准办公文件 | 1081 | 软件应用程序 | 324 |
纯文本 | 903 | 数据库 | 307 |
图片 | 890 | 网络数据 | 111 |
原始数据 | 798 | 源代码 | 80 |
结构化图形 | 696 | 配置数据 | 42 |
结构化文本 | 584 | 其他 | 662 |
存档数据 | 421 |
注:数据截止到2017 年3 月。
OAD 的数据知识库注册数量为321,分为数据知识库(Data repositories)和学科知识库(Disciplinary repositories)两类。OpenDOAR 和ROAR 中收录最多的均为机构知识库。在数据知识库方面,OpenDOAR 共收录了177 个数据集、52 类应用软件、529 个数据参考库。ROAR 收录了60 个数据集、30 个科研数据库、26 个开放的关联数据。截至 2017 年 3 月,OpenAIRE的科研数据已经收录了27506 个数据集、17122 个收藏物、587 个软件应用、125 个视听资料,其收录的范围较广泛。创建数据知识库注册目录系统的主要目的是为了满足用户的信息需求,根据知识库的开放程度,OpenDOAR 将知识库分为4 种形态:全功能可操作性知识库、试验型知识库、技术故障型数据库和封闭型知识库。
re3data.org 则分为开放型、限制型、封闭型和禁用型4种类型。由表2 可知,在科研数据知识库领域,知识库的开放程度高达94.8%。
表2 re3data.org 和OpenDOAR 中知识库的开放程度
re3data.org | 数量 | 比例 | OpenDOAR | 数量 | 比例 |
开放型知识库 | 1541 | 57% | 全功能可操作性知识库 | 3162 | 94.8% |
限制型知识库 | 873 | 32% | 试验型知识库 | 86 | 2.6% |
封闭型知识库 | 140 | 5% | 技术故障型数据库 | 66 | 2% |
禁用型知识库 | 166 | 6% | 封闭型知识库 | 20 | 0.6% |
注:数据截止到2017 年3 月。
3.2 检索功能分析
科研数据知识库注册目录系统的基本功能是将所收录的知识库尽可能地呈现给使用者,因此其检索功能较为重要。每一个科研数据知识库注册目录系统都具备了浏览功能和基本检索功能,但每一个数据知识库注册目录系统的检索功能不尽相同。
由表 3 可知,re3data.org 提供的检索方式最多。re3data.org 的基本检索共有27 种过滤方式,例如年代、关键词、数据开放程度等。同时re3data.org 支持标签查询和布尔逻辑运算,进一步提高了检索效率。OAD 不提供检索,只提供数据知识库的基本浏览,但OAD 与哈佛大学合作的开放存取跟踪项目(Open Access Track⁃ ing Project,OATP)中的tagteam[24]网站提供数据检索。该网站支持标签检索,其每一个标签前缀均为“oa.”,例 如“oa.medicine、oa.repositories.data”等。OpenAIRE 的检索方式与其它注册目录系统基本一致,提供3 种基本检索,即基本信息检索、数据提供者检索和出版数据项目检索。
OpenDOAR 和ROAR 有许多相似之处。OpenDO⁃AR 和ROAR 检索方式均有基本检索、内容检索和交叉查询。OpenDOAR 提供了知识库所在地区、知识库机构所在国家等16 类数据统计,更加直观地反映了知识库的分布情况。OpenDOAR 可以按主题领域、内容类别、知识库类型、国家、语种、软件6 种途径交叉查询,同时在每种查询类别的下拉框中都标明其数量。同时OpenDOAR 与ROAR、DOAJ 等大型知识库相关联,构成了当前开放存取学术信息资源检索的主要平台[25]。
表3 数据知识库注册目录系统检索功能比较
目录系统检索方式 | re3data.org | OAD | OpenAIRE | OpenDOAR | ROAR |
检索方式 | 基本检索标签查询支持布尔逻辑运算支持图像检索 | 不提供检索与OATP 合作的Tagteam 网站支持标签检索 | 基本检索 | 基本检索内容检索交叉查询 | 基本检索高级检索内容检索交叉查询 |
浏览方式 | 国家浏览学科浏览文本类型浏览 | 学科浏览 | 基本信息浏览 | 国家浏览学科浏览 | 国家浏览年份浏览知识库类型浏览知识库软件浏览 |
过滤方式 | 学科、关键词、文本类型、国家、数据开放程度等 | 无 | 出版物、研究数据、项目组织、语种、开放类别等 | 主题领域、内容类别、知识库类型、国家、语种、软件类别 | 国家、年份、知识库类型、知识库软件 |
标签查询 | 有 | 有 | 无 | 无 | 无 |
OpenDOAR 和ROAR 提供科研数据知识库ID,其记录的格式分别为http://opendoar.org/id/***/和http://roar.org/id/***,通过其特定的ID 可以链接到特定的科研数据知识库。ROAR 检索界面相对简单,用户可以通过ROAR ID、知识库类型、软件等限定进行高级检索,检索结果可以通过相关度、时间、活跃程度来排序。
在浏览方面,re3data.org、OpenDOAR 和OAD 都有学科浏览和国家浏览。其中,re3data.org 的学科和国家浏览不仅支持文本浏览,还支持图像浏览,即知识地图。在学科知识地图中,用户可以通过点击选择学科来过滤搜索范围,从而选择特定的学科数据知识库。re3data.org 的国家知识地图可以清楚地显示国家名称、地理位置及注册的知识库数目。
3.3 服务模式分析
科研数据知识库注册目录系统提供的服务主要以FAQ 服务和邮件咨询为主。各系统均提供科研数据知识库的名称、所属学科、简短描述、科研数据知识库的URL、注册时间、知识库类型等基本信息。re3data.org 还提供表单服务;OAD、OpenDOAR 和ROAR 提供的服务主要围绕开放存取信息;OpenDOAR 和ROAR 可以利用简便的工具为特定的用户群提供符合要求的检索服务,例如提供RSS 和Atom 服务;OpenDOAR 可以为搜索引擎等第三方服务使用;OpenDOAR 会定期标注科研数据知识库的更新,提供知识库的最新收录;ROAR 提供知识库信息增长趋势的图表。
作为欧盟开放存取的基础设施,OpenAIRE 为研究者[26]、数据提供者[27]、科研管理者[28]和资助机构[29]提供不 同程度的基础设施和服务。它为研究者提供了一系列的文件(作者指南、版权问题、OA in FP7for publications 等;为数据管理员提供数据政策;为资助机构提供开放数据政策等。
数据提供者将数据提供给 OpenAIRE 后,OpenAIRE将数据存储在其构建的知识库中,OpenAIRE 可以丰富数据内容、分析数据,让数据提供者了解其数据的影响力。研究管理员可以统计OpenAIRE 的数据(包括OpenAIRE 的项目、相关出版物、数据集等)、分析数据趋势、查看项目进度和研究报告。此外OpenAIRE 可以帮助研究管理员了解其所在机构项目数据的输出进程、资助进程,以及其数据与其他基础设施或研究实体的关联进程等。根据“出版物-数据-资金-研究人员- 资助机构-数据源”[30],OpenAIRE 通过对数据清洗、转换、解疑等确定数据之间的关系。OpenAIRE 通过数据挖掘等算法研究数据,为资助机构提供分析和预测服务。7×24 小时开放门户(OpenAIRE Portal)提供研究成果记录的开放存取[31]。OpenAIRE 不仅提供资源指南、研讨会、培训等服务,同时还提供开放存取的NOADs 咨询台(33 National Open Access Desks,NOADs),用户可以通过NOADs 咨询台来咨询OA 专家,在48 小时内便可得到回复。OpenAIRE 的服务已经被成功应用在FP7 部分的评估里。
3.4 注册目录系统的管理
3.4.1 数据规范与政策分析
数据规范与政策是数据知识库发展至关重要的基础,是知识库有序管理的制度保障和行为规范。科研数据知识库的数据来源包括多种形式,在注册目录系统中需要明确清晰地说明数据来源。为更好地管理知识库的注册信息,OpenDOAR 和ROAR 采用ID 规范标识,同时引用数据知识库也有相应的规范。此外,OpenDOAR 提供元数据标准,主要用于元数据的重用、数据知识库内容的提交以及数据政策的保存。
re3data.org列出了一系列元数据标准(如下页表4), 例如联邦地理数据委员会的数字地理空间元数据内容标准(Federal Geographic Data Committee Content Stan⁃ dard for Digital Geospatial Metadata,FGDC/CSDGM)、数据文件倡议(Documentation Initiative,DDI)等。其中,使用较多的是都柏林核心元数据(Dublin Core,DC),如Dyrad、data.bris Research Data Repository 等知识库均在使用DC 元数据。
表4 re3data.org 元数据列表及其应用数目
re3data.org元数据列表 | 应用数目 |
都柏林核心元数据(DC) | 102 |
数据文件倡议(DDI) | 65 |
联邦地理数据委员会的数字地理空间元数据内容标准(FGDC/CSDGM) | 46 |
DataCite元数据架构(DataCite Metadata Schema) | 29 |
RDF数据立方体词汇(RDF Data Cube Vocabulary) | 18 |
目录交换格式(Directory Interchange Format,DIF) | 16 |
re3data.org遵循DataCite元数据引用规范,在 re3data.org注册的数据知识库目录中都有“DataCiteCitethis”的标识,而且较多数据知识库也采用DataCite 的引用格式,如figshare、Zenodo知识库等。由于长期 跟踪链接和数据传播再利用的需要,数据知识库注册 目录系统通过转换数据格式,保证数据内容的更新频 率和提交效率。数据知识库注册目录系统可以查询知 识库的开放权限。由于考虑到各方利益关系人的权 益,知识库有一定的时滞期,例如Dryad的时滞期为1~ 10年。在知识库的开放存取时期内,知识库内容允许 被第三方复制和索引,例如ROAR开发的repository66 软件[32]可以在谷歌地图中检索知识库。
2001年1月,开放文档计划(Open Archives Initiative,OAI)推出的元数据收割协议OAI-PMH(Protocol for Metadata Harvesting Specification)解决了分布式异 构数据库之间的互操作和跨库检索问题,使得知识库 的标准规范化取得新的突破[33]。在re3data.org、Ope⁃ nAIRE、ROAR等注册的知识库均遵循OAI-PMH协议。
3.4.2 科研数据知识库注册机制
为保证科研数据的质量,数据知识库注册目录系统会对注册者进行若干审查。在OAD 系统中,注册成功的用户可以修改其中的数据,所以OAD 的注册机制相对严格,注册者不仅需要提供个人信息,还需要提交个人简历。ROAR、OpenAIRE 也需要注册,而re3data.org 和 OpenDOAR 不需要注册。用户可以直接建议re3data.org 收录科研数据知识库,用户需要提供数据知识库的名称、所属机构、URL、研究语言和简短描述等15 个条目。然而不是每一个推荐的数据知识库都可以被收录,用户建议的数据知识库需要通过“审查—索引— 复查—发布”才可以被检索。
同时,re3data.org 为方便用户检索,制定了图标符号体系,其图标元素主要包括一般信息、质量标准、技术标准、法律议题、政策与法律议题5个方面。一般信 息主要包括科研数据知识库的名称、URL、简短描述、 关键词等,其中学科类型、文本类型和关键词并不局限 于一个,采用标签形式; re3data.org还可以查询知识库 的机构信息、引用知识库的记录以及编辑知识库的状 态。数据标准和政策主要包括科研数据知识库的开放 状态、数据是否有限制及其限制的类别、有关政策的政 策名称以及其政策的URL,同时包括数据访问许可、 数 据知识库注册时间、知识库更新的最新时间。如果科 研数据知识库采用了元数据方案,注册者需要揭示元 数据的名称、元数据URL等。re3data.org提供了有关研 究数据知识库的详细信息,其独特的图标让研究人员 更加容易地访问相关知识库。同时,资助者和研究机 构等都推荐使用注册目录系统,例如欧洲委员会在多 个文件中都推荐使用re3data.org。《开放存取科学出版 物指南》 [34](Guidelines on Open Access to Scientific Publi⁃ cations and Research Data in Horizon 2020)中提到开放 的研究数据首选存储在re3data.org中。德国的比勒费 尔德大学(Bielefeld’sUniversity)的ResolutiononRe⁃ searchDataManagement[35]建议将科研数据存储在比勒 费尔德大学出版社的机构知识库中,同时在re3data.org 注册。欧盟委员会在地平线计划[36](H2020Pro⁃ gramme)中研究数据开放部分也建议使用re3data.org。 在《电子基础设施:使欧洲成为研究和创新的最佳地 点》 [37]的宣传册中以实例的形式标明可以使用re3data. org或者OpenAIRE来选择合适的科研数据知识库。
3.5 科研数据知识库软件应用情况
系统软件是数据知识库运行的基础,是推动数据知识库建设的技术保障。根据OpenDOAR 等网站的统计,目前数据知识库所应用的软件种类已达160 多种, 其中DSpace、E-prints、Bepress、Fedora 等是比较常用的开放存取知识库软件。表5 分别是OpenDOAR、re3data.org、ROAR 对数据知识库创建软件使用情况的统计。从表中可知,数据知识库的软件种类较为丰富,既应用了开源型的软件,又自主研发了各种创新性的软件。全球大多数科研数据知识库普遍应用开源型软件Dspace, 占总数的近40%。Dspace软件是2002年10月由美国麻省理工大学图书馆和美国惠普实验室合作开发的遵循BSD 协议、用于创建学术和发布数字内容的开放存取知识库开放源码库软件包[38]。它服务于大学、学院以及 研究中心,可实现资源最大程度的开放存取,提高管理效率,Dspace 软件在全球范围内都有较好的发展。
表5 re3data.org、ROAR、OpenDOAR 软件使用情况
软件名称目录系统数 量 | re3data.org | ROAR | OpenDOAR |
DSpace | 46 | 1707 | 1485 |
EPrints | 20 | 611 | 452 |
OPUS | - | 87 | 80 |
Fedora | 28 | 66 | - |
DataVerse | 40 | - | 2 |
CKAN | 30 | - | - |
MySQL | 31 | - | - |
Bepress | - | 414 | - |
Digital Commons | - | - | 161 |
unknown | 962 | 540 | 274 |
注:数据截止到2017 年3 月。
4 结语
作为科研数据存取的重要途径,科研数据知识库以及科研数据知识库目录注册系统表现出了强大的生命力,在全球范围内迅速发展。科研数据起源于21 世纪初,10 年多来,科研数据知识库受到了广泛的关注,呈现出快速上升的局面。在未来一段时间内,随着科研数据知识库的增长,科研数据知识库注册目录系统也将越来越丰富。科研数据知识库注册目录系统多数是由大学、大学图书馆或公共图书馆合作创建的,同时大部分得到了多所科研机构的资助。
这5个科研数据知识库注册目录系统有各自的优势与特点。在资源收录方面,各系统收录知识库的侧重点不同,如OpenDOAR 和ROAR 收录最多的是机构知识库,同时在系统中注册的知识库大部分为开放型知识库。数据知识库收录的种类较多,但各知识库及知识库注册目录系统对科研数据的划分方式不尽相同,OpenAIRE 将数据知识库分为数据集、科研数据、数据知识库等;re3data.org 将知识库划分为机构科研数据知识库、学科科研数据知识库、跨学科科研数据知识库和项目科研数据知识库4 类[39]。由于对科研数据概念的界定尚未统一、划分方式多样,增大了科研数据知识库注册目录系统收录知识库的困难。
在发展概况方面,ROAR 的成立时间最早,检索界面简单友好,OAD 系统简洁明了,ROAR 和OpenDOAR系统的功能最为相似。re3data.org 和OpenAIRE 的检索方式最多,从知识库的各个角度进行揭示。re3data.org 是最“年轻”的科研数据知识库注册目录系统,但其增长速度较快。re3data.org 采用了图标符号体系,在数据的上传、访问、许可等方面均进行了相关的分类,为以后科研数据知识库注册目录的发展提供了一定的借鉴。
由于用户信息需求的个性化和多样化,标签检索是在Web2.0 时代背景下出现的一种新的检索方式。检索系统在检索功能完备的同时,re3data.org 和Tag⁃team 采用了标签检索,同时越来越多的检索系统采用标签检索。在服务模式方面,OpenAIRE 具有独特性,提供OA 专家。随着科研数据的发展,注册目录系统制定了相应的数据规范政策和数据注册机制。元数据标准是科研数据知识库常用的数据规范之一,常用的元数据标准有都柏林核心元数据、数据文件倡议等。同时数据的引用也有相应的规范,DataCite 元数据引用规范是科研数据知识库常用的数据引用规范之一。由于各个注册目录系统对科研数据知识库描述的侧重点不同,注册目录系统对知识库的注册形式也各不相同。
目前广泛使用的系统软件是DSpace、EPrints、DataVerse、Bepress 等软件。现有的系统软件基本功能差别较小,主要是在细节方面有所不同。对科研数据知识库建设者而言,可以选择DSpace,也可根据自身情况选择其他系统软件。同时英语是目前知识库使用最广泛的语言,几乎涉及所有的学科领域。
笔者对 re3data.org、OAD、OpenAIRE、OpenDOAR 和ROAR 这5 个系统深入描述,可以协助科研人员快速选择适合的科研数据的知识库。在建设科研数据知识库方面,美国、德国、英国、欧盟等国家领先于其他国家。以re3data.org 为例,美国注册的科研数据知识库高达 844 个、德国为 261 个、英国为 238 个,而中国在re3data.org 中注册的科研数据知识仅有25 个。截至目前,我国尚未形成科研数据知识库目录注册系统。我国在科研数据知识库以及注册目录系统的建设过程中,要积极学习国外的先进经验,采取符合我国国情的措施和方法,建立合适的科研数据知识库注册目录系统,来发挥科研数据知识库的作用。
参考文献
- [ 1 ] 孙鸿烈, 刘 闯. 国际科学技术数据前沿领域发展研究[J]. 中国基础科学, 2003, 18(1):329-333.
- [ 2 ] Redalyc L, Clase R, In S. Berlin declaration on open access to knowledge in the sciences and humanities[J]. Negotium, 2008, 4(10):89-91.
- [ 3 ] Pilat D, Fukasaku Y. OECD principles and guidelines for ac⁃ cess to research data from public funding[J]. Data Science Journal, 2007, 6:4-11.
- [ 4 ] Boulton G, Campbell P, Collins B, et al. Science as an open en⁃ terprise[EB/OL].[2012-12-02].http://wbc-inco.net/object/doc ument/10795/attach/Science_as_an_open_enterprise.pdf.
- [ 5 ] European Commission Recommendation on Access to and Pres⁃ ervation of Scientific Information[EB/OL].[2013-05-16].http:// ec.europa.eu/research/science-society/document_library/pdf
- _06/recommendation-access-and-preservation-scientific-in formation_en.pdf.
- [ 6 ] Communication from the Commission to the European Parlia⁃ ment,the European Economic and Social Committee and the Committee of the Regions[EB/OL].[2013-05-16].http://ec.eu ropa.eu/research/science-society/document_library/pdf_06/ era-communication-towards-better-access-to-scientific-in formation_en.pdf.
- [ 7 ] Office of Science and Technology Policy Increasing Access to the Results of Federally Funded Scientific Research[EB/OL]. [2013-05-16].http://www.whitehouse.gov/sites/default/files/mi crosites/ostp/ostp_public_access_memo_2013.pdf.
- [ 8 ] Registry of Research Data Repositories[EB/OL].[2017-03-11]. http://www.re3data.org/.
- [ 9 ] Open Access Directory[EB/OL].[2017-03-29].http://oad.sim mons.edu/oadWiki/Main_Page.
- [ 10 ] Open Access Infrastructure Research for Europe [EB/OL]. [2017-03-11].https://www.openaire.eu/.
- [ 11 ] The Directory of Open Access Repositories[EB/OL].[2017-03- 11].http://www.opendoar.org/.
- [ 12 ] Registry of Open Access Repositories[EB/OL].[2017- 03- 11]. http://roar.eprints.org/.
- [ 13 ] 顾立平(译). 呈现科研数据知识库:re3data.org注册机制[J]. 现代图书情报技术, 2014, 30(3):26-34.
- [ 14] Figshare[EB/OL].[2016-12-19].https://figshare.com.
- [ 15 ] Datadryad[EB/OL].[2016-12-19].http://datadryad.org/.
- [ 16 ] Zenodo[EB/OL].[2016-12-19].https://www.zenodo.org/.
- [ 17 ] Registry of Research Data Repositories launched- re3data.org [EB/OL].[2013-06-04].http://sparceurope.org/registry-of-re search-data-repositories-launched-re3data-org/.
- [ 18 ] Merger of Databib and org, First Version of API Available [EB/OL].[2015-03-09].http://www.re3data.org/2015/03/merg er-and-first-version-of-api/.
- [ 18 ] Seventh Framework Programme (FP7) [EB/OL].[2016- 12- 19]. http://www.efta.int/eea/eu-programmes/fp7.
- [ 19 ] OpenAIRE[EB/OL].[2013-12-19].https://www.openaire.eu/.
- [ 20 ] About OpenDOAR[EB/OL].[2016-12-19].http://www.opendo org/about.html.
- [ 21 ] Brody T, Carr L, Hey J M N, et PRONOM- ROAR: adding format profiles to a repository registry to inform rreservation services[J]. The International Journal of Digital Curation,2007, 2(2):3-19.
- [ 22 ] ROARMAP[EB/OL].[2016-08-26].http://roarmap.eprints.org/.
- [ 23 ] Tagteam[EB/OL].[2016-12-26].http://tagteam.harvard.edu/ hubs/oatp/tag/oa.repositories.data.
- [ 24 ] 刘 莹. 学科信息的开放存取策略[J]. 情报探索, 2012(11):30-33.
- [ 25 ] For Researchers[EB/OL].[2015- 09- 11].https://www.openaire. eu/intro-researchers.
- [ 26 ] For Data Providers[EB/OL].[2015-09-11].https://www.openair eu/intro-data-providers.
- [ 27 ] For Research Admins[EB/OL].[2015-09-11]. https://www.open eu/intro-research-managers.
- [ 28 ] For Funding Agencies[EB/OL].[2015-09-11].https://www.open eu/intro-funders.
- [ 29 ]Terms of Service[EB/OL].[2016- 01- 05].http://datadryad.org/ pages/policies.
- [ 30 ]聂 华. 全球开放存取运动的新进展 ——OpenAIRE-COAR2014 年会的观察与思考[J]. 大学图书馆学报,2015, 33 (2):5-12.
- [ 31 ]org Repository Maps[EB/OL].[2016-12-20]. http://maps.repository66.org/.
- [ 32 ]齐华伟, 王 军. 元数据收割协议OAI—PMH[J]. 情报科学,2005, 23(3):414-419.
- [ 33 ]Guidelines on Open Access to Scientific Publications and Re⁃ search Data in Horizon 2020 [EB/OL].[2016-08-26].http://ec.eu/research/participants/docs/h2020-funding-guide/ cross-cutting-issues/open-access-data-management/open-access_en.htm.
- [ 34 ]Resolution on Research Data Management[EB/OL].[2013-11- 12].https://data.uni-bielefeld.de/en/resolution?mini=calendar-event%2F2016-11.
- [ 35 ]European Commission:H2020 Programme[EB/OL].[2016- 08- 26].http://ec.europa.eu/research/participants/data/ref/h2020/ grants_manual/amga/h2020-amga_en.pdf#page=215.
- [ 36 ]European Commission E- Infrastructures: making Europe the Best Place for Research and Innovation[EB/OL].[2016-06-30]. http://ec.europa.eu/futurium/en/system/files/ged/booklet_infraweb_final.pdf.
- [ 37 ]Dspace[EB/OL].[2016- 06- 30].https://en.wikipedia.org/wiki/
- [ 38 ]Pampel H, Vierkant P, Scholze F, et al. Making research data repositories visible: the re3data.org registry[J]. Plos One, 2013, 8(11):e78080.
[作者简介]王翠萍,女,1974 年生,东北师范大学信息科学与技术学院教授。
王佳佳,女,1991 年生,东北师范大学信息科学与技术学院研究生。
收稿日期:2017-04-05