在互联网上为科研数据办张“身份证

  现在我们大多数论文都只发表“结果”,不发表“数据”,而论文结果只是作者对“数据”的理解,正确与否无法判断。近日,阿里巴巴集团技术委员会王坚在全国科学数据大会上抛出的观点,得到众多专家的认同。

  不少科研人员、高校学生也都有类似的体验:一篇论文可能只有几十页,但背后的各种实验数据得有几百上千页,大量数据长期“沉睡”在“科研工作者个人电脑中”。

  数据分享的好处毋庸置疑,无论是从国家层面,还是社会角度,资源共享都会促进成本节约和效率的提高。但是,科研数据完全无条件的分享又存在诸多障碍。作为数据分享的一种有力尝试,数据出版刚刚起步。

  科研工作者为什么不愿意分享数据呢?8月9日,国家科技基础条件平台中心副主任王瑞丹展示的一项调研问卷或许能给出答案。在“没有将科学数据发布并共享的主要原因”问题中,选择最多的3项是:“数据的知识产权不清晰,不宜公开”“数据还有为自己的团队持续利用的价值,不发布有利于保持自己团队的科研优势”“科研项目资助机构、所在单位及发表研究的期刊并未要求将数据共享”。

  “数据公不公开,首先应该尊重科研工作者的意见,不能将数据分享单纯看作是科研工作者的一种‘义务’,毕竟数据隐含了科研工作者的大量心血,完全无条件的公开也是不现实的。”中国农业大学汪懋华院士表达了自己的观点。

  8月11日,中国科学院计算机网络信息中心研究员黎建辉介绍,所谓数据出版,是指将科研过程中产生的数据,经过规范和质量控制,以互联网方式发布,供别人访问、引用、评价、再应用,给数据加以“标识”,相当于给数据办了一张“身份证”。

  “其实,原来论文和数据并不分离,发表论文的同时也会附带数据,只是随着数据容量越来越大,纸质媒介无法承载,才形成今天单独发表论文的形式。但是,随着互联网技术的发展,又为数据的发表提供了可能性。”黎建辉提到。

  中国科学院地理科学与资源研究所石瑞香指出,数据出版的优点显然不少,最重要的是作者知识产权,出版也就意味着数据被贴上“标签”;同时,确保数据准确规范,出版拥有一套对应的体系标准,将对数据的准确性和规范性进行审核;此外,永久保留数据,降低个人不慎丢失数据的风险;而且还能提高数据和作者的影响力,作者甚至在没有形成论文的情况下,单独发表数据。