问仙吴沉水书包网:机构知识库建设的“最后一公里”

来源:百度文库 编辑:九乡新闻网 时间:2024/04/28 17:41:37


作者:钱建立

2011年6月在成都参加了2011年高校图书馆发展论坛暨数字图书馆前沿问题高级研讨班,会议安排了整整3天的报告,许多报告很精彩,受益匪浅。期刊出版上游为作者,下游为图书馆和读者,期刊从业人员应该走出期刊出版的“圈子”,从更广阔的视野来审视数字出版。会议期间接受了中国教育装备采购网的访问,把当时的问答整理了一下。

问:据了解,您是科研人员出身,当初是如何想到要成立知先信息这样一家致力于“开放存取”和“机构知识库”的科技信息传播企业?

  答:之前我在一所军事工程院校担任教学和科学工作从事教学、科研工作二十多年。工作中遇到的最大困扰就是信息获取和科研团队协作。由于所在大学非211大学,图书馆资源有限,要想获取到相关领域最新发展动态和文献,是一件比较困难的事情。从2005年开始把个人和团队的主要精力集中到 “开放存取”,致力于科研文献的无障碍获取。在所在学校的支持下,成立了“开放存取”研究中心,并得到了科技部、教育部、陕西省多项基金的支持,建设了“开网”,协助建设了科技部的中国学术论文开放存取系统,算是“中国开放存取的积极倡导者和实践者”(科学时报)。

  在指导研究生和管理团队的过程中,还有一个体会,就是每个研究生、团队成员都收集、产生了很多有价值的资料,包括很多花费大量精力和经费的实际记录,但这些资料都散存在成员个人计算机中。随着研究生的毕业,这些文献和资料也随之流失,没有在团队之间形成积累和传承。

  还有就是,所在机构的图书馆尽了最大努力为师生的科研工作提供资源服务,通过各种渠道采集了很多科研资料,机构网站、办公系统中也积累了大量的有价值文档、资料,但这些资料没有很好的集成检索,都是一些信息孤岛,导致了机构知识的“雪藏“和浪费。

  做博士论文时,收集了大量OA和元数据抽取方面的文献,还想解决论文中参考文献标引的事务性劳动,就接触到了参考文献管理软件。由于之前一直在寻求开放存取、团队协作的途径,参考文献管理软件让我找到了一个开放存取、团队协作、机构知识库建设的支点。

  参考文献管理软件由于具有文献管理、参考文献自动形成等实用价值,得到了科研人员的青睐。研究人员在收藏的文献中,大多都包括自己发表的文献。之前的绿色开放存取,需要作者花费时间来人工填写各项元数据、上传文件,影响了开放存取的积极性。现在作者在参考文献管理软件中已经收藏有个人成果,一键即可分享,实现绿色OA。让作者不花费精力就可做“善事”,这是当时开发NoteFirst参考文献管理软件的初衷之一。

  目前一些机构都有建设机构知识库的计划,但国内外建成机构知识库的利用率不高,除了机构成果记录的功能得到实现外,为机构成员带来有价值的服务不多,因此在很多机构成员眼中,机构知识库除了“找事儿”(机构成员要上网申报成果)外,有点“形象工程”的味道,沦为了“鸡肋”。其实机构知识库是一项非常有价值的工作,只是目前还没有找到给机构和成员都能带来价值的实现方式。NoteFirst就是想在这方面做一个常识。通过NoteFirst个人知识库管理软件,在为机构成员提供知识获取、文献管理、论文写作、团队协作等有价值功能的同时,把NoteFirst个人知识库中的个人成果进行自动收割、团队内分享,解决机构知识库建设的“最后一公里”。

  NoteFirst是在广泛吸取国内外参考文献管理软件优点的基础上,广收并蓄,加上我们对开放存取、机构知识库、知识服务的理念,开发的一套个人知识库管理软件。首先改进了国外软件对中文文件不支持的缺点。国外参考文献管理软件在形成参考文献时会出现“王小勇,卢晓,郑波,et al”这样的低级错误。中国同类软件尚处于单机版时代,在办公室电脑收藏的文献,回家想要使用的话,需要再录入一遍,非常麻烦,而且也不符合当前互联互通的趋势。NoteFirst主创人员有多年的科研工作经历和期刊给爱经历,知先团队在2010年发布了中国首款互联网版参考文献管理软件NoteFirst,并能支持EI收录期刊要求的双语参考文献,并把功能从单纯的参考文献管理扩充到团队协作,并为绿色开放存储和机构知识库开辟了绿色通道。

  我们的目标就是通过为科研人员知识获取、知识管理、知识应用(论文写作)、团队协作等科研人员急需服务的同时,探索开放存取和机构知识库的“最后一公里”的解决道路。

问:从数字出版这个角度来看,您认为数字图书馆当前面临最大的问题是什么?

  答:在印刷版时代,图书馆的价值是为机构成员购买文献,在成员提供阅读服务。现在互联网时代,目前图书馆的最大功能仍然是中科院图书馆张晓林馆长提到的“Buyer”,购买数据库的在机构内的访问权,为机构成员提供知识获取通道。但除了“Buyer”功能外,我认为机构图书馆需要在以下3个方面进行突破。

  1) 知识生产者。通过机构知识库建设,从Buyer变为知识生产者。我这里所说的机构知识库建设,和目前图书馆馆员理解的机构知识库有些区别。机构知识库不应该仅仅是机构公开成果库,更应该在内部其他有价值资源上下功夫,如教案(麻省大学的开放教案就是一个成功的案例)、实验记录等。个人认为,机构内部的实验记录、学位论文、教案、课件也是一种很重要的知识产品,如果能把这些资源进行集成,将使机构图书馆从单纯的Buyer变为知识生产者。

  2) 服务提供者。图书馆本来就是服务性机构。但随着数字出版的到来,图书馆的服务功能没有得到及时的完善。科研趋势分析、情报收集、交流等功能等新型服务,包括为机构成员提供文献管理、团队协作这样的基础服务,在数字出版时代正在变得可能,而且变得更有价值。目前在很多图书馆还没有开展,还停留在“Buyer”的角色上。

  3) 知识组织者。目前整个人类的知识还以文献的文献进行展现。打个比喻就是:人类的知识就像一粒粒的“珍珠”,掩藏于文献的“蚌壳儿”中。无论是Google搜索,还是Summon等集成搜索,仅仅能帮助找到可能包含需要知识珍珠的蚌体,但里面是否有需要的珍珠,掰开以后才能知道,而且要花费力气去发现珍珠。如果能把蚌壳而掰开,摘出珍珠,并串成珍珠项链,那将节省大量的时间,使得知识获取变得更加高效、容易。这就是目前热门研究的“知识再组织”。在这个新的发展阶段,机构图书馆应该有所作为。但本人认为,在这个阶段,让图书馆员去自己做这个工作难度较大,应着眼于为机构提供工具和平台,让成员在强势学科中有所表现,编辑出国际影响力的知识节点。

问:国内外图书馆的发展有一定差距,您认为造成这一差距的关键因素是什么?

  答:最关键的因素有以下三点——视野、观念、体制。

  在大多数科研机构,图书馆一直是一个附属机构。其实不然,我们军队系统中很重要的一个大部门就是参谋部,用于负责战略、战术方案的决策咨询。在科研机构,更需要这样的机构。但目前在科研机构管理者眼中,图书馆是一个只花钱、不产出的部门,这样就造成了思想、人员的不重视。这个现象的改变仅仅靠一些有追求、有思想的图书馆馆员,难度很大,需要科研机构管理者思想、观念的转变,进而导致政策、人员、经费的重视。另外就是目前图书馆员的视野和观念也急需改变。

  随着目前国家对教育、科研经费的持续投入,经费将逐渐不成为主要问题。但传统思维模式对图书馆员的影响,加上大多数图书馆对外交流的匮乏,以及科研机构行政化的现实,中国图书馆的发展还需要一段时间的酝酿。中国图书馆的发展,既需要中科院张晓林馆长这样的思想家,也需要更多的实践者。独木不成林,中国图书馆界需要更多的思考者、探索者。

  很欣慰看到,中国不乏这样的人。除了张馆长之外,有幸看到了中科院、清华、北大、川大、夏大等众多图书馆进行的卓有成效的努力和实践。

问:本次论坛有很多国内外的专家学者进行了专业讲座,哪一个令您印象最深刻?

  答:这是给我留下深刻印象的研讨会之一。3天的研讨会的每一场报告很想去听。很遗憾,由于其他工作安排,错过了很多精彩的报告。

  在主论坛中,中科院张晓林馆长的报告,给我留下了非常深刻的印象,尤其是“颠覆”这个词,给人的冲击力非常强。张馆长在报告中提到的很多问题也是我一直在关注的。

  通过听清华大学图书馆姜爱蓉副馆长作的《从Google和Facebook的发展看图书馆服务的集成与分布》的报告,我们了解到清华大学在进行文献价值排序方法的研究。加菲尔德博士提出了通过被引频次来定量描述文献价值度的理论,奠定了现在文献计量的基础。Google把引文理论变换为PageRank,开创了新一代搜索引擎。社区中通过“Like”的人工推荐来表征文献价值,我们的想法是,文献的收藏人数也能反映出文献的价值,而且收藏是研究人员的一个自然行为,没有人为因素。我们希望通过读者的收藏行为分析,来展现文章的价值度。越多人收藏,那么就表示这篇文章的价值越高。基于读者行为的统计,我们自己也在进行更多的探索。

  北大图书馆副馆长聂华的“图书馆资源的深度整合”的报告,由于和我们通过“知识树”来探索人类知识新表现形式的工作有交集,其中很多观点受益匪浅。

  美国雪城大学秦键的“E-science”的报告,让我了解到国外科学社区中没有注意到的应用。我一直在关注ResearchGate、mendeley,connotea,citeulike等国外科学社区,这个报告给了我更多的信息。在西安知先产品里也包含了科学社区的概念,把微博社区这个理念融入科学社区,把每个用户的文献收藏行为(用户愿意的情况下),变为一条微博信息,将每一个期刊变成一个独立个体,用每个用户的文献收藏和每个出版机构的文献发布来组成一个大的科学社区体系的信息来源。有了这样一个社区的形成,就可以有很多人性化得应用。比如业界的一个专家,我是他的粉丝,那么我就可以知道这个专家在阅读哪些文献,可以跟着他的步伐前进,对于个人知识获取就是一个捷径。

  另外我们也注意到Serials Solution的技术报告。西安知先的产品中有一个参考文献自动编校产品,是参考文献的深度应用,这个产品由于能为文献出版机构的论文提供直接的展现度(被引用),因此得到了一些数据库集成商的数据使用授权。但二次文献集成搜索应用市场,我们起步已经晚了,就需要调整我们的思路。

  总之,精彩的报告很多。

  这里略有删减。全部内容参见:http://www.sal.edu.cn/Info.asp?id=750


本文引用地址:http://blog.sciencenet.cn/home.php?mod=space&uid=65283&do=blog&id=466810