黄靖翔整容:图书情报学开放存取知识库的对比分析

来源:百度文库 编辑:九乡新闻网 时间:2024/05/16 19:56:26
图书情报学开放存取知识库的对比分析

论文作者 朱玉奴/田稷
论文关键词 图书情报学/开放存取知识库/OA期刊/OA知识库
,论文来源 ,论文单位 ,点击次数 0,论文页数 页2007年2007月论文网 http://www.lw23.com/paper_19281571/



  开放存取(Open Access, OA)作为一种新的学术信息共享理念和机制,受到越来越多的关注和重视。目前开放存取主要有两种途径:OA期刊(开放存取期刊)和OA知识库(开放存取知识库)。其中OA知识库是一种基于网络的免费在线资源库,其内容由作者通过自存档方式存人,未通过专家评议,一般由一个机构或一个学科组织依据一定的规范建立。早期OA知识库主要集中在自然科学领域,近年来,社会科学和人文科学领域的OA知识库也开始出现并逐渐发展,如图书情报学领域的E-LIS,并在相应的学科研究中逐渐扩大影响力及影响范围。本文根据开放存取知识库名录(DOAR)以及笔者所调查的有关图书情报学 OA知识库的情况,选取了国内外6种典型图情学OA知识库进行对比分析,希望能为图书馆同仁研究图书情报学、了解和使用图情学OA知识库提供一定的参考。
  1 图书情报学开放存取知识库的基本情况
  开放存取知识库名录(Directory of Open Access Repositories, DOAR)对各领域的开放存取知识库进行记录和分类,DOAR项目由英国的诺丁汉大学与瑞典的Lund大学合作开发,受到OSI、JISC、CURL和SPARC欧洲部等机构的支持。DOAR提供了综合权威的机构知识库、学科知识库,以及由各资助机构建立的开放存取知识库(如NIH、Wellcome Trust)列表。用户可以通过知识库的地点、类型、收藏资料等等方式检索使用这些知识库。DOAR既适合那些希望在专门的知识库中查找原始研究论文的用户使用,也适合如搜索引擎等服务第三方使用[1][2]。
  目前DOAR总共收集了796个知识库,其中涉及图情学的知识库总共有46个,分别来自美国、英国、法国、德国、巴西、加拿大、澳大利亚、芬兰、荷兰、意大利、印度、西班牙、南非、葡萄牙、墨西哥、纳米比亚16个国家。DOAR提供了知识库的组织机构、描述、 OAI-PMH协议、应用软件、主题、文档数量、文档类型、语言、备注等信息,绝大多数知识库的主页可以通过DOAR直接点击进入,经分析,这些知识库主要有以下特点:
  1.1 组织机构
  DOAR开放存取知识库的组织机构主要有大学、大学图书馆、政府机构、研究机构、协会等。
  1.2 文档收藏情况
  DOAR收藏范围有大有小,有的面向全世界收录所有相关领域作者撰写和发表的论文,而有的只是进行针对性地收录,如只收藏某一机构(如大学)、某一项目或某个人撰写和发表的相关论文等。而且收藏的数量差别也较大,据统计(统计截止时间为2006年 8-10月),DOAR有6个知识库收录达到1000条以上,其中巴西的REPOSCOM(9154条)、意大利的E- LIS(4111条)分别位居第一、第二位。
  知识库收录的文档类型包括已出版和未出版的文章,如预印本、后印本、会议论文、学位论文、书籍章节、参考、说明、多媒体、报告等。一般知识库收集多种类型的文档,也有一些知识库只收录一种类型的文献,如美国北卡莱罗纳州大学的SILS学院建立的针对 Open Video Proiect项目的知识库,专门收集数字化的视频;以及针对Electronic Theses & Dissertations (SILS-ETD)的知识库,专门收集该大学LIS专业的硕士学位论文。
  1.3 语言
  开放存取知识库所使用的语言以英语为主。经笔者统计,46个知识库中的80%都支持英语,其中有 50%以上只支持英语。少数知识库不使用英语,如德国的3个知识库使用的都是德语。
  1.4 开放程度
  根据DOAR对开放存取知识库的描述,以及笔者的初步使用,发现绝大部分知识库都实现完全开放,使用者可以免费、自由地阅读和下载文档全文。但也有一些知识库网站在登录时需要安全认证或有会员限制,一部分知识库收录的文档中有一部分只提供题录,并不提供全文。
  1.5 应用软件
  46个知识库均遵守用于元数据收集的开放文档存储协议,主要采用Dspace和Eprints两个开放资源软件。 值得注意的是,在DOAR收集的46个LIS主题的知识库中,并不包括中国的知识库。目前国内在机构知识库方面已取得了一定的进展,主要是创建了一些以收集论文预印本为主的机构知识库,如中国科技论文在线、中国预印本服务系统、奇迹文库等比较著名的预印本网站,而且,我国目前已有由国家图书馆负责开发创建的基于DSpace平台的“中国图书馆情报学开放文库”[3][4],该文库的内容既包括过去已经发表过的期刊论文,也包括未经评审的预印本。
  基于上述调查与分析,我们选择了E-LIS、 DLIST、LDL、CaltechLIB、OZone以及“中国图书馆情报学开放文库”6个典型的图情学OA知识库进行分析比较,详细、深入地探讨各个知识库的特点和功能。
  2 图情学开放存取知识库的对比分析
  2.1 创建组织和文档收藏情况
  从收藏资源的数量来看,截至2006年10月26日,E-LIS文档量已达到4414条,明显多于其它知识库,DLIST、LDL分别为793、257条,分居第二、第三位, CaltechLIB、OZone和“中国图书馆情报学开放文库”均少于100篇。这可以从一定程度上反映各个知识库影响力的差异,但无疑也与各个知识库的定位有关。E- LIS从开始创建就具有全球性的特点,它是国际上第一个收集图情学文献的电子开放知识库,依靠全世界具有各种背景的志愿者进行管理和维护,收录来自世界各地图书情报领域作者的论文,包括各种语言、格式和类型的论文,如果是非英文的论文,只需要作者在提交论文时提供英文摘要和英文关键词。而其余知识库基本上由其组织和创建机构进行管理和维护。 LDL、CaltechLIB、OZone由相应的研究机构、大学和大学图书馆创建,目前只收录来自组织和创建机构或相关成员的论文,而“中国图书馆情报学开放文库”是一个面向中国的图书馆学、情报学、信息管理学的老师、学生和全国图书馆员的学科型开放知识库。DLIST受美国亚利桑那州大学的信息资源和图书馆学学院 (SIRLS)以及学习技术中心(LTC)的支持,拥有一个专门的顾问团,由7位来自印度、美国、丹麦、新加坡的图书馆学和信息学领域的专家组成[5],其职责是帮助 DLIST建立一个图情学的动态公共区域。虽然DLIST没有限制论文的地域来源,但目前DLIST只支持英文文档,这可能是影响文档数量的一个因素。
  2.2 论文提交和存储
  表1 6种图情学开放存取知识库的基本情况对比
  
  论文提交和存储是开放存取知识库在收藏资源过程中的一个最基本环节。一般在论文提交和存储之前,用户需要进行注册。其中,E-LIS、DLIST和Cal techLIB采用的是Eprints软件,其提交和存储方法相似,而E-LIS更加完善和人性化,其网站上的“Submission guidelines”一栏[6]规定了接收论文的格式等方面内容,一般接收各种类型和格式的文献,但其推荐格式是PDF和HTML。而且对各种类型论文的元数据都有具体规定和实例说明。“Submission demon stration”[7]一栏对论文的提交和存储过程进行了动画演示,给用户一种很直观的感觉。
  LDL、OZone和“中国图书馆情报学开放文库”采用 Dspace软件,可以通过点击主页的“我的个人空间” (My DSpace)进入注册和登录页面,然后按照要求和提示一步一步操作即可完成论文的提交和存储。
  论文提交后是否能顺利在知识库上公开发布和被使用,就涉及到下面讨论的质量控制和版权问题。
  2.3 版权问题和质量控制
  2.3.1 版权问题
  由于开放存取知识库的自存档性质,提交到知识库的作品其版权归作者或版权所有者所有,在自存档之前需确保作品没有版权纠纷。而各个知识库在版权政策的具体操作方面有所不同。
  E-LIS知识库对版权问题有较详细的规定,其版权政策包括作者权利、自存档权利、元数据政策、读者和复制权等内容[8][9]。具体为:存放在E-LIS服务器上的所有作品其所有权均归作者拥有。提交文献的作者应确保其作品在发布方面没有任何限制。就未经审核的预印本来说,作者拥有其版权,可自行存档而不需征得他人同意;若已经审核的预印本,如不能与出版商达成协议,作者可以向已经存档的预印本添加一个勘误表或者超级链接到一个勘误表。而对于后印本来说,作者则要商议修改版权协议以便自行存档。大多数的期刊允许作者自行存档,但这完全仰赖于出版商的版权政策。作者也可以在有限利用的条件下向开放存取知识库存放后印本。作者可以向出版商请求转让某些权利,比如将作品存放到开放存取知识库或者其个人主页上。
  元数据政策是指允许第三方采用一些技巧来采集知识库中的元数据,并利用这些数据来创建相关知识库内容的用户服务。通常情况下,只允许第三方采集元数据,而不允许采集全文。目前已有的第三方的元数据采集工具有MetaLIS、DLIST的DL-Harvest等。E-LIS知识库中的作品受版权法保护,作者或者其他所有人保留这一权利,作者或者出版商拥有这些作品的翻译和复制权。但是,在国内外以及国际版权法的范围内,用户可以在从事个人研究、教学和非赢利情况下进行复制。E-LIS知识库中的作品其产权归作者所有,可以授权使用。在目前有关利用电子文献的规范尚不明确的情况下,建议采用合理利用知识库内的作品这一原则。读者可以在线阅读、下载知识库中的作品,或者可以在另一电子文档中引用作品的网址。如果没有得到作者的许可,无论采用印刷方式或者采用电子方式,这些文本均不可以用于商业性出版、编辑以及其他用途。与印刷型文献一样,删节或参考这些文献时需要注意准确地反映原文的观点。
  DLIST提供了版权研究和存储服务[10],如果作者不能确认提交论文的版权问题,可向DLIST工作人员求助,DLIST工作人员收到作者的论文信息及签署好的DLIST上传许可同意书后,将帮助作者调查论文的版权情况,如果获得了期刊版权转移协议的允许,会直接将论文保存到DLIST上,并通知作者。CaltechLIB在其政策文件[11]的主题下提供了管理员发布的作者许可协议书。Ozone要求签署一个发布许可书[12],以允许OCUL可以对作品以印刷、电子和其它任何媒介形式进行复制、翻译和发布。
  2.3.2 质量控制
  E-LIS由于E-LIS涉及的语言和地域的广泛性,其编辑人员由全世界各地志愿者组成,基本上是图书情报学领域的研究者和工作人员,目前总共有来自40个国家的60多名编辑[13]。E-LIS明确规定了编辑的职责是负责来自自己国家的论文在发布和存储之前的元数据的质量控制,并负责与论文存储者之间的联系工作。一般要求2天内完成论文的审核。编辑的常见问题解答对编辑的工作规范和流程等都进行了详细的说明。
  DLIST拥有一个相对稳定的编辑团体[14],,包括1个总编辑、2个专著编辑和8个主题编辑,8个主题分别为学术讨论、数字人文和数字图书馆、科学技术研究、社会信息学、档案学和档案管理、博物馆信息学、资讯行为、信息检索和自然语言处理。通过各个编辑的e-mail和主页信息可以与其联系。
  2.4 特色服务和功能
  2.4.1 采集工具DL-Harvest[15]
  DL-Harvest是一种搜索工具,可以看成是DLIST提供的一个特色服务,目前DL-Harvest采集了18, 000多条来自14个基于OAI-PMH元数据标准的数据库的有关图书情报方面的学术论文记录,14个数据库中包括了E-LIS、DLIST和CaltechLIB知识库。
  DL-Harvest的服务界面较简洁,可以进行检索和浏览。其检索和浏览的论文结果均为论文的元数据记录,可以通过点击“View Original”链接到论文的原数据库界面,从而获取全文。这遵守了上述提及的第三方数据采集的版权规定。
  2.4.2 统计功能
  E-LIS、DLIST均提供了整个知识库所有论文点击、下载数的统计表,以及论文下载量的排名,同时可以查看某一篇论文点击、下载量的统计表。其中E- LIS只提供论文下载量前15名的排名,而DLIST提供了下载量至少为1的所有论文的排名。另外,E-LIS还提供了其收录的有关计算机、图书情报方面研究论文数随时间变化(从2002年12月开始)的图表,以及有关E-LIS使用情况的统计表。E-LIS和DLIST的统计功能对作者了解自己作品的被利用情况和相关研究者评价知识库使用情况具有一定的参考价值。
  LDL和OZone的统计功能类似,它们主要提供了知识库存档、论文访问、用户登录、检索词、处理信息等方面的统计数据,但与E-LIS和DLIST相比有较大不同,显得不够直观。
  3 小结
  通过以上6个图情学开放知识库的对比分析,笔者有以下几点体会:(1)无论从管理、技术还是使用的层面,E-LIS都是一个比较完善的系统,其收录论文的广泛性无疑对开放存取的支持者是一种激励,也提高了其在图情学开放存取领域的影响力。(2)虽然其他知识库与E-LIS相比存在差距和不同,但也不乏自己的特色和存在的意义。如DLIST相对固定和专业的编辑体系的设置,可以看成是一种实现更加严格的质量控制的途径;DL-Harvest采集工具对其它图情学相关知识库的资源实现了一种整合。另外,创建面向某一国家、机构或项目的开放知识库,从特色文献的保存角度来说也是一件有意义的事。(3)如果上述各类图情学的开放知识库可以相互借鉴、相互学习,取长补短,将能更好地促进自身网站的发展,给广大的图情领域的研究者和工作人员提供更好的交流平台。 (4)由于OA的开放性,国内图情界人士应积极参与论文发表,在提高水平的同时,努力提高国内图书馆人士在国内外的影响力。另一方面,我们应该加强图情学OA知识库的建设,在论文提交和存储技术、版权、质量控制、检索功能等方面构建一套先进、完善的机制,吸引国内外的优秀论文,形成品牌效应,进而提升国内OA知识库的地位。转自:http://www.lw23.com/paper_19281571_6/
<>< td="">