觉得石像鬼:数字图书馆解决方案

来源:百度文库 编辑:九乡新闻网 时间:2024/04/30 01:54:55
天宇数字图书馆实现馆藏文献存储的数字化、知识服务的智能化、馆际资源共享的最大化,在全国图书馆有近百家成功应用案例。
一、概述
数字图书馆是以数据库技术、全文检索技术等为支撑,以建设图书馆资源数字化加工、信息智能采集与整合、信息内容管理、信息发布与全文检索、个性化信息服务等应用系统为应用目的,构建数字图书馆信息采集、信息管理与信息服务平台,实现馆藏文献存储的数字化、知识服务的智能化、馆际资源共享的最大化。
浙江天宇信息技术有限公司凭借多年数字图书馆建设经验,及近百家成功应用案例,结合图书馆的实际业务需求,推出以下数字图书馆应用解决方案。
二、总体结构
系统体系构架

系统功能结构
数字图书馆解决方案主要是以CGRS全文据库为应用支撑平台,围绕图书馆各种信息资源的采集和数字化加工整理、信息的存储和管理、信息的发布和服务、信息利用与挖掘等,跨越信息的生命周期,构建数字图书馆数字资源加工、采集与整合平台,内容管理平台,信息发布检索服务平台。
三、系统功能
数字资源加工、采集与整合
◆ 纸本文献数字化加工:
纸本文献数字化加工是数字图书馆资源制作与获取的重要手段。数字资源加工与管理系统融合了高速扫描、OCR识别和全文检索三项技术,可以将数以万计的特色纸本馆藏文献快速、自动地转换成标准的PDF格式,便于读者浏览、交换、存档和全文检索。整个系统最终经由扫描录入、图像处理、版面分析、识别、校对、版面还原、文件自动生成、批量数据入库等工序处理最终完成数字化加工流程。整个加工工序可以设置自动处理,人工干预很少,生成的文件既可以实现全文检索,又能够实现摘抄。
◆ 文献编辑与格式转换:
文献编辑与通用文档转换系统作为信息编辑与标引的有效工具,可以实现对Office、PDF、HTML、ISO2709等格式的电子文档进行预处理、编辑、标引和格式转换等标准化处理。系统支持编辑与标引好的信息资源自动上载、入库,实现数据的直接入库功能。数据入库自动建立索引,实现数据实时发布;系统支持本地、远程信息采集、提交上载;具有文件批处理功能,可以实现大批量文件的处理操作。
◆ 互联网信息采集:
智能互联网信息采集系统(CGSEEK5.3)作为互联网信息内容快速获取的工具,支持各种标准格式信息资源的采集,如HTML页面、文本信息、图片、声音、视频等。对于采集下来的页面内容,系统可以进行内容分析、智能提取、过滤、分类,自动加载到后台全文及多媒体数据库中,丰富图书馆特色数据库信息资源。另外,系统支持OAI等标准协议,可以通过互联网采集系统,建立重点学科导航库,方便嵌入到图书馆门户网站相关栏目中。
◆ 学位论文提交:
用户经过系统相应的身份验证后,进入学位论文网上提交系统,按照规定的格式对论文进行著录,对于论文正文,可以分成一个或多个文件进行提交。提交后,用户可以在网上进行论文检索与浏览,在系统管理员授权的情况下,作者也可以进行论文修改等操作。内容管理图书馆数字资源绝大部分是以非结构化形式存储的,如各类电子文档、图片、音频、视频、WEB页面等,称之为内容。我们采用CGRS全文数据库进行有效地管理与利用。
◆ 信息管理:
信息资源管理是以CGRS全文数据库作为后台管理系统,全面整合与管理各种标准的信息资源,如OFFICE、PDF、HTML、TXT、XML、ISO2709等。系统具有与RDBMS接口网关,实现以主流关系型数据库(Sybase、Oracle,SQLServer和DB2)作为后台数据库的图书馆自动化业务集成系统的无缝连接,实现在两类数据库中一条记录的自动同步更新记录级实现自动关联。系统具有强大数据库管理及维护功能,如数据库定义、建立、备份、恢复、逻辑删除、物理删除、重组、增量备份、记录查重等功能。
◆ 用户管理用户权限管理:
系统提供独立于操作系统的用户权限管理,用户操作审计、分析与统计,日志分析与统计等功能。系统允许最多管理30000个用户,用户根据实际需要可以自定义用户数。用户计费管理:系统提供与用户计费系统接口,用户可以根据读者使用信息资源的情况,制定相关的计费标准,方便地进行统一的信息检索与浏览计费系统开发。
信息服务
◆ WEB信息发布:
系统支持多栏目、多数据库的信息内容统一自动发布;系统提供基于模板技术,发布的信息和表现形式分离,所见即所得地发布信息;信息实时发布,页面动态生成与内容自动更新功能;系统实时无延时地发布各种信息;页面发布时自动生成页面链接,无需人工操作。
◆ 全文检索:
系统提供全方位全文检索手段,支持多种检索运算符,支持包括外部特征与正文内容的各种逻辑组合检索、多字段复合检索、距离检索、二次检索、历史检索、相关词扩展检索、分类导航检索、西文(字符)字段支持前方一致检索、短语与句子检索功能等;系统提供基于同义词典的扩展检索功能,能够满足特殊应用领域的高查准率和高查全率的要求,词典可维护;支持对检索结果的各种排序:对检索结果可按与检索表达式的相关性和重要性程度排序;基于字段的排序;后进先出的快速排序。
◆ 异构资源统一检索:
系统实现将图书馆常用的各种异构资源,如人大复印资料、维普、CNKI、书生电子书、超星电子书、方正电子书、万方数据等,组织成一个有机的整体,在WEB方式下为用户提供统一的信息检索服务。系统允许用户可同时选择多个资源,从同一个检索入口对多个资源提交检索请求,检索结果统一显示。
系统不仅能统一检索图书馆常用的国内、国外商用数据库外,还提供对外部数据资源,如对图书馆新增的数据库、门户网站、搜索引擎及其他网络资源进行统一检索功能,方便用户获得全面的信息资源。
◆ 关联检索:
系统提供图、文、声、像多媒体关联检索功能,满足用户快速获取相关资源的需要;系统具备多数据库关联检索和跨服务器多数据库关联检索功能,提供自由关联、外部关联、词典关联和特征关联四种关联方法。
◆ 全文传送与信息推送:
用户自定义专题信息内容,系统根据用户设置信息要求,定时在图书馆自建数据库中搜索,把符合用户要求的全文信息自动推送到用户指定的邮箱中。目前专题信息订阅推送服务可以用于图书馆全文传送服务,构建全文信息传送系统。
◆ 数字参考咨询:
用户通过系统可以快速建立FAQ数据库,将图书馆常见的问题与解答存放在FAQ数据库中,可以方便读者的进行查询与浏览;另外,系统提供实时在线虚拟参考咨询平台,实现交互式的在线数字化咨询服务。
◆ 系统提供自建数据库打包成光盘专题数据库工具:
该工具能够把整个数据库制作成光盘数据库,也可以在多个数据库选择部分内容制作成专题数据光盘,方便馆际之间进行特色馆藏资源的交流。
四、安全方案
检索代理:
通过检索代理服务器对数据进行访问,检索用户只能访问到检索代理服务器,无法进入数据库服务器,在数据库服务其(内部网)前设置了一个“堡垒型”防火墙,拒绝黑客进入数据库服务器和局域网,增加数据库安全性。
用户操作统计与分析:
用户检索的记录保存在数据库中,并提供检索记录的查询、浏览、打印、统计与分析等功能。通过统计分析记录查询数据库中的内容被用户操作(包括浏览)的情况,如用户每次查询登录曰期、时间、登录IP地址、检索用时、检索次数、下载信息的情况分析、统计等。
独立于操作系统的用户管理、身份验证机制:
提供系统、数据库、记录及字段级的安全控制手段;用户使用信息资源的授权机制、用户文献存取数量控制;用户IP地址限制;数据操作审计和日志功能,控制台运行日志和故障分析工具。
五、图书情报部分用户案例
中国人民大学图书馆 华中师范大学图书馆 浙江师范大学图书馆
成都大学图书馆 四川省委党校图书馆 杭州市委党校图书馆
全国妇联办公厅档案处 温州发电责任有限公司档案处 北京大学图书馆
首都师范大学图书馆 苏州市图书馆 新疆财经学院图书馆
浙江省委党校图书馆 温州市委党校图书馆 浙江省水利河口研究院资料中心
中共中央党校图书馆 首都医科大学图书馆 苏州大学图书馆
中国社会科学院图书馆 福建省委党校图书馆 海南省委党校图书馆
东南大学图书馆 北方工业大学图书馆 中国人民大学报刊复印资料中心
江苏省委党校图书馆 河南省委党校图书馆 湖州市委党校图书馆……
 
cglibrary_solution.pdf