
设计开发
我国高校图书管理中的数据挖掘平台建设分析
王红梅”郭燕青2
(1.辽宁大学图书馆辽宁沈阳110036; 2.辽宁大学商学院辽宁沈阳110136)
摘要:随着我国高校图书情报管理的目益信息化和国际化,基于信息技术的现代管理系统开始深入高校图书馆的目常管理活动中,光其是对信息对象、管理人页和高校读者的整个流程管理中开始应用的数据忙据技术平台,突显其资源活化与整合的综合功效。本文正是基于这样一个研究肾景,展开对高校图书馆应用数据挖据技术,格建实用便捷的数据挖据平台,深化图书馆管理创新这一整体研究。我国高校图书馆的管理创新关键是基于数据挖据平台,我们研究得出这一平台的四大功能模块,其核心理念是客户关系管理(CRM)关键是贡穿整个流程的技术实现。它将使我国高校图书馆的管理步入全新的开放型、国际化和个性化运转轨道。
关键调:图书馆管理数据挖据技术信息化
中图分类号:G250
文献标识码:A
文章编号:1007-9416(2012)03-0108-02
信息化环境下我国高校图书馆的图书资源管理必须藉由信息技术手段由传统图书馆向数字化,网络化图书馆转变,由馆藏文献资源建设向网络信息资源建设转变,由传统文献传递服务向网络信息导航服务转变,由封闭的办馆模式向开放的社会化办馆模式转变,为此,图书馆管理中的信息技术平台建设关系到图书馆在高等人才培养中的功能实现及其教育地位。其中,优化图书馆的信息管理,采用新型信息管理技术就显得十分关键。本文利用数据挖据技术就图书馆的资源信息管理及其个性化发现等信息化管理平台建设进行分析,旨在推动我国高校图书馆信息化管理的有效转型。 1、相关背量研究
1.1高校图书资料管理中的数据挖据现状及面临的问题近年来,我国高校图书馆管理中利用数据挖播技术主要做了三
个方面的创新性工作:其一,在文献信息管理中的应用。传统的图书信息采集多由专门采访人员独自确定,或采纳学科专家的意见,不可避免地带有极大的主观性以及个人喜好。同时,图书馆每年的文献购置费是有限的,各门学科之间如何分配,各种文献载体形式如
何均衡才能使有限的文献购置
经费发挥最大的效益,对于这共问题
数据挖掘技术提供了较好的解决方案。如利用数据挖掘中的供求关
系动态图找出图书类别
借阅次数的对应关系,对借阅量的大小进
二,在信息服务中的应
行分析进而确定新的购书目录及其数量。其二
用。随着网络技术、计算机技术的广泛应用,图书馆服务模式由以往等着读者上门改为主动为读者服务,由以往单纯图书文献形式的信息呈现转为依靠新技术的信息生成,具体包括四类服务创新模式:信息检索服务,定题与查新服务:信息分析服务,个性化服务。其三,在人员管理上的应用,新时代读者对图书馆的需求不仅仅局限于简
,而是要求图书馆员提供附加值大的信
单层次上的信息套询与反馈
息产品,因此图书馆必须加强对工作人员的管理,在对职工兴趣,资
个有特色的专业小组,激发馆员的
历等信息分析的基础上,成立多个
工作和学习热情,为馆员提供信息交流平台,不断提高员的业务能力,为读者提供个性化服务。与此同时,利用数据挖据中的一些技术,如统计回归、速辑回归、决策树、神经网络等,揭示用户的行为习惯,兴趣爱好,将用户感兴趣的内容与服务系统结合在一起,为每个用户提供主动的个性化的服务,提高图书文献的利用效率。
当然,在利用数据挖插技术实施图书管理创新方面仍存在着以下一些垂待解决的间题:首先,网站建设中利用数据挖据技术设计不合理,致使读者利用图书网站获取信息资源的功能实现上存在着人为的障碍,影响了用户使用的便利性和实效性。其次,个性化服务程度不高,智能化服务内容不多。对于大多数高校图书馆线上资源管理来说,不能根据用户个人的具体需要提供高质量的、系统的信息服务,即不能全面客观地分析用户的信息需求,对各种信息资源进行过滤,把用户所需要的个性化的精品信息资源提供给用户,最后,信息孤岛现象比较明显。信息岛是指在社会信息化过程中,由于信息系统,软件系统、数据库之间关联性差,难于互联、互通和互操作的弊端,造成数据共享性差,信息难以融合贯通,无法实现业务协作,系统效率低,而无法真正实现信息化的问题,当前,各高校
108
数据
图馆部保存有大量的数字化资源,诸如馆藏书目数据库、全文期刊数据库、学位论文库、会议记录库等。然面,它们的存储和读取方式不尽相同:有些以数据库形式存放,有些以文件形式保存。读者在使用时,需要用各自数据库不同的用户名和密码来登录系统,并以各自专有的客户端检索界面进行数据读取和检索。这就需要图书馆用户进行反复的登录,通过适应千变万化的检索界面和要求,来获取相应的数据资源。
1.2数据挖据技术及其应用进展
上世纪90年代以来,随着信息技术的飞速发展,海量繁杂的数据使管理组织日益感受到这些业务数据中蕴涵着丰富的有价值的知识,如何充分发掘出这些知识会对管理组织产生巨大的实时管理效益。因此,数据挖掘作为知识发现领域中的一个核心技术一直是众多学者研究的热点,数据挖掘包括了分类,聚类、关联规则,序列模式等几个类别机器学习算法。在国外,数据挖掘已经在金融、保险、医疗、电信等许多行业投人应用。在国内,也产生了很多数据挖掘技术的理论,但数据挖掘软件的实际应用则刚刚起步。随着互联网的普及以及Web技术的不断成熟,面向服务的体系结构(service orientedarchitecture一SOA)成为近年来软件模式研究领城的-个新热点。Gartner的最新报告显示,2006年有60%以上的组织考虑以SOA为指导原则来设计关键任务应用和流程,到2008年SOA为80%的新管理项目提供实施基础。目前,市场上已有很多流行的数据挖掘软件,主要为国外产品,如SASEnterpriseMiner、SPSS的 Clementine以及IBM的IntelligentMiner等,这些数据挖据软件基本均为用户提供了一些经典的和部分自行研究的数据挖掘算法,但在数据预处理和结果可视化方面提供的功能则较为有限。这样一来,用户要使用这些数据挖掘软件,往往要借助其他工具和方法完成大量的数据预处理工作。更值得关注的是,出于竞争等多方面原因,这些商业数据挖据软件内部功能模块之间基本都是紧耦合关系。每个算法与其分析结果的可视化功能紧紧绑定在一起,没有向用户提供调用接口,用户除了接受软件厂商制定的所有使用规则外别无选择。这些软件也不会为用户提供功能的扩展接口。用户只能使用现有的算法,无法通过增添其他算法来扩展软件功能,也不可能在几种软件之间进行功能的优化重组。因此,如何设计一个松散耦合的、支持功能模块的重用和优化重组且容易扩展的数据挖掘平台成为一个值得研究的问题
1.3面向服务的数据挖据平台
面向服务的数据挖掘平台(serviceorienteddatamining platform-SODMP)其概念模型如图1所示,主要由DM应用,DM服务代理,DM服务三部分组成。DM应用包括了各种具体的数据挖抵应用项,是服务的请求者角色,DM服务代理包括了各种服务的调度,目录维护和管理,充当服务的中间代理角色,DM服务提供了各种所需的功能服务,是股务的提供者,SODMP平台通过使用服务代理,实现了股务请求者与服务提供者间的分离,同时也实现了两者在调用关系上的松合。这种松散耦合对数据挖掘流程中各部分功能的重用、优化和扩展有着非同导常的意义: