大数据对图书馆的挑战

来自:水畔网行 0 0 2019-06-24

       大数据时代的到来改变了传统的 IT 架构与数据存储结构和利用方式,将对储存信息知识、提供信息服务的图书馆带来深刻影响和严峻挑战。因此,深刻理解大数据的内涵,认真分析大数据技术对图书馆带来的影响与挑战,就显得非常必要。笔者认为,大数据对图书馆的挑战主要表现在下列几个方面。

       1.对图书馆的网络架构、数据存贮能力及计算能力提出挑战

       信息环境下,信息产生的成本快速下降,产生的方式也多种多样,存在于社会空间中的信息数据量迅猛增长,新的数据源和数据采集技术的出现使数据类型增多,各种非结构化的数据又增加了大数据的复杂性,人们的生产、生活行为和各种言行都将产生出大量的半结构化、非结构化信息数据,信息数据的组成结构、类型格式、存在形态等都愈加复杂。读者的信息也不象现在这样简单了,既要有当前通用的数据记录中的个人身份、借阅记录等结构化数据外,还需要大量的存储信息行为、搜索方式、行为痕迹等半结构化、非结构化数据。

       传统的网络结构设计是以用户端向服务器发出请求,由服务器应答返回结果给客户的垂直结构。而在大数据时代,大量的数据都存储在分布广泛、不同地域、各种类型的服务器中。当用户发出一个搜索或查询请求时,最多的运算是服务器之间的信息交换,收关将结果返回给用户。显而易见,水平结构的横向请求服务将取代垂直结构的服务请求。

       这就对图书馆的网络基础设施及数据存储能力提出更高的要求。至少在三个方面需要考虑:首要,设计网络架构时需要将存储、计算需求分布到为大规模分布式数据密集型应用中,网络系统的存储与计算能力,能满足存储和分析 TB甚至PB 级别的数据;第二,网络系统具备一定的智能分析能力以减少数据痕迹(如大数据压缩、自动数据分层及重复数据删除等);第三,网络系统设施能将分块的大数据集快速复制到集群服务器节点进行处理,并具有保护高度分布式基础设施和数据的可信应用体系。

       信息技术的大量应用,将突破传统图书馆发展的局限性,超强的数据处理能力,信息资源的整合,动态资源分配,新型馆藏数据与结构,这些都将为大数据的应用奠定物质基础。


       2.对图书馆信息检索分析能力和传统服务模式的挑战

       图书馆必将在大数据时代产生巨大的变化。首先,图书馆的服务质量提升需大数据的支持。大数据时代,数据的形态多样且富有价值,数据的处理将形成新的产业。图书馆间的竞争不仅仅是馆藏资源、建筑空间、服务水平的竞争,更为重要的是大数据的拥有量及对庞大数据的挖掘与分析能力将成为大数据时代的图书馆竞争的一大关键因素。图书馆的发展将取决于对大数据的分析与预测能力。可以说,数据的深层分析与价值挖掘将是信息服务机构的主要业务。图书馆的信息服务将面临以复杂数据为对象、以深度挖掘为手段、以满足需求为标准的挑战。图书馆需要通过搜集各种数据了解客户的需求,以便找到更好的服务营销模式应对未知的危机与挑战。

       其次,大数据将成为图书馆的核心资产。随着人们对大数据价值认识的提升与业界对大数据分析技术的日渐成熟,大数据将变得越来越有价值,大量的习以为常的数据,如读者借阅习惯、服务消费痕迹等都有可能为图书馆的发展及服务进行趋势分析和预测提供支撑。图书馆不仅需要通过结构化数据了解现在客户享受了哪些图书馆服务,也更需要利用大量的非结构化数据、半结构化数据在图书馆--用户的服务关系中去挖掘正在发生什么、预测和分析将来会发生什么,以便图书馆找到更好的服务营销模式应对可能的危机及挑战。

       再次,建立数据驱动的 E-Science 服务模式。大数据时代,图书馆的核心竞争力不仅仅是文献数据信息的竞争,多类数据的拥有、融合、挖掘与利用水平才是图书馆行业间竞争的关键因素。因此,加强对多类数据资源的采集与管理将成为大数据时代图书馆资源建设的一大内容。信息分析将由传统常规分析向广度、深度分析发展。数据分析将成为图书馆知识服务体系创新与完善必不可少的支撑点。图书馆不仅需要通过数据了解现在知识服务过程发生了什么,更需要利用数据对科研创新过程及知识服务过程将要发生什么进行分析和预测。

       第四,技术引擎将成为图书馆信息服务的技术核心。如何利用大数据技术构建图书馆的新型知识服务引擎,将会是未来几年图书情报领域信息技术研究的主要内容。新型知识服务引擎包括资源及学术搜索引擎、资源及服务推荐引擎、知识服务社区实体行为智能分析引擎、用户知识需求预测引擎、及多维度信息资源获取、组织、分析及决策引擎等。例如美国 Hiptype 公司应用大数据技术来分析电子书读者阅读习惯和喜好,这也是国内外图书情报领域首例利用大数据技术构建知识服务社区实体行为的智能分析引擎。

    

      3. 对图书馆职业和人员素质的挑战

      未来国家的核心竞争力将很大程度上依赖将数据转化为信息和知识的速度与能力,而这种转化速度和能力,实际上则取决于大数据方面的专业人才。

       图书馆职业是与知识和信息有着天然关联和紧密联系的职业,是以促进人类知识的交流与利用为己任的职业。数据概念的外延与信息和知识的外延本身就交错重叠,不可分割。数据是图书馆馆藏资源的重要组成部分,数据作为原始类的产品可经过加工、整理和分析提炼转化为信息和知识,以便在人类生产生活当中发挥更大的作用。因此对大数据主题的研究也是图书馆职业的份内之事,是图书馆人认清时代发展方向,主动把脉并参与到社会发展脉动之中的体现,显示出图书馆职业在信息社会中谋求生存和发展能力的迅速提升。

      美国学者对图书馆员在大数据环境下的角色和所需专业技能做了调查与设想。他们认同图书馆可以在大数据时代中承担起数据管理的职责这一观点,同时也通过实证型研究认识到目前绝大多数图书馆员并不具备数据科学人才必备的素质与知识结构。

       图书馆作为学术性的信息服务机构,应持续跟踪包括大数据在内的新兴技术的发展,积极思考并尝试应用新兴技术解决图书馆信息服务面临的一系列问题,尤其是要尽快提高从业人员的综合素质与应用新技术的技能。作为无处不在的大数据,数据发现效率与数据的规范程度是呈正比的,而图书馆职业对知识规范性控制的思想和技术方法也许会在大数据领域派上用场。

    

       4.数据图书馆对传统图书馆未来发展趋势的挑战

       图书馆在文献信息资源的组织与服务方面积累了丰富的经验,已成为科研教学和信息知识交流体系中的有力支撑。但随着学术信息交流方式的变化和大数据技术的发展,存储在各类数据库和文档系统中的科学数据及其它元数据体系,将构成一种新型的、分布式的数据库系统。数据档案库将超越一般文献档案库而成为图书馆的主要处理对象。因此数据图书馆将成为未来图书馆的发展方向。

       这种数据图书馆既包括传统数字图书馆的各类处理、管理、检索服务等功能,又包括数据转换、可视化和数据挖掘服务等新型数据服务功能。有可能出现下述特征:

       ① 基于网络和数据场的学术过程记忆,引文索引和评价将不再起主导作用;② 数据场中信息的类型、来源渠道和获取方式都是多元的;③ 各种数据的流动、交互操作、融合、引用等都将留下轨迹,隐性的数据流动转变为显性的,甚至可视化,并可在网络中记载和显现这种过程;④ 学术过程可以机读信息发布于互联网,数据与信息高度融合;⑤ 科学研究的部分甚至全部过程都可以在数据图书馆的电子环境中开放进行;⑥ 科学研究的素材、思路、过程和结论都能得到传播和共享。

      上述特征的出现标志着科学向数据密集型科学研究范式转换的成功,标志着一种新的常规科学的形成,必将引发科学研究观念和方法的重大突破和创新发展,并将对专业图书馆产生新的需求。因此,建立融数据和文献于一体的新型数据图书馆是必然趋势。


喜欢 0
收藏 0
0条评论
查看更多评论