论文网首页|会计论文|管理论文|计算机论文|医药学|经济学论文|法学论文|社会学论文|文学论文|教育论文|理学论文|工学论文|艺术论文|哲学论文|文化论文|外语论文|论文格式
中国论文网

用户注册

设为首页

您现在的位置: 中国论文网 >> 理科论文 >> 统计学论文 >> 正文 会员中心
 物理论文   统计学论文   数学论文   地理论文   农林学论文   其他理学论文   化学论文   生物学论文   环境学论文
 自动化专业
图书馆数字资源访问统计研究(1)

 1 图书馆数字资源访问统计的现状

    1.1 典型的研究计划
    美国和欧盟针对图书馆数字资源的访问统计已经展开了一些针对性的研究计划,比如,由美国研究图书馆协会资助的e-metric项目、美国多个机构(包括arl、jisc、niso等)资助的counier项目、欧盟telematics for libraries programme支持的equinox项目等,这些项目多为研究制定描述电子信息服务和资源的统计指标和绩效测度及其方法。
    1.2 相关标准
    在相关的标准方面,面对新的信息环境和图书馆形态,一些组织开始尝试将新的电子资源绩效评估标准融入原有相关标准/指南的框架。例如niso在2004年批准了图书馆和信息提供者信息服务和利用的测度和统计数据字典(niso z39.7-2004 information services and use:metrics & statistics for libraries and infomation providers--data dictionary),该标准在传统图书馆工作的基础上,还特别增加了网络服务、网络资源、网络运行的新的测度方法,这套数据字典将逐渐纳入美国图书馆统计工作,成为美国图书馆统计工作的参考依据,
    icolc1998年制定的《网上索引、文摘和全文资源使用统计测度指南》(guidelines for statistical measures of usage of web-based indexed,abstracted and full text resources)提供了一套网络化信息资源使用的绩效测度指南。wwW.11665.coM2001年的修订版明确了网络信息使用数据统计的最基本要求,并提供在隐私、保密、获取、传递和报告形式方面的指导。
    iso iso/cd 11620也在传统服务统计指标的基础上,结合icolc和counter的研究,进行了图书涫数字资源测度及其定义、方法的描述。
    1.3 国内图书馆数字资源访问统计的研究和应用
    国内随着公共图书馆、大学图书馆、科学图书馆系统图书馆评估工作的进行,图书馆界开始逐步重视对图书馆数字馆藏、图书馆数字化信息服务的评估。
    参考文献2中提出了数字资源后评估的概念,但是对图书馆数字资源访问统计等后评估的方法和指标体系尚未全面展开评论。一些图书馆自行开发了基于jsp或者asp的图书馆网站访问统计软件,一些数字图书馆系统,如清华同方的tpi、北京拓尔思的trs、浙江天宇的cgrs等等也提供了相应的统计功能,但是尚没有一款商业化的软件针对图书馆的各种类型的数字资源提供一揽子的访问统计方案。

      2 图书馆数字资源访问统计的方式

    2.1 web日志方式
    web服务器在工作时,时刻将/yuyanlunwen/" target="_blank" title="">语言自行开发
    通过web服务器的日志可以获得用户访问图书馆网站信息的情况,但是,这种方式需要对日志的格式进行了解,然后用相应的工具软件或者进行一定的开发来完成。还有一种获取网站访问情况的方法是利用asp或者isp等网络脚本语言,利用它们内置的server、session、request对象等获取相关的信息,获取数据进行统计。比如:利用jsp我们可以用jsp的内置request对象的获取参数方法request.get parameter("userid"),获取用户名;用(request.get remote addr)获取访问者的ip地址;通过request.get header("user-agent")获取包含浏览器和操作系统的信息,然后用字符串分割substring()方法来分别得到浏览器和操作系统;通过jsp的内置对象session的方法session,get creation-time()返回session被创建的时间,而session.get last accessed time()则返回当前session对象最后被客户发送的时间,两者之差为停留时间。
    主要分以下几个开发步骤:
    (1)确定将要统计的信息;
    (2)建立数据库;
    (3)实时的访问信息纪录,记录每次点击的信息,包括页面信息、用户信息、访问ip、访问时间;
    (4)实时信息的分类存储;
    (5)显示方式的选择。可以用windows的表格系统,也可以自行编制表格显示。
    利用这种方法相对比较简单,但是可获得的统计指标也有限。
    除了上述几种统计方式外,还有基于路由器的流量统计、基于防火墙的流量统计、基于以太网广播特性的流量统计。但是这些方法所提供的简单流量的统计功能,不能完全满足图书馆数字资源访问统计的目标。

     3 图书馆数字资源访问统计的指标

    3.1 国际图书馆联盟的统计指标指南
    国际图书馆联盟认为,信息资源提供商对他们提供的特定的电子信息资源所提供的统计数据应该满足以下的最低需求。
    必须提供的数据元素是:
    a)会话(session)数量(或者登陆数量)number of sessions。为了满足政府机构和专业组织的报告的需要,应该提供会话数量或者登陆数量。在没有国界的网络环境中,会话数量的统计是一个粗糙的指标。
    b)提问数(number of queries),即经过分类的提问数量。一次检索是一次独立的知识查询。典型地,一次检索被记录为向服务器提交的一个检索表单,之后的浏览行为或者选定一个单独条目的行为没有表现为额外的检索,除非通过提交二次检索。立即进行重复的检索、双击或者其他用户的无意识行为都不应计入其内。
    c)菜单的选择数(number of menu selections),如果数据的显示需要通过使用菜单来进行浏览,则应该提供这个指标(如一个电子期刊网站提供的基于音序和主体的菜单选择)。
    d)全文的数量(打开的、下载的或者提供给用户的全文,这些全文都是由服务器控制的而不是由浏览器控制的):
    期刊文章-按照期刊名称列出刊名和issn;
    电子书——按照书名列出书名和isbn;
    参考资料——按照改资源的内容单元(如字典的定义、百科全书的文章、传记等);
    非文本型资源——按照自愿的文献类型(如图像、音频、视频等)。
    上述的每个数据元素应该按照每个特定的数据库提供商、按照每一组机构的ip地址或其他特别的元素(如账号),以及机构名称、协会名称和时间跨度(每月或者每年)分组描述,供应商还应该提供每天、每小时的统计数据,并且还应该可以动态地集成几个月或者某一段时间的数据,而不用限制是当年数据还是由供应商限定的时间段。
    3.2 e-metrics推荐的统计指标
    为了了解图书馆数字资源的使用情况,确定数字资源的花费是否合理,mrl的e-metrics项目推荐的指标如下:
    (1)用户可检索的电子资源。包括:r1电子全文期刊种数、r2电子参考资源种数、r3电子书的种数。
    (2)对网络资源和服务的使用情况。包括:u1电子参考事务的数量、u2登录电子数据库的数量(会话session数)、u3电子数据库的提问和检索数量、u4电子数据库的请求条数、u5对图书馆网站和书目的远程访问次数。
    (3)网络资源和相关设备的花费。包括:c1全文电子期刊的成本、c2电子参考资源的成本、c3电子书的成本、c4图书馆对书目设备、网络环境等相关设备的花费、c5对书目设备、网络环境等相关设备的外部花费。
    (4)图书馆数字化活动。包括:d1数字馆藏的大小、d2数字馆藏的使用、d3数字馆藏建设和管理的成本。
    e-metrics的统计指标,既考虑了数字资源和数字化服务的访问量,还考虑了数字资源及其支持成本,便于从成本/效益的角度进行分析。
    3.3 我国图书馆常用的数字资源访问统计指标
    对于图书馆数字资源访问统计的指标,在我们常见的统计分忻工作中,统计指标围绕什么被使用?谁在使用?如何使用?什么时候使用?为什么使用?哪些资料经常被下载?哪些资料被检索最频繁?资料检索来自哪些单位?哪个单位使用量最多等问题,通常采用数字资源提供商提供的访问统计数据与对图书馆网站及自建数字资源的访问统计相结合的方式,除了资源提供商提供的数据外,往往采用网站访问流量、访问者的ip、网站点击次数、数字资源的点击次数、下载的篇数等指标。
与国外相比,我国图书馆的数字资源访问统计指标设定相对比较粗略,没有统一的、针对各种类型数字资源的一致的标准,而且统计指标往往仅仅反映了访问情况,未能与数字资源的购买和管理成本挂钩进行成本/效益分析。

      4 图书馆数字资源访问统计存在的问题

    4.1 资料库不在馆内,正确及时的统计数据不易取得
    随着各个图书馆在数字资源建设方面的积累和发展,图书馆数字资源的来源多样,既有通过远程镜像或者资源提供商服务器访问的数据,也有在本地镜像的数据,还有图书馆自建的数字资源。尤其对于资料库不在馆内的情况,需要厂商配合协助,但是最大的问题在于没有办法从厂商那里得到充分的数据,或是厂商提供的数据不标准,或是提供的资料不是图书馆想要的,而且由于统计数据是由资源提供商提供,其客观性和真实性的保障机制弱。这样,正确及时的统计数据不易取得。
    4.2 缺乏标准的统计指标
    由于资源来源多样,统计指标不规范,不同的系统提供的统计报告五花八门,没有统一指标。统计指标定义混乱、不明确,例如“search”在大多数系统内被定义为用户发送检索式的次数,但有些数据库却用“query”来表示同样含义的指标,而csa数据库则同时使用了“search”和“query”,二者的含义和区别并不明确。没有一致、标准、科学的统计指标体系,对用户访问统计的分析及其对图书馆决策的支持可信度就会降低。同时对于数字资源的访问统计指标还应该结合每种数字资源的类型、考虑数字资源服务的研究人员规模等参数。
    4.3 图书馆数字资源的后评估,应该结合多种评估途径展开
    图书馆数字资源的访问统计,是图书馆数字资源后评估的方法之一,目前的图书馆数字资源的访问统计存在统计指标不一致、不标准的问题,而且网站访问统计不能确定是否与使用者的目的相符,无法完全反映使用者真正的使用状况,因而,图书馆数字资源的后评估可以结合数字资源的访问统计、用户使用调查、用户访谈等方式完成。
    4.4 用户隐私的问题
    图书馆数字资源访问统计的数据主要来自web server的log files,目前法律上并无相关条文规定log file资料的处理,但由于其中包含使用者的ip地址,应该与图书馆的流通记录一样,加以保密。不论图书馆决定如何分析log file的数据,对于收集何种数据、谁能判读数据以及如何使用数据等,都应有详细的规定和说明,以免一时大意触犯子个人隐私权。未经个人用户同意,不能收集用户的个人信息,也不能将所收集的统计信息用于分析和识别用户个人信息。如果为提供特定服务必须采集用户的个人信息,必须向用户告知他的权利、个人信息用途及其保护方式,只有在用户知情同意的情况下才能基于该服务明确相关的个人信息。并且必须对合法采集的用户个人信息必须进行安全保管,未经用户同意不得公开,不得将个人信息转给第三方,而且服务中止后,必须立即删除。

【参考文献】
    1 /stats/newmeas/emetrics/index.html
    2 /index.html
    3 http://equinox.dcu.ie/
    4 /emetrics/index.cfm
    5,9 icolc.guidelines for statistical measures of usage of web-based information resources </article/ca411564?display=features news & industry
    7 张川,肖金升,周振,胡运发.具有访问时间完整性的web日志方法.计算机应用与软件.2004(2):105-107
    8 梁玉环,李村合,索红光.基于jsp的网站访问统计系统的设计与实现.计算机应用研究.2004(4):166-167
    10 詹丽萍.e-metrics在数位图书馆使用评估的应用.http://p105.lib.nctu.edu.tw/2001conference/pdf/1-1.pdf
    11 张晓林、宛玲、徐引篪、宋小冬、王欣.国家科学效字图书馆数字资源采购的技术要求.

  • 上一篇理学论文:
  • 下一篇理学论文:
  •  作者:佚名 [标签: 图书馆 数字 资源 统计 ]
    姓 名: *
    E-mail:
    评 分: 1分 2分 3分 4分 5分
    评论内容:
    发表评论请遵守中国各项有关法律法规,评论内容只代表网友个人观点,与本网站立场无关。
    农业院校图书馆电子阅览室管理探讨与研究
    浅论小型图书馆自动化建设
    图书馆数字资源访问统计研究
    | 设为首页 | 加入收藏 | 联系我们 | 网站地图 | 手机版 | 论文发表

    Copyright 2006-2013 © 毕业论文网 All rights reserved 

     [中国免费论文网]  版权所有