论文网首页|会计论文|管理论文|计算机论文|医药学|经济学论文|法学论文|社会学论文|文学论文|教育论文|理学论文|工学论文|艺术论文|哲学论文|文化论文|外语论文|论文格式
中国论文网

用户注册

设为首页

您现在的位置: 中国论文网 >> 医药学论文 >> 药学论文 >> 正文 会员中心
 药学论文   医学论文   临床医学论文   护理论文   口腔医学论文   肿瘤论文   妇产科学论文   内科论文   外科论文
 儿科论文   医学期刊
中医古籍电子化系统的研究与实现

                  作者:符永驰 李斌 郭敏华 刘国正

【关键词】  中医药信息 古籍数字化 中医古籍

  古籍数字化是当前中医古籍文献整理工作的热点。中医古籍传承了数千年中华医药文化,是宝贵的历史遗产。对中医古籍文献进行数字化处理,不仅可以再生性保护这些珍贵的中医古籍,而且为更加便捷地开发和利用古籍资源开辟了新的途径。
   
  通过对目前国内外古籍数字化尤其是国内中医古籍数字化的研究与发展现状的深入研究,结合中国中医科学院中医药信息研究所近几年来在中医药珍籍秘典的整理抢救、保护及相关研究方面所取得的经验,本研究提出了一种新的中医古籍电子化系统的解决方案。旨在介绍一种实现无缺/错字、图文对照、通用性好、检索快捷方便、输入/输出灵活、读者互动交流、辅助研究性强的中医古籍电子化系统。该系统具有电子化编辑、压缩、上传、存储、图书分组管理、读者分组管理、读者-图书授权借阅、网络在线阅读、原文图像浏览、图书需求信息分析、计费电子借阅、古籍学术论坛、短信互动平台、准确快速检索等功能。其科学、便捷、安全、高效的古籍资源管理,将进一步实现古籍阅览由传统方式向电子/网络方式的重大转变。

  1  系统主要功能结构

  1.1  中医古籍编辑平台
   
  中医古籍编辑平台提供对数字中医古籍的编辑处理功能。wWW.11665.COM我们开发了《古籍编辑器》软件,用来对古籍图片元数据进行标注和压缩,输出电子书。
   
  中医古籍电子书籍一般包含的信息有:①置标信息,古籍中的主要知识点,如病、证、方、药等;用于全文检索和浏览古籍图片;②原扫描图像,保待原图原貌,用于与文本信息对照使用;③书目的元数据信息,如分类、书名、成书年(出版年代)、作者、版本、馆藏地、内容提要、书籍特征、保管措施、复制状况等;④书的章节信息,用于划分清晰的书籍层次结构。
  
  其特点主要体现在以下方面: ①古籍的卷、章、节可以灵活分级管理;②支持对图片的标记和编辑,不会改变原始图片,可以搜索图片信息和图片的标记数据;③支持缩略图方式浏览章节中的图片,支持鼠标放大/缩小图片和旋转查看,图片能自动播放和根据显示器分辨率调整大小;④依据中医古籍总目的分类标准归类书籍。

  1.2  电子古籍发布系统
   
  电子古籍发布系统用于将中医古籍编辑平台输出的电子
古籍上传、解压、导入并存贮到阅览系统中。发布系统会根据古籍分类信息自动归入正确的分类位置并建立索引,以树状形式展示,且在树的每个层次上显示该层次结构下的总条目数,与原有书库无缝集成。

  1.3  电子古籍阅览系统

     电子古籍阅览系统实现了用户在线进行图文阅览,并可以记录用户在线阅览古籍的种类和时间信息,从而分析读者对各古籍的借阅和需求信息。同时,电子古籍阅览系统具有网上计费借阅功能,以便于珍贵古籍的保护和有效利用。计费借阅方案灵活,主要有按时计费(按实际借阅时间、包月/年等)、按书籍计费、按会员级别计费、按流量计费和综合计费。

  1.4  古籍信息搜索平台

     搜索平台具有简单查询、组合查询和全文搜索功能。对于中医古籍涉及众多生僻字的问题,平台建立了中医古籍的繁简字体对照表,增加繁简字体关联互检功能,提高搜索准确率,同时提供基于内容的高效检索和对知识的准确挖掘功能。

  1.5  学术论坛即时通讯

     古籍学术论坛和即时通讯平台提供读者与读者之间、读者与中医古籍管理员之间进行互动古籍学术交流和即时通讯功能。

  1.6  辅助软件操作平台

     辅助软件操作平台提供了字数词频统计、历史年表、古今纪年换算、干支/公元纪年换算、六十四卦表等辅助功能,为古籍研究者对古籍数据进行多角度的分析研究提供方便,从而提高系统的实用性和友好性。

  2  系统采用的主要技术

     考虑到基于java的web应用技术的实用性、灵活性和稳定性,同时结合基于j2ee的struts和实现数据持久化的hibernate框架的mvc设计模式所具有的优良特点,本文采用了该架构来构建高内聚、弱耦合、可维护和可扩展的中医古籍电子化系统。数据库采用oracle 9i,数据搜索采用oracle text技术。下面对其中一些关键技术予以介绍。

  2.1  mvc设计模式

     mvc(model-view-controller,模型-视图-控制器)是一种著名的用户界面软件开发设计模式,最早由xerox在20世纪80年代为smaltalk-80语言发展提出,后来被广泛应用于其它面向对象的编程语言中。mvc设计模式把应用程序分成了3个核心部分,将应用程序进行了分层,视图和模型通过控制器连接,从而减少了用户界面和业务逻辑之间的耦合,使程序设计更加清晰、灵活,也提高了软件的可扩展性、可维护性,克服传统web系统的不足之处[2]。

  2.2  struts框架

     struts框架是apache的一个开源项目,体现了mvc设计模式的特性,遵守了j2ee的servlet、jsp等技术规范,同时根据j2ee的特点做了相应的变化和扩展,是j2ee体系架构的一种轻量级实现。作为一款优秀的java web应用程序的开发框架,struts框架凭借其清晰性和灵活性,成为当前最为广泛应用的轻量级java web开发框架[3]。

  2.3  hibernate框架

     hibernate框架是开放源代码的对象关系映射工具(object-relational mapping),是一款基于java环境的优秀的对象持久化开发框架,根据o/r(对象/关系)映射技术思想,对jdbc进行了轻量级封装,使开发人员可以使用一种面向对象的方式来操纵和管理关系数据库,所以从技术本质上来说该框架是一种提供面向对象的数据库服务中间件[4]。

  2.4  oracle text搜索技术

     oracle text是一种功能强大的搜索技术,内置于oracle数据库中,其提供的开发api使软件设计人员能轻松实现功能齐备的内容搜索应用程序,可用于搜索结构化和非结构化文档,是对sql通配符匹配技术的补充。oracle text支持使用基本的布尔运算符(and、or、not、near等)将多个搜索条目组合到一起,同时具有更高级的功能,如soundex和模糊搜索以及结果排序等。该技术支持数百种文件类型,包括microsoft office和pdf。

  2.5  中医古籍中生僻汉字处理

     古籍生僻汉字问题是中医古籍电子化工作的一大障碍。目前很多电子化古籍系统采用偏旁相加的方法来写,看起来非常别扭,而且如果遇到无法用偏旁相加的方法来输入的汉字,表达起来会更为麻烦。本系统通过对中医古籍电子化中遇到的生僻汉字问题进行深入研究并对生僻汉字进行分析统计后,对其进行编码、造字,建立繁简字体对照表,增加繁简字体关联互检功能,从而有效提高了搜索准确率。用户可以通过输入相近的简化字或者生僻汉字的模糊发音,即可进行生僻汉字有关的查询搜索。这种简单易用的方法实现了古籍电子化中遇到的生僻汉字的存储、检索和显示,较好地解决了古籍电子化中遇到的生僻汉字问题。

  3  中医古籍电子化系统的实现

     从2002年开始,中国中医科学院中医药信息研究所先后承担了科技部公益项目《1 100种中医珍籍秘典的抢救整理》、《中医药珍贵典籍的保护技术及相关问题研究》的工作,已初步建立起中医古籍电子化系统。通过自主开发的《古籍编辑器》、《古籍发布系统》,已经完成了1 500种中医古籍的书目元数据信息编辑工作,850余种的数字中医古籍的编辑工作;建立起的中医古籍阅览管理系统,实现简单检索、组合检索、全文检索、模糊检索、精确检索,实现了用户的分级管理,图书分组管理、读者分组管理、网络在线阅读、原文图像浏览等功能。可检索信息48多万条。系统功能正在逐步的建设和完善。

     在系统建设中我们也碰到很多问题,如据根项目支持的经费,我们尚不能对数字化的中医古籍全文本化,那么如何实现阅读的检索呢·我们采取了对原书图标注的方法,通过标注,基本能实现古籍中主要知识点的检索。标注的度是达到检索量的要点,标注度过细,会大量增加工作量,标注度过粗,又会遗漏主要认知点,为此我们制定了标注的基本原则。数字古籍的图像,保待了原图原貌,除海外回归古籍是缩微胶片扫描完成外,原书扫描都是彩色储存。这样就大大地增加了储存的量,使图像的处理、图像上传及网上阅读都出现了速度慢的问题,为提高检索和阅读的速度,我们对数据库结构进行了多次优化和设备功能的提升,基本上解决了速度问题。速度问题随着数据量的加大,可能还会出现。

  4  小结

     本研究结合中国中医科学院中医药信息研究所多年来在中医药珍籍秘典的整理抢救、保护及相关研究方面所取得的经验,提出了一种基于数据库和web网络技术的中医古籍电子化系统的解决方案,并就解决方案设计了技术路线和系统架构。该方案已在中国中医科学院中医古籍电子化研究项目中得到了良好的应用并取得了一定成效。
   
  随着技术的进步和人们对电子古籍阅读需求的变化,中医古籍电子化系统是在不断发展,许多问题还需进一步研究。如:古籍中同药异名、异药同名,古籍中的病证和现代病名问题,这些目前已有相关的研究成果,如何利用这些成果建立起关联词表,将为中医古籍的阅读检索提供更加便捷的支持。

     电子古籍生僻汉字问题的研究。传统的计算机二字节编码技术只能处理2万多个汉字,对古籍中大量的生僻字、俗体字、异体字、通假字、避讳字无能为力。龙语瀚堂典籍数据库采用unicode四字节编码技术解决了古籍整理和研究中生僻汉字数字化的瓶颈,完善了汉字信息网络化的平台。
   
  提供人性化的电子中医古籍阅读方式也是一个值探讨的问题。新加坡电子书系统有限公司推出的e-book systems pte.ltd.解决方案,其用户界面将传统浏览的多媒体内容如数码相片、文字、音乐乃至动画等表现形式通过三维翻页界面以虚拟翻书页的方式呈现出来,将自然贴切的真实书本效果带入电脑及网络世界。如何将其技术应用到中医古籍电子系统中,我们还需进一步的探讨。

【参考文献】
    [1] 符永驰,孙海舒,李 斌,等.多媒体技术在中医药信息工作中的应用[j].中国中医药信息杂志,2006,13(12):103-104.

  [2] steve mcconnell. code complete[m]. washington:microsoft,2006. 101.

  [3] 孙卫琴.java网络编程精解[m].南京:东南大学出版社,2005.78.

  [4] elliott j. hibernate程序高手秘笈(影印版)[m].北京:清华大学出版社,2003.195.

  • 上一个医药学论文:
  • 下一个医药学论文:
  •  作者:符永驰 李斌 郭敏华 刘国正【关键词】 [标签: 电子 系统 实现 ]
    姓 名: *
    E-mail:
    评 分: 1分 2分 3分 4分 5分
    评论内容:
    发表评论请遵守中国各项有关法律法规,评论内容只代表网友个人观点,与本网站立场无关。
    湖南中医药大学学报
    中医专业本科生西医内科综合评估考核模式研
    《走进中医一现代人认识中医的8堂必修课》等
    罗定地区冠心病患者中医体质特点分析及中医
    穴位按摩护理技术在中医外科和中医骨伤科的
    从社区老年人的生活状况到老年中医护理及人
    实行中医专科三级护理查房提升中医护理水平
    不必硬把中医往唯物上靠警惕科学霸权损害中
    改革中医妇科教学模式 注重中医经典学习
    又是一年春节来,中医帮您把把脉——中医妙
    慢性心力衰竭的中医研究进展
    骨碎补在中医骨伤科的应用
    | 设为首页 | 加入收藏 | 联系我们 | 网站地图 | 手机版 | 论文发表

    Copyright 2006-2013 © 毕业论文网 All rights reserved 

     [中国免费论文网]  版权所有