论文网首页|会计论文|管理论文|计算机论文|医药学|经济学论文|法学论文|社会学论文|文学论文|教育论文|理学论文|工学论文|艺术论文|哲学论文|文化论文|外语论文|论文格式
中国论文网

用户注册

设为首页

您现在的位置: 中国论文网 >> 医药学论文 >> 药学论文 >> 正文 会员中心
 药学论文   医学论文   临床医学论文   护理论文   口腔医学论文   肿瘤论文   妇产科学论文   内科论文   外科论文
 儿科论文   医学期刊
方剂配伍规律数据挖掘的研究现状及思考

                     作者:李文林,段金廒,赵国平,范欣生,尚尔鑫

【关键词】  方剂配伍规律;知识发现;综合集成;复杂系统

         从金·成无己于《伤寒明理论》中以君臣佐使研究张仲景方剂[1]至今,为了把握中医方剂应用历史嬗变的轨迹,寻找中医方剂的配伍方法及组方思路,人们利用哲学、数学等其他学科的方法或手段对方剂配伍规律的研究从未间断过。尤其是近年来,以大量经方、成方或个人临床经验组方中蕴含的配伍规律为分析对象,数据挖掘、人工智能等现代信息技术在中医方剂配伍理论研究中得到了广泛的应用,为拓宽中医理论现代化研究思路提供了一定的借鉴,但也暴露出一些问题。笔者现结合个人的研究体会对这些问题加以总结和探讨。

  1  应用现状

    目前,利用数据挖掘技术探讨方剂配伍规律的研究概括起来主要有以下3种模式:其一是以分类为主的数据挖掘研究,应用模式是运用不同的方法如判定树、贝叶斯网络、人工神经网络等,参考现行已知的方剂分类标准,将研究对象中的方剂按照组方药物的功效、性味或归经等分成若干类[2-6];其二是以聚类为主的数据挖掘研究,即按照相似性和差异性的分布,将数据对象按照不同的属性特征聚集为不同的类,然后结合领域知识对方剂的制方要素进行分析[7-12];其三是以关联规则为主的挖掘研究,即利用apriori算法、fp-tree及其变体,经过大量的预处理工作和谨慎的设计,把理-法-方-药之间的多维关系降维处理后,从药物与药物、药物与症状、症状与证型等不同属性之间的关联关系探讨方剂配伍模式[13-18]。www.11665.CoM上述不同方法对方剂配伍规律的研究取得了一定成绩,但挖掘层次多集中在药对、药组或药症、症证关联等局部信息的揭示上,从理-法-方-药整体层次对方剂的综合配伍规律进行探讨不多。同时,鉴于中医理论体系的“复杂性”与方剂配伍规律的“内隐性”,上述研究方法在信息提取的“准确性”、挖掘技术的“针对性”和挖掘方法的“适用性”等方面还存在一些共性问题。

  2  问题探讨

  2.1  方剂数据预处理
   
  信息处理中有一个著名的“garbage in, garbage out”理论[19],即数据挖掘最后成功与否,数据准备起到了至关重要的作用。针对药名、功效、方名、症状、证候等数据有多种不同的表述方式的普遍现象,为了对方剂文本中存在的词义模糊、词义涵盖或多词义交叉的描述信息进行规范和统一,目前大部分研究者采取的方式是依据现有中医药教材或相对权威的工具书对原始数据进行相应的规范,如涉及药名的依据《中华本草》、涉及方名的依据《中医方剂大辞典》、涉及症状的依据《中医症状鉴别诊断学》、证型依据《中医证候鉴别诊断学》、剂量参考《中华人民共和国药典》中采用的国际单位制等,也有些研究者则根据个人研究方法的需要利用本体技术建立了相应的基础词表。事实上,除了《中医药学主题词表》外,上述工具书本身对症状或证型等名称的表达以及其中涉及的过程类、状态类或层次关联类语义信息的描述也是基于自然语言,因此,不同的人对药物名称、症状名称、剂量表示等制方要素进行表达方式的统一及对方剂内的药味配伍与其针对的相应症状之间的因果关系的“解析”和“映射”,或许可以满足一种方法应用时对数据“一致性”、“正确性”和“可靠性”的要求;但放大到其他方法,则存在数据源的融合度低、可扩展性差、共享程度不高等问题,不能为提高文献处理的准确性和一致性提供良好的支撑环境。

  2.2  数据挖掘方法平台的构建
   
  科学研究过程首先需要对未知领域进行分析和推测,明确研究目标和现实技术方法的内在联系,然后寻找最佳的方法进行检验。数据挖掘的不同算法都是针对应用中的具体问题提出的,一种建模方法只是对被研究问题某一方面的简化了的分析。中医方剂是一个复杂的信息系统,一味药物的多种药效在不同剂量和配伍下,药效的主次地位会发生变化,且不同药物的组合相互作用后会影响整个方剂功效的趋向,对类似的涉及药物之间联系和层次关系的认识和分析,都需要借助相应的技术和方法,才有可能实现对方剂处方规律进行较深层次的挖掘。而从应用情况来看,目前大部分学者还只是从各自专业的角度,通过特定的抽样技术或方法对被研究问题所有数据的一个区间进行了局部的探讨,针对同样数据对象、不同数据挖掘方法之间缺乏比较,针对整体数据,也缺乏不同方法的有机融合。如同样是对方剂信息进行挖掘,基于频集模式发现的关联规则可以从药物与药物、药物与症状、症状与证型之间的关联结果去揭示方剂配伍关系;而分类和模糊聚类分析的方法,则可以从聚类的最优个数以及变量的组成方面去解析方剂配伍关系。从表面上,这些方法所得的结果看似都有一定道理,但由于无法发现不同方法针对同一问题所得结果中的共性和差别,因而面对不同方法所得离散的、多点分布的挖掘结果,似乎依然无法把握同病异治的不同方剂或异病同治的某一类方剂配伍规律的脉络。

  2.3  数据挖掘结果评价
   
  数据挖掘应用特定方法对数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性。一般来说,数据挖掘所得到的信息应具有未知、有效和可用3个特征。先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,有时挖掘出的信息越是出乎意料,就可能越有价值。但在中医药领域,一方面目前的挖掘结果仍以验证性的居多,即大部分结果还是在用配伍的已知原则与理论和通过相对简单和固定的方法就能获得的结果在相互印证;另一方面,即使挖掘出了先前未知的信息,如何验证这些挖掘结果的有效性和可用性?一般情况下,对数据挖掘结果的评价,最直接的是将挖掘结果结合专业背景及专家意见通过临床或实验室验证。但面对医学数据的社会性和法律约束性等特点,不同的数据挖掘方法获得的结果对问题的实际解析有可能差之毫厘却谬以千里。因此,如何对医学数据挖掘结果进行有效性评价,已经迫切地摆在了我们的面前。

  3  思考
   
  生命系统研究当前的最佳支撑点是中医药学的整体性和系统性理论,在这样的理论指导下,越来越多的医学研究试图从多点的、局部的分散式研究走向系统的、整体研究阶段。以方剂配伍研究所积累的多方面的基础数据为对象,传统数据处理技术因处理数据之间各种联系和因果关系的局限性所呈现的相互独立的分析结果,已经不能满足人们对某一方面知识的整体性和关联性的需求。目前,中医界越来越多的研究者希望通过加强信息处理以及各种新技术的应用,从批量的信息或数据之间找到具有科学意义的关联,以便对方剂配伍规律做出层次性的解释,来提高临床和实验室研究体系的效率和产出。
   
  近年来,国外以生命科学中积累的大量信息和巨量文献为对象,以知识发现为目的的数据挖掘技术,在基因、蛋白质、疾病、药物及其相互关系的研究中已取得显著成绩[20],并有研究结果得到临床和实验室的验证[21],给国内中医药的知识发现研究提供了思路和方法学的借鉴。
   
  首先,在数据挖掘对数据的规范要求方面,美国国立医学图书馆自1986年开始研制的统一医学语言系统(unified medical language system,umls,由超级叙词表、语义网络、信息资源及专用词典组成),以其实时更新、面向互联网免费开放的应用方式,有效地克服了计算机生物医学信息研究领域的两个显著障碍:相同的概念具有不同的表达方式,有用的信息分散在不同的数据库系统中,在医学词汇的规范、统一、标准化、科技信息的交流以及深层次自然语言处理方面发挥了巨大作用。国内科技信息界虽在20世纪90年代后也相继进行了分类-主题词一体化词的研制工作,如中国医学科学院信息所图书馆编制的《中图法与mesh、中医药学主题词对照表》,在中文生物医学文献计算机标引和分类等方面提供了良好的支撑环境。但由于数据更新不及时、共享机制不完善,这些词表在满足医学数据挖掘对概念术语的名称、表达方式、语义类型统一规范的保障与支撑需求方面总显得力度不够。因此,一方面,中医数据规范依据的缺失是造成中医药语料处理困难的一个难以回避的瓶颈;另一方面,即使有了数据规范的标准,倘若不能象umls那样通过信息的无障碍传递而实现这些基础科学数据的共享,则依然会阻碍基于信息技术通过事物的共性研究而进行事物分类和知识发现的进程。
   
  其次,国内针对中医药数据挖掘的研究,大部分是基于单一方法的应用,而国外生物医学领域的知识发现研究,在技术平台方面往往是机器学习、文本挖掘和网络信息技术等多种方法与技术的融和。在研究团队方面则是由临床、信息检索、数据挖掘等不同专业背景的研究人员共同构成。典型的案例如以pubmed数据库中积累的关于某一疾病的大量文献为分析对象,swanson[22]利用arrowsmith系统对镁缺失与偏头痛的关联关系的探讨、hristovski d等[23]利用bitola系统对多发性硬化病病因的分析、kristina m hettne等[24]基于medscan和pathwayassist软件对复杂性疼痛综合征的发病机制的推测等等。这种以专家群体、数据和各种信息技术有机结合的形式进行生命科学知识发现的研究模式,恰恰是1990年钱学森院士提出的“把专家体系、数据和信息体系以及计算机体系有机结合起来,从定性定量综合集成角度处理复杂问题”的综合集成方法体系[25]的体现。
   
  中医理论体系的复杂性与临床诊疗的个性化决定了方剂配伍规律的“内隐性”,与方剂相关的症状证型、治则治法、药味组合、剂量剂型等各个环节的差异又造成了方剂信息的多样性和复杂性。可以设想,针对方剂配伍规律的知识发现研究,只能是由相宜的方法和技术组成的多模块的系统模型,既要反映中医学认识论整体、综合、联系的特点,符合中医定性模糊思维特征,又要能定量描述药物之间的配伍关系、药物配伍与病证的针对性。借助这种综合集成的技术平台的支撑,或许我们可以从经方或类方入手,对同病异治的不同方剂或异病同治的同类方剂之中蕴含的共性和差异性信息进行多层次的探讨,从而为方剂配伍规律知识地图的呈现提供线索与思路。
   
  另外,在关于数据挖掘结果的评价方面,由于数据挖掘技术汇集了来自机器学习、模式识别、数据库、统计学、人工智能以及管理信息系统等各学科的成果,因此对其进行评测本身就是一种全新而富有挑战性的工作。关于中医药领域数据挖掘结果的评价方案,北京中医药大学的任廷革教授曾在针对名老中医的病案处方进行数据挖掘的研究中提出,可以围绕“方证”关系,从“方证一致性、法(治则治法)-效(处方功效)一致性、性(处方综合性味归经)-候(处方主治症候)一致性、处方药效释放率等方面对挖掘结果进行分析和评价”[26]。国外常见的模式是,一个研究团队利用一种技术平台进行的综合知识发现结果可以由其他团队利用另外的方法或平台进行验证。如hristovski d[27]利用bitola系统、weeber m等[28]使用dad (disease adverse drug reaction-drug)系统曾分别对swanson关于“雷诺氏病与鱼油”和“偏头痛与镁”的研究结论进行验证性研究。虽然目前还没有相对成熟的评价模式,但可以预见,随着数据挖掘方法和技术在医学领域应用范围的增多,如何对数据挖掘方法或产生的结果进行科学合理的评价也将成为一个有意义的研究课题。

  4  总结与展望
   
  数据挖掘是一个领域专家合作的过程,这一过程要反复进行,并在反复过程中不断地趋近事物的本质。根据钱学森院士提出的综合集成理论,可以想象,以开放的中医药统一医学语言系统为数据规范依据,构建面向方剂配伍知识发现的多模块综合集成数据挖掘支持系统是方剂配伍规律知识发现研究的努力方向。综合集成方法的实质是把专家体系、数据和信息体系以及计算机体系有机结合起来,从定性定量综合集成角度处理复杂问题[29]。在这样的集成系统支撑下,我们可以在最大限度地跨越语言表达的差异性和相关信息的分散性前提下,从不同角度对其中蕴含的相关性和规律性信息进行全面探讨,并将研究结果以知识地图的方式加以呈现,从而为方剂的临床运用以及实验研究提供线索与思路。
   
  当然,要达到这样的效果,无可避免地要讨论中医方剂理论中现存的一些问题以及不同学派和专家的不同认识等,如方剂配伍君臣佐使之间如何分工?方剂配伍及其所主病证之间存在的君药对主证(症)和臣药、佐使药对兼证(症)之间的针对性如何界定?怎样将问题求解中所需要的专家知识、背景知识、领域知识进行确切的描述与表达?以及由此产生复杂系统知识组织的维护与理解等问题。然而,利用信息技术探讨、解决这些问题的过程,不仅是信息时代自然语言处理、人工智能等领域的创新成果应用于方剂配伍规律理论探讨和实践要面对的重要内容,也是复杂系统思想指导下方剂配伍规律的知识发现必须要面对的问题。这种实践不仅可以使中医方剂理论得以深化,使临证处方选药向标准化、规范化的方向发展,同时也是证候本质研究、方剂作用机制研究、方剂适用范围研究等领域找到突破口的希冀所在。

【参考文献】
  1] 董正华.试论《伤寒明理论》的学术成就[j].陕西中医学院学报, 2002,25(3):1-2.

  [2] 刘齐宏,唐常杰,李 川,等.基于属性归纳的中药方剂数据挖掘[j].计算机应用,2007,27(2):450-452.

  [3] 彭 京,唐常杰,曾 涛,等.基于神经网络和属性距离矩阵的中药方剂功效归约算法[j].四川大学学报(工程科学版),2006,38(1):92-95.

  [4] 雍小嘉,彭 京,韩佩玉,等.采用空间矢量方法判断方剂功效倾向新论[j].辽宁中医杂志,2005,32(7):660-662.

  [5] 于润桥,危 荃,王建红,等.基于粗糙集理论的右归丸配伍研究[j].辽宁中医药大学学报,2007,9(2):3-6.

  [6] 孙 燕,臧传新,任廷革,等.支持向量机方法在《伤寒论》方分类建模中的应用[j].中国中医药信息杂志,2007,14(1):101-103.

  [7] 陈学进.数据挖掘中聚类分析的研究[j].计算机技术与发展,2006, 16(9):44-49.

  [8] 王咏梅,马 红,刘苏中.方剂配伍的模糊数学特性研究[j].中国实验方剂学杂志,2000,6(6):59-61.

  [9] 蒋永光,李 力,李认书,等.中医脾胃方配伍规律的数据挖掘试验[j].世界科学技术——中医药现代化,2003,5(3):32-35.

  [10] 张晓杰.荨麻疹辨证论治规律的聚类分析[j].山东中医杂志,2003, 22(12):709-711.

  [11] 张 静,徐忠恒,雷钧涛,等.逍遥丸的模糊聚类分析[j]. 吉林医药学院学报,2006,27(1):6-8.

  [12] 周 鲁,唐向阳,付 超,等.解表类中药的模糊聚类分析[j].华西药学杂志,2004,19(5):339-341.

  [13] 姚美村,艾 路,袁月梅,等.消渴病复方配伍规律的关联规则分析[j].北京中医药大学学报,2002,25(6):48-50.

  [14] 杨雪梅,王 君,林端宜.明清脾胃湿热方用药关联规则挖掘[j].江苏中医药,2007,39(1):45-47.

  [15] 周忠眉,林宝德,肖 青.古代方剂与新药方剂高频药组配情况分析[j].漳州师范学院学报(自然科学版),2004,17(1):19-21.

  [16] 张万水,陈利国,黄运坤,等.数据挖掘技术及其在中医遣方用药规律中的应用[j].辽宁中医药大学学报,2006,8(4):62-64.

  [17] 陈 波,蒋永光,胡 波,等.东垣脾胃方配伍规律之关联分析评述[j].中医药学刊,2004,22(4):611-613.

  [18] 纪荣芳,牛建昭,许树强,等.从数据挖掘角度看中医药治疗健忘与痴呆[j].中日友好医院学报,2006,20(6):337-339.

  [19] tamraparni dasu, gregg vesonder, jon r, et al. data quality through knowledge engineering, conference on knowledge discovery in data archive, proceedings of the ninth acmsigkdd international conference on knowledge discovery and data mining[c]. washington, d.c.2003.705-710.

  [20] 周雪忠,吴朝晖,刘保延.生物医学文献知识发现研究探讨及展望[j].复杂系统与复杂性科学,2004,1(3):45-48.

  [21] 董风华,兰小筠.基于文献的知识发现工具——arrowsmith[j].情报杂志,2004,(5):52-54.

  [22] swanson d, smalheiser nr. an interactive system for finding complementary literatures:a stimulus to scientific discovery[j]. artificial intelligence,1997,91:183-203.

  [23] hristovski d, peterlin b, mitchell ja, et al. using literature- based discovery to identify disease candidate genes[j]. int j med inform,2005,74(2/4):289-298.

  [24] kristina m hettne, marissa de mos, anke gj de bruijn, et al. applied information retrieval and multidisciplinary research:new mechanistic hypotheses in complex regional pain syndrome[j]. journal of biomedical discovery and collaboration,2007,2(2):1-16.

  [25] 黄志澄.以人为主,人机结合,从定性到定量的综合集成法[j].西安交通大学学报(社会科学版),2005,25(2):55-57.

  [26] 任廷革.中医学术和临证经验的继承的技术和方法研究[c].名老中医思想临床经验传承高级研修班资料汇编.2007.119-123.

  [27] hristovski d, stare j, peterlin b, et al. supporting discovery in medicine by association rule mining in medline and umls[j]. medinfo,2001,10(pt 2):1344-1348.

  [28] weeber m, klein h, aronson ar, et al. text-based discovery in biomedicine:the architecture of the dad-system[a]. proc amia symp[c].2000.903-907.

  [29] 王 阶,王永炎.复杂系统理论与中医方证研究[j].中国中医药信息杂志,2001,8(9):25-27.

  • 上一个医药学论文:
  • 下一个医药学论文:
  •  作者:李文林,段金廒,赵国平,范欣生,尚尔鑫【关键词】 [标签: 配伍 数据挖掘 ]
    姓 名: *
    E-mail:
    评 分: 1分 2分 3分 4分 5分
    评论内容:
    发表评论请遵守中国各项有关法律法规,评论内容只代表网友个人观点,与本网站立场无关。
    中西药配伍禁忌探讨
    脂溶性维生素注射液(Ⅱ)与3种输液的配伍稳
    注射用亚硫酸氢钠穿心莲内酯与2种输液配伍的
    中药桑寄生治病方剂与药膳
    中药注射剂与其它药物配伍的思考
    中西医结合治疗肠粘连78例 附经验方剂预防肠
    浅谈中西药的合理配伍应用
    活血化瘀配伍祛痰散结药治疗卵巢囊肿体会
    沙美特罗替卡松粉吸入剂配合氨茶碱治疗哮喘
    新瑞普欣与潘诺存在配伍反应
    中西药配伍的药理分析
    中医方剂功效定性和定量研究初探
    | 设为首页 | 加入收藏 | 联系我们 | 网站地图 | 手机版 | 论文发表

    Copyright 2006-2013 © 毕业论文网 All rights reserved 

     [中国免费论文网]  版权所有