首    页

关于我们

产品发布

其它产品

成功案例

公司动态

服务与支持

联系我们

    我国医院信息化建设
医院移动信息管理系统
医院信息化建设历史与现状...
医院信息系统的框架结构
典型案例研究
数据挖掘技术在医院信息化...
    企业文化

董事长兼总经理:丁晓良。工学博士、经济学博士、工商管理硕士。

    服务与支持            
用户购买我公司产品后,可以通过QQ、电话,邮件与我们联系,您的意见和建议将更好的促使完善产品,我们也将根据这些信息反馈为您提供更好的个性化服务。

MEOR 

      首页 >> 数据挖掘技术在医院信息化建设的应用
    近年来,随着电子信息技术的迅速发展,医院信息系统(HIS)和数字医疗设备的广泛应用,医院数据库的信息容量不断膨胀。数据库技术的发展解决了海量数据的存储和数据检索的效率问题,但无法改变“数据爆炸但知识贫乏”的现象。如何充分利用这些宝贵的医学信息资源来为疾病的诊断和治疗提供科学的决策,促进医学研究,已成为人们关注的焦点。数据仓库及数据挖掘(Data Mining,DM)是近几年才发展起来的信息处理技术,它是从大量数据中提取出可信的、新颖的、有效的并最终能被人理解的模式的处理过程,涉及数据库、人工智能、统计学、模式识别、可视化技术、并行计算等众多领域知识。医学数据挖掘是一门涉及面广、技术难度大的新兴交叉学科,需要从事智能信息处理、计算机、应用数学的科研人员与医务工作者通力合作。将数据挖掘技术应用到医学信息数据库中,可以发现其中的医学诊断规则和模式,从而辅助医生进行疾病诊断。
一医学数据挖掘的过程
医学数据的特点使得医学数据挖掘与常规的数据挖掘之间存在较大的差异,但医学数据挖掘仍遵循一般的知识发现过程,可按以下几个步骤进行。
1 理解应用领域。这一阶段主要包括确定医学研究的问题和目标,熟悉当前解决此类问题的主流方法,理解相应的医学领域知识,确定医学数据挖掘的目标和结论的评估标准。
2 理解数据。这个过程要求初步确定数据挖掘需要的数据属性,并从原始数据库中小规模采样进行初步挖掘试验,将试验结果与上一步骤所确定的挖掘目标进行对照比较,必要时更新数据属性。
3 准备数据。这是决定整个医学数据挖掘结论正确与否的关键性步骤。由于医学数据的冗余性特征,我们需要在重要性和相关性检验的基础上采样以消减数据;又由于医学数据的多样性,我们必须针对各种类型的数据采取相应的数据预处理方法,这方面的内容后面将有详细的讨论。通过这个步骤的数据准备,将原始数据转换为特定数据挖掘方法所需要的数据形式。
4 数据挖掘。这是医学知识发现过程中的另一个关键性步骤。这一步骤包括建模技术的选择,训练与检验程序的确定,模型的建立与评估。实现数据挖掘的方法包括粗糙集理论、神经网络、进化计算、决策树等,在下面将有详细的介绍。数据挖掘的精确度在很大程度上取决于挖掘方法与研究目标的匹配程度。
 5 评估所得到的知识。对医学数据挖掘的结论进行医学解释,并与最初的研究目标相比较。追溯整个数据挖掘过程中可能存在错误的步骤,并且寻找其解决的方法。通过使用各种挖掘方法,选择最佳的算法,得到最有效的模型。
6 应用所发现的知识。在应用所得知识的过程中,要有计划性地实施和控制,发现和解决实施过程中出现的问题,并对应用情况进行阶段性总结,指导今后的实际应用。
二相关的数据挖掘关键技术
1 数据预处理。数据预处理是数据挖掘过程中的一个重要步骤,尤其当数据库中包含噪声、不完整,甚至是不一致的数据时,更需要数据的预处理。在一个完整的数据挖掘过程中,数据预处理通常要花费60%左右的时间,而挖掘工作仅占整个过程的10%左右。数据预处理主要包括数据清洗、数据集成、数据转换和数据消减。
2 匿名化(Anonymization)与标识转换(Deidentification)。由于医学信息涉及到患者隐私信息的问题,还需要对患者记录进行匿名化和标识转换,从而分离患者与患者记录之间的关联关系。
3 医学文本数据挖掘。医学文本信息中,医学专家对影像、信号或者其它临床数据的解释是非标准化的,难以直接进行数据挖掘,因此需要对文本数据进行标准化处理。机器转换主要包括三个步骤:分析源语句,转换,产生目标语句。XML(eXtensible Markup Language)是一种结构化的语言,提供了文本数据标准化的途径。XML不仅能创建包含结构化数据的文本,同时也可以共享和处理数据,是数据挖掘和知识发现的关键技术。
4 影像数据挖掘。当前医学影像数据主要来自一些成像仪器(如B超、CT等),它们已被越来越多的医学专家视为一种可靠的辅助诊断手段。医学影像数据挖掘主要包括:去除或降低影像噪音的影响,提高目标影像质量或对目标组织进行边缘提取;对目标组织进行概念描述,并概括这类对象的有关特征,从而获得或验证有关参数的动态范围;医学影响数据的管理与检索。
二 数据挖掘在医院信息化中的应用
对医学数据库进行数据挖掘和知识发现的可以预测疾病和对疾病进行分类,发掘潜在信息。分类和预测是两种数据分析形式,可以用于描述重要数据类的模型或预测未来的数据趋势。医学数据挖掘常用的用于分类和预测的智能化方法有粗糙集理论、决策树、人工神经网络、进化计算等。
1 粗糙集理论(Rough Set Theory)。粗糙集理论近年来得到了迅速的发展和完善,是一种用于处理不确定性和含糊性知识的软计算方法。在医学数据挖掘中,基于粗糙集理论的规则产生模型可以自动发现临床数据库中的正例和反例知识;基于粗糙集理论的自主判别算法可以诊断肺部肿瘤是良性还是恶性的。
2人工神经网络(Artificial Neural Network)。人工神经网络方法模拟人脑神经元结构,是通过训练来学习的非线性预测模型,可以完成分类、聚类、关联规则挖掘等多种数据挖掘任务。目前,采用Bayesian神经网络结构,能够找出服用抗精神药物与心肌炎和心肌病发作的关系;运用组合神经网络可对危及生命的心律失常进行归类;还可以通过神经网络来动态检测病人的麻醉深度和控制麻醉药物的用量。
3 决策树(Decision Tree)。决策树是一种用树枝状展现数据受各变量的影响情况的分析预测模型,根据对目标变量产生效应的不同而制定分类规则,它是建立在信息论基础之上对数据进行分类的一种方法。决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。决策树在自动诊断心脏SPECT影像的课题和诊断心肌灌注的知识发现系统中有相应的应用。
4 进化算法(Evolutionary Algorithms)。进化算法是由生物进化规律而演化出的一种搜索和优化的计算方法,它包括遗传算法、进化规划、进化策略和遗传编程。进化算法从任一初始的群体出发,通过随机选择、交叉和变异等过程,使群体进化到搜索空间中越来越好的区域。采用遗传编程可对胸痛症状疾病进行诊断,运用进化算法可对脊柱的侧凸进行分类。此外,模糊系统、支持向量机等其它智能化方法在医学数据挖掘中也得到相应的应用。
医院数据库是一个复杂数据库,包括电子病历、医学影像、病理参数、化验结果等,而目前数据挖掘技术主要应用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚处在起步阶段。结合医学信息自身具有的特殊性和复杂性,处理好挖掘过程中的关键技术,医学数据挖掘将有广阔的应用前景。
    友情链接
Copyright 2006-2008 北京科创无限技术有限公司    技术支持:七色互联