基于优化主题模型的临床路径挖掘
作者:
作者单位:

作者简介:

徐啸(1990-),男,安徽宁国人,博士,主要研究领域为医疗大数据,数据挖掘;王建民(1968-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为大数据与知识工程,流程数据管理与挖掘;金涛(1980-),男,博士,助理研究员,主要研究领域为工作流,业务过程管理,医疗大数据.

通讯作者:

金涛,E-mail:jintao05@gmail.com

中图分类号:

基金项目:

国家自然科学基金(61325008);国家科技支撑计划(2015BAH14F02)


Optimized Topic Model for Clinical Pathway Mining
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61325008); National Key Technology R&D Program of China (2015BAH14F02)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在健康领域,诊疗过程对于医疗质量至关重要.临床路径集合了各种医疗知识,是对诊疗过程进行标准化的重要途径.然而,当前大多数临床路径由专家研讨制定,往往静态不变,难以部署和实施.在之前的工作中,提出了一种基于主题的临床路径挖掘算法,可以从医疗数据中抽取历史执行路径,客观反映数据中实际存在的医疗模式.算法首先通过主题模型将繁杂的诊疗活动聚合成若干主题,而每个诊疗日就可以表示为一个主题分布,一个病人的诊疗日志也相应的转换为一个主题序列,然后利用过程挖掘方法从这些主题序列中生成基于主题的临床路径模型.但传统主题模型(LDA)的聚类效果往往难以满足医疗数据的特点,导致主题质量不高,影响最终过程模型的可解释性.其中,一个普遍的问题就是LDA无法保证两个相似的诊疗日所得的主题分布也是相似的,这是由于其忽略了诊疗日之间原有的相似性特征.提出了一种优化的主题模型算法,该算法引入了基于本体生成的诊疗日相似性约束,可以有效地提升聚类效果.实验结果表明,提出的方法能够发现更符合医疗领域特点的高质量主题,进而为基于主题的临床路径的挖掘奠定基础.

    Abstract:

    In healthcare domain, the care process is critical for the care quality. Clinical pathway (CP), which integrates a lot of medical knowledge, is a tool for standardizing the care process. However, most of existing CPs are designed by experts with limited experience and data, and consequently they are always static and non-adaptive for implementation. According to authors' previous work, topic-based CP mining is an effective approach which can discover the process model from clinical data. The various clinical activities are summarized into several topics by latent dirichlet allocation (LDA), and each clinical day in the patient trace is converted to a topic distribution. A CP model can be derived by applying process mining method on the topic-based sequences. However, LDA ignores the similarity between clinical days, which means that in some cases, two similar days may be assigned quite different topic distributions. This paper proposes an optimized topic model for clinical topic discovering by incorporating the similarity constraint, which is based on the domain knowledge. Experiments on real data demonstrate that this new approach can discover quality topics which are useful for topic-based CP mining.

    参考文献
    相似文献
    引证文献
引用本文

徐啸,金涛,王建民.基于优化主题模型的临床路径挖掘.软件学报,2018,29(11):3295-3305

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-07-20
  • 最后修改日期:2017-09-16
  • 录用日期:2017-11-14
  • 在线发布日期: 2017-12-05
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号