融合多种支持度定义的频繁情节挖掘算法
作者:
作者单位:

作者简介:

朱辉生(1968-),男,博士,教授,CCF高级会员,主要研究领域为数据库,数据挖掘,大数据;汪卫(1970-),男,博士,教授,博士生导师,CCF杰出会员,主要研究领域为数据库,数据挖掘,大数据;陈琳(1981-),女,副教授,CCF专业会员,主要研究领域为图像处理,模式识别;施伯乐(1935-),男,教授,博士生导师,CCF高级会员,主要研究领域为数据库,数据挖掘;倪艺洋(1986-),女,博士,副教授,主要研究领域为移动通信,机器学习.

通讯作者:

朱辉生,E-mail:zhs@fudan.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61802274,61701201,U1509213);教育部“云数融合科教创新”基金(2017B06109);江苏省自然科学基金(BK20141307,BK20170758);江苏省“333工程”基金(BRA2015212);江苏省无线通信重点实验室开放研究基金(2017WICOM02)


Frequent Episode Mining Algorithm Compatible with Various Support Definitions
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61802274, 61701201, U1509213); "Integration of Cloud Computing and Big Data, Innovation of Science and Education" Foundation of Ministry of Education of China (2017B06109); Natural Science Foundation of Jiangsu Province of China (BK20141307, BK20170758); "333 Engineering" Foundation of Jiangsu Province of China (BRA2015212); Open Project Foundation of Key Laboratory of Wireless Communications of Jiangsu Province of China (2017WICOM02)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    事件序列中蕴藏的频繁情节刻画了用户或系统的行为规律.现有的频繁情节挖掘算法在各自支持度定义下具有较好的挖掘效果,但在支持度定义发生变化时却很难甚至无法直接挖掘频繁情节.针对用户多变的支持度定义需求,提出了一种频繁情节挖掘算法FEM-DFS(frequent episode mining-depth first search).该算法通过单遍扫描事件序列,以深度优先搜索方式来发现频繁情节,以共享前/后缀树来存储频繁情节,以单调性、前缀单调性或后缀单调性来压缩频繁情节的搜索空间.实验评估证实了所提出算法的有效性.

    Abstract:

    Frequent episodes hidden in an event sequence describe the behavioral regularities of users or systems. Existing algorithms yield good results for mining frequent episodes under their respective definitions of support, but each of them is difficult or impossible to directly mine frequent episodes when the definition of support is changed. To meet the needs of changeable support definitions of users, an algorithm called FEM-DFS (frequent episode mining-depth first search) is proposed to mine frequent episodes in this paper. After scanning the event sequence one pass, FEM-DFS finds frequent episodes in a depth first search fashion, stores frequent episodes in a shared prefix/suffix tree and compresses the search space of frequent episodes by utilizing monotonicity, prefix monotonicity or suffix monotonicity. Experimental evaluation demonstrates the effectiveness of the proposed algorithm.

    参考文献
    相似文献
    引证文献
引用本文

朱辉生,陈琳,倪艺洋,汪卫,施伯乐.融合多种支持度定义的频繁情节挖掘算法.软件学报,2020,31(7):2169-2183

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-03-27
  • 最后修改日期:2018-12-28
  • 录用日期:
  • 在线发布日期: 2020-07-11
  • 出版日期: 2020-07-06
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号