面向时间有序事务数据的聚簇频繁模式挖掘算法研究
DOI:
作者:
作者单位:

内蒙古大学计算机学院

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然基金地区基金


Research on Cluster Frequent Pattern Mining Algorithm for Time-Ordered Transactional Data
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    本文首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出了一种改进的聚簇频繁模式挖掘算法ICFPM (Improved Cluster Frequent Pattern Mining, ICFPM).该算法使用了2种优化策略,一方面可以利用定义的参数minCF,有效减少挖掘结果的搜索空间,另一方面可以参考(n-1)项集的判别结果加速聚簇频繁n项集的判别过程,算法还使用了ICFPM-list结构来减少候选n项集的构建开销.基于两个真实世界数据集的仿真实验证明了ICFPM算法的有效性,与Naive算法相比,ICFPM算法在时间和空间效率方面得到了大幅度的提高,是解决聚簇频繁模式挖掘的有效方法.

    Abstract:

    In this paper,the problem of mining cluster frequent patterns in time-ordered transaction data is studied for the first time. In order to solve the problem of redundant operations when Naive algorithm deals with this problem, an Improved Cluster Frequent Pattern Mining (ICFPM) algorithm is proposed. The algorithm uses two optimization strategies, on the one hand, it can use the defined parameter minCF to effectively reduce the search space of mining results, on the other hand, it can refer to the discriminative results of (n-1)-itemsets to accelerate the discriminative process of cluster frequent n-itemsets, and the algorithm also uses the ICFPM-list structure to reduce the overhead of the candidate n-itemsets construction. Simulation experiments based on two real-world datasets demonstrate the effectiveness of the ICFPM algorithm. Compared with the Naive algorithm, the ICFPM algorithm improves substantially in terms of time and space efficiency, and it is an effective method for solving the clustered frequent pattern mining.

    参考文献
    相似文献
    引证文献
引用本文
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-12-11
  • 最后修改日期:2024-03-29
  • 录用日期:2024-04-15
  • 在线发布日期:
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号