主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
吴信东,谢飞,黄咏明,胡学钢,高隽.带通配符和One-Off条件的序列模式挖掘.软件学报,2013,24(8):1804-1815
带通配符和One-Off条件的序列模式挖掘
Mining Sequential Patterns with Wildcards and the One-Off Condition
投稿时间:2011-08-05  修订日期:2012-09-12
DOI:10.3724/SP.J.1001.2013.04422
中文关键词:  数据挖掘  序列模式挖掘  频繁模式  通配符  One-Off条件
英文关键词:data mining  sequential pattern mining  frequent pattern  wildcard  One-Off condition
基金项目:国家自然科学基金(61229301, 60828005, 61273292); 美国国家科学基金(CCF-0905337, CCF-0514819); 国家高技术研究发展计划(863)(2012AA011005); 国家重点基础研究发展计划(973)(2013CB329604)
作者单位E-mail
吴信东 合肥工业大学 计算机与信息学院, 安徽 合肥 230009
Department of Computer Science, University of Vermont, Burlington, VT 05405, USA 
xwu@uvm.edu 
谢飞 合肥师范学院 计算机科学与技术系, 安徽 合肥 230601  
黄咏明 合肥工业大学 计算机与信息学院, 安徽 合肥 230009  
胡学钢 合肥工业大学 计算机与信息学院, 安徽 合肥 230009  
高隽 合肥工业大学 计算机与信息学院, 安徽 合肥 230009  
摘要点击次数: 3770
全文下载次数: 2832
中文摘要:
      很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off 条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA 序列上的实验结果表明,One-Off Mining 比相关的序列模式挖掘算法具有更好的时间性能和完备性.
英文摘要:
      There is a huge wealth of sequence data available in real-world applications. The task of sequential pattern mining serves to mine important patterns from the sequence data. Given a sequence S, a certain threshold, and gap constraints, this paper aims to discover frequent patterns whose supports in S are no less than the given threshold value. There are flexible wildcards in pattern P, and the number of the wildcards between any two successive elements of P fulfills the user-specified gap constraints. The study designs an efficient mining algorithm: One-Off Mining, whose mining process satisfies the One-Off condition under which each character in the given sequence can be used at most once in all occurrences of a pattern. Experiments on DNA sequences show that this method performs better in time and completeness than the related sequential pattern mining algorithms.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利