主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第8期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
柳萌萌,赵书良,韩玉辉,苏东海,李晓超,陈敏.多尺度数据挖掘方法.软件学报,2016,27(12):3030-3050
多尺度数据挖掘方法
Research on Multi-Scale Data Mining Method
投稿时间:2015-02-12  修订日期:2015-09-25
DOI:10.13328/j.cnki.jos.004924
中文关键词:  多尺度  频繁项集  关联规则  尺度转换  多尺度关联规则挖掘
英文关键词:multi-scale  frequent item-set  association rule  scale conversion  multi-scale association rules mining
基金项目:国家自然科学基金(71271067);国家社会科学基金(13BTY011,13&ZD091)
作者单位E-mail
柳萌萌 河北师范大学 数学与信息科学学院, 河北 石家庄 050024
河北省计算数学与应用重点实验室(河北师范大学), 河北 石家庄 050024 
 
赵书良 河北师范大学 数学与信息科学学院, 河北 石家庄 050024
河北省计算数学与应用重点实验室(河北师范大学), 河北 石家庄 050024 
zhaoshuliang@sina.com 
韩玉辉 河北师范大学 数学与信息科学学院, 河北 石家庄 050024
河北省计算数学与应用重点实验室(河北师范大学), 河北 石家庄 050024 
 
苏东海 冀广传媒集团 河北广电无限传媒有限公司, 河北 石家庄 050000  
李晓超 河北师范大学 数学与信息科学学院, 河北 石家庄 050024
河北省计算数学与应用重点实验室(河北师范大学), 河北 石家庄 050024 
 
陈敏 河北师范大学 数学与信息科学学院, 河北 石家庄 050024
河北省计算数学与应用重点实验室(河北师范大学), 河北 石家庄 050024 
 
摘要点击次数: 1270
全文下载次数: 1370
中文摘要:
      多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的.
英文摘要:
      Many researches of data mining have paid close attention to multi-scale theory. However the study of multi-scale data mining still comes short on universal theories and approaches. To overcome this limitation, this paper conducts a study of universal multi-scale data mining on theoretical and methodological aspect. First, the paper lays out the definition of data-scale-partition and data-scale based on concept hierarchy, and characterizes the relationship of upper-layer and lower-layer datasets between multi-scale datasets. Next, it illustrates the definition and essence of multi-scale data mining, and presents the classification of multi-scale data mining methods. Finally, it introduces the algorithm framework and its theoretical basis of multi-scale data mining, and proposes an algorithm named MSARMA (multi-scale association rules mining algorithm) to realize the transition of knowledge in multi-scale data expressions. Experiments are carried out to test MSARMA with the help of IBM T10I4D100K dataset and demographic dataset from H province, and the results indicate that MSARMA is effective and feasible with better coverage rate, better accuracy and lower average support error.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利