主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
杨 宁,唐常杰,王 悦,陈 瑜,郑皎凌.一种基于时态密度的倾斜分布数据流聚类算法.软件学报,2010,21(5):1031-1041
一种基于时态密度的倾斜分布数据流聚类算法
Clustering Algorithm on Data Stream with Skew Distribution Based on Temporal Density
投稿时间:2008-02-25  修订日期:2008-10-07
DOI:
中文关键词:  数据流聚类  时态密度  倾斜分布
英文关键词:data stream clustering  temporal density  skew distribution
基金项目:Supported by the National Natural Science Foundation of China under Grant No.600773169 (国家自然科学基金); the National KeyTechnology R&D Program in the 11th Five-Year Plan of China under Grant No.2006BAI05A01 (国家“十一五”科技支撑计划)
作者单位
杨 宁 四川大学 计算机学院,四川 成都 610065 
唐常杰  
王 悦  
陈 瑜  
郑皎凌  
摘要点击次数: 5956
全文下载次数: 4451
中文摘要:
      为解决倾斜分布的数据流聚类这一难题,提出了时态密度概念,给出其度量,揭示了其包括可增量计算在 内的一系列数学性质;设计了时态密度树结构,提高了聚类时的存储和检索效率;设计了能够以实时或异步方式捕捉 数据倾斜分布的数据流时态特征的聚类算法TDCA(temporal density based clustering algorithm),其时间复杂度为 O(c×m×lgm).实验结果表明,该算法不仅有较强的功能,而且具有较好的规模可伸缩性.
英文摘要:
      To solve the problem of clustering this paper proposes a concept of temporal density, which reveals a set of mathematical properties, especially the incremental computation. A clustering algorithm named TDCA (temporal density based clustering algorithm) with time complexity of O(c×m×lgm) is created with a tree structure implemented for both storage and retrieve efficiency. TDCA is capable of capturing the temporal features of a data stream with skew data distribution either in real time or on demand. The experimental results show that TDCA is functionable and scalable.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利