主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第5期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
翟婷婷,高阳,朱俊武.面向流数据分类的在线学习综述.软件学报,2020,31(4):912-931
面向流数据分类的在线学习综述
Survey of Online Learning Algorithms for Streaming Data Classification
投稿时间:2019-02-22  修订日期:2019-07-11
DOI:10.13328/j.cnki.jos.005916
中文关键词:  在线学习  流数据分类  维度诅咒  概念漂移  稀疏在线学习  演化流分类
英文关键词:online learning  streaming data classification  curse of dimensionality  concept drifting  sparse online learning  evolving data stream classification
基金项目:国家重点研发计划(2017YFB0702600,2017YFB0702601);国家自然科学基金(61906165,61432008,61872313);江苏省高等学校自然科学研究项目(19KJB520064)
作者单位E-mail
翟婷婷 扬州大学 信息工程学院, 江苏 扬州 225127
计算机软件新技术国家重点实验室(南京大学), 江苏 南京 210023 
翟婷婷,E-mail:zhtt.go@gmail.com 
高阳 计算机软件新技术国家重点实验室(南京大学), 江苏 南京 210023  
朱俊武 扬州大学 信息工程学院, 江苏 扬州 225127  
摘要点击次数: 655
全文下载次数: 328
中文摘要:
      流数据分类旨在从连续不断到达的流式数据中增量学习一个从输入变量到类标变量的映射函数,以便对随时到达的测试数据进行准确分类.在线学习范式作为一种增量式的机器学习技术,是流数据分类的有效工具.主要从在线学习的角度对流数据分类算法的研究现状进行综述.具体地,首先介绍在线学习的基本框架和性能评估方法,然后着重介绍在线学习算法在一般流数据上的工作现状,在高维流数据上解决"维度诅咒"问题的工作现状,以及在演化流数据上处理"概念漂移"问题的工作现状,最后讨论高维和演化流数据分类未来仍然存在的挑战和亟待研究的方向.
英文摘要:
      The objective of streaming data classification is to learn incrementally a decision function that maps input variables to a label variable, from continuously arriving streaming data, so as to accurately classify the test data that may arrive anytime. The online learning paradigm, as an incremental machine learning technology, is an effective tool for classification of streaming data. This paper mainly summarizes, from the perspective of online learning, the recent development of algorithms for streaming data classification. Specifically, the basic framework and the performance evaluation methodology of online learning are first introduced. Then, the latest development of online learning algorithms for general streaming data, for alleviating the "curse of dimensionality" problem in high-dimensional streaming data, and for resolving the "concept drifting" problem in evolving streaming data are reviewed respectively. Finally, future challenges and promising research directions for classification of high-dimensional and evolving streaming data are also discussed.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利