主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第5期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
鲁刚,余翔湛,张宏莉,郭荣华.基于集成聚类的流量分类架构.软件学报,2016,27(11):2870-2883
基于集成聚类的流量分类架构
Traffic Classification Framework Based on Ensemble Clustering
投稿时间:2015-03-16  修订日期:2015-04-07
DOI:10.13328/j.cnki.jos.004885
中文关键词:  基于集成聚类的流量分类架构  集成聚类  流量分类  数据流特征  机器学习
英文关键词:traffic classification framework based on ensemble clustering (TCFEC)  ensemble clustering  traffic classification  flow-based feature  machine learning
基金项目:国家自然科学基金(61303061,61402485);高性能计算国家重点实验室开放课题(201513-01)
作者单位E-mail
鲁刚 中国洛阳电子装备试验中心, 河南 洛阳 471003 lgang198202@126.com 
余翔湛 哈尔滨工业大学 计算机科学与技术学院, 黑龙江 哈尔滨 150001  
张宏莉 哈尔滨工业大学 计算机科学与技术学院, 黑龙江 哈尔滨 150001  
郭荣华 中国洛阳电子装备试验中心, 河南 洛阳 471003  
摘要点击次数: 816
全文下载次数: 941
中文摘要:
      流量分类是优化网络服务质量的基础与关键.机器学习算法利用数据流统计特征分类流量,对于识别加密私有协议流量具有重要意义.然而,特征偏置和类别不平衡是基于机器学习的流量分类研究所面临的两大挑战.特征偏置是指一些数据流统计特征在提高部分应用识别准确率的同时也降低了另外一部分应用识别的准确率.类别不平衡是指机器学习流量分类器对样本数较少的应用识别的准确率较低.为解决上述问题,提出了基于集成聚类的流量分类架构(traffic classification framework based on ensemble clustering,简称TCFEC).TCFEC由多个基于不同特征子空间聚类的基分类器和一个最优决策部件构成,能够提高流量分类的准确率.具体而言,与传统的机器学习流量分类器相比,TCFEC的平均流准确率最高提升5%,字节准确率最高提升6%.
英文摘要:
      Traffic classification is the basis and key for optimizing network quality of service. Machine learning algorithms apply flow statistics in traffic classification, which are significant for identifying both encrypted and private traffic. However, the discriminator bias problem and the class imbalance problem are two main challenges in traffic classification. The discriminator bias problem denotes that some flow statistics can improve the accuracies for some applications but reduce the accuracies for other applications. The class imbalance problem denotes that machine learning based traffic classifier identifies the minority application with a low accuracy. To address the above two issues, traffic classification framework based on ensemble clustering (TCFEC) is proposed in this paper. TCFEC is composed of several base classifiers trained by clustering in different feature subspaces and an optimal decision component. It is able to improve accuracy in traffic classification. Specifically, compared with the traffic classifier based on traditional machine learning algorithms, TCFEC improves average flow accuracy by 5% as well as average byte accuracy by 6%.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 
主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利