特征选择稳定性研究综述
作者:
作者单位:

作者简介:

刘艺(1990-),男,安徽蚌埠人,博士生,主要研究领域为数据治理,演化算法;曹建军(1975-),男,博士,副研究员,CCF高级会员,主要研究领域为数据治理,演化算法;刁兴春(1964-),男,研究员,博士生导师,主要研究领域为数据工程;周星(1988-),男,博士,工程师,主要研究领域为数据挖掘,数据工程.

通讯作者:

曹建军,E-mail:jianjuncao@yeah.net

中图分类号:

基金项目:

国家自然科学基金(61371196);中国博士后科学基金(201003797)


Survey on Stability of Feature Selection
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61371196); China Postdoctoral Science Foundation Funded Project (201003797)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动具有一定鲁棒性.提高特征选择稳定性有助于发现相关特征,增强特征可信度,进一步降低开销.在回顾现有特征选择稳定性提升方法的基础上对其进行分类,分析比较各类方法的特点和适用范围,总结特征选择稳定性中的相关评估工作,并通过实验剖析其中稳定性度量指标的性能,进而对比4种集成方法的效用.最后讨论当前工作的局限性,指出未来的研究方向.

    Abstract:

    With the development of big data and the wide application of machine learning, data from all walks of life is growing massively. High dimensionality is one of its most important characteristics, and applying feature selection to reduce dimensions is one of the preprocessing methods of high dimensional data. Stability of feature selection is an important research direction, and it stands for the robustness of results with respect to small changes in the dataset composition. Improving the stability of feature selection can help to identify relevant features, increase experts' confidence to the results, and further reduce the complexity and costs of getting original data. This paper reviews current methods for improving the stability, and presents a classification of those methods with analysis and comparison on the characteristics and range of application of each category. Then it summarizes the evaluations of stability of feature selection, and analyzes the performance of stability measurement and validates the effectiveness of four ensemble approaches through experiments. Finally, it discusses the localization of current works and a perspective of the future work in this research area.

    参考文献
    相似文献
    引证文献
引用本文

刘艺,曹建军,刁兴春,周星.特征选择稳定性研究综述.软件学报,2018,29(9):2559-2579

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-04-24
  • 最后修改日期:2017-07-10
  • 录用日期:2017-09-26
  • 在线发布日期: 2017-11-13
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号