基于信息检索的软件缺陷定位技术研究进展
作者:
作者单位:

作者简介:

张芸(1991-),女,博士,特聘副研究员,CCF专业会员,主要研究领域为软件仓库挖掘,软件维护;吴明晖(1976-),男,博士,教授,CCF专业会员,主要研究领域为软件工程,人工智能;刘佳琨(1992-),男,博士生,CCF学生会员,主要研究领域为软件仓库挖掘,经验软件工程;颜晖(1964-),女,教授,CCF专业会员,主要研究领域为教育大数据分析,软件工程;夏鑫(1986-),男,博士,讲师,博士生导师,CCF专业会员,主要研究领域为软件仓库挖掘,经验软件工程.

通讯作者:

夏鑫,E-mail:Xin.Xia@monash.edu

中图分类号:

基金项目:

2019年度高层次留学回国人员在杭创新项目


Research Progress on Software Bug Localization Technology Based on Information Retrieval
Author:
Affiliation:

Fund Project:

2019 Innovation at Hangzhou Program for High-level Returned Oversea Scholars

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    缺陷定位是软件工程研究最活跃的领域之一.大部分软件缺陷都会被提交到类似于Bugzilla和Jira的缺陷追踪系统中.由于提交的缺陷报告数量过多,开发人员不能及时处理,因而迫切需要一个自动化工具来帮助开发人员识别缺陷相关源代码文件.研究人员已提出了大量缺陷定位技术.基于信息检索的软件缺陷定位技术(information retrieval-based bug localization,简称IRBL)利用了缺陷报告的文本特性,并且由于计算成本低、对不同的程序语言更具普适性而成为缺陷定位领域的研究热点,取得了一系列研究成果.然而,IRBL技术也在数据预处理、相似度计算和工程应用等方面存在诸多挑战.鉴于此,对现有的IRBL技术进行梳理总结,主要内容包括:(1)梳理了IRBL中数据预处理的过程和信息检索通用方法;(2)对IRBL技术中利用的数据特征进行了详细的分类和总结;(3)总结了技术评估中使用的性能评估指标;(4)归纳出了IRBL技术的关键问题;(5)展望了IRBL技术的未来发展.

    Abstract:

    Bug localization is one of the most active domains in software engineering. Most of the bugs are submitted to bug tracker systems, e.g., Bugzilla and Jira. Because of the large number of the submitted bug reports, it is difficult for developers to resolve these defects in time. Therefore, an automatic tool to help developers to identify bug related files is needed. Many bug localization technologies have been proposed by researchers. Taking advantages of the text nature of bug report, information retrieval technologies are adopted to solve bug localization problems. Due to the low computing cost and the applicability to various programming languages, information retrieval-based bug localization (IRBL) technologies become hot spots in bug localization and acquire a series of achievements. However, challenges still exist in data preprocessing, similarity calculation, and engineering application. Therefore, current IRBL technologies are summarized. The contributions of this study are: (1) the data preprocess methods and general information retrieval algorithms are summarized; (2) the feature categories are concluded and classified; (3) the performance measures are concluded; (4) the current problems in IRBL technologies are highlighted; and (5) the trends of IRBL technologies are outlooked.

    参考文献
    相似文献
    引证文献
引用本文

张芸,刘佳琨,夏鑫,吴明晖,颜晖.基于信息检索的软件缺陷定位技术研究进展.软件学报,2020,31(8):2432-2452

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-02-16
  • 最后修改日期:2020-04-07
  • 录用日期:
  • 在线发布日期: 2020-05-26
  • 出版日期: 2020-08-06
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号