结合情节挖掘的软件实体演化耦合分析方法
作者:
作者单位:

作者简介:

张鑫雨(1999-),女,硕士生,主要研究领域为软件历史分析;晋武侠(1989-),女,博士,副教授,CCF专业会员,主要研究领域为软件分析,微服务,软件架构与质量;刘靖雯(1996-),女,硕士生,CCF学生会员,主要研究领域为软件架构坏味道,软件重构;范铭(1991-),男,博士,副教授,博士生导师,CCF专业会员,主要研究领域为移动软件安全,隐私合规,AI安全;刘烃(1981-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为软件工程,智能电网,AI安全

通讯作者:

晋武侠,jinwuxia@mail.xjtu.edu.cn

中图分类号:

基金项目:

国家重点研发计划(2018YFB1004500);国家自然科学基金(61902306,62002280,61721002,61833015,62272387);中央高校基本科研业务费专项资金;中国博士后基金(2020M683507,2019TQ0251,2020M673439);西安市科协青年人才支持计划(095920201303)


Evolutionary Coupling Analysis Method of Software Entity Based on Episode Mining
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    软件系统的实体演化耦合分析有助于共同变更预测、软件供应链风险识别、代码漏洞溯源、缺陷预测、架构问题定位等分析活动.两个代码实体之间存在演化耦合(evolutionary coupling)是指在软件修订历史中,这对实体倾向于共同变更(共变).已有的演化耦合分析方法难以准确检测软件维护历史中频繁发生的、有“距离”的共变.为了解决这一问题,提出了基于关联规则挖掘、情节挖掘、潜在语义索引模型相结合的演化耦合分析方法(association rule,MINEPI and LSI based method,AR-MIM),以挖掘有“距离”的共同变更关系.实验收集了58个Python项目、242 074条训练数据、330 660条ground truth的数据集,与已有的4种baseline方法进行了比较,验证了AR-MIM的效果.结果表明:在预测共同变更候选项场景上,AR-MIM的准确性、召回率、F1分数均优于已有方法.

    Abstract:

    The entity evolutionary coupling analysis of software systems is helpfulfor analysis activities such as co-change candidate prediction, risk identification of software supply chain, code vulnerability traceability, defect prediction and architecture problem localization. The evolutionary coupling between two entities indicates that these entities tend to be changed together in the software revision history. Existing methods present a low accuracy to detect the frequent "having distance" co-change in the revision history. To address this problem, this study proposes an evolutionary coupling analysis method based on the combination of association rule mining, episode mining and latent semantic indexing (association rule, MINEPI and LSI based method, AR-MIM), which mines co-change relations of "having distance". The experiment verified the effectiveness of AR-MIM by compared with the four baseline methods on the dataset, collecting 58 Python projects, 242 074 pieces of training data, and 330 660 pieces of ground truth. The results show that the precision, recall, and F1 score of AR-MIM are better than those of existing methods in co-change candidate prediction.

    参考文献
    相似文献
    引证文献
引用本文

张鑫雨,晋武侠,刘靖雯,范铭,刘烃.结合情节挖掘的软件实体演化耦合分析方法.软件学报,2023,34(6):2562-2585

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-09-05
  • 最后修改日期:2022-12-14
  • 录用日期:
  • 在线发布日期: 2023-01-13
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号