基于StackOverflow数据的软件功能特征挖掘组织方法
作者:
作者单位:

作者简介:

朱子骁(1990-),男,湖南郴州人,博士,主要研究领域为软件复用,软件资源理解,知识挖掘;沈琦(1995-),男,博士生,主要研究领域为软件工程,软件资源管理与复用;邹艳珍(1976-),女,博士,副教授,CCF专业会员,主要研究领域为软件复用,软件资源管理,软件数据挖掘,知识图谱;赵俊峰(1974-),女,博士,副教授,CCF高级会员,主要研究领域为软件复用与构件技术,智慧城市数据分析与挖掘,知识工程;华晨彦(1994-),男,硕士生,主要研究领域为软件工程,软件资源管理与复用

通讯作者:

邹艳珍,E-mail:zouyz@pku.edu.cn

中图分类号:

基金项目:

国家重点研发计划(2016YFB1000801);国家杰出青年科学基金(61525201)


Mining and Organizing Software Functional Features Based on StackOverflow Data
Author:
Affiliation:

Fund Project:

National Key Research and Development Program of China (2016YFB1000801); National Natural Science Fund for Distinguished Young Scholars (61525201)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    软件的功能描述文档是开发人员了解软件的重要基础.现有的软件项目并不都是具备全面描述软件功能的文档,但软件项目开发和应用过程中的各种交流记录蕴含了讨论其功能的大量信息.为此,提出了一种基于StackOverflow问答数据的软件功能特征挖掘组织方法.该方法提出以动宾短语形式描述软件功能特征,挖掘并组织蕴含在StackOverflow数据中的软件功能特征,自动生成一种以层次化方式展示的软件项目功能特征文档.在针对真实项目的实验中,该方法生成的软件功能文档可以覆盖官方文档中列举的97.6%的软件常用功能.同时,该方法可以扩展从不同形式的项目交流记录中生成全面描述软件功能特征的文档.

    Abstract:

    Functional specification documents are very important for the developers who want to understand and reuse unfamiliar software libraries. Due to high cost of human effort and time, lots of software do not provide the official functional documentation. However, some software communication records produced in software developing processes contain valuable information regarding software functions and usages. In this paper, an approach is proposed to automatically mining and organizing functional features for open source software based on StackOverflow data. By describing functional features in the form of verb phrases, this approach generates hierarchical list of software functional features as the supplement of software documentation. In the experimental evaluation on some real-world subjects, the automatically generated documents have covered 97.6% of the frequent-used functional features in the official documents. At the same time, the proposed approach can be adapted to different types of software communication records, and applied to software in different domains.

    参考文献
    相似文献
    引证文献
引用本文

朱子骁,邹艳珍,华晨彦,沈琦,赵俊峰.基于StackOverflow数据的软件功能特征挖掘组织方法.软件学报,2018,29(8):2210-2225

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-07-19
  • 最后修改日期:2017-09-28
  • 录用日期:
  • 在线发布日期: 2018-03-13
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号