一种语义感知的细粒度App评论缺陷挖掘方法
作者:
作者单位:

作者简介:

王亚文(1993-),男,博士生,主要研究领域为智能需求工程,软件工程,自然语言处理;王俊杰(1987-),女,博士,副研究员,主要研究领域为智能软件工程,软件工程大数据,经验软件工程,软件质量,众包软件测试;石琳(1985-),女,博士,副研究员,CCF高级会员,主要研究领域为智能需求工程,软件工程,经验软件工程,软件演化,软件质量;王青(1964-),女,博士,研究员,博士生导师,CCF高级会员,主要研究领域为以过程为中心的软件质量管理技术,建模技术,知识管理技术,软件协同工作技术.

通讯作者:

中图分类号:

TP311

基金项目:

国家重点研发计划(2018YFB1403400); 国家自然科学基金(62072442)


Semantic-aware and Fine-grained App Review Bug Mining Approach
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    手机用户提交的App评论为开发者提供了一个了解用户满意度的沟通渠道. 许多用户通常使用“send a video”和“crash”等关键短语来描述有缺陷的功能(即用户操作)和App的异常行为(即异常行为), 而这些短语可能会与其他琐碎信息(如用户的抱怨)一起交杂在评论文本中. 掌握这些细粒度信息可以帮助开发者理解来自用户的功能需求或缺陷报告, 进而有利于提升App的质量. 现有的基于模式的目标短语提取方法只能对评论的高层主题/方面进行总结, 并且由于对评论的语义理解不足, 短语提取的性能较差. 提出了一种语义感知的细粒度App评论缺陷挖掘方法(Arab), 来提取用户操作和异常行为, 并挖掘两者之间的关联关系. 设计了一种新颖的用于提取细粒度目标短语的神经网络模型, 该模型将文本描述和评论属性相结合, 能更好地建模评论的语义. Arab还根据语义关系对提取的短语进行聚类, 并将用户操作和异常行为之间的关联关系进行了可视化. 使用6个App的3 426条评论进行评估实验, 实验结果证实了Arab在短语提取方面的有效性. 进一步使用Arab对15个热门App的301 415条评论进行了案例研究, 以探索其潜在的应用, 并验证其在大规模数据上的实用性.

    Abstract:

    App reviews are considered as a communication channel between users and developers to perceive user’s satisfaction. Users usually describe buggy features (i.e., user actions) and App abnormal behaviors (i.e., abnormal behaviors) in forms of key phrases (e.g., “send a video” and “crash”), which could be buried with other trivial information (e.g., complaints) in the review texts. A fine-grained view about this information could facilitate the developers’ understanding of feature requests or bug reports from users, and improve the quality of Apps. Existing pattern-based approaches to extract target phrases can only summarize the high-level topics/aspects of reviews, and suffer from low performance due to insufficient semantic understanding of reviews. This study proposes a semantic-aware and fine-grained App review bug mining approach (Arab) to extract user actions and abnormal behaviors, and mine the correlations between them. A novel neural network model is designed for extracting fine-grained target phrases, which combines textual descriptions and review attributes to better represent the semantics of reviews. Arab also clusters the extracted phrases based on their semantic relations and provides a visualization of correlations between User Actions and Abnormal Behaviors. 3,426 reviews from six Apps are used to carry out evaluation test, and the results confirm the effectiveness of Arab in phrase extraction. A case study is further conducted with Arab on 301,415 reviews of 15 popular Apps to explore its potential application and examine its usefulness on large-scale data.

    参考文献
    相似文献
    引证文献
引用本文

王亚文,王俊杰,石琳,王青.一种语义感知的细粒度App评论缺陷挖掘方法.软件学报,2023,34(4):1613-1629

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-01-19
  • 最后修改日期:2022-03-04
  • 录用日期:
  • 在线发布日期: 2022-07-22
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号