主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第11期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
凌春阳,邹艳珍,林泽琦,谢冰,赵俊峰.基于图嵌入的软件项目源代码检索方法.软件学报,2019,30(5):1481-1497
基于图嵌入的软件项目源代码检索方法
Approach to Searching Software Source Code with Graph Embedding
投稿时间:2018-08-31  修订日期:2018-10-31
DOI:10.13328/j.cnki.jos.005721
中文关键词:  API检索  代码检索  代码图  图嵌入
英文关键词:API search  code search  code graph  graph embedding
基金项目:国家重点研发计划(2016YFB1000801);国家杰出青年科学基金(61525201)
作者单位E-mail
凌春阳 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
 
邹艳珍 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871
北京大学(天津滨海)新一代信息技术研究院, 天津 300450 
 
林泽琦 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
 
谢冰 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
xiebing@pku.edu.cn 
赵俊峰 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871
北京大学(天津滨海)新一代信息技术研究院, 天津 300450 
 
摘要点击次数: 311
全文下载次数: 322
中文摘要:
      源代码检索是软件工程领域的一项重要研究问题,其主要任务是检索和复用软件项目API(application program interface,应用程序接口).随着软件项目的规模越来越大、越来越复杂,当前,源代码检索一方面需要提高基于自然语言API查询的准确性,另一方面需要定位和展示目标API及其相关代码之间的关联,以更好地辅助用户理解API的实现逻辑和使用场景.为此,提出一种基于图嵌入的软件项目源代码检索方法.该方法能够基于软件项目源代码自动构建其代码结构图,并通过图嵌入对源代码进行信息表示.在此基础上,用户可以输入自然语言问题、检索并返回相关的API及其关联信息构成的连通代码子图,从而提高API检索和复用的效率.在以开源项目Apache Lucene和POI为例的检索实验中,该方法检索结果的F1值比现有基于最短路径的方法提高了10%,同时显著缩短了平均响应时间.
英文摘要:
      Searching software source code and locating software's API (application program interface) are important research issues in software engineering. As software projects are becoming more and more complex, existing search tools mainly face the following two challenges. First, more accurate search results are required in natural language question based search process. Second, the relationships between API are required to illustrate so that these API' underlying logic and usage scenarios are able to be understood more quickly. In this study, an ovel approach is proposed to searching a software project's API based on graph embedding. It aims to improve the accuracy of natural language based code graph search. A software project's code graph is built automatically from its source code and they are represented through graph embedding. For a natural language question, a code-connected subgraph, composed by relevant API and their associated relationships, are returned as the best answer. In experiments, Apache Lucene and POI projects are selected as examples to perform some API search tasks. Experimental results show that the proposed approach improves F1-score by 10% than existing shortest path based approach, while reduces average response time significantly.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利