摘要:人工智能(Artificial Intelligence,AI)的飞速发展得益于开源社区的开放协同,大量的开发者通过提交PR (Pull-request,PR)为AI开源软件做贡献.然而,外部贡献者所提交的PR质量参差不齐,开源项目管理团队需要对PR进行代码审查,并要求贡献者根据审查意见对PR进行修订.PR的修订过程对AI开源软件的质量有着重要的影响,因此对该过程进行更加全面、深入的实证研究很有必要.首先,从TensorFlow开源软件社区中收集了一组PR的修订历史,通过对PR的代码提交信息以及审查评论进行定性分析,归纳总结了PR修订类型的分类体系.其次,根据此分类体系人工标注了一组修订数据集,并基于此数据集定量分析了不同修订类型的频率分布、次序分布以及关联关系.研究结果表明:TensorFlow开源社区中的PR存在3大类共11种不同类型的修订,其中完善类修订出现的频率最高;此外,相比于其它类修订和完善类修订,修正类修订更常发生在PR的早期更新中;与结构相关的修订更有可能与其它类型的修订同现或邻现,配置修订以及变基修订有较大概率会接连出现.实证研究结果可帮助AI开源实践者和研究者更好地理解PR的修订过程,特别是有助于引导PR的审查和修订行为、提高开源群体协同效率.