摘要:图神经网络(graph neural network, GNN)在图分类任务中表现出色, 但其“黑箱”性质引发了对预测过程可解释性的广泛关注. 作为一种自解释机制, 证据提取方法近年来受到广泛研究, 其目标是在生成预测结果的同时, 从原始图中提取紧凑、具备判别性的子图结构(即证据子图)以作为解释. 然而, 现有方法往往依赖数据中的“捷径”特征进行预测, 导致提取的解释缺乏忠实性, 进而影响模型的可解释性与鲁棒性. 为缓解上述问题, 提出一种互补感知证据提取(complement-aware rationale extraction, CaR)方法, 将未被选为证据的子图区域视为互补信息, 并从以下3个方面提升反事实建模与解释能力: 首先, 引入对比学习机制以解耦证据表示与互补表示, 增强二者的语义独立性; 其次, 提出回声学习(echo-learning)策略, 充分利用GNN各层消息传递过程中的中间表示, 捕捉不同深度层次下互补结构的差异性; 最后, 将当前与历史层的互补表示与证据表示结合, 进而构造反事实样本, 提升训练数据的多样性. 在多个真实数据集及一个合成数据集上的实验证明, CaR能够生成更具忠实性的证据, 验证了其有效性.