半监督场景下多视角信息交互的图卷积神经网络
作者:
作者单位:

作者简介:

王悦天(2000-), 男, 硕士生, 主要研究领域为深度学习, 图表示学习, 计算机视觉. ;傅司超(1995-), 男, 博士生, 主要研究领域为流形学习, 图表示学习. ;彭勤牧(1985-), 男, 博士, 副教授, 主要研究领域为视觉计算, 机器学习, 医学图像分析. ;邹斌(1969-), 男, 博士, 教授, 博士生导师, 主要研究领域为统计学习理论, 机器学习. ;荆晓远(1971-), 男, 博士, 教授, 博士生导师, CCF专业会员, 主要研究领域为机器学习, 人工智能, 软件工程. ;尤新革(1969-), 男, 博士, 教授, 博士生导师, CCF高级会员, 主要研究领域为模式识别, 图像与信号处理, 计算机视觉, 生物特征识别与智能防伪.

通讯作者:

傅司超, E-mail: fusichao_hust@hust.edu.cn;尤新革, E-mail: youxg@hust.edu.cn

中图分类号:

基金项目:

国家重点研发计划 (2022YFC3301004); 国家自然科学基金 (62172177); 中央高校基本科研业务费专项资金 (2022JYCXJJ034)


Multi-view Interaction Graph Convolutional Network for Semi-supervised Classification
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在当前数据来源多样化且人工标记难度大的现实生活中, 半监督场景下多视角数据的分类算法在各个领域中都具有重要的研究意义. 近年来, 基于图神经网络的半监督多视角分类算法研究已经取得了很大的进展. 但是现有的图神经网络算法大多是在分类阶段进行多视角互补信息的融合, 反而忽略了训练阶段同一样本不同视角间互补信息的交互. 针对上述问题, 提出半监督场景下多视角信息交互的图卷积神经网络算法MIGCN (multi-view interaction graph convolutional network). 该方法通过在不同视角上训练的图卷积层之间引入Transformer Encoder模块, 使得同一样本在训练阶段都可以通过注意力机制自适应的在不同视角间获取互补性信息, 进而加强自身的训练; 除此之外, 还通过引入一致性约束损失让不同视角最终特征表达的相似关系尽可能一样, 促使图卷积神经网络在分类阶段更加合理的利用多视角特征之间的一致性和互补性信息, 进一步提升多视角融合特征的鲁棒性. 最后, 在多个真实世界多视角数据集上的实验表明, 相比于基于图的半监督多视角分类模型, MIGCN可以更好地学习到多视角数据的本质特征, 进而提升半监督多视角分类的准确性.

    Abstract:

    In current real life where data sources are diverse, and manual labeling is difficult, semi-supervised multi-view classification algorithms have important research significance in various fields. In recent years, graph neural networks-based semi-supervised multi-view classification algorithms have achieved great progress. However, most of the existing graph neural networks carry out multi-view information fusion only in the classification stage, while neglecting the multi-view information interaction between the same sample during the training stage. To solve the above issue, this study proposes a model for semi-supervised classification, named multi-view interaction graph convolutional network (MIGCN). The Transformer Encoder module is introduced to the graph convolution layer trained on different views, which aims to adaptively acquire complementary information between different views for the same sample during the training stage. More importantly, the study introduces the consistency constraint loss to make the similar relationship of the final feature expressions of different views as similar as possible. This operation can make graph convolutional neural networks during the classification stage better utilize the consistency and complementarity information between different views reasonably, and then it can further improve the robust performance of the multi-view fusion feature. Extensive experiments on several real-world multi-view datasets demonstrate that compared with the graph-based semi-supervised multi-view classification model, MIGCN can better learn the essential features of multi-view data, thereby improving the accuracy of semi-supervised multi-view classification.

    参考文献
    相似文献
    引证文献
引用本文

王悦天,傅司超,彭勤牧,邹斌,荆晓远,尤新革.半监督场景下多视角信息交互的图卷积神经网络.软件学报,2024,35(11):5098-5115

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-08-03
  • 最后修改日期:2022-11-16
  • 录用日期:
  • 在线发布日期: 2023-11-29
  • 出版日期: 2024-11-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号