利用标签相关性先验的弱监督多标签学习方法
作者:
作者单位:

作者简介:

欧阳宵(1998-),女,硕士生,主要研究领域为机器学习,多标签学习;矫媛媛(1982-),女,博士,副教授,主要研究领域为数据挖掘及应用;陶红(1990-),女,博士,主要研究领域为机器学习,系统科学,数据挖掘;侯臣平(1982-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为机器学习,数据挖掘,计算机视觉;范瑞东(1996-),男,博士生,CCF学生会员,主要研究领域为机器学习,迁移学习.

通讯作者:

中图分类号:

TP18

基金项目:

国家自然科学基金(61922087, 61906201, 62006238, 62136005); 湖南省杰出青年基金(2019JJ20020)


Weakly Supervised Multi-label Learning Using Prior Label Correlation Information
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    多标签学习是一种非常重要的机器学习范式. 传统的多标签学习方法是在监督或半监督的情况下设计的.通常情况下, 它们需要对所有或部分数据进行准确的属于多个类别的标注. 在许多实际应用中, 拥有大量标注的标签信息往往难以获取, 限制了多标签学习的推广和应用. 与之相比, 标签相关性作为一种常见的弱监督信息, 它对标注信息的要求较低. 如何利用标签相关性进行多标签学习, 是一个重要但未研究的问题. 提出了一种利用标签相关性作为先验的弱监督多标签学习方法(WSMLLC). 该模型利用标签相关性对样本相似性进行了重述,能够有效地获取标签指示矩阵; 同时, 利用先验信息对数据的投影矩阵进行约束, 并引入回归项对指示矩阵进行修正. 与现有方法相比, WSMLLC模型的突出优势在于: 仅提供标签相关性先验, 就可以实现多标签样本的标签指派任务. 在多个公开数据集上进行实验验证, 实验结果表明: 在标签矩阵完全缺失的情况下, WSMLLC与当前先进的多标签学习方法相比具有明显优势.

    Abstract:

    Multi-label learning is a very important machine learning paradigm. Traditional multi-label learning methods are designed in supervised or semi-supervised manner. Generally, they require accurate labeling of all or partial data into multiple categories. In many practical applications, it is difficult to obtain the label information with a large number of labels, which greatly restricts the promotion and application of multi-label learning. In contrast, label correlation, as a common weak supervision information, has lower requirements for labeling information. How to use label correlation for multi-label learning is an important but unstudied problem. This study proposes a method named weakly supervised multi-label learning using prior label correlation information (WSMLLC). This model restates the sample similarity by using label correlation, and can obtain label indicator matrix effectively, constrain the projection matrix of data by using prior information, and modify the indicator matrix by introducing regression terms. Compared with the existing methods, the outstanding advantage of WSMLLC model is that it can realize the label assignment of multi-label samples only by providing label correlation priors. Experimental results show that WSMLLC has obvious advantages over current advanced multi-label learning methods in the case of complete loss of label matrix.

    参考文献
    相似文献
    引证文献
引用本文

欧阳宵,陶红,范瑞东,矫媛媛,侯臣平.利用标签相关性先验的弱监督多标签学习方法.软件学报,2023,34(4):1732-1748

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-10-21
  • 最后修改日期:2022-04-01
  • 录用日期:
  • 在线发布日期: 2022-07-22
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号