快速检索
    过刊检索
    全选反选导出
    显示模式:
    2026,37(4):1449-1471, DOI: 10.13328/j.cnki.jos.007521, CSTR: 32375.14.jos.007521
    [摘要] (845) [HTML] (0) [PDF 4.16 M] (873)
    摘要:
    跨领域方面级情感分析利用源领域的已标注样本来帮助训练目标领域上的方面级情感分析任务, 但并非所有源领域样本均适合进行迁移训练, 部分样本会对迁移模型训练产生负迁移效应, 需要进行样本筛选工作. 现有的跨领域实例迁移方法所考虑的迁移依据比较片面, 忽略了样本间的协同作用, 影响跨领域泛化性能. 为了解决方面级情感分析任务中的特定领域训练样本匮乏与跨领域迁移中的样本筛选问题, 以多领域情感分析为开放环境, 结合高可信机器学习理论及建模中的领域适应方法, 提出一种基于高质量样本选择的跨领域方面级情感分析方法. 首先, 该方法分别设计了域间及域内高质量样本选择指标, 依次对源领域数据进行领域层面和样本层面的筛选, 兼顾了两种样本选择粒度的优势. 其次, 全面地设计了源领域与目标领域间相似性的衡量指标, 并通过图神经网络进行高效计算. 最后, 将多源领域迁移的场景纳入跨领域ABSA (aspect-based sentiment analysis)的讨论范围中, 设计了域间联合适应性分数, 通过平衡领域特征的重合性与差异性来选择领域间协同性高的多源领域组合. 在涵盖6个领域的基准数据集上设计了跨领域迁移任务, 并在方面级情感分析的3种子任务上进行了实验来验证所提方法的有效性.
    2026,37(4):1472-1491, DOI: 10.13328/j.cnki.jos.007522, CSTR: 32375.14.jos.007522
    [摘要] (900) [HTML] (0) [PDF 5.35 M] (845)
    摘要:
    对抗训练被视为提升深度模型鲁棒性的核心防御手段, 但其固有缺陷严重制约了实际应用效果. 传统对抗训练方法依赖固定攻击模式生成对抗样本, 导致训练过程中样本多样性不足、模型泛化能力受限, 且在鲁棒性与干净准确率间难以达成有效平衡. 更为关键的是, 现有对抗训练框架缺乏对训练过程的自适应控制, 容易引发鲁棒过拟合现象. 针对上述挑战, 利用演化优化提出一个自适应对抗训练框架, 称为基于自适应策略优化的鲁棒泛化权衡学习, 简称TRG-ASO. 该方法将遗传算法引入对抗训练过程, 通过动态调整不同训练阶段的对抗攻击策略, 实现对抗样本生成模式的渐进式复杂化. 这种层级递进的对抗机制不仅增强了样本多样性, 还可通过策略优化记录实现训练早停, 有效抑制过拟合风险. 在CIFAR系列数据集上的实验表明, 相较于传统对抗训练方法, 所提框架在维持基础分类性能的同时, 提升了模型面对多种攻击范式的防御能力, 且加快了训练收敛速度. 为对抗训练中鲁棒性-泛化性的权衡提供了新思路, 对构建可信深度学习系统具有重要实践价值.
    2026,37(4):1492-1510, DOI: 10.13328/j.cnki.jos.007523, CSTR: 32375.14.jos.007523
    [摘要] (744) [HTML] (524) [PDF 6.32 M] (921)
    摘要:
    大多数图异常检测方法依赖图神经网络(GNN)在相对高质量的图数据上进行学习. 然而, 在现实应用中, 这种理想场景极为罕见, 大多数数据存在标签缺失、动态变化和结构不完整等问题, 这些问题统称为动态不完整图. 针对GNN在极端条件下性能下降的挑战, 提出一种可解释的动态不完整图异常检测方法EXDIG (explainable dynamic incomplete graph anomaly detection), 其核心是一种结合强-弱互信息优化的图掩码自编码器框架. 该框架通过对图结构(节点/边)和节点特征进行掩码, 模拟现实中的动态不完整场景. 此外, 通过强-弱互信息损失, EXDIG捕捉结构与特征之间的关系, 同时保持结构完整性, 降低过拟合风险, 并提升泛化能力. 此外, 该方法通过在节点、边及特征上引入掩码扰动, 提高动态不完整图异常检测的可解释性, 使其能够识别关键组成部分, 并为异常检测结果提供透明且可信的解释. 在9个真实世界图数据集上进行评估, 实验结果表明, EXDIG在不同程度的动态不完整场景下, 在多种下游任务和表示学习评估(包括有监督和无监督设定)中均优于现有最先进方法. 其中, 在异常检测数据集Amazon上, EXDIG的NMI和ARI指标分别提升了超过 13% 和 15%; 在动态不完整比率从25%到99%的设置下, 其F1分数波动被控制在5%以内. 此外, EXDIG还实现了在动态不完整图中对各节点的可解释性分析.
    2026,37(4):1511-1530, DOI: 10.13328/j.cnki.jos.007524, CSTR: 32375.14.jos.007524
    [摘要] (945) [HTML] (663) [PDF 3.40 M] (993)
    摘要:
    随着信息技术的迅猛发展, 欺诈行为在金融交易、社交网络与评论系统等多个领域呈现出日益复杂化和多样化的趋势, 给传统欺诈检测技术带来了严峻挑战. 当前主流的基于图神经网络的方法虽然在单机构数据环境中表现出色, 但由于涉及用户敏感信息, 难以实现跨机构间的数据共享与协作, 进而限制了模型的训练效果与泛化性能. 联邦学习作为一种新兴的隐私保护分布式学习范式, 为跨机构协作训练提供了可行途径, 但现有图联邦学习方法多针对通用图任务设计, 难以适应欺诈检测中普遍存在的类别分布不平衡和数据异构性问题, 导致在欺诈样本识别方面表现不佳. 为应对上述挑战, 提出一种面向欺诈检测的风险感知动态聚合图联邦学习方法(FedRPDA), 旨在有效应对跨机构的复杂欺诈风险事件识别. FedRPDA包括两项关键策略: 典型风险动态聚合策略通过衡量客户端图中欺诈节点的结构性风险强度, 并结合具有时间衰减特性的动态权重映射机制来自适应地调整客户端的聚合权重, 从而在数据异构条件下增强全局模型对正常样本与典型欺诈样本的判别能力; 多样化风险平均聚合策略结合基于变分扰动的欺诈样本特征增强机制与全局原型引导的对比学习机制, 有效提升模型对结构多样、数量稀少的非典型欺诈样本的表征能力, 促进其在特征空间中向共性异常靠拢, 进一步提升模型在复杂欺诈风险场景下的识别鲁棒性. 在多个真实欺诈检测数据集上的实验结果表明, FedRPDA 在检测性能与训练收敛效率方面显著优于现有图联邦学习基线方法, 展现出良好的泛化能力与实际应用潜力.
    2026,37(4):1531-1547, DOI: 10.13328/j.cnki.jos.007525, CSTR: 32375.14.jos.007525
    [摘要] (945) [HTML] (0) [PDF 2.64 M] (841)
    摘要:
    开放世界持续学习(OWCL)旨在模拟现实环境中任务不断演化、类别动态变化且遇到未经训练的未知样本的情景. 一个良好的开放世界持续学习模型不仅需要在学习新任务的同时保持对已学任务的记忆, 还需具备识别未知类别的能力, 进而实现持续且鲁棒的知识积累与泛化. 然而, 现有持续学习方法普遍建立在封闭世界假设之上, 无法有效应对开放类别带来的类别不确定性与任务间干扰, 尤其在知识稳定性与知识可塑性之间的权衡上表现出明显不足. 因此, 在开放世界持续学习问题的形式化定义基础上, 提出一种任务敏感提示驱动的混合专家模型TP-MoE (task-aware prompt-driven mixture of experts), 以实现对任务语义的动态建模与专家模块的高效调度, 从而帮助模型进行知识传输和知识更新. 具体而言, TP-MoE引入一种即插即用的任务提示聚合机制并改进门控机制用以专家网络路由, 在任务增量过程中持续融合历史与当前任务知识; 同时结合一种自适应开放边界阈值策略, 可根据新旧知识的迁移动态调整开放类别的判别边界, 从而提升开放类别检测能力与已知类别分类准确性. 实验结果表明, TP-MoE在Split-CIFAR100和Open-CORe25基准数据集上对各类指标的测试均取得领先性能, 展现出良好的稳健性与泛化性, 为开放世界持续学习任务中的知识建模与任务调度提供了一种可扩展、可迁移的新框架.
    2026,37(4):1548-1559, DOI: 10.13328/j.cnki.jos.007526, CSTR: 32375.14.jos.007526
    [摘要] (683) [HTML] (0) [PDF 1.71 M] (799)
    摘要:
    在回归任务中, 数值型标签噪声会扭曲数据的真实分布, 削弱模型的泛化能力. 数据过滤是目前常用的一类方法, 在一定程度上能减少噪声影响, 但易引发过度过滤问题, 导致有效样本流失和数据分布偏移. 提出一种回归噪声标签的渐进式区间校正(progressive interval correction, PIC)算法, 旨在解决数据过滤导致的样本流失问题, 并有效降低标签噪声水平. 首先基于真实标签的后验分布给出标签校正的有效性条件, 以确保降低标签噪声水平; 然后对满足有效性条件的标签进行最大后验校正; 最后通过逐步缩小可信区间范围的方式渐进地校正和优化标签. 在基准数据集与真实数据集上的实验结果表明, PIC算法能够显著降低数据的噪声水平, 有效提升模型性能.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2026-04-09 , DOI: 10.13328/j.cnki.jos.007614
    摘要:
    TLS协议在保障网络通信的隐私性、完整性和可靠性方面发挥着至关重要的作用. 近年来, 工业界和学术界积极推动TLS协议相关研究和发展, 尤其在TLS 1.3中取得了巨大进展. 然而, 随着网络环境的日益复杂化和攻击手段的不断进步, TLS 1.3的安全性也面临着严峻挑战, 如重放攻击、前向安全风险, 以及OpenSSL软件实现漏洞. 这些攻击和漏洞不仅严重威胁用户隐私与企业数据安全, 也对互联网的信任体系乃至整个社会的数字经济产生深远影响. 首先对TLS 1.3协议发展历程和原理进行详细介绍. 其次, 对TLS 1.3协议相关安全研究进行分类梳理和对比分析, 从协议机制、软件实现和应用配置这3个方面系统分析和归纳. 最后, 总结TLS 1.3协议安全研究现状和瓶颈挑战, 为未来的研究方向提供建议.
    优先出版日期:  2026-04-09 , DOI: 10.13328/j.cnki.jos.007648
    摘要:
    图像处理任务正快速向云端和多方协同环境迁移, 而云服务器上直接处理明文图像数据, 极易泄露图像中的敏感信息, 且难以抵御篡改等恶意攻击, 无法保证数据完整性和服务可靠性. 在此背景下, 提出一种面向恶意敌手环境的目标检测推理方案——MalOD, 实现针对恶意敌手环境的安全目标检测. MalOD通过构建加密的特征金字塔网络 (secure feature pyramid network, SecFPN)实现密文图像的多级特征提取, 并基于多层次密文特征设计安全区域提议网络(secure region proposal network, SecRPN)和兴趣区域安全对齐(secure region of interest align, SecRoIA)模块从而完成安全目标检测. 具体来说, 借助复制秘密共享(replicated secret sharing, RSS)技术, 设计一系列安全计算原语, 包括安全向上取整函数、安全双线性插值和安全最近邻插值, 为SecFPN、SecRPN、SecRoIA等模块提供底层支撑, 确保恶意敌手环境下检测流程的高效与准确. 此外, 证明MalOD的正确性和安全性, 并在COCO和Pascal VOC数据集上进行性能评估. 实验结果表明, 在满足严格安全要求的同时, MalOD实现较高的目标检测精度. 特别地, 当目标检测的交并比阈值为0.5时, 其在COCO子集上平均精度仅比明文检测下降0.113. 为恶意环境下的隐私保护图像处理提供了理论和实践支持, 尤其适用于不可信的云计算和多方协作场景中.
    优先出版日期:  2026-04-01 , DOI: 10.13328/j.cnki.jos.007642
    摘要:
    随着数字经济的快速发展, 数据作为重要的生产要素, 在推动新质生产力和经济社会高效运转中发挥了核心作用. 数据要素的高效利用及其在不同主体间的有序、安全、合规流通对于数据要素价值释放具有重要意义. 然而, 数据流通过程中面临显著的安全隐患与可信挑战, 如泄露、篡改以及不可用等问题, 同时数据真实性和流通透明性要求也愈发重要. 为应对这些问题, 密码学、区块链、可信执行环境等技术被广泛应用, 但仍存在成本高、灵活性不足等限制, 且当前研究多集中于特定阶段, 缺乏系统性视角. 为此, 以数据要素全生命周期为主线, 构建了包含数据采集、传输、存储、处理、发布、溯源这6大阶段的分析框架, 系统性分析其安全与可信挑战. 提炼出安全技术“三线分化、协同融合”和可信技术“验证深度递进”两大演进模型. 旨在为该领域的关键问题提供体系化的解决思路, 并对未来研究方向提出展望.
    优先出版日期:  2026-04-01 , DOI: 10.13328/j.cnki.jos.007611
    摘要:
    Web 3.0 是以区块链为技术底座的新一代互联网框架, 能够助力数据资产化, 形成可流通的数字资产, 促进数字经济发展. 然而, Web 3.0 在用户生态构建与数字资产流通两方面仍然存在挑战: (1) Web 3.0 用户信任机制多样导致用户数字身份管理难; (2) Web 3.0 数字资产侵权成本低、鉴权粒度粗导致数字资产高效流通难; (3) Web 3.0 开放自治且参与实体多元导致用户生态治理难; (4) Web 3.0 数据公开透明且攻击面多样导致隐私保护与安全监管平衡难. 围绕这4个挑战, 提出面向数据资产化的 Web 3.0 技术架构, 针对数据资产化在身份管理、资产流通、生态治理与安全监管这4个方面的需求, 结合技术自身特点, 对国内外相关的 Web 3.0 技术研究工作进行归纳、分类、分析与总结. 具体包括: (1)分布式数字身份管理机制, 包含数字身份创建、标识鉴别与隐私保护等技术; (2) Web 3.0 数字资产流通机制, 包含数字资产确权、鉴权与流通等技术; (3) Web 3.0 生态治理机制, 包含用户声誉评价与权益激励等技术; (4) Web 3.0 数字资产安全防护与监管技术, 包含主动监管、链上数据监测与应用前端安全分析等技术. 最后, 展望 Web 3.0 技术的未来研究方向.
    优先出版日期:  2026-04-01 , DOI: 10.13328/j.cnki.jos.007612
    摘要:
    在大型在线服务系统中, 由于各组件间错综复杂的依赖关系, 故障的发生常会引发大量相关告警, 形成告警风暴. 告警风暴不仅增加了值班工程师的工作负担, 也使得故障诊断和根因分析变得更加困难. 为了解决这一问题, 提出了Alert-CM, 一种基于图表示学习的告警聚类方法, 将由同一故障引发的告警有效地聚类在一起, 从而减轻工程师的工作负担. 在告警管理过程中, 一条告警往往由故障发生时的多种底层系统数据共同汇总得到, 如异常相关应用、指标、日志、预警规则和应急场景等. Alert-CM认为由同一个故障引发的多个告警通常在底层系统数据层面存在紧密关联, 并且当中的底层核心系统数据将更能代表当前告警对应的系统异常状态. 根据这一核心思想, Alert-CM基于告警相关配置数据构建出细粒度的系统数据依赖图, 并将告警与图中各节点的依赖关系进行抽象和映射, 进一步扩展告警的特征空间. 基于系统数据依赖图, Alert-CM搭建了图神经网络模型进行图表示学习, 挖掘核心底层系统数据对于告警的贡献强弱, 从而输出准确的告警向量表示. 最终, Alert-CM使用DBSCAN算法实现告警聚类. 在真实工业数据集上对Alert-CM进行评估, 重点考察聚类的有效性和实时效率. 实验结果表明, Alert-CM在告警聚类任务中的表现显著优于传统的告警聚合方法. 在评估中, Alert-CM的NMI和ARI分别达到了 0.901 和 0.645, 相较于现有方法的平均值分别提升 31.7% 和 153.9%, 同时Alert-CM在在线实时聚类任务上也表现出良好的性能.
    优先出版日期:  2026-04-01 , DOI: 10.13328/j.cnki.jos.007613
    摘要:
    大语言模型在自动代码生成领域已展现出巨大的潜力, 但在实际应用中, 生成的代码常存在语法、语义、安全性、运行效率和可维护性等多方面的问题. 为解决这些挑战, 受约束代码生成技术应运而生. 此技术借鉴了受约束文本生成的方法, 通过在代码生成的各个阶段引入严格的约束, 确保生成代码能够满足预期的要求. 首先回顾大语言模型在代码生成过程中所暴露的主要问题, 详细分析代码正确性与代码质量方面的缺陷. 接着, 总结当前受约束代码生成技术的研究进展, 深入探讨不同方法的优势与局限. 之后, 讨论