P979﹥《机器阅读理解研究综述》
概述:机器阅读理解(Machine Reading Comprehension,MRC)作为自然语言处理领域的核心任务之一,旨在赋予机器理解文本并回答相关问题的能力。本文综述了MRC领域的最新研究进展,系统地梳理了自2015年以来的主要研究工作。文章首先概述了MRC任务的不同形式,包括填空式、多项选择式、抽取式和自由答案式,并对其评估方法进行了详细分析。随后,本文深入分析了机器阅读理解模型架构的发展历程,从基础的通用结构和依赖注意力机制的模型出发,进一步探讨了预训练语言模型(Pre-trained Language Models,PLMs)及大语言模型(Large Language Models,LLMs)技术的应用,并对融合推理结构的模型进行了详细阐述。此外,文章还讨论了MRC面临的任务挑战,如无答案问题、多答案问题、对话型、多轮交互型、跨语言与跨模态型阅读理解,以及零样本和少样本问题,并分析了相应的解决方案;最后讨论其应用和发展趋势。本文的主要贡献包括:(1)对MRC不同形式及其相关数据集的系统综述;(2)对MRC架构的深入探讨;(3)分析MRC面临的任务挑战。本文旨在为MRC领域的研究者提供全面的参考,以促进具有更强理解能力和泛化能力的模型设计与发展,推动相关领域的深入探索。
作者简介:张天成,博士, 东北大学计算机科学与工程学院教授,中国计算机学会(CCF) 高级会员;主要研究领域为人工智能、时空数据管理、智慧教育;E-mail: tczhang@mail.neu.edu.cn。
王雅婷,硕士,中国计算机学会(CCF)会员,东北大学计算机科学与工程学院;主要研究领域为知识追踪、自然语言处理、可解释人工智能;E-mail:2301964@stu.neu.edu.cn。
引用:张天成, 王雅婷, 李凡, 等. 机器阅读理解研究综述[J]. 计算机学报 . 2026 ,49 (05) : 979-1008.
全文:点击下载
P1046﹥《基于RT-DETR的小目标检测算法》
概述:随着低空经济的发展,小目标逐渐成为目标检测领域的难点。现有小目标检测算法无法满足实际场景需求,主要表现为特征保持能力不足、全局上下文信息利用不充分。为此,本文提出了基于RT-DETR的小目标检测算法SOD-DETR。首先,本文提出了小目标特征保持网络。该网络采用双分支结构,分别提取空域特征和频域特征,通过融合空、频特征来增强特征表达,提高小目标特征保持能力。在频域特征提取时,结合频带分离与注意力机制,实现关键频域特征的自适应学习,以提升频域特征处理的效率。然后,本文构建了一个亚像素-激励模块,该模块融合亚像素处理、Focus策略及压缩激励机制,将亚像素信息保存到通道维度、引导模块关注重要通道信息,以提升小目标检测性能。最后,通过改进混合编码策略,进一步增强了小目标提取能力。本文在Vis Doner 、TT100K和UAVDT-2024-DET三个数据集上进行了测试,实验结果表明:本文提出的SOD-DETR明显优于当前主流方法,m AP50和m AP50-95指标提升分别最高达到6%和5.1%。
作者简介:张云佐,博士,石家庄铁道大学信息科学与技术学院教授,博士生导师,中国计算机学会(CCF)杰出会员;主要研究领域为计算机视觉、人工智能、大数据;E-mail:zhangyunzuo888@sina.com。
康尧星,博士研究生,工程师,中国计算机学会(CCF)专业会员,石家庄铁道大学交通运输学院/ 河北省科学院应用数学研究所/ 河北省信息安全认证技术创新中心;主要研究领域为计算机视觉、人工智能;E-mail:kyaoxing@163.com。
引用:张云佐, 康尧星, 刘婷, 等. 基于RT-DETR的小目标检测算法 [J]. 计算机学报 . 2026 ,49 (05) : 1046-1060.
全文:点击下载
P1075﹥《基于混合聚类的多级别加权图对比学习》
概述:图对比学习无需依赖数据标签,能够从未标注的图数据中自动学习有价值的信息。其核心思想是通过对比图数据的不同视图来学习样本的表示。然而,现有研究大多仅基于节点特征或拓扑结构的单一角度生成对比视图,限制了对图结构数据的全面探索,单一角度的感知使模型容易忽略特征相似但非直接连接的节点或对边连接密集的节点过拟合,进而影响其在下游任务上的性能表现。此外,现有方法在进行视图对比时,无论是同级别还是跨级别的对比,通常忽视了负样本的差异性,即模型无法有效区分节点中的假负样本以及群组中不同规模负样本对全局语义的影响,从而在学习过程中出现表示偏差,影响下游任务上的性能。为了解决上述问题,我们提出了基于混合聚类的多级别加权图对比学习(multi-level weighted graph contrastive learning via hybrid clustering,HCWGC)框架。具体来说,它基于两种互补型聚类方法,分别从结构和特征两个角度生成对比视图,既能从边连接稠密性的角度挖掘局部显式结构,又能从特征相似性的角度挖掘全局隐式结构,进而全面捕获图结构数据中的复杂信息。随后,设计了多级别加权对比策略计算对比损失,在节点-节点级对比中,设计节点相似等级指标以识别假负样本,减少其噪声干扰;在节点-群组级对比中,设计群组局部强度指标以考虑不同规模的群组对全局语义的影响,使规模较大的群组负样本在对比过程中发挥更大的作用。实验结果表明,HCWGC在多个图数据集上均展现出优越的性能。与最优基线模型相比,在节点分类任务的Micro-F1指标上最高相对提升达到0.45%,Macro-F1指标上最高相对提升达到0.57%,在节点聚类任务的NMI指标上最高相对提升达到4.77%,在链接预测任务部分数据集的AP指标上最高相对提升了0.1%。
作者简介:王笛苹,北京交通大学计算机科学与技术学院硕士研究生;主要研究领域为数据挖掘、图神经网络;E-mail:dipingwang@bjtu.edu .cn。
原继东,博士,北京交通大学计算机科学与技术学院副教授,中国计算机学会(CCF)会员;主要研究领域为数据挖掘、时间序列分类;E-mail:yuanjd@bjtu.edu.cn。
引用:王笛苹, 刘海洋, 原继东, 等. 基于混合聚类的多级别加权图对比学习 [J]. 计算机学报 . 2026 ,49 (05) : 1075-1092.
全文:点击下载
P1153﹥《支持高频数据更新的OKVS-PIR标签隐私求交方案》
概述:标签隐私集合求交(Labeled Private Set Intersection,LPSI)作为PSI的重要扩展,不仅延续了传统PSI保护集合元素隐私的核心能力,更进一步实现了与元素关联的标签信息(如医疗协作中的患者诊断结果)的安全共享。这一特性使得LPSI在跨机构联合分析、安全数据匹配等实际场景中具有关键应用价值。然而,现有LPSI方案在应对大规模、高动态数据环境时仍面临显著挑战:一方面,基于全同态加密的方案(如APSI,CCS’21)尽管提供了强大的安全性保障,但其预处理阶段具O(n2)的复杂度,难以适应数据频繁更新的需求;另一方面,基于不经意键值存储(Oblivious Key-Value Store,OKVS)与批量隐私信息检索(Batch Private Information Retrieval,BatchPRI)的高效混合架构(如UCPSI,USENIX’24)虽在计算与通信效率上取得重要进展,却缺乏对交集元素对应标签的生成与安全传输机制的原生支持,无法直接满足LPSI的核心功能要求。为应对上述挑战,本文提出一种支持动态更新的标签隐私集合求交方案,旨在实现数据高频更新与标签实时共享的高效安全统一。本文的核心贡献在于通过系统性的协议重构与技术创新,解决了动态LPSI场景下的效率与功能瓶颈。首先重构OKVS键值对结构,实现数据-标签的原子化安全传输。安全机制上,运用不经意伪随机函数来保护参与方集合内容的隐私性;并创新性地设计基于HMAC的盲化与验证机制,有效防止在标签更新与传输过程中可能引发的信息泄露,确保即使在多次动态更新操作下,敌手也无法推断出额外的关联信息,并在半诚实敌手模型下证明方案安全。性能表现上,提出二维哈希表分组匹配策略,将大规模集合的交集计算分解为可并行执行的子任务,显著提升计算吞吐量。在通信优化方面,结合随机带状矩阵OKVS构造与高效的Batch PRI技术,大幅降低在线阶段的通信负载,使方案能够扩展到百万量级的数据规模。C++实现表明:与LPSI方案PEPSI(USENIX’24)相比,在各种数据集规模下的总运行时间减少90%~96%。相较于APSI,在预处理时间上减少12%~61%;且在nx=220规模下,的总运行时间比APSI减少19%~50%,充分证明其在处理大规模动态数据时的可扩展性与实用性。本文提出的方案已开源在https://github.com/Li Crypto X/ulpsi 。
作者简介:薛婧婷,博士,副教授,中国计算机学会(CCF)会员,西南石油大学计算机与软件学院/ 电子科技大学计算机科学与工程学院/ 中国电子科技集团公司第三十研究所保密通信全国重点实验室;主要研究领域为应用密码学、云数据安全审计、区块链技术。E-mail:jtxue@swpu.edu.cn。
李发根,博士,电子科技大学计算机科学与工程学院教授,博士生导师;主要研究领域为密码学、信息安全;E-mail:fagenli@uestc.edu.cn。
引用:薛婧婷, 李文毅, 李发根, 等. 支持高频数据更新的OKVS-PIR标签隐私求交方案[J]. 计算机学报 . 2026 ,49 (05) : 1153-1169.
全文:点击下载
P1170﹥《体系结构模拟器技术进展与分析》
概述:体系结构模拟器(computer architecture simulator)是以体系结构视角对处理器功能部件及部件间时序等关系进行建模,模拟处理器功能和性能(速度、功耗等)行为的软件。相较于传统的电路层(门级)模拟器,体系结构模拟器因其忽略门级电路实现细节,通常表现出更高的模拟速度。由于体系结构模拟器在处理器架构设计和优化空间探索等方面的重要作用,目前广泛应用于软硬件协同和体系结构创新中,已成为处理器设计工具链的一个关键环节。本文首先讨论了体系结构模拟器的构成、关键指标和面临的挑战。在此基础上调研了近年关于体系结构模拟器的国内外最新研究进展以及开源生态,分析了各个研究小组和公司机构对开发新的模拟技术和工具的贡献。最后对未来体系结构模拟器的发展方向进行了讨论并给出了可能的发展方向的建议。本文希望为领域研究者提供一些启发,推动体系结构模拟器在软硬件协同工具链的更广泛应用。
作者简介:耿子端,博士研究生,中国计算机学会(CCF)会员,复旦大学计算与智能创新学院/ 复旦大学大数据研究院/ 复旦大学并行处理研究所;主要研究领域为计算机体系结构、模拟仿真;E-mail:zdgeng21@m.fudan.edu.cn。
张为华,博士,教授,博士生导师,中国计算机学会(CCF)会员,复旦大学计算与智能创新学院/ 复旦大学并行处理研究所;主要研究领域为编译优化、计算机体系结构、并行、系统软件等;E-mail:zhangweihua@fudan.edu.cn。
引用:耿子端, 张宇航, 王啸峥, 等. 体系结构模拟器技术进展与分析[J]. 计算机学报 . 2026 ,49 (05) : 1170-1196.
全文:点击下载