P2523﹥《多视图聚类研究综述》
概述:随着互联网、社交网络和医学图像等多元化数据源的日益增多,传统的单视图聚类方法难以处理来自各种视图的海量数据。因此,关于多视图数据上的聚类问题变得越来越重要。本文以多视图聚类(Multi-view clustering,MVC)为对象,对多视图聚类常用的技术框架和方法进行综述。首先对多视图聚类技术框架进行分析和归类,并根据其技术特点将其分为三大类:基于启发式的MVC、基于判别式的MVC和基于生成式的MVC;其次,分别重点介绍这三种技术框架的常见方法,包括非负矩阵分解、子空间聚类、图学习、张量学习、深度嵌入聚类、对比学习、变分自动编码器和生成对抗网络;最后比较和分析现有的多视图聚类在不同数据集上的性能,总结该领域所面临的挑战,并对发展前景进行展望。
作者简介:丁世飞,博士,教授,博士生导师,中国计算机学会(CCF)杰出会员,中国矿业大学计算机科学与技术学院 / 人工智能学院,矿山数字化教育部工程研究中心(中国矿业大学);主要研究领域为人工智能、模式识别、机器学习、数据挖掘;E-mail: dingsf@cumt.edu.cn。
韦修喜,博士研究生,副教授,中国计算机学会(CCF)会员,中国矿业大学计算机科学与技术学院 / 人工智能学院,广西民族大学人工智能学院,广西混杂计算与集成电路设计分析重点实验室(广西民族大学);主要研究领域为机器学习、聚类分析;E-mail: weixiuxi@163.com。
引用:丁世飞, 韦修喜, 梅炎斌, 等. 多视图聚类研究综述[J]. 计算机学报 ,2025,11: 2523-2560.
全文:点击下载
P2594﹥《近似最优的分布式博弈论介数中心度算法》
概述:传统的介数中心度仅依赖通过节点的最短路径数量度量节点重要程度,但在多节点失效场景下,可能无法准确反映节点对网络整体功能的影响。相比之下,基于博弈论的介数中心度则能够考虑节点在不同节点组中的贡献,从而为多节点失效场景下最小化失效影响提供参考。其中常用的一类中心度为基于半值的介数中心度。然而,基于半值的介数中心度的集中式算法在无权图中的复杂度可达O(n4),其中n为网络的节点数,这使得传统的单机计算方法在大规模网络中面临挑战。本文提出了一种基于半值的介数中心度分布式算法(MR-SMBC算法),轮数复杂度为O(n)。该算法通过解决中心度计算过程中边际贡献导致的顶点重复遍历问题,相较于基础算法实现了线性级别的轮数复杂度降低。MR-SMBC算法基于CONGEST模型设计,该模型限制每轮网络节点传输的消息大小为O(logn)比特。此外,本文通过通信复杂度问题的归约,证明了基于半值的介数中心度问题的轮数复杂度下界为Ω(n/logn+D),其中D为网络的直径长度。这一结果表明MR-SMBC算法在CONGEST模型下实现了近似最优的计算效率。本文通过在多个真实世界图和人工生成图上的实验,测试了MR-SMBC算法的可扩展性,并评估了通信与计算时间比率等性能指标。实验结果表明,与基础算法相比,MR-SMBC算法能够实现线性级别的时间加速。
作者简介:王烨飞,博士研究生,大数据技术与系统国家地方联合工程研究中心;主要研究方向为分布式算法和图算法;E-mail: wangyefei@hust.edu.cn。
华强胜,博士,教授,中国计算机学会(CCF)杰出会员,服务计算技术与系统教育部重点实验室;主要研究方向为并行与分布式计算理论与算法;E-mail: qshua@hust.edu.cn。
引用:王烨飞, 华强胜, 高文杰, 等. 近似最优的分布式博弈论介数中心度算法[J]. 计算机学报 ,2025,11: 2594-2610.
全文:点击下载
P2611﹥《基于能量理论的通用信息抽取框架》
概述:信息抽取(Information Extraction,IE)旨在从非结构化的自然文本中提取实体、关系配对、事件元素、情感极性等结构化信息。主流的基于跨度的方法通过联合建模目标标签的语义信息与抽取目标的边界分布,在不同任务上表现出强大性能,但仍存在局限:(1)预测跨度起始和结束边界的策略忽略了跨度边界之间的配对关联性;(2)传统的微调损失使模型过度依赖目标跨度的精确边界;(3)传统的Transformer结构注重全局表示,与IE任务中总是具有有限长度目标的情况不匹配。为解决上述问题,我们提出了基于能量的通用信息抽取(Energy Based Universal Information Extraction,EBUIE)框架。通过引入基于能量的模型的思想,我们设计了一种新颖的基于能量的配对专家(Energy-based Pairwise Expert,EPE),使用标量能量来量化跨度边界之间的配对关联性。受自然界中能量分布和转化的启发,我们提出了能量分布平滑损失(Energy-distribution Smoothing Loss,ESL)和能量场注意力(Energy Field Attention,EFA),以减轻模型对标签边界的过度依赖,并在决策过程中自适应调整注意力分布。在四个纯文本IE任务和三个多模态IE任务上均取得了优于最先进方法的结果。在纯文本场景下:命名实体识别、关系抽取、事件触发词抽取、情感观点三元组抽取上分别取得0.69%、3.15%、1.6%、7.71%的最优提升;在多模态场景下:术语抽取、情感分类、联合抽取分别取得1.8%、0.2%、2.8%的最优提升。
作者简介:李祖超,博士,副教授,中国计算机学会(CCF)会员,武汉大学人工智能学院;主要研究领域为自然语言处理、人工智能;E-mail: zcli-charlie@whu.edu.cn。
杜博,,博士,教授,武汉大学计算机学院;主要研究领域为人工智能、医学图像处理;E-mail: dubo@whu.edu.cn。
引用:李祖超, 彭天硕, 张乐飞, 等. 基于能量理论的通用信息抽取框架[J]. 计算机学报 ,2025,11: 2611-2630.
全文:点击下载
P2631﹥《机器视觉编码技术研究及其进展》
概述:机器视觉编码技术的不断进步,在工业制造、遥感监测、低空经济以及智慧安防等领域展现出广阔的应用前景。然而,现有的机器视觉编码技术和算法结构仍在不断演进,不同技术之间存在显著差异,导致研究人员对其理解还未达到一致,未能形成统一的标准和体系。因此,迫切需要对机器视觉编码技术的发展现状进行系统梳理,为未来研究和实际应用提供参考。本文从机器视觉的信源数据和编码原理入手,首先深入分析了机器视觉数据源的生成过程,包括信号采集和典型数据的编码特性等。接着,围绕“码率-任务质量-可计算性”的核心架构,阐述了机器视觉编码的基本原理,提出了通用的典型参考架构,并讨论了评价方法、可计算性分析、标准进展以及面临的技术瓶颈。针对机器视觉视频编码中的关键技术进行了全面论述,包括机器语义的视觉信息表示方法、特征生成及编码技术、面向任务的编码技术、可变码率优化技术以及近似重构技术。进一步,从编码器结构的角度出发,介绍了多种新型机器视觉编码器结构,如机器视觉的端到端编码结构、适用于可见光通用的混合编码结构、人机混合编码结构、集成编码结构、基于内容信息抽象表示的编码结构以及点云编码结构等。通过分析多种机器视觉数据类型的编码算法及其应用,详细评估了典型数据编码算法在不同应用场景中的优势与不足,并根据具体应用需求提出了系统性的解决方案。最后,对机器视觉编码技术的未来研究发展方向和应用前景进行了展望,旨在推动该技术在各领域的进一步发展和应用。
作者简介:田港一,博士研究生,中国计算机学会(CCF)会员,中国科学院计算技术研究所处理器芯片全国重点实验室 \ 中国科学院大学;主要研究领域为机器视觉编码、图像信号处理(ISP)、微光算法等;E-mail: tiangangyi22b@ict.ac.cn。
纪雯,博士,研究员,博士生导师,中国计算机学会(CCF)高级会员,中国科学院计算技术研究所处理器芯片全国重点实验室 \ 龙眼国科智能信息技术有限公司;主要研究领域为视觉处理器、多媒体系统、工业人工智能,包括高性能视觉处理器、多媒体端边云计算系统、视觉编码与传输、工业智能芯片与系统等;E-mail: jiwen@ict.ac.cn。
引用:田港一, 纪雯. 机器视觉编码技术研究及其进展[J]. 计算机学报 ,2025,11: 2631-2665.
全文:点击下载
P2713﹥《基于强化学习的算力网络管理和调度》
概述:算力网络作为一种新兴的网络架构,通过整合分散的计算资源,构建一个统一的资源池,实现计算能力的动态按需分配。然而,现有的调度策略在算力资源和网络资源分配之间解耦合,无法为时延敏感型任务提供稳定的时延保障。针对这一挑战,本文提出了一种基于强化学习的算力网络联合调度优化框架(RLMS-CPN),通过实时监测网络状态和算力资源分布,智能地进行算力节点选择与路径规划,旨在最小化任务的响应时延。该框架包含多项创新技术,包括面向开放网络环境的AI算力任务计算时延估计模型,以及基于图神经网络的强化学习算网联合调度算法。通过在NS3模拟系统中对算力网络控制系统进行仿真,我们在四种不同的网络拓扑下进行实验。结果表明,与现有方法相比,RLMS-CPN在降低响应时延方面取得了显著成效,平均降低了22.61%的响应时延,显著提升了网络整体性能和用户体验。此外,针对新设备的计算时延估计,两阶段微调时延估计模型(TSFT)在仅使用50个新样本的情况下,实现了0.003的低预测误差。
作者简介:王静,硕士研究生,湖南大学信息科学与工程学院 / 超算与人工智能融合计算教育部重点实验室;主要研究方向为计算机网络,算力网络; Email:wangjingwr@hnu.edu.cn。
谢鲲,博士,教授,中国计算机学会 (CCF) 高级会员,湖南大学信息科学与工程学院 / 超算与人工智能融合计算教育部重点实验室;主要研究方向为计算机网络、网络安全、算力网络、人工智能;E-mail:xiekun@hnu.edu.cn。
引用:王静, 谢鲲, 曾鑫, 等. 基于强化学习的算力网络管理和调度[J]. 计算机学报 ,2025,11: 2713-2734.
全文:点击下载