P15﹥《面向开放互联网的科学数据挖掘与理解》
概述:随着数据观测、采集手段的发展,科学大数据正快速增长,并推动着科研范式变革。然而,科学数据分散在互联网中各类数据仓储与个人数据库中形成了“数据孤岛”,难以有效整合与关联科学数据。为此,本文提出了一种面向开放互联网的科学数据挖掘与理解方法,通过机器阅读各类互联网数据资源,自动识别科学数据并结构化抽取关键字段,实现对科学数据的高效发现与管理。具体来说,本文融合网页多视角信息设计了网页筛选器WebFlteri,通过融合网页DOM树的结构共现与语义相关实现对网页级特征理解与分类;此外,本文设计了基于节点异构关联的网页阅读器WebRadere,通过异构图网络的消息传递对网页关键信息进行结构化抽取,形成科学数据画像。本文采用了多个公开数据集进行实验性能评估:在网页分类方面,本文提出的WebFlteri相较于基线模型准确率提升了1.39%到3.71%、F1分数提升了1.42%到4.10%;在网页信息抽取方面,本文提出的WebRadere平均提升1.40%,在少训练样本情况下性能提升显著。更进一步,基于本文技术研究成果研制了面向地球科学领域的开放科学数据系统DataExpo,汇聚百万科学数据并提供了数据多维查询、地图查询等数据服务,已应用于“深时数字地球”国际大科学计划,推动了地球科学领域数据驱动范式研究 。
作者简介:卢彬,博士,博士后,中国计算机学会(CCF)会员,上海交通大学信息与电子工程学院 / 集成电路学院;主要研究领域为图机器学习、AI for Science;E-mail:robinlu1209@sjtu.edu.cn。
甘小莺,博士,教授,博士生导师,中国计算机学会(CCF)会员,上海交通大学信息与电子工程学院 / 集成电路学院;主要研究领域为物联网数据挖掘、时空感知计算;E-mail:ganxiaoying@sjtu.edu.cn。
引用:卢彬, 甘小莺, 甘雨, 等. 面向开放互联网的科学数据挖掘与理解[J]. 计算机学报 . 2026 ,49 (01) : 15-28.
全文:点击下载
P29﹥《基于图神经驱动自激励的协作多智能体强化学习方法》
概述:在协作多智能体系统(Multi-Agent System,MAS)中,智能体之间的通信因移动、干扰或带宽受限而动态变化,导致消息丢失与网络拓扑不连通,影响协同决策效率。同时传统的探索策略缺乏针对性,智能体易陷入局部最优,无法充分覆盖环境空间。针对这些问题,提出一种协作多智能体强化学习方法(Graph-based Reinforced Exploration Multi-Agent Reinforcement Learning,GREMARL),该方法将自激励探索(Self-Motivated Exploration,SME)与图神经网络(Graph Neural Network,GNN)多智能体通信方法相结合。其中SME模块通过将状态-动作对熵增量设计为内在奖励信号,使每个智能体能够根据自身对环境未知区域的好奇心动态调整探索优先级。并且SME通过可学习权重参数来自适应衰减,保证在后期更偏重于环境外部奖励,实现从广度探索向深度利用的平滑过渡。GNN通信模块则以动态图卷积网络为基础,通过时序图神经网络端到端地学习通信拓扑的动态演化规律,确保在不同任务阶段关键信息能够沿着最优路径快速传播,而冗余或次要通道则被自动弱化。为了验证GREMARL算法的有效性,将GREMARL方法应用于星际争霸(Star Carft Multi-Agent Challenge,SMAC)与谷歌足球(Google Research Football,GRFootball)环境中。实验结果表明,该方法在SMAC等复杂任务环境中的平均胜率达到了88.8%,比目前最优算法高16.8%。通过设计消融实验,从多个方面验证了自激励探索与图神经建模对GREMARL的必要性。
作者简介:曹玉康,博士研究生,中国计算机学会(CCF)会员,苏州大学计算机科学与技术学院;主要研究领域为深度强化学习、计算机视觉、多智能体强化学习;E-mail:20244027007@stu.suda.edu.cn。
刘全,博士,教授,中国计算机学会(CCF)高级会员,苏州大学计算机科学与技术学院 / 苏州大学江苏省计算机信息处理技术重点实验室;主要研究领域为深度强化学习、自动推理;E-mail:quanliu@suda.edu.cn。
引用:曹玉康, 刘全, 刘洪哲, 等. 基于图神经驱动自激励的协作多智能体强化学习方法 [J]. 计算机学报 . 2026 ,49 (01): 29-42.
全文:点击下载
P43﹥《基于鲁棒思维链的大语言模型语音翻译方法》
概述: 语音翻译作为促进全球信息交流与消除语言障碍的关键技术,在国际会议、在线教育等多元场景中应用日益广泛。大语言模型凭借其强大的文本理解与生成能力,为语音翻译领域带来了新的突破契机。其中,思维链技术通过引导大语言模型先生成源语言转录再进行翻译,虽提升了性能,但也易导致模型过度依赖中间文本、忽略原始语音输入,从而可能放大转录缺陷,影响最终翻译的准确性与鲁棒性。为此,本文提出一种面向语音翻译的鲁棒思维链方法。该方法在训练阶段,一方面按预设概率对思维链中的部分词元进行随机掩码,以此迫使模型减少对转录文本的绝对依赖,更多地从原始语音信号及不完整的文本线索中学习推理,提升其对不完整思维链的适应与纠错能力;另一方面则引入一种正则化机制,旨在约束模型在拥有完整思维链与面对不完整思维链两种情况下对目标译文的预测分布,力求使其保持一致,从而缓解模型在拥有完整思维链时可能发生的过度依赖问题,进而全面增强翻译的准确性与鲁棒性。在CoVoST 2数据集六个主要翻译方向上的系统性实验评估表明,本文所提出的方法相较于不使用思维链的基线系统,平均BLEU得分提升高达2.78分;相较于标准的思维链方法,亦能取得0.92 BLEU分的性能增益。此外,在不同参数规模的Qwen2.5系列模型上的验证结果充分证明了该方法的有效性、通用性与良好的可扩展潜力。
作者简介:房庆凯,博士研究生,中国科学院计算技术研究所智能信息处理重点实验室 / 中国科学院大学;主要研究领域为自然语言处理、语音翻译和大语言模型;E-mail:fangqingkai21b@ict.ac.cn。
冯洋,博士,研究员,博士生导师,中国计算机学会(CCF)杰出会员,中国科学院计算技术研究所智能信息处理重点实验室 / 智能算法安全全国重点实验室 / 中国科学院大学;主要研究领域为自然语言处理和大语言模型;E-mail:fengyang@ict.ac.cn。
引用:房庆凯, 冯洋. 基于鲁棒思维链的大语言模型语音翻译方法 [J]. 计算机学报 . 2026 ,49 (01): 43-61.
全文:点击下载
P84﹥《基于可学习聚合权重的解析性联邦学习方法》
概述:联邦学习通过在客户端与参数服务器之间交换模型参数而非原始数据,有效保护了数据隐私安全。然而,随着客户端数量和数据规模的增加,联邦学习仍面临通信开销增加和任务复杂性提升的问题。现有方法通常采用基于客户端本地数据量的权重归一化策略进行模型聚合,在一定程度上降低通信开销,但未充分考虑数据异质性,这可能导致模型过拟合、收敛速度减缓,并加重通信负担。因此,本文提出了一种具有可学习聚合权重的解析性联邦学习算法(Learnable Aggregation Weights and Analytic Federated Learning,LAW-AFL),该算法首先通过引入可学习的收缩因子和相对权重,改进了聚合过程中的权重计算方式,并引入闭式训练范式指导神经网络训练,增强模型在异质性数据下的稳定性和泛化能力;其次通过推导绝对聚合规则,进一步提升了聚合过程的效率和准确性,实现了单周期本地训练,简化了训练流程,同时该算法利用闭式解进行高效聚合,简化了训练流程。实验结果表明,所提出的算法在多个数据集和模型上都显著提高了全局模型的精度和泛化能力,相比较于基线方法,在处理大规模客户端和非独立同分布(Non Independent and Identically Distributed,Non-IID)数据时准确率提高了10%,并在特定实验设置下将全局模型的准确率提升至90%以上,单论训练时间相较于Fed AVG缩短了69.82秒/轮。这证明了LAW-AFL在准确性和鲁棒性方面具有一定的优势,并且大幅度降低了通信成本。
作者简介:蒋伟进,博士,教授,博士生导师,中国计算机学会(CCF)高级会员,湖南工商大学计算机学院 / 湘江实验室;主要研究领域为边缘计算、联邦学习、网络空间安全;E-mail:jwjnudt@163.com。
崔新雨,硕士研究生,中国计算机学会,CCF)学生会员,湖南工商大学计算机学院 / 湘江实验室;主要研究领域为联邦学习、隐私保护;E-mail:2822867259@qq.com。
引用:蒋伟进, 崔新雨, 刘志华, 等. 基于可学习聚合权重的解析性联邦学习方法[J]. 计算机学报 . 2026 ,49 (01): 84-108.
全文:点击下载
P109﹥《大模型训练的混合并行技术综述》
概述:在生成式人工智能的迅猛发展推动下,基于Transformer架构的大规模预训练模型呈现出参数规模的指数级增长。面对数百亿甚至千亿级参数模型的训练需求,传统的单模态并行方法在计算效率、内存占用和通信开销等方面面临严峻挑战,从而促使混合并行技术逐渐成为大规模分布式训练的主流范式。本文以Transformer架构的并行化特性为研究切入点,系统地分析了数据并行、张量并行、序列并行、流水线并行及专家并行的内在机制,揭示了不同并行策略之间的耦合关系与组合边界。通过整合算子内切分与算子间切分的数学模型,构建了混合并行策略的统一表示框架。该框架通过分离算子切分逻辑与并行拓扑映射,为现有研究提供了可扩展的理论分析工具。在方法论层面,基于该混合并行框架的理论推导,本文总结了基于计算图分解的自动并行搜索技术的发展路径。最后,结合当前技术瓶颈与新兴硬件架构,本文展望了从多模态计算协同与异构集群调度等方面的未来发展方向,为突破万亿参数模型训练的系统性挑战提供理论依据。
作者简介:张贵鹏,博士研究生,中国计算机学会(CCF)会员,中国科学院计算技术研究所 / 中国科学院大学;主要研究领域为分布式训练、异构计算;E-mail:zhangguipeng23z@ict.ac.cn。
孙毓忠,博士,研究员,中国计算机学会(CCF)会员,中国科学院计算技术研究所 / 中国科学院大学;主要研究领域为云计算、操作系统;E-mail:yuzhongsun@ict.ac.cn。
引用:张贵鹏, 孙毓忠. 大模型训练的混合并行技术综述 [J]. 计算机学报 . 2026 ,49 (01): 109-131.
全文:点击下载