P22﹥《深度学习的多视角三维重建技术综述》
概述:为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几何和隐式几何两种几何表示方式对近几年的多视角三维重建算法进行了分类与梳理。重点介绍了目前具有较高重建精度的将隐式函数以及体渲染相结合的神经隐式三维重建算法,并分别定量、定性分析了该类部分算法在数据集上的结果;另外列举了常用数据集和评价指标,并对未来的研究趋势和发展方向进行了展望。
作者简介:王文举,博士,上海理工大学教授,CCF 会员,研究方向为计算机视觉、深度学习、三维点云和计算光谱成像。
唐邦,上海理工大学硕士研究生,研究方向为深度学习和三维重建;E-mail:223332932@st.usst.edu.cn。
引用:王文举, 唐邦,等. 深度学习的多视角三维重建技术综述[J]. 计算机工程与应用,2025,6: 22-35.
全文:点击下载
P36﹥《深度学习在知识图谱构建及推理中的应用》
概述:知识图谱作为自然语言处理领域的一种结构化知识表示形式,能够描述现实世界中的概念及相互关系,常被应用于信息检索、数据管理等领域。深度学习因其具有自动学习多元数据内在规律和表示层次的特性,可用于大规模、高质量知识图谱的精准构建及有效推理,已逐渐成为新兴研究热点。为进一步促进深度学习和知识图谱的技术融合,以知识图谱构建及推理过程为主线,全面介绍深度学习在知识表示、知识抽取、知识融合、知识推理领域的相关理论及最新研究成果;同时,根据近年来的研究趋势,重点归纳与总结了适用于图数据特征推理的图深度学习与知识推理相融合的最新研究成果。最后,对深度学习和知识图谱的融合发展做了概要总结和技术展望,为未来研究发展提供参考和思路。
作者简介:孙宇,硕士,山东中医药大学医学信息工程学院,山东中医药大学中医文献与文化研究院,研究方向为中医药数字人文与知识工程。
周扬,博士,山东中医药大学中医文献与文化研究院教授,研究方向为中医药数字人文与知识工程、中医古籍整理;E-mail:zhouyangjn@163.com。
引用:孙宇, 刘川, 周扬. 深度学习在知识图谱构建及推理中的应用[J]. 计算机工程与应用,2025,6: 36-52.
全文:点击下载
P53﹥《语音识别与大语言模型融合技术研究综述》
概述:在当今时代背景下,多种大语言模型层出不穷,推动了人工智能众多领域的发展和创新。归纳大语言模型在语音识别技术中的积极作用,并探讨其发展前景,可以为语音识别技术的发展提供创新思路。在目前主流的端到端语音识别模型中,常使用额外的语言模型对语音识别结果重打分或结合WFST算法辅助解码来提升语音识别结果的准确率。最新研究发现,将大型语言模型融入语音识别模型的端到端训练中,能够更好地提升语音识别结果的准确率。以浅融合、深度融合、冷融合三类语音识别与语言模型的融合方式为主线,进行了其原理及优劣的分析。近期研究者的实验结果证实,大语言模型与声学模型相结合能够有效提高识别精度。在系统地梳理了大语言模型在语音识别技术中的研究进展后,其在语音识别中的重要作用也得以揭示。语音识别与大语言模型融合的相关技术已经逐渐成熟,值得进一步的探索与深入研究。
作者简介:王敬凯,广西民族大学人工智能学院硕士研究生,CCF学生会员,研究方向为语音识别。
白凤波,博士,广西民族大学人工智能学院讲师,CCF会员,研究方向为人工智能、数据科学等;E-mail:baif@gxun.edu.cn。
引用:王敬凯, 秦董洪, 等. 语音识别与大语言模型融合技术研究综述[J]. 计算机工程与应用,2025,6: 53-63.
全文:点击下载
P96﹥《改进YOLOv8的轻量化水下生物检测模型》
概述:在复杂自然环境下高效探测水下生物资源对中国渔业具有重要意义,为了解决YOLO系列针对复杂的水下环境的检测能力较弱且模型泛化性不足等问题,提出一种基于改进YOLOv8n的水下生物目标检测的方法 SGDCYOLOv8。将深度监督的思想融入检测头,利用共享感受野注意力卷积提高检测精度的同时优化感受野,引入额外的监督损失函数来实现参数共享的高效检测头;为降低计算成本和参数量,设计了轻量化门控正则单元部分卷积模块为模型减负;针对水下生物目标的特征容易模糊或丢失的问题,提出浅层混合池下采样模块和深层最大池下采样模块,以优化多尺度特征融合,并保证关键数据的准确性和完整性;在网络中加入卷积与注意力融合CAFM模块来增强全局和局部的特征建模。在公开数据集DUO上的实验结果表明,相比于基线模型YOLOv8n,SGDC-YOLOv8在mAP@50上提升2.5个百分点,在mAP@50-95提升1.8个百分点,参数量和计算量分别降低14.62%和15.85%,FPS提升至146.2,相比于其他主流目标检测模型表现效果也最佳。
作者简介:闵锋,博士,副教授,武汉工程大学智能机器人湖北省重点实验室,研究方向为图像处理与模式识别、计算机视觉。
张雨薇,硕士研究生,武汉工程大学智能机器人湖北省重点实验室,研究方向为目标检测与计算机视觉;E-mail:1227346823@qq.com。
引用:闵锋, 张雨薇,等. 改进YOLOv8的轻量化水下生物检测模型[J]. 计算机工程与应用,2025,6: 96-105.
全文:点击下载
P106﹥《基于CDD-YOLO的轻量级低光照目标检测算法》
概述:针对低照度场景下目标检测算法面临的检测精度不高、计算成本以及内存消耗大等问题,提出一种改进YOLOv8的轻量级低光照目标检测网络模型CDD-YOLO。提出一个基于坐标注意力机制的多尺度卷积模块,提取不同感受野纹理特征并捕获空间位置之间的远程依赖关系;将动态头部框架集成到检测头中,减少复杂背景和尺度变化的干扰;基于动态非单调聚焦机制设计边界框回归损失函数,提升锚框回归路径和质量,提高模型对光照变化和噪声的适应能力;通过剪枝算法修剪模型中的冗余参数,实现模型轻量化。采用自建数据集、ExDark和VOC数据集进行实验验证,实验结果表明该方法与主流算法相比具有更好的检测效果,在计算复杂度与检测精度之间实现了更好的平衡。
作者简介:史丽晨,博士,西安建筑科技大学机电工程学院教授,研究方向为设备状态监测与智能运维;E-mail:bestslc@xauat.edu.cn。
杨超,西安建筑科技大学机电工程学院硕士研究生,研究方向为机器视觉与图像处理。
引用:史丽晨, 杨超, 等. 基于CDD-YOLO的轻量级低光照目标检测算法[J]. 计算机工程与应用,2025,6: 106-117.
全文:点击下载