图书馆

杭州拱宸桥校区  8:00—21:30

绍兴杨汛桥校区  8:00—21:00

首页 / 通知公告 / 正文
【期刊导读】《大数据》2025年第1期
来源:大数据   作者:   编辑:黄求尔   时间:2025-03-06   点击数:

P36AIGC独创性标准的构建

概述:随着生成式人工智能技术的普及,AIGC著作权的问题凸显。传统“工具论”和“贡献论”下的独创性标准适用于AIGC时尤显不足,必须构建更具可操作性的独创性标准。通过对著作权法的立法价值进行分析和对现行法律的规范进行研究,结合国内外司法案例的实证研究,提出“决定论”下独创性标准的构建。应当立足人类中心主义,坚持著作权主体的唯一性,将劳动投入作为权利基础,并引入英美法系因果关系理论,将人类对作品的呈现结果决定和创作过程控制作为充分必要条件。由此,“决定论”在对象、标准、法律、事实、因果关系上是自洽的,并能指导实践。

作者简介:李祎恒,博士,河海大学法学院副教授、副院长,主要研究方向为数字法学、房地产法。

张峥,河海大学水利政策法制研究与培训中心研究助理,主要研究方向为数字法学、经济法;E-mail1571560503@qq.com

引用:李祎恒, 张峥. AIGC独创性标准的构建[J].  大数据,2025,1: 36-44.

全文:点击下载


P79《大模型时代下的存储系统挑战与技术发展》

概述:大语言模型(简称大模型)在文本和视觉处理等复杂任务中表现出色,受到工业界和学术界的广泛关注。大模型的训练与推理高度依赖于GPU算力,而GPU的显存容量有限且属于易失性存储介质,难以满足大模型在训练和推理过程中的存储需求。深入分析了大模型时代下存储系统面临的挑战:一是大模型的数据呈现高度碎片化特征,且大模型数据语义稀疏化显著,这降低了存储系统的利用率;二是大模型训练与推理对数据的读写带宽需求高,但异构存储介质间的数据传输通信开销大,这增加了利用异构存储介质扩展GPU显存的难度;三是大模型训练过程中的容错需求高,但直接使用以CPU为中心的容错技术会带来高昂的开销。针对上述挑战,从数据管理、存储扩容和数据容错3个方面总结了现有的解决方案。最后,展望了未来大模型时代存储系统的发展趋势。

作者简介:冯杨洋,清华大学计算机科学与技术系博士生,主要研究方向为存储系统和机器学习系统。

舒继武,博士,清华大学计算机科学与技术系教授、博士生导师,中国计算机学会(CCF)会士,主要研究方向为非易失内存存储系统、存储可靠性和分布式计算;E-mailshujw@tsinghua.edu.cn

引用:冯杨洋, 汪庆, 舒继武. 大模型时代下的存储系统挑战与技术发展[J]. 大数据,2025,1: 79-91.

全文:点击下载


P117《沙尘图像视觉增强技术综述》

概述:沙尘图像视觉增强技术旨在提高沙尘暴天气下成像设备捕获数据的视觉感知清晰度,以辅助高级视觉算法提高从数据中获取关键特征的能力。随着沙尘天气出现频次的增多,沙尘图像视觉增强技术逐渐成为图像处理领域的研究热点,在遥感勘测、无人驾驶、智慧交通等人工智能相关行业有着十分广泛的应用前景。为了更好地了解当前沙尘图像处理领域的研究进展,详细阐述了基于传统技术的沙尘图像增强算法和基于大气散射模型的沙尘图像复原算法,总结了基于数据驱动的沙尘图像重构算法,对当前公开数据集的构建进行了细致的研究和分析,并简单梳理了图像增强领域常用的评价指标。最后对所述内容做出总结,指出当前研究中存在的困难,并对未来沙尘图像增强技术的发展方向进行了展望

作者简介:司亚中,河北工业大学博士生,平安科技(深圳)有限公司算法工程师,主要研究方向为深度学习、计算机视觉等。

王健宗,博士,平安科技(深圳)有限公司副总工程师,资深人工智能总监,联邦学习技术部总经理,智能金融前沿技术研究院院长。美国佛罗里达大学人工智能博士后,美国莱斯大学和华中科技大学联合培养博士,中国计算机学会资深会员,中国计算机学会大数据专家委员会委员,中国自动化学会联邦数据和联邦智能专业委员会副主任。主要研究方向为大模型、联邦学习和深度学习等;E-mailjzwang@188.com

引用:司亚中, 张旭龙,. 沙尘图像视觉增强技术综述[J]. 大数据,2025,1: 117-134.

全文:点击下载


P135《基于时间序列的非周期预测模型》

概述:在实际应用中,纯周期性的数据相对罕见,大多数数据往往表现出非周期性特征,难以通过简单的周期性变化进行预测或描述。而单一神经网络在处理非周期性时间序列时往往面临过拟合、长时依赖捕获困难、非线性关系捕获有限等问题。为了有效地对非周期性时间序列进行预测,基于Informer模型提出了ILTNet模型。ILTNet模型结合线性预测(AR模型)和非线性预测(Informer模型与循环跳跃组件),能有效捕获长期依赖关系。实验证明,与LSTNetInformerAR以及GRU模型相比,ILTNet模型在非周期时间序列预测上表现出显著优势。例如,在Exchange Rate数据集上,ILNet模型相对于LSTNet模型,在步长为96128时将RSE分别降低了0.03330.0277,相对于Informer模型在所有步长下,RSE均有显著降低,尤其是在步长为96时将RSE降低了0.2877

作者简介:曹建文,兰州工业学院计算机与人工智能学院副教授,主要研究方向为计算机技术。

委兴宝,兰州大学信息科学与工程学院硕士生,主要研究方向为时间序列分析、人工智能;E-mail220220942340@lzu.edu.cn

引用:曹建文, 委兴宝,. 基于时间序列的非周期预测模型[J]. 大数据,2025,1: 135-149.

全文:点击下载


P167《生成式人工智能的算法伦理难点分析与探索》

概述:2022年下半年以来,生成式人工智能技术和产业快速发展。聚焦生成式人工智能技术所用的生成式算法,结合相关法规规范,提出“生成式算法三定律”伦理原则。结合其技术特点,对实践中存在的伦理难点开展分析,并初步探索并提出解决框架

作者简介:施敏,上海市互联网信息办公室,主要研究方向为互联网新技术新业务的发展和安全、网络空间治理、人工智能与大数据伦理等。

杨海军,博士,上海市互联网信息办公室高级工程师,主要研究方向为通信和公共互联网领域的网络与信息安全工作、互联网舆情、网络空间治理、网络与信息安全战略、互联网新技术新业务的发展及其安全等。

引用:施敏,杨海军. 生成式人工智能的算法伦理难点分析与探索[J]. 大数据,2025,1: 167-174.

全文:点击下载