图书馆

绍兴杨汛桥校区  8:00—21:00

杭州拱宸桥校区  8:00—21:30

【期刊导读】《大数据》2025年第1期
来源:大数据   作者:信息资源部   编辑:黄求尔   时间:2025-04-07   点击数:

P3《面向人工智能的数据治理框架

概述:数据对人工智能的开发应用具有至关重要的作用,这已成为工业界和学术界的共识。基于人工智能与数据的互动关系,以及以数据为中心的开发实践,提出面向人工智能的数据治理框架,包含源数据治理、预训练数据治理、评测数据治理、微调数据治理、推理数据治理和运维数据治理6个方面,每个方面都有其重点任务和技术。同时,深入分析ChatGPTZiya2和能源领域部分人工智能模型的数据治理案例和成功经验,以验证该框架的有效性。结果表明,该框架在提高人工智能模型性能、优化数据管理流程等方面具有积极作用,对面向人工智能的数据治理的理论和技术创新具有参考价值。

作者简介:李继峰,博士,国务院发展研究中心资源与环境政策研究所气候政策研究室主任、研究员,主要研究方向为能源经济环境系统分析建模、能源战略、碳减排政策分析。

毕超,博士,中国农业发展银行总行处长、高级工程师,主要研究方向为大语言模型、数字金融、金融科技;E-mailznufebc@163.com

引用:李继峰, 张成龙,. 面向人工智能的数据治理框架[J]. 大数据,2025,1: 3-20.

全文:点击下载


P36AIGC独创性标准的构建》

概述:随着生成式人工智能技术的普及,AIGC著作权的问题凸显。传统“工具论”和“贡献论”下的独创性标准适用于AIGC时尤显不足,必须构建更具可操作性的独创性标准。通过对著作权法的立法价值进行分析和对现行法律的规范进行研究,结合国内外司法案例的实证研究,提出“决定论”下独创性标准的构建。应当立足人类中心主义,坚持著作权主体的唯一性,将劳动投入作为权利基础,并引入英美法系因果关系理论,将人类对作品的呈现结果决定和创作过程控制作为充分必要条件。由此,“决定论”在对象、标准、法律、事实、因果关系上是自洽的,并能指导实践。

作者简介:李祎恒,博士,河海大学法学院副教授、副院长,主要研究方向为数字法学、房地产法。

张峥,河海大学水利政策法制研究与培训中心研究助理,主要研究方向为数字法学、经济法;E-mail1571560503@qq.com

引用:李祎恒, 张峥. AIGC独创性标准的构建[J]. 大数据,2025,1: 36-44.

全文:点击下载


P117《沙尘图像视觉增强技术综述》

概述:沙尘图像视觉增强技术旨在提高沙尘暴天气下成像设备捕获数据的视觉感知清晰度,以辅助高级视觉算法提高从数据中获取关键特征的能力。随着沙尘天气出现频次的增多,沙尘图像视觉增强技术逐渐成为图像处理领域的研究热点,在遥感勘测、无人驾驶、智慧交通等人工智能相关行业有着十分广泛的应用前景。为了更好地了解当前沙尘图像处理领域的研究进展,详细阐述了基于传统技术的沙尘图像增强算法和基于大气散射模型的沙尘图像复原算法,总结了基于数据驱动的沙尘图像重构算法,对当前公开数据集的构建进行了细致的研究和分析,并简单梳理了图像增强领域常用的评价指标。最后对所述内容做出总结,指出当前研究中存在的困难,并对未来沙尘图像增强技术的发展方向进行了展望

作者简介:司亚中,河北工业大学博士生,平安科技(深圳)有限公司算法工程师,主要研究方向为深度学习、计算机视觉等。

王健宗,博士,平安科技(深圳)有限公司副总工程师,资深人工智能总监,联邦学习技术部总经理,智能金融前沿技术研究院院长。美国佛罗里达大学人工智能博士后,美国莱斯大学和华中科技大学联合培养博士,中国计算机学会资深会员,中国计算机学会大数据专家委员会委员,中国自动化学会联邦数据和联邦智能专业委员会副主任。主要研究方向为大模型、联邦学习和深度学习等:E-mailjzwang@188.com

引用:司亚中, 张旭龙,. 沙尘图像视觉增强技术综述[J]. 大数据,2025,1: 117-134.

全文:点击下载


P135《基于时间序列的非周期预测模型》

概述:在实际应用中,纯周期性的数据相对罕见,大多数数据往往表现出非周期性特征,难以通过简单的周期性变化进行预测或描述。而单一神经网络在处理非周期性时间序列时往往面临过拟合、长时依赖捕获困难、非线性关系捕获有限等问题。为了有效地对非周期性时间序列进行预测,基于Informer模型提出了ILTNet模型。ILTNet模型结合线性预测(AR模型)和非线性预测(Informer模型与循环跳跃组件),能有效捕获长期依赖关系。实验证明,与LSTNetInformerAR以及GRU模型相比,ILTNet模型在非周期时间序列预测上表现出显著优势。例如,在Exchange Rate数据集上,ILNet模型相对于LSTNet模型,在步长为96128时将RSE分别降低了0.03330.0277,相对于Informer模型在所有步长下,RSE均有显著降低,尤其是在步长为96时将RSE降低了0.2877

作者简介:曹建文,兰州工业学院计算机与人工智能学院副教授,主要研究方向为计算机技术。

委兴宝,兰州大学信息科学与工程学院硕士生,主要研究方向为时间序列分析、人工智能;E-mail220220942340@lzu.edu.cn

引用:曹建文, 委兴宝,. 基于时间序列的非周期预测模型[J]. 大数据,2025,1: 135-149.

全文:点击下载


P167《生成式人工智能的算法伦理难点分析与探索》

概述:2022年下半年以来,生成式人工智能技术和产业快速发展。聚焦生成式人工智能技术所用的生成式算法,结合相关法规规范,提出“生成式算法三定律”伦理原则。结合其技术特点,对实践中存在的伦理难点开展分析,并初步探索并提出解决框架

作者简介:施敏,上海市互联网信息办公室,主要研究方向为互联网新技术新业务的发展和安全、网络空间治理、人工智能与大数据伦理等。

杨海军,博士,上海市互联网信息办公室高级工程师,主要研究方向为通信和公共互联网领域的网络与信息安全工作、互联网舆情、网络空间治理、网络与信息安全战略、互联网新技术新业务的发展及其安全等。

引用:施敏, 杨海军. 生成式人工智能的算法伦理难点分析与探索[J]. 大数据,2025,1: 167-174.

全文:点击下载