网联工业 赋能制造
洞察资讯
聚焦您关心的

工联网平台+大模型 | 评估视角:“工业互联网平台+大模型”评价体系

2025/5/13 17:20:36

在工业数字化转型的浪潮中,工业互联网平台与大模型正加速融合,成为推动制造业迈向智能化、高效化、可持续发展新阶段的关键力量。为深入洞察工业互联网平台与大模型融合背后的作用机理、关键技术、应用成效及未来走向,赛迪研究院信息化与软件产业研究所工业互联网研究室从背景视角、理论视角、技术视角、评估视角和未来视角等五大核心视角出发,展开了全方位、深层次、系统性的研究。本期发布《评估视角:“工业互联网平台+大模型”评价体系》。


文| 赛迪智库信息化与软件产业研究所工业互联网研究室

在制造业数字化转型的浪潮中,“工业互联网平台+大模型”的融合正成为推动产业升级的关键力量。当前这一模式仍处于前期探索阶段,产业各界对其性能和可靠性存在诸多疑虑,亟需制定一套科学合理、系统全面、紧贴实际的评价指标体系。本期从评估视角深入探讨“工业互联网平台+大模型”评价体系的构建,在深入一线企业调研的基础上,从数据准确性、算法稳定性、结果可靠性、场景匹配度、应用可行性和抗污染能力六个维度,构建了全面且实用的“工业互联网平台+大模型”评价体系。该体系不仅为制造业企业在选型产品时提供了科学依据,也为数字服务商在技术迭代过程中指明了方向,助力制造业高端化、智能化、绿色化发展。


数据准确性

数据是提升大模型性能的基础养料。数据准确与否,直接关系到“工业互联网平台+大模型”应用效果的高低。为有效衡量“工业互联网平台+大模型”相关产品中数据的准确性,拟围绕数据一致性、数据完整性、数据精确度、数据时效性等细分指标进行评价,力争全方位体现训练和推理数据的质量水平。a2ae6a34-e954-4730-8c7a-ed9935d26d91.png


算法稳定性

“工业互联网平台+大模型”应用于各类工业场景,对不同数据的分析利用,都离不开算法的稳定性。为了确保“工业互联网平台+大模型”在具体应用过程中工业决策的正确性,必须衡量其算法的稳定性。本研究报告拟围绕鲁棒性、收敛性、重复性、泛化能力、容错性等方面评价算法的稳定性,引导开发者和用户理解算法在实际应用中的稳定性表现,并据此做出相应的改进和优化。9f273f44-5fc7-4f15-a15f-0121eb10a0c1.png


结果可靠性

在工业环境中,若“工业互联网平台+大模型”生成不准确的结果,可能导致严重的安全事故或经济损失。所以,在制定“工业互联网平台+大模型”评价体系时,考虑结果可靠性是至关重要的。本研究报告拟从准确性、精度、灵敏度、可解释性等四个方面评价“工业互联网平台+大模型”的结果可靠性,综合采取对比分析、统计测试等方法,确保“工业互联网平台+大模型”在具体落地过程中能取得正向收益。ac0a8ad8-95e9-4ee2-9890-a92c175fe835.png


场景匹配度

“工业互联网平台+大模型”应落实到场景的实际应用情况,能否解决实际问题、提升生产效率、改善经营状况是企业重点关注的几个因素。本研究报告拟从实际成效、场景适应性、场景覆盖度、跨域能力、数据处理能力等五个方面评价“工业互联网平台+大模型”的在具体场景的应用实效,通过场景实测方式,为企业是否选择“工业互联网平台+大模型”提供一定的参考依据。

59f4a9f0-2725-4d77-b060-a33da0c02f7c.png


可行性

大模型在工业领域使用的灵活度和易用性,决定了产品未来是否可持续应用,需考察大模型与平台融合的兼容性问题、产品的使用体验,以及在满足现有需求的情况下,能否通过定制化调整来满足企业需求变化。针对“工业互联网平台+大模型”相关应用的可行性,拟围绕灵活性、兼容性、易用性、轻量化、安全性、平台适配度等细分指标进行评价,提升“工业互联网平台+大模型”的功能延展性和使用延续性。23773f9f-d341-47c6-bb67-c3b6b91e7ed1.png


抗污染能力

“工业互联网平台+大模型”在研发设计、生产制造、经营管理、运维服务等环节中的应用场景千差万别,数据质量、数据频率等因素也不尽相同。只有“工业互联网平台+大模型”具备强大的抗污染能力,面对不同应用场景才能避免“幻觉”,进而充分适应各类工业场景。为此,本研究报告拟围绕异常值检测能力、噪声容忍度、对抗攻击鲁棒性、数据污染恢复力、多源数据融合稳定性等五个方面衡量“工业互联网平台+大模型”的抗污染能力,提高其对应用场景变化的适应水平。58f1a567-ff4b-45be-9af3-c69fc9000bc6.png

30d026e0-fa87-4aef-a893-531cd0b8cae7.png


来源:工业互联网世界