生成式AI大模型并未改变,人工智能在工业领域应用的范式

以ChatGPT、Llama等为代表的大模型技术拉开了迈向通用人工智能的序幕,人工智能成为全球经济增长的重要驱动力,对各类产业的智能化带来全新的空间。根据普华永道的预测,到2030 年,人工智能可为全球经济贡献高达 15.7 万亿美元,超过中国和印度目前的产出总和。其中,6.6 万亿美元可能来自生产率的提高,9.1 万亿美元可能来自消费端的影响。对于制造业,人工智能一直是智能制造、工业4.0、工业互联网等领域的重要部分,在ChatGPT、Stable Diffusion等崛起前,质量检测、设备预测性维护等代表性的人工智能应用已经深度融入制造业,并且形成成熟的应用范式。

工业人工智能的应用范式已经成型 ,一是需要深度学习、强化学习等数据科学算法,计算机视觉、自然语言处理、语音识别等面向领域的算法,知识图谱、专家系统等知识工程,例如通过计算机视觉来构建产品外观检测的模型,基于强化学习进行排产规划模型的构建,借助知识图谱构建设备运维服务。二是需要通用支撑技术保障人工智能应用在制造业的部署和推理,例如边缘计算、高性能计算等技术保障现场的推理速度,时序数据库、大数据平台等保障数据的有效管理和接入。三是需要工业领域知识及经验实现人工智能应用与工业场景的适配,例如在模型训练的时候需要专家经验的介入实现调优和优化,在部分场景下需要机理模型和人工智能模型的结合才能发挥作用,在生产现场模型的部署和实施也需要和自动化的设备、工业软件等进行集成。

图1 工业人工智能实施范式

大模型的崛起并没有对人工智能在制造业的应用范式引起根本性的变革,但是在不同的环节增添了特定的需求,例如在算法层面,基于Transformer、U-Net 等架构的基础模型成为生成式人工智能进入制造领域的基础;在通用支撑技术领域,向量数据库、MaaS等也成为重要的数字基础设施;在工业知识及经验领域,不同以往对时间序列等结构化数据的需求,生成式AI对高质量文本、图片、文档等数据的要求不断提升。虽然大模型仍在原有的范式下进行应用,但是大模型技术会不断的拓展人工智能在工业领域应用的空间,根据埃森哲测算,Al可以在2035年将制造业的附加值提高近4万亿美元,根据Marketresearch预测,到 2032年,全球生成式人工智能制造市场规模将达到63.98亿美元。

图2 生成式人工智能在制造业的市场规模

生成式AI大模型短期趋势:拓展新场景并未出现替代小模型

图3 生成式人工智能大模型在制造业的应用情况

生成式AI大模型能力覆盖结构化数据、文本、图像、音视频等多个领域生成,但在制造业领域的探索仍聚焦于结构化数据、自然语言和图像数据的处理和生成。这种情况的形成主要是目前尚未出现能力较强的音频、视频领域的基础模型,所以尚未出现小模型领域像基于声纹分析的设备诊断、基于视频分析的安全生产等相关的工业案例。生成式AI探索也覆盖了制造业的研发设计与规划、生产过程管控、经营管理优化、产品服务优化等全生命周期。

在研发设计与规划阶段, 一方面是利用自然语言的交互能力实现CAD软件功能的拓展,例如Back2CAD 基于Elaine CAD Bot、ChatGPT 和 Amazon AWS等的支持推出CADGPT™,支持智能推荐、文档生成、代码生产等各类功能。另一方面是基于图像数据的生成能力提升设计效率,例如海尔设计基于亚马逊云科技和合作伙伴 Nolibox 携手打造的 AIGC 解决方案,将AIGC 图像生成能力引入到产品设计、UI 设计、CMF 设计、品牌设计等环节,涵盖了新品设计、改款升级、渠道定制化等工业设计的业务场景。

在生产制造环节, 围绕知识问答和代码生成等能力成为重要的探索热点。例如西门子和微软还在合作开发可编程逻辑控制器 (PLC) 的代码生成工具,ChatGPT 被用于通过自然语言输入生成 PLC 代码。Authentise通过利用12,000 篇科学增材制造论文对通用大语言模型的精调,推出 3DGPT用于增材制造技术问答。用户可以获得例如“在使用粉末不锈钢时如何减少缺陷的可能性”等专业问题答案。例如创新奇智推出AInno-15B工业大模型,通过大模型服务引擎支撑生成式AI应用,实现工业机器人控制、企业私域数据分析、企业私域知识库等应用。SprutCAM X结合ChatGPT api 构建CAM虚拟助手,能够支持工程师操作机床加工,例如提出在点(100, 25)处钻一个直径10毫米的孔”,AI助手就会为生成相应的CAM执行代码。C3iot 也是基于大语言模型构建了面向多个行业和多个领域的生成式AI 服务,并且为某大型制造企业基于生成式AI提供设备运维服务,借助 C3 Generative AI,操作员可以利用简化的工作流程来诊断设备故障根因。当操作员发现生产问题时,可以直接进入 C3 Generative AI 搜索故障排除指南和教科书,以找出潜在原因。

图4 C3IOT生成式AI 服务架构图

在经营管理环节, 基于大语言模型新增智能问答、数据分析等能力成为主流。例如在ERP领域,用友以ChatGPT、文心一言、Llama等大模型为底座构建yongpt,在大模型的基础架构当中,把确定性的事项交回用友BIP原有的产品功能去做,把不确定的事项、推理性的事项和人脑思维意识派定的事项交给大模型去开发,能够支撑企业经营洞察、智能订单生成、供应商风控、动态库存优化等应用。在CRM 领域,Salesforce、微软等均加强生成式AI在产品中的集成和应用。

图5、用友yongpt架构

在产品服务优化环节, 将大模型的能力集成到产品中,成为消费电子、汽车等领域产品智能化能力提升的探索焦点。例如国光电器推出的智能音箱Vifa ChatMini 内置了ChatGPT和 文心一言双模型,在保持了专业声学标准的基础上,与传统的智能音箱相比,Vifa ChatMini 在自然语言生成和情感表达方面具有显著的优势,可应用到老年人和儿童等特定用户群体,用于情感支持和智能学习陪伴,也可作为智能助手应用在日常工作和规划中。

综上,目前生成式AI大模型在制造业的探索路径初步呈现为三条路径:

一是通过直接集成基础大模型的问答、代码生成等通用能力来提升效率。例如海尔、西门子等的CAD、PLC代码生成;Salesforce、微软、ABB、用友等在CRM、ERP、生产管理等软件接入大模型,提升专业软件的数据分析、文档管理、知识问答等辅助能力。

二是通过微调、外挂知识库等方式来聚焦领域实现场景创新,增加新的功能。例如,Authentise通过利用12,000篇科学增材制造论文的精调对通用大语言模型的精调,推出 3DGPT用于增材制造技术问答。

三是从预训练开始构建工业大模型。 例如创新奇智工业大模型AInno-15B从 Llama  2、Falcon、Bloom等开源大模型中蒸馏一部分知识,再结合自己设计的参数结构和积累的工业知识数据做训练。经过Pretrain、SFT和RLHF三个训练步骤,依次使模型获得更懂工业、支持问答交互和答案更标准的能力。

生成式AI大模型,在制造业领域仍需克服三大挑战

人工智能在工业领域的应用仍具备非常广阔的空间,根据凯捷统计,只有欧洲顶级制造企业AI 应用普及率超过30%,日本制造企业AI 应用率达到30%;美国制造企业AI 应用率达到28%;中国制造企业普及率达到11%,这个调查表明人工智能在工业领域的普及率仍有很高的空间。但是生成式AI大模型的应用仍需面临一些挑战:

图6 人工智能在制造业渗透率对比

一是尚未出现投入产出比非常明确的场景。 在ChatGPT爆发之前,人工智能虽然在制造业拥有很多场景的探索,但是较为认可的领域仍然聚焦于的质量检测和设备预测性维护,这两种场景被认可的核心原因就是在项目实施后的效果较为明显,例如产品表面缺陷检测能够同过人力成本的节省来计算明确的ROI,设备预测性维护能够基于设备故障发现的时间节点来衡量效果,但是在生成式AI的应用,尚未出现类似以上两种经济效应较为明显的场景,大多数场景的探索处于试点和探索阶段。

二是面向领域的基础模型缺乏。目前面向工业领域大模型的做法,大多都是从精调做起,并没有经过预训练阶段,而预训练才是真正知识灌输阶段,让模型真正学习领域数据知识,做到适配领域。从精调做起或者直接集成大模型只是激发原有大模型的能力,并没有从实现对领域知识的理解和推理。而当前的基础模型发展仍处于通用大模型竞争的白热化阶段,对面向行业的基础模型关注较少,目前也仅有少数的企业开始从预训练阶段构建制造业领域的生成式大模型应用。

三是制造业领域场景高度碎片化。碎片化的场景对大模型这种对数据、算力要求较高的范式也提出了挑战。工业数字化领域经常流传一个逻辑,“工业数字化是万亿级的市场,但其是一万个亿级市场的组合”,对于细分领域来说,很难有足够多可用的数据来从预训练阶段开始训练大模型,通用的大模型又无法适配聚焦细分领域的场景需求,这种天然的矛盾会阻碍大模型的发展。

备注:斯坦福大学用基础模型来泛指通过自监督学习在超大规模数据上训练并且可以适配(例如,微调)各种下游任务的模型,这些模型包含但不限于ChatGPT、Llama等。在我国伴随着产业发展,通常用大模型来泛指ChatGPT、Llama等生成式模型,本文撰写过程中对语言、图像、多模态等各类生成式AI沿用了目前我国产业界形成的共识。