事项:
2024年1月16日,在智谱AI技术开放日(ZhipuDevDay)上,智谱AI推出新一代基座大模型GLM-4,发布了AllTools、GLMs、MaaSAPI、大模型科研基金、大模型开源基金以及“Z计划”创业基金等内容。
平安观点:
GLM-4整体性能大幅提升,能力逼近GPT-4。根据GLM大模型公众号信息,新一代基座大模型GLM-4,整体性能相比GLM3全面提升60%,逼近GPT-4:(1)基础能力(英文):GLM-4在MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等数据集上,分别达到GPT-494%、95%、91%、99%、90%、100%的水平。(2)指令跟随能力:GLM-4在IFEval的prompt级别上中、英分别达到GPT-4的88%、85%的水平,在Instruction级别上中、英分别达到GPT-4的90%、89%的水平。(3)对齐能力:GLM-4在中文对齐能力上整体超过GPT-4。(4)长文本能力:GLM-4在LongBench(128K)测试中,性能超过Claude2.1。(5)多模态-文生图:GLM-4的CogView3模型在文生图多个评测指标上,相比DALLE3约在91.4%~99.3%的水平之间。
GLM-4升级智能体能力,开发模式进一步优化,商用落地有望加速。智谱AI发布GLM-4的AllTools能力,只需一个指令,GLM-4即可自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、CodeInterpreter代码解释器和多模态文生图大模型,以完成复杂任务。同时,GLMs个性化智能体定制能力也同步上线。此外,MaaS平台也将全网开放GLM-4、GLM-4V、CogView3等模型API,并邀请内测GLM-4AssistantAPI。此前,OpenAI在其首届开发者大会上发布了GPT-4Turbo,并引入了GPTs功能,即每个用户都可以通过自然语言构建定制化GPT,并将其上传到应用商店GPTStore获得分成收入。GPTStore于当地时间2024年1月10日正式上线,根据澎湃新闻信息,GPTStore目前已经有超过300万个自定义版本的ChatGPT应用。智谱AI公司CEO张鹏表示,公司不久将公布GLMs应用商店的开发者分成计划。我们认为,GLM-4AllTools的推出降低了用户的使用门槛,MaaS平台的开放也将加快GLM-4商业化落地的进程,未来随着公司开发者收入共享计划的启动,国内AIGC应用开发有望加速。
多项基金加持开源生态建设,国内大模型应用落地有望加速。从ChatGLM一代二代三代以来,智谱AI几乎开源了所有内核模型,包括千亿级基座GLM-130B、搜索增强模型WebGLM、图形理解模型VisualGLM、代码模型CodeGeeX1、2,文生图模型CogView1、2,图形增强理解模型CogVLM还有可视化认知Agent模型CogAgent。根据GLM大模型公众号信息,智谱AI将发起“大模型开源基金”,为优秀的开发者提供1000张卡、1000万元现金和1000亿免费APItokens。此外,智谱AI智谱联合生态伙伴发起的“Z计划”大模型创业基金,总10亿元人民币,已经支持了面壁智能等数十家企业。智谱AI作为国内大模型赛道的领先企业,率先开源模型并发起多项基金聚合开发者共建生态。国内大模型开源生态的建设将促进国内大模型能力提升,我国AIGC应用落地步伐有望加速。
投资建议:智谱AI作为国内大模型赛道的领先企业,本次发布的GLM-4整体性能较上一代大幅提升,能力逼近GPT-4。同时,GLM-4增强了智能体能力,GLMs应用商店的引入,使得大模型的开发模式进一步优化,商用落地有望加速。此外,智谱AI公司发起多项基金加持大模型开源生态建设,将促进国内大模型能力提升,我国AIGC应用落地步伐有望加速。当前,我国通用人工智能产业政策逐步完善,国产大模型能力持续升级。美国对华半导体出口管制升级,将倒逼我国国产AI芯片产业链加快成熟。随着国产大模型厂商和AI芯片厂商的持续发力,我国AIGC产业未来发展前景广阔。在标的方面:1)算力方面,推荐海光信息、中科曙光、紫光股份、浪潮信息、神州数码、龙芯中科,建议关注寒武纪、景嘉微;2)算法方面,推荐科大讯飞;3)应用场景方面,推荐金山办公,建议关注万兴科技、拓尔思;4)网络安全方面,强烈推荐启明星辰。
风险提示:1)国内大模型算法发展可能不及预期。当前,虽然国产大模型能力持续升级,但相比OpneAI等全球领先的大模型厂商,国产大模型的追赶进度存在不达预期的风险。2)AI算力供应链风险上升。美国对华半导体出口管制升级,将倒逼我国国产AI芯片产业链加快成熟。但如果我国国产AI芯片的迭代速度不达预期,将影响我国AI算力的发展。3)大模型产品的应用落地低于预期。当前,我国国产大模型已经开始在教育、医疗、汽车、办公、工业、智能硬件等B端和C端应用场景持续落地,如果产品的市场拓展不及预期,则我国大模型产品的应用落地将存在低于预期的风险。