导语:
美国商业科技界正在升起两位“新神”。
一位是“钢铁侠”埃隆·马斯克,“带领人类走向火星”;
一位是“奥特曼”山姆·阿尔特曼,“带领AI走向人类”。
大多数人对马斯克很熟悉了,特斯拉汽车在中国道路上疾驰,朋友圈也经常能刷到SpaceX火箭发射和星链卫星的新闻。
阿尔特曼是因为ChatGPT爆热,才被国人知晓。2023年,大模型LLM、AGI、AIGC、Prompt成为很多人口中的新名词。
本文就从头开始聊一聊:啥是大模型?
正文内容包括:
1)啥是大模型?ChatGPT掀起了第四次AI浪潮
2)百模大战:最值得关注的“100家AI大模型”
3)中美争锋:“中国BAT” 大战 “美国OMG”
01
啥是大模型?
百度李彦宏 近期经常在演讲中谈及大模型,用的标题都很吸睛 ——《大模型改变世界》。
“人工智能再次成为人类创新的焦点,越来越多的人认可第四次产业革命正在到来,而这次革命是以人工智能为标志的。
之所以成为焦点,是因为大模型。大模型成功地压缩了人类对于整个世界的认知,让我们看到了实现通用人工智能的路径。
当下,我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”
360周鸿祎 也不止一次地提到,过去三个月,相当于过去人工智能历史上的三十年,大模型是新时代“发电厂”。
“我觉得大模型的机会是一次不亚于PC、互联网、iPhone被发明的机会,应该说是一次新的工业革命的机会。
现在数字化已经成为国家战略,但数字化的终点不是大数据,数字化的终点应该是智能化。”
李开复博士 更是在《AI1.0到AI2.0的新机遇》的演讲中,旗帜鲜明的发声:AI大模型是不能错过的历史机遇!AI2.0市场预计将是移动互联网规模的10倍。
无论是企业还是个人,都极度重视这一波AI大模型巨变。
但是,究竟啥是大模型?
百度百科给了一个“很糟糕的”回答:为了仿照实体而去建造的大型道具模型。
文心一言回答地还不错:
AI大模型是人工智能领域中的一种重要技术,具有强大的能力和广泛的应用前景。
今年4月,我现场参加了陆奇博士的分享,第一次比较清晰地理解了这个所谓的“大模型”。
陆奇博士 放了一张PPT:
无论是人类还是机器,都是这三个体系的组合:
“信息”系统(subsystem of information),从环境当中获得信息;
“模型”系统(subsystem of model),对信息做一种表达,进行推理和规划;
“行动”系统(subsystem of action),我们最终和环境做交互,达到人类想达到的目的。
基于此,陆奇还得出一个简单结论。
今天大部分数字化产品和公司,包括Google、微软、阿里、字节,本质是信息搬运公司。
“一定要记住,我们所做的一切,一切的一切,包括在座的大部分企业都在搬运信息。Nothing more than that,You just move bytes。但它已经足够好,改变了世界。”
可以说,以前的PC互联网也好,移动互联网也好,都还是信息无处不在。
2023年的拐点是什么?
AI大模型。
当下,模型无处不在,未来,行动无处不在。
陆奇的布道,让众多创业者和投资人,清晰地感受到了,无处不在无所不能的“大模型”。
今年6月,在黑马AIGC产业营上,百度智能云李扬,从人工智能的技术维度,更仔细地说清楚了——啥是大模型?
人工智能 > 机器学习 > 深度学习 > 深度学习模型 > 预训练模型 > 预训练大模型 > 预训练大语言模型
预训练大预言模型的代表:就有百度的文心、Open AI的GPT,进而有了文心一言和ChatGPT等大模型产品。
回头看一下,ChatGPT的英文全称:Chat Generative Pre-trained Transformer,恍然大悟。
这时如果再有人问你“啥是大模型”,你是不是,从概念到技术,都比较清晰了。
还没完,我们还应该从产业的视角进一步来看,什么是大模型?什么是AIGC应用?什么是算法、算力和数据?什么是模型层、应用层?
可以看一下上帝视角般的——“产业图谱”。
众所周知,AI人工智能,早已不是什么新鲜词了。
你的脑中或许会闪过这样的几个重要节点:
Deep-blue(1997)- AIphaGo(2016)- ChatGPT(2023)
人工智能的浪潮可谓是一波又一波。
人们回过头看,2014年之后的那一波AI创业企业,在近两年也是陷入低谷。
曾经的AI四小龙,而今安在哉?
语言人工智能、视觉人工智能、安防人工智能,也都时过境迁,远远不如今天的大模型、AGI、AIGC、ChatGPT火热。
给大家梳理下四个名词概念:AI、AGI、AIGC、ChatGPT。
AI:人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
AGI:通用人工智能(Artificial general intelligence),计算机科学与技术专业用语。这一领域主要专注于研制像人一样思考、像人一样从事多种用途的机器。这一单词源于AI,但是由于主流AI研究逐渐走向某一领域的智能化(如机器视觉、语音输入等),因此为了与它们相区分,增加了general。
AIGC:人工智能生成内容(AI generated content),又称生成式AI。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。
ChatGPT:(ChatGenerative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
所以,当智源研究院林咏华在黑马AIGC产业峰会上说:
“AIGC+ChatGPT大模型正是第三次浪潮谷底之后迎来的拐点,也是由大模型推动的新的一轮发展浪潮的来临。”
台下的我,是极度认同的。
光有技术和产品还不够,还得有顾客用户愿意买单。
商业化的考卷难题,再一次传到AI大模型企业的手中……
02
百模大战:最值得关注的100家AI大模型
有了产品就有了市场,有了江湖就有了竞争。
移动互联网时代的那场“百团大战”,还让很多从业者记忆犹新。
那会,无论是马云、马化腾还是李彦宏,整个互联网圈都还在喊:
“所有行业都值得用互联网重做一遍。”
再看如今,无论是阿里百度,还是腾讯华为,也都在新时代振臂高呼:
“所有行业都值得用大模型重做一遍。”
故事总是充满熟悉的味道。
2023年,“百模大战”,一触即发。
因为工作需要,我除了参加行业、企业、研究机构的发布会和闭门会,还需要基于自身的业务,不断了解最新的AI大模型和AIGC应用。
比如,我们有产业媒体,从而需要了解各个企业的大模型和AIGC产品动态;比如,我们有商业培训,从而需要挖掘行业里的导师资源和学员需求;我们自己的技术团队也开发了行业大模型,从而也需要了解产业上下游有没有合适的合作伙伴。
基于这个公众号以及网站,我们的AI黑马媒体栏目,就是要聚焦AI大模型和AIGC产业,提供深度内容和榜赛会课,和从业者一起奔赴AI新时代。
我们整理了《百模大战:最值得关注的100家AI大模型》,从这100个AI明星企业,足以窥见未来伟大的新世界!
《百模大战:最值得关注的100家AI大模型》
(本版顺序随机排布,未来将发布权威榜单)
创业黑马牛文文 曾在演讲中提到,只要有一个革命性技术出来,中国在应用层会快速追上。
“在AI大模型和AIGC应用上,互联网大厂、高校和研究机构、产业龙头企业,包括一些先知先觉的中小企业,都可以再大模型领域和大模型时代有所作为。”
那么,中国进入“百模大战”,未来机会在哪?
或者说,除了诞生ToC的“中国版ChatGPT”,中国的通用大模型企业其它的机会点在哪?
第一,ToG政府,为各级政府各个城市部署私有化大模型。
第二,ToB企业,为一些有需求的企业部署私有化大模型。
除了通用大模型,未来也将属于千千万万的行业大模型。
这主要是因为,越来越多的人感受到通用大模型的问题:
比如,大模型是“通才”,但缺乏行业深度。比如,大模型无法保证内容可信,行业称之为“幻觉”。还有一个很现实的问题,共有大模型的训练和部署成本太高,大多数中小企业无法承担,进而导致无法普惠到所有人。
相较于通用大模型,行业模型至少有三个优点:
第一,解决专业领域问题能力很强;第二,训练和部署成本更低;第三,升级和迭代更加灵活。
或许,AI大模型的未来,将是十几个通用大模型,以及成百上千个行业大模型。
除此以外,基于大模型产生的AIGC应用更是数不胜数,遍布各个细分场景,帮助人们解决各个具体问题。
03
中美争锋:“中国BAT”大战“美国OMG”
不止百模大战,也是中美争锋。
早在2017年,国家就出台了新一代人工智能发展规划,明确将人工智能列为国家战略。今年4月28号,中央政治局会议更是重点提及要重视通用人工智能的发展,营造创新生态。7月13日,《生成式人工智能服务管理暂行办法》公布,鼓励技术在各行业和各领域的创新应用。
人工智能三大要素,算力、算法和数据。其中,中国两国在算力方面差距不大,按2022年年底的数据,美国占全球算力36%,中国占31%。
不可否认的是,中美在AGI和AIGC上还是存在差距的。
大模型的基础是深度学习框架,美国的Tensorflow和PyTorch已经深耕深度学习框架生态多年,虽然国内企业也自主开发了深度学习框架,但市场考验还不够,生态还有待打造。
邬贺铨院士 认为:“在中国从事AI研究的技术人员不算少,但具有架构设计能力和AIGC数据训练提示师水平的人才仍然短缺。在ChatGPT出现之前,有人认为中国在AI方面的论文与专利数与美国不相上下,ChatGPT的上线使我们看到了在AIGC上中美的差距,现在是需要清楚认识和重视我们面对的挑战,做实实在在的创新。”
现在许多公司和研究机构都处在“百模大战”之中,不论初创公司还是大公司,充分竞争的市场才是好市场,充分竞争的公司才是好公司。
张亚勤院士 认为:“大模型时代才刚刚开始,42公里的马拉松我们刚跑到5公里,算力、数据不够都不成问题。中国在PC时代落后于美国,但在移动互联时代领先于美国(数字支付、微信、短视频),AI时代要给创业者、科研人员、企业更多信心。”
一些产业从业人士指出,在AI大模型上中美争锋,主要是“OMG”和“BAT”的战斗。
我们依次看一下这六家企业:OpenAI、Meta、Google、百度、阿里、腾讯。
1)Open AI
2022年11月30日,OpenAI发布ChatGPT。作为ChatGPT的母公司,Open AI引领着AI大模型的发展。2016年微软投资了OpenAI十亿美金。2020年推出的 GPT-3 ,有1750亿参数,是大模型的技术。2022年推出的 ChatGPT 是基于大模型的产品形态。2023年微软继续投入100亿美金,OpenAI+微软已成为最具影响力的AI力量。
2)Meta
Facebook先是押注元宇宙,如今又入局AI大模型。扎克伯格是蹭热点,还是全面发力?过去Facebook的使命是“Make the world more open and connected”,这个话也是非常具有互联网时代特色的,就是开放、连接。如今,扎克伯格已然意识到这个东西不够了,他说我们要“Bring the world closer together”,怎么才能“closer together”呢?还是要通过用户画像、通过人工智能的技术,找到人和人之间相同的兴趣,把他们连接在一起。MetaAI发布了开源大模型LLaMA,可以在单个GPU上运行。
3)Google
2023年5月10日,谷歌在两个小时的大会里提及“AI”200多次,并一口气推出了AI大模型PaLM2、AI机器人Bard、AI搜索、AI办公等多款模型和产品,一套完整的AI系统全面嵌入谷歌旗下超过25个产品和应用。
4)百度
2023年3月16日,百度在中国率先发布文心大模型。据了解,百度是中国最早布局大模型的公司,于2019年就开始了预训练模型 Ernie1.0。目前,文心大模型家族已形成文心大模型+工具与平台+产品与社区的庞大大家族。
除了依托百度搜索的海量数据优势,百度在AI大模型领域的“四层模式”(芯片层+框架层+模型层+应用层)才是其在“百模大战”中的核心竞争力。百度之所以能够在Google、Meta、阿里、腾讯等大厂之前先做出来“文心一言”,就是因为这四层的全栈布局。
百度在芯片层的布局是昆仑芯,已经量产几万片。昆仑芯第三代,预计2024年初量产。飞桨属于框架层,文心属于模型层。
5)阿里
2023年,4月11日,阿里发布大模型。张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马、饿了么等。他认为,面向AI时代,所有产品都值得用大模型重新升级。
阿里云也面向企业提供普惠的AI基础设施和大模型能力。未来每一个企业都可以通过阿里云调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
6)腾讯
直到2023年6月19日,腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展,宣布将助力企业构建专属大模型及智能应用,为企业提供MaaS一站式服务。
据了解,腾讯将为文旅、政务、金融等10余个行业,提供超过50个大模型行业解决方案。比如,基于腾讯云智能媒体AI中台,为央视打造人工智能开放平台,提供智能标签、修复、智能翻译等30多种算法。为上海大学,利用腾讯云教育行业大模型能力,构建专属的教育行业大模型基础平台,覆盖在校生和毕业生全生命周期业务,将提供教学助手、人才培养、招生就业助手和作业批改等服务;此外,腾讯企点、腾讯会议、AI代码助手等多款头部SaaS产品,也迎来了能力升级。
我们认为,中国大模型战队中除了BAT,还应该重点关注四家企业和机构,360、华为、智源和智谱。
百度、阿里、腾讯、360、华为、智源、智谱,就好比是中国AI大模型的“战国七雄”。
7)360
2023年6月13日,360集团对外发布了360智脑大模型。360关于大模型的战略是八个字:“两翼齐飞、四路并发”。
“两翼齐飞”,一方面要发展大模型的技术,另一方面要场景化、产品化、平民化、垂直化。只是模仿ChatGPT,做了一个搜索对话框,做了一个聊天机器人,指望这个东西带来工业革命是不现实的。场景分为四路:一是To C的场景,搜索引擎+浏览器和桌面。二是面向中小企业。三是面向政府、大型企业。四是面向行业的GPT,跟有行业数据的合作伙伴相结合。
8)华为
2023年7月7日,华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“AI for Industries ”华为的盘古大模型聚焦行业价值场景,围绕行业重塑、技术扎根、开放同飞三大方向,为行业客户提供服务。
盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构。
华为从2019年到2021年之间就开始立项做盘古大模型。2021年发布了盘古NLP大模型、盘古机器视觉大模型、盘古科学计算大模型、盘古药物分子大模型。到2022年在行业中拓展应用,发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。2023年7月7日发布的盘古大模型3.0,重点提及了5个基础大模型(自然语言、多模态、视觉、预测、科学计算)和7个行业大模型(政务、金融、制造、药物分子、矿山、铁路、气象)。
9)智源
2023年6月9日,智源研究院院发布了全面开源的“悟道3.0”系列大模型及算法。继 2021 年悟道大模型项目(悟道1.0于2021年3月发布)连创“中国首个+世界最大”纪录之后,智源 “悟道3.0 ”进入全面开源新阶段,带来一系列领先成果:“悟道·天鹰”(Aquila)语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台,“悟道 · 视界”视觉大模型系列,以及一系列多模态模型成果。
10)智谱
2023年3月,基于千亿基座模型的ChatGLM开启内测。智谱AI由清华大学计算机系的技术成果转化而来,致力于打造新一代认知智能通用模型,提出了Model as a Service(MaaS)的市场理念。公司于2021年合作研发了双语千亿级超大规模预训练模型GLM-130B,并主导构建了高精度通用知识图谱,把两者有机融合为数据与知识双轮驱动的认知引擎,并基于此千亿基座模型打造ChatGLM。此外,智谱AI也推出了认知大模型平台Bigmodel.ai,形成AIGC产品矩阵。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座,赋予机器像人一样“思考”的能力。
最后,总结一下。
1、中国为什么一定要自研AI大模型?
基于战略安全角度和经济商业价值,都能得出中国一定要自研AI大模型这一确切答案。从中美贸易战到芯片卡脖子等,中国政府必然要保证关键技术的自主可控和国家安全。并且OpenAI和微软的实践也表明了,AI大模型将有巨大的商业价值,中国企业需要抓住这一机遇。
李开复也认为,“使用海外的开源大模型就可以做出中国版的OpenAI”的说法是绝对错误的,技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外,拿海外训练出来的大模型,在国内做微调是值得商榷的。因为国内外的文化习惯、法律法规不同,所以自主创新做大模型是中国企业的必经之路。
2、中国AI大模型产品何时能赶上“ChatGPT”?
李彦宏曾公开表示,文心一言与ChatGPT版本差距并不明显,可能只相差一两个月的时间。对于这种说法,王小川则调侃称,媒体采访的可能是平行世界的李彦宏。
王小川认为国内目前的大模型和ChatGPT的差距不可能只是两个月。“如果在追上目前ChatGPT-3.5的水平,大概今年内就能做到,但如果要追上未来的GPT-4和GPT-5,预计要3年左右的时间。”
艾瑞咨询认为,与ChatGPT功能对标的大语言模型(Large Language Models, LLMs),目前国外主要有Google推出的Gopher、LaMDA以及Meta的Llama等;国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的 “商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹,但对于Google等国外大厂而言,克隆ChatGPT并不存在太高壁垒,当前暂时落后主要是出于公司战略与技术理念差异,选择了不同技术路线,随着各家探索成果和新技术方法的实践不断推进,仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言,则在数据、算力、工程化能力等关键要素上存在短板,短期内难以对国外领先大模型实现赶超,为跟随者角色,长期更需要国内AI全产业链整体进化。
3、AI大模型的竞争关键和创新机会在哪?
1)通过OMG可以看到:ChatGPT在逻辑推理、上下文理解等方面的能力,是模型参数量达到该量级后“涌现”出的,即所谓的“大力出奇迹”。在此之前,坚定的科研初心,丰厚的资本支持,是中国科技企业需要向美国科技企业认真学习的。
2)通过百度可以看到:“基础层+模型层+应用层”,底层技术的积累至关重要。无论是芯片层的昆仑还是框架层的飞桨,“根技术”的深厚决定枝叶的生长速度。
3)通过阿里可以看到:“互联网时代的产品都值得用AI重新升级”。阿里是这么说的,也是这么做的。必然有后浪高举AI原生的旗帜,颠覆马云的互联网思维。
4)通过腾讯和华为可以看到。无论是云服务还是大模型,竞争的核心和商业的重点,都指向行业ToB服务,AI大模型要更有行业价值,也要“离钱更近一点”。
5)通过360可以看到,数字人是大模型重要的应用入口,大模型的发展要和国家的产业数字化战略相结合,企业级垂直大模型更为关键。把大模型拉下神坛,变成每个企业、政府部门都感觉能够直接使用的东西。
4、中小企业该如何面对AI大模型?
李开复说:
我们完全可以想象今天的Word、PowerPoint、Excel、Photoshop等应用通通都会用AI大模型重写一次,而且重写之后它的用户体验会变,甚至商业模式也会变。
李彦宏说:
业界有一种说法,大模型时代来了,每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!
也有企业保持理性:
折腾是找死!不折腾是等死!
大模型更像是巨头的游戏和军备竞赛,它和芯片、语料息息相关,如果没有巨量的资金储备,很难真正做大模型;非巨头还是要理性看待大模型。
大模型是基础建设,行业模型与应用场景等将拥有更大的发展机会?
创业黑马近期举办了两期AIGC产业营,参与者大多都是中小企业,300家。
通过其数据可以发现:25%的企业已经开始探索和应用AIGC,传统产业的企业期望利用AIGC转型升级,300家企业分布在企服、消费、培训、文娱、营销等各个行业领域。
但无论如何,中小企业不得不去思考:
有没有能力做AI大模型或行业模型?
自己的行业会不会出现新的AI产品?
新的AI产品会不会颠覆自己?
自己有没有能力做出那个AI产品?
自己原有产品如何基于AI新技术进行迭代创新?
自己基于大模型做微调做应用层创新?
基于国内外的哪个大模型做应用研发和产品创新?
不考虑大模型,直接用AIGC的产品或工具,简单粗暴降本增效?
……
最后,还有一点值得大家注意:
“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性工作。现在看起来,它会以相反的顺序进行。”
高科技投机机构ARK Invest预测,以AIGC为代表的新一代人工智能技术将辅助知识工作者(包括教师、律师、医生、财务、程序员等白领职业)提高工作效率。报告预测,到 2030 年,AI 将大幅提高知识工作者的工作效率,平均工作效率增加140%,新一代人工智能技术将有可能大幅度降低脑力劳动者的工作强度。如果这一切成为现实,或将是继人类历史上由于动力革命而摆脱繁重的体力劳动之后,人类社会发生的又一次伟大的技术革命。
上面引号里那句话,是ChatGPT创始人,山姆·阿尔特曼,说的。
他还说过一个观点:
“没必要担心被AI取代,人类和机器终将融为一体。”
以上文章内容仅代表原作者观点,不代表今日指点观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与今日指点联系。